df3 = pd.read_csv('----------.csv')
two = df3[df3['연령대'] == '20대'].sum()
three = df3[df3['연령대'] == '30대'].sum()
four = df3[df3['연령대'] == '40대'].sum()
five = df3[df3['연령대'] == '50대'].sum()
over_six = df3[df3['연령대'] == '60대이상'].sum()
box = [two, three, four, five, over_six]
x = ['20대', '30대', '40대', '50대', '60대이상']
y = [i[2] for i in box]
z = [i[2]/i[3] for i in box]
clrs = ['blue' if (x < max(y)) else 'red' for x in y]
plt.bar(x, y, color=clrs)
plt.title('3년간 연령대별 OTT 총 소비금액')
plt.bar(x, z, color=clrs)
plt.title('3년간 연령대별 OTT 평균 소비금액')
위 코드를 통해 3년간의 연령대별 총 소비금액과 평균 소비금액을 구하였다. 필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.
이전에 다뤘던 소비자 데이터를 연령대 별로 묶어서 각 유형별 차지하는 비중을 나타내보았다.
나오는 표는 안 보여준다 필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.
b = a.groupby('연령대')[['국내영화', '해외영화', '국내드라마', '해외드라마', '예능', '다큐멘터리', '애니메이션', '생방송']].sum()
b
우리가 정한 타겟이 영엔 리치 였기 때문에 유형별로 젊은 층이 많았던 것과 적었던 것을 중점적으로 봤다.
c = a.groupby('연령대')['예능'].sum()
d = a.groupby('연령대')[['국내영화', '해외영화']].sum()
plt.pie(x=c, labels=c.index, autopct='%.1f%%')
plt.title('예능 주 시청 연령대')
plt.pie(x=d['국내영화'], labels=d.index, autopct='%.1f%%')
plt.title('국내영화 방송 주 시청 연령대')
plt.pie(x=d['해외영화'], labels=d.index, autopct='%.1f%%')
plt.title('해외영화 방송 주 시청 연령대')