본문 바로가기
TIL

내배캠 TIL 19일차

by ColorConeHead 2024. 1. 15.
반응형

1. 팀 프로젝트

- PPT 제작

주요 개념
: 컴프리헨션, pie 차트 그리기, 3항 연산자.

ppt의 템플릿과 내용에 들어갈 그래프를 제작하게 되었다.

아래와 같이 있는 데이터 프레임을

df3 = pd.read_csv('----------.csv')

two = df3[df3['연령대'] == '20대'].sum()
three = df3[df3['연령대'] == '30대'].sum()
four = df3[df3['연령대'] == '40대'].sum()
five = df3[df3['연령대'] == '50대'].sum()
over_six = df3[df3['연령대'] == '60대이상'].sum()

box = [two, three, four, five, over_six]

x = ['20대', '30대', '40대', '50대', '60대이상']
y = [i[2] for i in box]
z = [i[2]/i[3] for i in box]

clrs = ['blue' if (x < max(y)) else 'red' for x in y]
plt.bar(x, y, color=clrs)
plt.title('3년간 연령대별 OTT 총 소비금액')


plt.bar(x, z, color=clrs)
plt.title('3년간 연령대별 OTT 평균 소비금액')

위 코드를 통해 3년간의 연령대별 총 소비금액과 평균 소비금액을 구하였다.
필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.


이전에 다뤘던 소비자 데이터를 연령대 별로 묶어서 각 유형별 차지하는 비중을 나타내보았다.

나오는 표는 안 보여준다 필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.

b = a.groupby('연령대')[['국내영화', '해외영화', '국내드라마', '해외드라마', '예능', '다큐멘터리', '애니메이션', '생방송']].sum()
b


우리가 정한 타겟이 영엔 리치 였기 때문에
유형별로 젊은 층이 많았던 것과 적었던 것을 중점적으로 봤다.

c = a.groupby('연령대')['예능'].sum()
d = a.groupby('연령대')[['국내영화', '해외영화']].sum()

plt.pie(x=c, labels=c.index, autopct='%.1f%%')
plt.title('예능 주 시청 연령대')

plt.pie(x=d['국내영화'], labels=d.index, autopct='%.1f%%')
plt.title('국내영화 방송 주 시청 연령대')

plt.pie(x=d['해외영화'], labels=d.index, autopct='%.1f%%')
plt.title('해외영화 방송 주 시청 연령대')​


 

 

- 느낀 점

유의미한 인사이트를 뽑기 위해서는

데이터를 잘 가공하고

groupby를 기준을 다르게 여러번 반복하고

그래프를 그리고를 많이 반복해야 한다.

반응형

'TIL' 카테고리의 다른 글

내배캠 TIL 21일차  (0) 2024.01.17
내배캠 TIL 20일차  (0) 2024.01.16
내배캠 TIL 18일차  (0) 2024.01.12
내배캠 TIL 17일차  (1) 2024.01.11
내배캠 TIL 16일차  (1) 2024.01.10