반응형
1. 팀 프로젝트
- PPT 제작
주요 개념
: 컴프리헨션, pie 차트 그리기, 3항 연산자.
ppt의 템플릿과 내용에 들어갈 그래프를 제작하게 되었다.
아래와 같이 있는 데이터 프레임을
df3 = pd.read_csv('----------.csv') two = df3[df3['연령대'] == '20대'].sum() three = df3[df3['연령대'] == '30대'].sum() four = df3[df3['연령대'] == '40대'].sum() five = df3[df3['연령대'] == '50대'].sum() over_six = df3[df3['연령대'] == '60대이상'].sum() box = [two, three, four, five, over_six] x = ['20대', '30대', '40대', '50대', '60대이상'] y = [i[2] for i in box] z = [i[2]/i[3] for i in box] clrs = ['blue' if (x < max(y)) else 'red' for x in y] plt.bar(x, y, color=clrs) plt.title('3년간 연령대별 OTT 총 소비금액') plt.bar(x, z, color=clrs) plt.title('3년간 연령대별 OTT 평균 소비금액')
위 코드를 통해 3년간의 연령대별 총 소비금액과 평균 소비금액을 구하였다.이전에 다뤘던 소비자 데이터를 연령대 별로 묶어서 각 유형별 차지하는 비중을 나타내보았다.필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.
나오는 표는 안 보여준다 필요한 만큼은 보여 줬다 이 이상은 보여주지 않는다.b = a.groupby('연령대')[['국내영화', '해외영화', '국내드라마', '해외드라마', '예능', '다큐멘터리', '애니메이션', '생방송']].sum() b
우리가 정한 타겟이 영엔 리치 였기 때문에
유형별로 젊은 층이 많았던 것과 적었던 것을 중점적으로 봤다.
c = a.groupby('연령대')['예능'].sum() d = a.groupby('연령대')[['국내영화', '해외영화']].sum() plt.pie(x=c, labels=c.index, autopct='%.1f%%') plt.title('예능 주 시청 연령대') plt.pie(x=d['국내영화'], labels=d.index, autopct='%.1f%%') plt.title('국내영화 방송 주 시청 연령대') plt.pie(x=d['해외영화'], labels=d.index, autopct='%.1f%%') plt.title('해외영화 방송 주 시청 연령대')
- 느낀 점
유의미한 인사이트를 뽑기 위해서는
데이터를 잘 가공하고
groupby를 기준을 다르게 여러번 반복하고
그래프를 그리고를 많이 반복해야 한다.
반응형
'TIL' 카테고리의 다른 글
내배캠 TIL 21일차 (0) | 2024.01.17 |
---|---|
내배캠 TIL 20일차 (0) | 2024.01.16 |
내배캠 TIL 18일차 (0) | 2024.01.12 |
내배캠 TIL 17일차 (1) | 2024.01.11 |
내배캠 TIL 16일차 (1) | 2024.01.10 |