반응형 SQL17 내배캠 TIL 18일차 1. 팀 프로젝트 관련 1) 데이터 관련 -> 데이터 분석 전의 과정이 가장 어렵고 오래걸린다. 컨텐츠 데이터는 join하는데 한계가 있는 것으로 보인다. 팀 프로젝트의 주제인 그룹화에 따른 시청 컨텐츠를 짜는 것 또한 데이터의 한계로 인해 힘들 것으로 생각된다. user_data와 nation income에서 join을 할 수 있을 거 같다. 2) 주제 관련 -> 우리는 결국 답을 찾아낸다 왜냐면 찾아낼 때까지 하니까. 결국 적절히 join하면서 user_data에 join할 데이터를 찾으니 주제에서 벗어나지 않아도 될 거 같다. 2. SQLD 강의 관련 -> 시간 관리를 잘 하자. 데이터셋 찾고 찾으면 열어봐서 필요 없는 칼럼 쳐내거나. join할 칼럼 찾고 하다보니 강의 들을 짬 내기가 쉽지가 않다. 2024. 1. 12. 내배캠 TIL 17일차 1. 기초 프로젝트 발제 1) SQL 기반의 데이터 분석. 2) join을 위하 2개 이상의 데이터셋. 우리팀은 넷플릭스 관련 데이터를 기반으로 진행 중이다. 2. 넷플릭스를 고르게 된 이유 1. 데이터가 다양하다. 2. 다양하면서도 얻기가 쉽다. 3. 커뮤니티 사이트에서 OTT 플랫폼을 키워드로 해서 언급수(포스팅수)를 크롤링한 결과 제일 인기가 좋았다. 아래 코드를 돌린 결과 이미지와 같이 결과가 나왔다. 심지어 언급수가 아니고 페이지 수였다 한 페이지당 글이 20개. 여기서 payload. 즉 키워드나 페이지수 같은 것을 할당할 때 한글일 경우 인코딩을 해줘야하는데 urllib 모듈을 통해 인코딩 해주었다. import requests import re from urllib import parse .. 2024. 1. 11. 내배캠 TIL 10일차 1. SQL 개인과제 "조건에 맞는 쿼리문을 작성하고 해설을 작성하기" 쿼리문을 올렸놨으니 자유로운 훈수 부탁드립니다 근데 오늘 특강에서 서브쿼리를 지양하라는 말씀이 있으셨다 이말이야 다 고쳐보도록 **문제 1:** "최소 주문 날짜 찾기" 주어진 테이블 **`list_of_orders`**에는 여러 주문들의 날짜가 저장되어 있습니다. 주문 날짜는 'dd-mm-yyyy' 형식으로 저장되어 있습니다. 이 테이블에서 가장 이른 주문 날짜를 찾아보세요. select a.ORDER_DATE from ( select STR_TO_DATE(order_date, "%Y-%m-%d") as ORDER_DATE from list_of_orders ) a where ORDER_DATE is not null order by.. 2024. 1. 2. 내배캠 WIL 2주차 지난 1주일을 돌아보며... Facts 1. 분석 종합반 강의를 마무리 - pandas, matplotlib을 이용한 다양한 시각화 2. 개인 과제 수행 - 데이터 분석 종합반 Feelings 1. 미니 프로젝트 관련 : 원하던대로 역할을 수행하지 못 해 스스로의 부족함을 많이 느낌 2. 강의 수강 관련 : 프로젝트 관련 역할을 수행하는 것과 효과적으로 병행하지 못하여 많이 아쉬움 Findings 1. 하나의 plot에 2개의 그래프를 그리는 법 : 팀원의 의견대로 그래프를 적절하게 수정하면서 습득 x = Year_sales.index # 공통의 x축인 년도 y1 = Year_sales.values # y1값 y2 = decade_counts.values # y2값 fig, ax1 = plt.subplo.. 2023. 12. 30. 이전 1 2 3 4 5 다음 반응형