반응형 넷플릭스1 내배캠 TIL 17일차 1. 기초 프로젝트 발제 1) SQL 기반의 데이터 분석. 2) join을 위하 2개 이상의 데이터셋. 우리팀은 넷플릭스 관련 데이터를 기반으로 진행 중이다. 2. 넷플릭스를 고르게 된 이유 1. 데이터가 다양하다. 2. 다양하면서도 얻기가 쉽다. 3. 커뮤니티 사이트에서 OTT 플랫폼을 키워드로 해서 언급수(포스팅수)를 크롤링한 결과 제일 인기가 좋았다. 아래 코드를 돌린 결과 이미지와 같이 결과가 나왔다. 심지어 언급수가 아니고 페이지 수였다 한 페이지당 글이 20개. 여기서 payload. 즉 키워드나 페이지수 같은 것을 할당할 때 한글일 경우 인코딩을 해줘야하는데 urllib 모듈을 통해 인코딩 해주었다. import requests import re from urllib import parse .. 2024. 1. 11. 이전 1 다음 반응형