본문 바로가기
반응형

Crawling2

내배캠 TIL 47일차 실전 프로젝트 관련 1. CSV 파일 만들기 대시보드 제작을 위한 컬럼을 추가한 기본 csv와 같이 사면 좋은 종목 추천을 위한 csv를 제작하였다. 종목 추천을 위해서 이전에는 국내 주식 1000개를 돌렸었는데, 1000개를 대상으로 추천을 위해 공분산을 산출하는 것은 경우의 수가 너무 많아지기도 하고 기존에 가지고 있는 주식을 해외주식으로 가정하고 만드는 것이기 때문에 해외주식으로 하는 것이 통일성이 더 있어보여서 해외주식으로 하는 것으로 노선을 변경하였다. 또한 지금은 이 모델의 성능을 극한으로 끌어올린다든지 추천을 위해 수집한 데이터의 수가 방대해야 하는 것이 중요한 프로젝트는 아니라고 생각되기에 추천을 위한 해외 주식의 수를 데이터를 수집하는 날 기준으로 상위 100개를 수집하였다. 크롤링 코드.. 2024. 3. 8.
내배캠 TIL 15일차 1. 알고리즘 특강 1) 자료구조 (1) 해시 테이블. - Key와 Value로 이루어진 “사전형“ 자료형. - Hash Table은 Python 에서 Dictionary 형으로 구현. (2) 트리 - 머신러닝 혹은 분석방법론에서 의사결정나무(Tree) 개념이 등장. (3) 그래프 - 데이터베이스에서의 다이어그램 같다. 2. 팀 프로젝트 1) 주제 (1) 한국 모바일 OTT 콘텐츠 장르 및 이용자 특성을 통한 마케팅 전략 선정. - 키즈 콘텐츠 특화. - EDA를 통해 특화할 요소를 찾아볼 것. (2) 넷플릭스 사용자 로그 분석을 통한 서비스 개선 방향 제시. - EDA를 통해 특화할 요소를 찾아볼 것. 2) 개인 크롤링 코드 사용한 사이트가 최신 정보로 로딩 후에 페이로드를 받아서 검색해주는 방식이여서.. 2024. 1. 9.
반응형