본문 바로가기
반응형

WIL12

내배캠 WIL 12주차 지난 1주일을 돌아보며... Facts. 1. 최종 프로젝트 시작 2. 파이썬 - 클러스터링 강의 Feelings 1. 최종프로젝트는 자유도가 높은만큼 고려해야 할 요소가 많아서 복잡하다 2. 최종프로젝트 기간에 다른 요소들이 많아서 일정관리가 힘들다 Findings 1. 주성분분석 2. spark Future 최종프로젝트이니만큼 다른 때보다 더 EDA에 집중하고 일정관리에도 더 힘쓸 것 2024. 3. 29.
내배캠 WIL 11주차 지난 1주일을 돌아보며... Facts. 1. 실전 프로젝트 진행. 2. 파이썬 - 빅쿼리 - 태블로 연동. Feelings 1. 프로젝트 중간에 바뀌는 요소가 많은 것은 자연스러운 일이다. 2. 결국에는 누군가가 다 해놨으니까 잘 찾아봐라. Findings 1. 파이썬에서 빅쿼리에 파일을 업로는 하는 법 2. Selenium을 통한 크롤링 Future 빅쿼리 연동해서 조금 더 관련 자료를 찾아보고 다양한 최적화를 해볼 것. Selenium을 통한 크롤링에 익숙해질 것 2024. 3. 8.
내배캠 WIL 10주차 지난 1주일을 돌아보며... Facts 1. 태블로 강의 수강 및 개인과제 수행. - 태블로 역량을 요구하는 기업이 많은 만큼 아주 유익한 강의였다. - 컷 편집으로 인해 수강에 어려움이 있었다. - 과제는 아주 만족스럽게 수행했다. 2. 심화 프로젝트 착수. - 주제 선정 이후 가이드라인을 따라 해본 결과 어려운 파트는 지표 생성으로 추정. Feelings 1. 대시보드는 결국에는 디자인이다. : 디자인적인 요소를 배재할 수 없기 때문에 감각이 중요하며, 지표 선정 후 표시하는 것 또한 디자인에 따라 그 효과가 달라진다. 2. 아이디어는 많으나 구현할 방도가 없다. : 아이디어는 진짜 많이 떠오르는데 구현할 능력이 없을 것이 떠올라서 우울해진다. Findings 1. 태블로에서의 통계량 생성법. 2. .. 2024. 2. 29.
내배캠 TIL 38일차 심화 프로젝트 관련 1) 결측치 대치 2) 이상치 제거 4분위수를 사용한 방법은 유실 데이터가 너무 많아 기각. EDS를 사용한 방법 채택. def remove_outliers(train_df, col, threshold=3): mean = np.mean(train_df[col]) std_dev = np.std(train_df[col]) lower_bound = mean - threshold * std_dev upper_bound = mean + threshold * std_dev train_df= train_df[(train_df[col] >= lower_bound) & (train_df[col] 2024. 2. 13.
반응형