본문 바로가기
반응형

ETA2

내배캠 TIL 49일차 1. 5분 기록보드 5분 기록보드라는 개념에 대해 배웠디. 그날 활동을 요약하는 행위로 요약 시간이 5분이라서 5분 기록 보드 그날 한 일들을 되새기고 다음날 할 일들을 생각할 수 있어서 좋다 2. 분석 데이터 탐색 분석 데이터를 선정해야 한다 유저데이터를 해보고 싶은데 기존에 캐글이나 데이콘에서 얻기 보다는 크롤링이나 api를 통해 얻고 싶기 때문에 쉽지가 않다 1) 네이버 쇼핑 데이터 분석 2) 네이버 웹툰 데이터 분석 위 두 가지를 고려중이다 2024. 3. 26.
내배캠 TIL 39일차 튜터님 피드백 1) 결측치 대치 관련 명목형 변수들이 이루는 비율을 통해 가장 유사한 것으로 대한 접근법 자체는 좋다. 하지만 사용한 명목형 변수들이 대치할 컬럼인 '대출기간'과 직접적인 연관이 없다. 고로 대치할 때, 명목형 변수 외에 몇몇 수치형 변수들 또한 대치의 근거로써 사용하는 것이 좋을 거 같다. 2) 파생 변수 관련 파생 변수를 추가한 논리는 좋다. 조원들의 니즈를 위한 중위 등급 판별을 위한 파생변수를 생각하면 좋을 거 같다. 3) 인코딩 관련 중위 등급을 잘 판별하지 못하는 것이 unique 값이 많은 대출목적을 원핫 인코딩한 것이 원인일 수 있다는 의견을 주셨다. 또 팀원분이 대출 목적을 몇가지 기준에 따라 통합하여 차원을 줄이는 의견도 주셨다. 둘 다 좋은 방법 같다 4) 안정적인 모.. 2024. 2. 14.
반응형