반응형
튜터님 피드백
1) 결측치 대치 관련
명목형 변수들이 이루는 비율을 통해
가장 유사한 것으로 대한 접근법 자체는 좋다.
하지만 사용한 명목형 변수들이
대치할 컬럼인 '대출기간'과 직접적인 연관이 없다.
고로 대치할 때, 명목형 변수 외에
몇몇 수치형 변수들 또한 대치의 근거로써
사용하는 것이 좋을 거 같다.
2) 파생 변수 관련
파생 변수를 추가한 논리는 좋다.
조원들의 니즈를 위한
중위 등급 판별을 위한 파생변수를 생각하면 좋을 거 같다.
3) 인코딩 관련
중위 등급을 잘 판별하지 못하는 것이
unique 값이 많은 대출목적을
원핫 인코딩한 것이 원인일 수 있다는 의견을 주셨다.
또 팀원분이
대출 목적을 몇가지 기준에 따라
통합하여 차원을 줄이는
의견도 주셨다.
둘 다 좋은 방법 같다
4) 안정적인 모델
일반적으로 Validation과 그리드 서치에 따른
모델 성능 저하(점수감소)는 필연적이라는 의견을 주셨다.
점수가 감소되어
하이퍼 파라미터 최적화 등을 제외시켰지만,
추가한 상태에서 높은 성능을 유지할 수 있도록
파생변수와 전처리에 더욱 신경을 써야겠다.
5) 예측 관련
모델을 통해 나온 예측값의 경향성이
학습을 위한 train 데이터의 경향성과
일치하는 지를 확인하는 것이 중요하다는 의견을 주셨다.
이는 파생변수 생성의 근거가 옳은지와
가설 검정의 근거로 사용할 수 있을 거 같다.
튜터님께 그래도 긍정적인 피드백을 많이 받았다.
이대로만 하면 주말이 오기 전에는 ppt까지 마무리할 수 있을 것으로 보인다.주말에는 ADsP 좀 봐야지..
반응형
'TIL' 카테고리의 다른 글
내배캠 TIL 41일차 (0) | 2024.02.19 |
---|---|
내배캠 TIL 40일차 (0) | 2024.02.15 |
내배캠 TIL 37일차 (0) | 2024.02.08 |
내배캠 TIL 36일차 (1) | 2024.02.07 |
내배캠 TIL 35일차 (0) | 2024.02.06 |