본문 바로가기
반응형

ML15

내배캠 TIL 36일차 심화 프로젝트 기초모듈 데이터를 불러오기 위한 기초 모듈과 경고 문구를 없애기 위한 코드 그래프에서의 글꼴 깨짐을 방지하기 위한 코드 등을 도입했다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import sidetable import warnings warnings.filterwarnings(action='ignore') plt.rcParams['font.family'] = 'Malgun Gothic' plt.rcParams['axes.unicode_minus'] = False​ 전처리 결측치 : EDA를 통해서 조금 더 적합한 결측치(Unknown) 처리 방법에 대해 고민해볼 것.. 2024. 2. 7.
내배캠 TIL 35일차 심화 프로젝트 1) 주제 우리 팀의 주제는 고객 대출 등급 분류다. EDA를 통해 특정 변수에 가중치를 둘지 파생변수를 만들지 등등 생각해볼 것이 많은 주제인듯 하다. 금융기관에서도 자사만의 신용등급 평가 모델이 있을테니 그런 측면에서도 좋다. 2) EDA 데이터 수 확인. : 96294 row 방금 발견했는데 row를 그대로 한글자판으로 치면 개s가 된다 복수형 ## 데이터 갯수 df = pd.read_csv('open/train.csv') len(df)​ 결측치 확인. : 결측치는 근로기간 : Unknown, 그리고 표기 양식이 조금씩 다르다 DACON이 약을 풀었다.. 주택상태 : ANY for col in df.columns: print(col, df[col].unique())​ 대출 등급별 특징.. 2024. 2. 6.
내배캠 TIL 33일차 머신러닝 개인 과제 1) 라이브러리를 이용해 데이터 불러오기 데이터 출처와 Github 출처가 주어졌다. 데이터 출처는 csv 형태로 바로 다운 받을 수 있는 것이고, Github에서는 모듈을 제시한다. 채점 환경이 어떨지 모르기 때문에 모듈을 사용하여 저장하기로 하였다. '''문제 시작''' !pip install -U ucimlrepo from ucimlrepo import list_available_datasets, fetch_ucirepo # list_available_datasets()을 통해 필요한 데이터셋의 id 확인 bank_marketing = fetch_ucirepo(id=222) df = bank_marketing['data']['original'] df.to_csv('bank_mar.. 2024. 2. 2.
반응형