본문 바로가기
반응형

TIL54

내배캠 TIL 34일차 머신러닝 개인 과제 선택과제 1) balance 음수값 보정 2) np.log() 대신 np.log1p 사용 이유 3) 더 나은 인코딩 4) 결측치 처리 3, 4를 한꺼번에 코드에서 다뤘다. (1) 결측치 처리. ## 결측치 확인 df = pd.read_csv('./bank_marketing.csv') df.isnull().sum() ## job, eduaction, contact 까지는 대치할만한데 ## poutcome은 버리는 게 좋을 거 같다 ## 결측치 처리를 위한 모듈 불러오기 from sklearn.impute import SimpleImputer ## 대치는 최빈값으로 imputer = SimpleImputer(missing_values=np.nan, strategy='most_frequen.. 2024. 2. 5.
내배캠 TIL 33일차 머신러닝 개인 과제 1) 라이브러리를 이용해 데이터 불러오기 데이터 출처와 Github 출처가 주어졌다. 데이터 출처는 csv 형태로 바로 다운 받을 수 있는 것이고, Github에서는 모듈을 제시한다. 채점 환경이 어떨지 모르기 때문에 모듈을 사용하여 저장하기로 하였다. '''문제 시작''' !pip install -U ucimlrepo from ucimlrepo import list_available_datasets, fetch_ucirepo # list_available_datasets()을 통해 필요한 데이터셋의 id 확인 bank_marketing = fetch_ucirepo(id=222) df = bank_marketing['data']['original'] df.to_csv('bank_mar.. 2024. 2. 2.
내배캠 TIL 32일차 1. 머신러닝 강의 1) 로지스틱 회귀분석 이전까지는 regression. 로직스틱은 분류. classification. 이를 시그모이드 함수라고 하고. 선형회귀식의 y에 로짓 함수를 대입한다. 2) 회귀분석의 절차 - 필요모듈. # 회귀모형 from sklearn.linear_model import LogisticRegression # 전처리 from sklearn.preprocessing import StandardScaler, MinMaxScaler, LabelEncoder, OneHotEncoder # 데이터 분리 from sklearn.model_selection import train_test_split # 평가 from sklearn.metrics import f1_score, accurac.. 2024. 2. 1.
내배캠 TIL 31일차 1. 머신러닝 강의 1) 실습 (1) 단순선형회귀. 회귀 모듈 불러오기. from sklearn.linear_model import LinearRegression from statsmodels.formula.api import ols​ 학습하기. reg = LinearRegression() reg.fit(X, y) model = ols(formula='y_col ~ X_cols', data=df).fit() 베타값들 구하기. w0 = reg.intercept_[0] w1 = reg.coef_[0][0] w0 = model.params[0] w1 = model.params[1] model.summary().tables[1] 예측하기. pred = reg.predict(X)​ 평가. from sklearn... 2024. 1. 31.
반응형