반응형 분류 전체보기66 내배캠 TIL 32일차 1. 머신러닝 강의 1) 로지스틱 회귀분석 이전까지는 regression. 로직스틱은 분류. classification. 이를 시그모이드 함수라고 하고. 선형회귀식의 y에 로짓 함수를 대입한다. 2) 회귀분석의 절차 - 필요모듈. # 회귀모형 from sklearn.linear_model import LogisticRegression # 전처리 from sklearn.preprocessing import StandardScaler, MinMaxScaler, LabelEncoder, OneHotEncoder # 데이터 분리 from sklearn.model_selection import train_test_split # 평가 from sklearn.metrics import f1_score, accurac.. 2024. 2. 1. 내배캠 TIL 31일차 1. 머신러닝 강의 1) 실습 (1) 단순선형회귀. 회귀 모듈 불러오기. from sklearn.linear_model import LinearRegression from statsmodels.formula.api import ols 학습하기. reg = LinearRegression() reg.fit(X, y) model = ols(formula='y_col ~ X_cols', data=df).fit() 베타값들 구하기. w0 = reg.intercept_[0] w1 = reg.coef_[0][0] w0 = model.params[0] w1 = model.params[1] model.summary().tables[1] 예측하기. pred = reg.predict(X) 평가. from sklearn... 2024. 1. 31. 내배캠 TIL 30일차 1. 머신러닝 강의 1) 데이터 수집 (1) 회사에 있는 거. (2) 다운받기. - csv - API 이용 : pd.read_json 등. - 크롤링 : requests, BeautifulSoup(후자 방법은 별로 안 좋아함) . 2) 탐색적 데이터 분석 (EDA) (1) 시각화를 통한 EDA - matplotlib, seaborn. (2) 비지도학습을 통한 EDA : 지도학습할 건덕지를 찾기 위해 비지도학습을 하기도 함. 3) 데이터 전처리 EDA를 통해 전처리 방법을 고안할 것. (1) 범주형 데이터 : 최빈값 대치 - drona(), fillna() - sklearn.impute.SimpleImputer : 통계량으로 대치. - sklearn.impute.IterativeImputer : 다변량대치.. 2024. 1. 30. 내배캠 TIL 29일차 1. 데이터 분석 개인 과제 해설 1) numpy와 pandas는 분산 계산시 적용하는 자유도가 다르니 주의 2) boolean 인덱싱 사용시 ~을 앞에 붙이면 not이 된다. 코드 리뷰를 같이 하면서 라이브 코딩을 하는 느낌의 해설이었다. 2. 머신러닝 강의 1) 머신러닝의 종류 (1) 지도학습. (2) 비지도학습. (3) 강화학습. 2) Gauss - Markov 정리 여러가지 회귀식 추정이 있고 그 중 몇 추정법을 위해서는 몇가지 가정이 필요한데 이를 "Gauss - Markov 정리" 라 한다. (1) 선형성 : 종속변수 y는 선형결합의 형태. (2) 오차항의 기댓값은 0이다. (3) 오차항은 등분산성을 가진다. (4) 오차항끼리는 독립이다(자기상관 x). (5) 독립변수와 오차항은 독립이다(공분.. 2024. 1. 29. 이전 1 ··· 5 6 7 8 9 10 11 ··· 17 다음 반응형