반응형 sklearn10 내배캠 TIL 30일차 1. 머신러닝 강의 1) 데이터 수집 (1) 회사에 있는 거. (2) 다운받기. - csv - API 이용 : pd.read_json 등. - 크롤링 : requests, BeautifulSoup(후자 방법은 별로 안 좋아함) . 2) 탐색적 데이터 분석 (EDA) (1) 시각화를 통한 EDA - matplotlib, seaborn. (2) 비지도학습을 통한 EDA : 지도학습할 건덕지를 찾기 위해 비지도학습을 하기도 함. 3) 데이터 전처리 EDA를 통해 전처리 방법을 고안할 것. (1) 범주형 데이터 : 최빈값 대치 - drona(), fillna() - sklearn.impute.SimpleImputer : 통계량으로 대치. - sklearn.impute.IterativeImputer : 다변량대치.. 2024. 1. 30. 내배캠 TIL 29일차 1. 데이터 분석 개인 과제 해설 1) numpy와 pandas는 분산 계산시 적용하는 자유도가 다르니 주의 2) boolean 인덱싱 사용시 ~을 앞에 붙이면 not이 된다. 코드 리뷰를 같이 하면서 라이브 코딩을 하는 느낌의 해설이었다. 2. 머신러닝 강의 1) 머신러닝의 종류 (1) 지도학습. (2) 비지도학습. (3) 강화학습. 2) Gauss - Markov 정리 여러가지 회귀식 추정이 있고 그 중 몇 추정법을 위해서는 몇가지 가정이 필요한데 이를 "Gauss - Markov 정리" 라 한다. (1) 선형성 : 종속변수 y는 선형결합의 형태. (2) 오차항의 기댓값은 0이다. (3) 오차항은 등분산성을 가진다. (4) 오차항끼리는 독립이다(자기상관 x). (5) 독립변수와 오차항은 독립이다(공분.. 2024. 1. 29. 이전 1 2 3 다음 반응형