반응형 matplotlib14 내배캠 TIL 30일차 1. 머신러닝 강의 1) 데이터 수집 (1) 회사에 있는 거. (2) 다운받기. - csv - API 이용 : pd.read_json 등. - 크롤링 : requests, BeautifulSoup(후자 방법은 별로 안 좋아함) . 2) 탐색적 데이터 분석 (EDA) (1) 시각화를 통한 EDA - matplotlib, seaborn. (2) 비지도학습을 통한 EDA : 지도학습할 건덕지를 찾기 위해 비지도학습을 하기도 함. 3) 데이터 전처리 EDA를 통해 전처리 방법을 고안할 것. (1) 범주형 데이터 : 최빈값 대치 - drona(), fillna() - sklearn.impute.SimpleImputer : 통계량으로 대치. - sklearn.impute.IterativeImputer : 다변량대치.. 2024. 1. 30. 내배캠 TIL 28일차 1. Git 특강 Git이란 개발자들을 위한 워크스페이스. 브랜치(지사와 같은)를 따서 이런 저런 개발을 해보는 것이 가능. 내가 공부한 흔적들을 기록하는 것도 가능. vs code보다 코랩을 즐겨 사용하기 때문에 코랩과 연동하는 법을 찾아봐야겠다. 코랩에서 새 노트 열기를 보면 좌측 탭에 Github이 존재한다. 생각보다 순조로울 거 같다. 2. 기초 통계 강의 ANOVA 이후에 정규성, 등분산 검정에 관한 내용. 이후 선형 회귀에 관한 내용. OLS, MLE에 관한 내용. MLE는 다루지 않았지만 보면 좋을 듯 하다 수식 자체는 너무 깊은 내용이라 자세히 다뤄주시지 않는다. 계량경제학이나 경제통계학. 시계열분석 강의 들을 때가 생각나서 재밌...지는 않고 그립...지도 않다. 요지는 result su.. 2024. 1. 26. 내배캠 TIL 24일차 1. 팀 프로젝트 '금융' 도메인을 중심으로 한 팀이 편성되었다. 다들 금융보다는 스포츠를 좋아하시는 듯 하다. 관심사가 비슷하니 추후에 프로젝트를 진행하는 것 또한 수월할 듯 하다. 2. 데이터 전처리/시각화 1) 전처리 (1) concat import pandas as pd result = pd.concat([데이터프레임들], axis=0(상하, 디폴트)) result = pd.concat([데이터프레임들], axis=1(좌우)) 이어 붙이는 메서드. 데이터 프레임 간의 행,열 갯수가 일치하지 않을 경우의 빈 값들은 결측치(NaN)으로 처리된다. 그럴 경우 dropna()나 fillna()를 통한 전처리 필요. 중복되는 row가 생겨 처리할 경우. drop_duplicates() 사용. (2) me.. 2024. 1. 22. 내배캠 TIL 21일차 팀 프로젝트 1) PPT - Bold 대신에 Light와 Medium으로 악센트를 표현하기. - 너무 요소를 빼기보다는 적당한 글머리기호 등을 추가하는 것이 눈에 잘 들어옴. - 색이 너무 쨍하면 투명도를 줘보기. 완성된 내용을 바탕으로 PPT 디자인을 하였다. 디자인도 팀장님께서 주신 템플릿에 내용을 삽입하고 전반적인 색감을 조정하는 정도? Adobe Color - https://color.adobe.com/ko/create/color-wheel 위 파레트 사이트를 통해서 PPT에 들어갈 색상을 정하였다. 우리의 메인 컬러는 티빙의 시그니처 컬러 - 마젠타끼가 있는 레드 덕분에 어렵지 않게 디자인을 마쳤다. 미적감각이라고는 1도 없는 내가 마친 거 보면 컬러 정하는 게 8할 이상은 하는 거 같다. 2).. 2024. 1. 17. 이전 1 2 3 4 다음 반응형