본문 바로가기
반응형

SQL17

내배캠 TIL 28일차 1. Git 특강 Git이란 개발자들을 위한 워크스페이스. 브랜치(지사와 같은)를 따서 이런 저런 개발을 해보는 것이 가능. 내가 공부한 흔적들을 기록하는 것도 가능. vs code보다 코랩을 즐겨 사용하기 때문에 코랩과 연동하는 법을 찾아봐야겠다. 코랩에서 새 노트 열기를 보면 좌측 탭에 Github이 존재한다. 생각보다 순조로울 거 같다. 2. 기초 통계 강의 ANOVA 이후에 정규성, 등분산 검정에 관한 내용. 이후 선형 회귀에 관한 내용. OLS, MLE에 관한 내용. MLE는 다루지 않았지만 보면 좋을 듯 하다 수식 자체는 너무 깊은 내용이라 자세히 다뤄주시지 않는다. 계량경제학이나 경제통계학. 시계열분석 강의 들을 때가 생각나서 재밌...지는 않고 그립...지도 않다. 요지는 result su.. 2024. 1. 26.
내배캠 TIL 27일차 1. 통계학 기초 강의 1) 중심극한정리 독립적이고 동일한 분포를 갖는 확률분포의 확률변수는 그 표본의 수가 충분히 커지면 표본평균의 분포가 정규 분포를 따른다. 따라서 정규분포를 이용하면 원래의 분포와 상관없이 평균에 대한 통계 모델 제작 가능. 그러나 현실에서는 데이터마다 정규분포에 수렴하게 해주는 표본수(N)가 다르거나 독립적이고 동일한 분포를 가지지 않음. 1. 독립성 깨짐 : 주가, 날씨(AR model?). 2. 동일성 깨짐 : 성별 구분 없는 신장 집계. 2) t-분포 모평균, 모분산 등. 모집단에 대한 정보를 모르기 때문에 t-분포를 대신 사용. 3) 가설 검정 귀무가설(영가설). 대립가설(우리가 원하는 결과 보통). 1종 오류 : 귀무가설이 맞았는데 기각하는 것. 2종 오류 : 귀무가설이.. 2024. 1. 25.
내배캠 TIL 25일차 1. 통계학 기초 강의 1) 평균 (1) 평균의 종류 ① 산술평균 : 일반적으로 생각하는 평균 = (a + b) / 2 아래 평균은 시간의 흐름에 따른 변화량의 평균 산출. ② 기하평균 : 비율의 평균 = (ab) ** (1/2) - 숫자들의 로그값에 대해 산술평균을 구한 뒤, 지수 함수를 취한 것과 같다. ex) 연평균수익률 ③ 조화평균 : 값의 평균 = 2(a + b) / ab - 역수의 산술평균을 구해 다시 역수 취하기. ex) 주행거리를 모를 때의 평균 속력 구하기. ④ 로그평균 : 각 관측치를 자연로그변환한 뒤 산술평균을 집계. = (1/n) * ∑ ln(Xi) - 이상치와 왜도에 강건 - 이는 로그변환이 preprocessing에서의 scaling이기 때문. ⑤ 절삭평균 : 상/하위 데이터를 .. 2024. 1. 23.
내배캠 TIL 24일차 1. 팀 프로젝트 '금융' 도메인을 중심으로 한 팀이 편성되었다. 다들 금융보다는 스포츠를 좋아하시는 듯 하다. 관심사가 비슷하니 추후에 프로젝트를 진행하는 것 또한 수월할 듯 하다. 2. 데이터 전처리/시각화 1) 전처리 (1) concat import pandas as pd result = pd.concat([데이터프레임들], axis=0(상하, 디폴트)) result = pd.concat([데이터프레임들], axis=1(좌우))​ 이어 붙이는 메서드. 데이터 프레임 간의 행,열 갯수가 일치하지 않을 경우의 빈 값들은 결측치(NaN)으로 처리된다. 그럴 경우 dropna()나 fillna()를 통한 전처리 필요. 중복되는 row가 생겨 처리할 경우. drop_duplicates() 사용. (2) me.. 2024. 1. 22.
반응형