반응형 pandas20 내배캠 TIL 28일차 1. Git 특강 Git이란 개발자들을 위한 워크스페이스. 브랜치(지사와 같은)를 따서 이런 저런 개발을 해보는 것이 가능. 내가 공부한 흔적들을 기록하는 것도 가능. vs code보다 코랩을 즐겨 사용하기 때문에 코랩과 연동하는 법을 찾아봐야겠다. 코랩에서 새 노트 열기를 보면 좌측 탭에 Github이 존재한다. 생각보다 순조로울 거 같다. 2. 기초 통계 강의 ANOVA 이후에 정규성, 등분산 검정에 관한 내용. 이후 선형 회귀에 관한 내용. OLS, MLE에 관한 내용. MLE는 다루지 않았지만 보면 좋을 듯 하다 수식 자체는 너무 깊은 내용이라 자세히 다뤄주시지 않는다. 계량경제학이나 경제통계학. 시계열분석 강의 들을 때가 생각나서 재밌...지는 않고 그립...지도 않다. 요지는 result su.. 2024. 1. 26. 내배캠 TIL 26일차 1. 데이터 분석 과제 1) 날짜 전처리 log_date col을 pd.to_datetime 으로 그냥 사용 시. YY-MM-DD의 구조로 읽어오지 않음. df.log_date = pd.to_datetime(df.log_date, format='%y-%m-%d') 위와 같이 format 인수를 추가해줘야 했다. condition = (df['log_date'] >= '2019-02-01') & (df['log_date'] 2024. 1. 24. 내배캠 TIL 24일차 1. 팀 프로젝트 '금융' 도메인을 중심으로 한 팀이 편성되었다. 다들 금융보다는 스포츠를 좋아하시는 듯 하다. 관심사가 비슷하니 추후에 프로젝트를 진행하는 것 또한 수월할 듯 하다. 2. 데이터 전처리/시각화 1) 전처리 (1) concat import pandas as pd result = pd.concat([데이터프레임들], axis=0(상하, 디폴트)) result = pd.concat([데이터프레임들], axis=1(좌우)) 이어 붙이는 메서드. 데이터 프레임 간의 행,열 갯수가 일치하지 않을 경우의 빈 값들은 결측치(NaN)으로 처리된다. 그럴 경우 dropna()나 fillna()를 통한 전처리 필요. 중복되는 row가 생겨 처리할 경우. drop_duplicates() 사용. (2) me.. 2024. 1. 22. 내배캠 5주차 WIL 지난 1주일을 돌아보며... Facts 1. 기초 프로젝트 완료 - 기초 프로젝트 PPT 디자인. - row 데이터 정체 및 기초 인사이트 도출. 2. Python 개인과제 피드백 - 파이썬 알고리즘 개인 과제 결과 확인. - 개선 사항 도출. Feelings 1. 데이터 분석보다 그 전과정이 어렵고 오래걸린다 : 기초 프로젝트 피드백에서도 그 부분에서 튜터분들의 도움을 많이 받았으면 했다고 말씀해주셨다. 2. 개인과제 피드백 관련 : 자기 색깔을 가져가는 것도 좋지만 결국에는 출제자(클라이언트)의 의도를 파악하고 그대로 시행하는 것이 중요하다. Findings 1. DBeaver 데이터베이스 생성, 삭제, 관리법 2. Pandas Encoding Method Future 강의의 구성이 Python으로 .. 2024. 1. 19. 이전 1 2 3 4 5 다음 반응형