반응형 TIL54 내배캠 TIL 26일차 1. 데이터 분석 과제 1) 날짜 전처리 log_date col을 pd.to_datetime 으로 그냥 사용 시. YY-MM-DD의 구조로 읽어오지 않음. df.log_date = pd.to_datetime(df.log_date, format='%y-%m-%d') 위와 같이 format 인수를 추가해줘야 했다. condition = (df['log_date'] >= '2019-02-01') & (df['log_date'] 2024. 1. 24. 내배캠 TIL 25일차 1. 통계학 기초 강의 1) 평균 (1) 평균의 종류 ① 산술평균 : 일반적으로 생각하는 평균 = (a + b) / 2 아래 평균은 시간의 흐름에 따른 변화량의 평균 산출. ② 기하평균 : 비율의 평균 = (ab) ** (1/2) - 숫자들의 로그값에 대해 산술평균을 구한 뒤, 지수 함수를 취한 것과 같다. ex) 연평균수익률 ③ 조화평균 : 값의 평균 = 2(a + b) / ab - 역수의 산술평균을 구해 다시 역수 취하기. ex) 주행거리를 모를 때의 평균 속력 구하기. ④ 로그평균 : 각 관측치를 자연로그변환한 뒤 산술평균을 집계. = (1/n) * ∑ ln(Xi) - 이상치와 왜도에 강건 - 이는 로그변환이 preprocessing에서의 scaling이기 때문. ⑤ 절삭평균 : 상/하위 데이터를 .. 2024. 1. 23. 내배캠 TIL 24일차 1. 팀 프로젝트 '금융' 도메인을 중심으로 한 팀이 편성되었다. 다들 금융보다는 스포츠를 좋아하시는 듯 하다. 관심사가 비슷하니 추후에 프로젝트를 진행하는 것 또한 수월할 듯 하다. 2. 데이터 전처리/시각화 1) 전처리 (1) concat import pandas as pd result = pd.concat([데이터프레임들], axis=0(상하, 디폴트)) result = pd.concat([데이터프레임들], axis=1(좌우)) 이어 붙이는 메서드. 데이터 프레임 간의 행,열 갯수가 일치하지 않을 경우의 빈 값들은 결측치(NaN)으로 처리된다. 그럴 경우 dropna()나 fillna()를 통한 전처리 필요. 중복되는 row가 생겨 처리할 경우. drop_duplicates() 사용. (2) me.. 2024. 1. 22. 내배캠 TIL 23일차 1. Python 개인 과제 리뷰 1) 제품 재고 관리 피드백 : 로직 구조가 잘 보이는 직관적인 코드. 로직구조라는 것을 잘 이해하지는 못했지만 잘하신 부분이라고 언급해주셨으니 좋긴 하다. 2) 이메일 주소 유효성 검사 오답! 피드백1 : 이메일의 점검 로직이 잘 보임. 피드백2 : .com을 유효한 도메인으로 걸러내지 못함. 결국은 문의 드렸던 사항이 수용되지 않아 오답처리 되었다. @ 2개는 문제의 조건에 없지만 걸러야 한다고 했으면서.... 3) 마라톤 미 완주자 찾기 피드백: continue를 통한 리스트 그대로의 문제풀이. 다른 분들의 정답을 보면 최빈값을 통해서 찾는다든지. 다양한 답안이 나왔서 그 부분도 생각해보면 좋을 듯 하다. 4) 고객 데이터 관리 시스템 피드백1 : very good.. 2024. 1. 19. 이전 1 ··· 5 6 7 8 9 10 11 ··· 14 다음 반응형