본문 바로가기
반응형

ML15

내배캠 TIL 46일차 실전 프로젝트 관련 튜터님 피드백 vs code로 너무 오래 걸리면 kaggle이나 코랩을 통해 하는 것이 바람직. gpu를 할당해주기 때문에 노트북보다는 훨씬 빠를 듯 하다. 기존 문제 국내 주식에서 단일 주식에 대하여 가격의 추이 및 예측, 같이 사면 좋을 주식(포트폴리오 이론 기반) 관련 뉴스 등을 제시하는 대시보드를 제작 중이다. 태블로 내에서 공분산 등의 계산이 어렵기에 파이썬으로 미리 계산하여 csv로 내보내려 했다. pykrx에서 기본으로 제공한 국내 주식 티커는 953개. 반복문으로 단순 이중 for문 돌리면 제곱이 되기 때문에 코드 돌리는데 시간이 엄청 길어졌고, 부차적인 문제로 주갸 데이터이다보니 모든 종목의 데이터의 길이가 일치하지 않았다. (각 회사에 귀책되는 문제로 인해 해당 주식.. 2024. 3. 5.
내배캠 TIL 45일차 실전 프로젝트 관련 1. Pandas 이동평균과 차분을 위한 메서드를 검색했다. temp['SMA_120days'] = temp['Close'].rolling(window=120).mean().round() temp['profit'] = ((temp['Close'] - temp['Close'].shift(1)) / temp['Close'].shift(1))*100​ rolling(window)를 통해 원하는 단위의 구간을 설정하여 이동평균을 낸다. shift()를 통해 원하는만큼 lag 오퍼레이터를 실행한다. 2. seaborn prophet 모델에 내장되어 있는 plot을 사용할 수 없기에 비슷하게 구현하려 했다. 신뢰구간이 있을 때, fill_between 메서드가 굉장히 매력적이다. data = d.. 2024. 3. 4.
내배캠 TIL 44일차 태블로 개인과제 관련 과제 자체는 잘 마무리 한 거 같다. 난이도 상이었던 a/b 테스트도 대시보드에 반영해서 만족스러운 마무리였다. t통계량이나 p_value 구하는 과정을 기록해놓으면 좋겠지만 과정이 너무 복잡했다 각 통계량을 만들 때 필요한 계산된 필드를 사전에 만들고 셀 내에서의 계산을 함수로 실행한다 심화 프로젝트 관련 주식데이터 파이프라인 구축 및 분석을 주제로 선정했다. 가이드라인을 보니 데이터 자체를 많이 만지는 작업은 없는 거 같고 지표를 얼마나 잘 생성하는 지가 관건인 주제 같다. 지금 생각나는 지표로는 ~개월 이동평균 수익률은 --입니다 제시 지금 사면 --개월 후에 최대 얼마 가능 제시 해당 주식과 ㅇㅇ 주식이 포트폴리오로 잘 어울립니다 등 떠오르는 것은 많지만 구현할 힘이 없다 2024. 2. 29.
내배캠 TIL 42일차 돌아온 탕자 1. ADsP 지난 주말에 ADsP 시험을 봤습니다. 시험에 시간을 많이 투자하여 태블로 강의와 블로그 작성을 소홀히 했습니다. 결과는 1달 후에나 나오는데 여러 카페 등을 봤을 때 난이도는 여려운 수준이었던 거 같습니다. 좋은 결과가 있기를. 2. 태블로 강의 태블로 강의 및 개인과제가 주어졌습니다. 강의 초반을 들으면서 느낀 점은 굉장히 강력한 BI 툴이라는 점입니다. 여러 형태의 데이터와의 연동이 용이하고 별로 만지지 않아도 기본 탬플릿 또한 예쁜 거 같습니다. 유료만 아니었다면. 1) 워크시트 ⊂ 대시보드 ⊂ 스토리. 2) 사용할 컬럼만 남기고 데이터원본 시트에서 나머지 컬럼을 숨길 것. 워크시트에서는 편집 불가능. 3) 행, 열 설정하는 것은 seaborn과 유사하다. 가령 본인이 .. 2024. 2. 26.
반응형