반응형
1. 통계학 기초 강의
1) 평균
(1) 평균의 종류
① 산술평균
: 일반적으로 생각하는 평균 = (a + b) / 2
아래 평균은 시간의 흐름에 따른 변화량의 평균 산출.
② 기하평균
: 비율의 평균 = (ab) ** (1/2)
- 숫자들의 로그값에 대해 산술평균을 구한 뒤,
지수 함수를 취한 것과 같다.
ex) 연평균수익률
③ 조화평균
: 값의 평균 = 2(a + b) / ab
- 역수의 산술평균을 구해 다시 역수 취하기.
ex) 주행거리를 모를 때의 평균 속력 구하기.
④ 로그평균
: 각 관측치를 자연로그변환한 뒤 산술평균을 집계.
= (1/n) * ∑ ln(Xi)
- 이상치와 왜도에 강건
- 이는 로그변환이 preprocessing에서의 scaling이기 때문.
⑤ 절삭평균
: 상/하위 데이터를 일부 제거한 뒤 산술평균 산출.
- 이상치에 강건, 왜도에는 취약 가능.
(2) 평균 값에 영향을 주는 요소
왜도 : 특정한 방향으로 데이터가 쏠려있는 것.
- 중앙값이 더 적절
이상치 : 다른 관측치와 유의하게 다른 데이터.
- 경연 심사 때 최대 최소 점수를 빼고 총점 산정한다든지.
2) 모수
다양한 모수들.
강의에서는 다양한 평균이라고 나와있지만
아마 모수를 말하고 싶으셨던 거 같다.
평균은 모수의 한 종류일 뿐이다.
모수 : 모집단의 특성치
평균 : 모수 중 하나
(1) 산술 평균
: 우리가 아는 그 평균.
(2) 중앙값
: 왜도에 강한 모수
n이 짝수인 경우 가운데 두 수의 산술평균을 중앙값으로 한다.
(3) 최빈값
: 데이터의 타입이 명목형일 때 쓰임.
2. 금융 도메인 관련 주제
1) 주식 관련 - 주가 데이터 분석을 통한 대응 방안 추천
: SP500, KOSPI200, 미연준의 금리 변동 뉴스 시기와 변동 정도 등을 join하여
국장에 어떤 영향을 주는지,
어느정도 영향을 주는지,
연준의 뉴스 이후 얼마나 이후에 영향을 받는지 등을 분석.
-> 주식은 언제나 핫한 주제이기도 하고, 주가를 긁어오는 라이브러리가 있기 때문에
데이터를 구하기도 어렵지는 않을 거 같다.
-> 액션 플랜은 연준의 금리 인상, 동결, 인하 -> 3가지 경우의 수
SP500의 상승 하락 동결의 3가지 경우의 수
사용자의 투자 성향 - 위험선호, 기피, 중립을 따져
9가지? 정도로 나뉠 수 있다고 생각.
사실은 27가지이지만 투자 성향과 상관없이 모든 방안을 제시하는 것이 좋음.
2) 카드 결제 관련 - 롯데카드 결제 데이터 분석을 통한 새 신용카드 혜택 기획.
: 카드 결제 트랜드 데이터 분석을 통해
특정 시즌에 자주 결제되는 카테고리에 할인 혜택을 주는
카드상품을 해놓는다는지,
기본적으로 어떤 혜택을 넣어야 해당 카드를 많이 발급할지 등.
-> datus에서 무료로 제공하는 롯데카드 데이터가 꽤 있다
데이터를 구하기는 쉬울 것이다.
-> 액션플랜은 트랜드를 따른 1안과, 스테디샐링을 위한 1안,
별 혜택이 존재하지 않았던 블루오션으로 1안?
총 3안 정도.
반응형
'TIL' 카테고리의 다른 글
내배캠 TIL 27일차 (1) | 2024.01.25 |
---|---|
내배캠 TIL 26일차 (1) | 2024.01.24 |
내배캠 TIL 24일차 (1) | 2024.01.22 |
내배캠 TIL 23일차 (0) | 2024.01.19 |
내배캠 TIL 22일차 (0) | 2024.01.18 |