반응형
클러스터링 강의
1. 거리
1) 유클라디안 거리.
- 통상적인 최단거리.
2) 맨해튼 거리.
- 좌표 차의 합.
3) 민코프스키 거리.
- 1), 2)를 결합하여 동시에 나타낸 것.
4) 코사인 거리.
- 두 벡터 사이의 세타값에 따른 유사도를 구함.
- 코사인 유사도(SIM) = 내적 / 두 벡터 의 크기의 곱.
- 코사인 거리 = 1 - SIM
5) 자카드유사도.
- 두 벡터의 성분에 대해
합집합에 대한 교집합의 비율.
- 넘파이 모듈을 통해 계산할 때에는 사용되는 array의 크기가 같아야 한다
2. 벡터와 행렬의 연산.
(1) np.dot.
- 단순한 벡터(행렬)의 곱셈 연산.
- 1차원 배열의 경우에는 broadcating이라는 법칙을 따름.
- 다차원 배열(행렬)의 경우에는 행렬의 곱셈을 위한 조건을 충족시켜야 함.
ex) (n x m)(m x n) = (n x n) 에서 곱셈을 위해 각 m이 일치해야 하는 조건.
(2) np.inner.
- 벡터의 내적.
- 1차원 배열에서 (1)과 아웃풋이 같아서 내적 시, (1)을 쓰는 경우가 있는데 inner가 내적이 맞다.
(3) np.cross.
- 벡터의 텐서곱을 의미.
- 벡터끼리 곱해서 벡터가 나오는 선형대 수학에서의 벡터의 외적.
- 3개 좌표를 가지고 있는 3차원 벡터에서만 적용된다고 한다.
- 계산에 사용되는 두 벡터와 직교한다.
(4) np.outer.
- 벡터의 외적.
- 벡터끼리 곱해서 행렬이 나오는 것.
- 계산에 사용되는 벡터 성분의 모든 경우의 수가 결과의 성분이 된다.
- 열벡터끼리의 연산으로 n개, m개 성분을 통해 (n x m)의 행렬이 결과로 나온다.
수학에서 나오는 외적이랑 넘파이 계산에서 나오는 외적이 달라서
굉장히 혼란스러웠다.
일신상의 이유로 블로그를 한동안 작성하지 않았는데ㅠ
스파크에 대한 실습을 내일부터 진행하여
이제부터는 블로그를 성실히 다시 작성 예정이다.
반응형
'TIL' 카테고리의 다른 글
내배캠 TIL 50일차 (0) | 2024.03.27 |
---|---|
내배캠 TIL 49일차 (0) | 2024.03.26 |
내배캠 TIL 47일차 (2) | 2024.03.08 |
내배캠 TIL 46일차 (0) | 2024.03.05 |
내배캠 TIL 45일차 (0) | 2024.03.04 |