4) 코사인 거리. - 두 벡터 사이의 세타값에 따른 유사도를 구함. - 코사인 유사도(SIM) = 내적 / 두 벡터 의 크기의 곱. - 코사인 거리 = 1 - SIM
5) 자카드유사도. - 두 벡터의 성분에 대해 합집합에 대한 교집합의 비율. - 넘파이 모듈을 통해 계산할 때에는 사용되는 array의 크기가 같아야 한다
2. 벡터와 행렬의 연산.
(1) np.dot. - 단순한 벡터(행렬)의 곱셈 연산. - 1차원 배열의 경우에는 broadcating이라는 법칙을 따름. - 다차원 배열(행렬)의 경우에는 행렬의 곱셈을 위한 조건을 충족시켜야 함. ex) (n x m)(m x n) = (n x n) 에서 곱셈을 위해 각 m이 일치해야 하는 조건.
(2) np.inner. - 벡터의 내적. - 1차원 배열에서 (1)과 아웃풋이 같아서 내적 시, (1)을 쓰는 경우가 있는데 inner가 내적이 맞다.
(3) np.cross. - 벡터의 텐서곱을 의미. - 벡터끼리 곱해서 벡터가 나오는 선형대 수학에서의 벡터의 외적. - 3개 좌표를 가지고 있는 3차원 벡터에서만 적용된다고 한다. - 계산에 사용되는 두 벡터와 직교한다.
(4) np.outer. - 벡터의 외적. - 벡터끼리 곱해서 행렬이 나오는 것. - 계산에 사용되는 벡터 성분의 모든 경우의 수가 결과의 성분이 된다. - 열벡터끼리의 연산으로 n개, m개 성분을 통해 (n x m)의 행렬이 결과로 나온다.
수학에서 나오는 외적이랑 넘파이 계산에서 나오는 외적이 달라서 굉장히 혼란스러웠다.
일신상의 이유로 블로그를 한동안 작성하지 않았는데ㅠ 스파크에 대한 실습을 내일부터 진행하여 이제부터는 블로그를 성실히 다시 작성 예정이다.