PCA

· PCA/2주차
1. Inner product: definition 내적은 이와 같이 정의된다. 벡터공간 v에 존재하는 세 벡터 x,y,z를 예시로, 내적의 세 가지 큰 특징을 알 수 있다. 1) Bilinear: 벡터의 합으로 표현된 벡터와 다른 벡터의 내적은 두 내적의 합으로 표현될 수 있다. 2) Positive definite: 자기 자신과의 내적의 값은 항상 0보다 크다. 자기 자신과의 내적의 값이 0이라는 것은 그 벡터가 영벡터라는 것과 필요충분 조건이다. 3) Symmetry: 두 벡터의 내적값은 순서를 바꿔도 동일하다. 대각성분을 제외한 다른 원소들은 대각성분을 기준으로 대칭을 이룬다. 2. Properties of inner products 특정함수 β(x,y) 의 알맞은 특성 고르기(5문제) symm..
· PCA/1주차
1. Variance of one-dimensional datasets D1 데이터셋에 포함되는 데이터들은 파란색 점으로, D2 데이터셋에 포함되는 데이터들은 빨간색 사각형으로 표현된다. 두 데이터셋은 같은 평균값을 가지지만 그 분포가 다르다는 것을 확인할 수 있다. 각 데이터셋의 평균값을 구하고 각 데이터들과의 편차를 구해본다. 계산해보면 D1에서 구한 것이 D2에서 구한 것보다 작다. 즉, D2의 분산이 더 큰 것이다. 분산은 데이터들이 얼마나 집중되어 있는지를 나타내는 지표로 쓰이게 된다. 구하는 식이 제곱의 합이므로 0이상의 값을 갖게 된다. 이 분산에 루트를 씌운 것을 standard variation(표준 편차)이라고 부른다. 2. Variance of 1D datasets 데이터셋의 평균,..
· PCA/1주차
1. Mean of a dataset 데이터가 늘어날수록 흐려진다(blur) mean은 데이터를 대표하는 값으로 데이터셋에 포함되지 않는 값이 mean이 될 수 있다. 어떤 데이터셋의 모든 원소를 더하고 그 개수로 나누어주면 mean(평균)이 된다. 설명했던 것처럼 데이터셋에 포함되지 않는 값인 3.8이 이 데이터셋을 대표하는 값이 된다. 2. Mean of datasets 단순한 집합의 평균을 구하기(1문제) 벡터끼리의 평균을 구하기(3문제) 벡터에 scalar를 더하거나 곱한 뒤에는 평균이 어떻게 변할까? 표본 평균 구하기(1문제) n-1번째의 표본 평균에 특정 데이터가 추가되었을 경우 n번째의 표본 평균을 식으로 나타내기 평균(mean)의 정의를 전개하여 식을 조작해야 한다. 2차원을 1차원으로 ..
chanmuzi
'PCA' 태그의 글 목록 (2 Page)