PCA/1주차

· PCA/1주차
1. Effect on the mean 원래의 dataset에 2를 더하면 mean(평균)에 어떤 변화가 생길까? 아주 간단하게 평균값이 2만큼 더 커진 것을 확인할 수 있다. 원래의 dataset에 2를 곱하면 mean(평균)에 어떤 변화가 생길까? 원래의 평균의 2배가 되는 것을 알 수 있다. 이를 일반화한식이 마지막에 적혀있다. 2. Effect on the (co)variance variance는 데이터가 얼마나 흩어져있는지 모여있는지를 파악하는 지표이기 때문에 특정 값을 더한다고 하더라도 분산 자체는 변하지 않는다. 하지만 variance를 구하는 방식이 '데이터들이 평균으로부터 떨어진 거리의 제곱 합'이므로, 특정 값을 곱하게 되면 분산은 그 값의 제곱만큼 커지게 된다. 이를 2차원 이상(다차..
· PCA/1주차
1. Variance of one-dimensional datasets D1 데이터셋에 포함되는 데이터들은 파란색 점으로, D2 데이터셋에 포함되는 데이터들은 빨간색 사각형으로 표현된다. 두 데이터셋은 같은 평균값을 가지지만 그 분포가 다르다는 것을 확인할 수 있다. 각 데이터셋의 평균값을 구하고 각 데이터들과의 편차를 구해본다. 계산해보면 D1에서 구한 것이 D2에서 구한 것보다 작다. 즉, D2의 분산이 더 큰 것이다. 분산은 데이터들이 얼마나 집중되어 있는지를 나타내는 지표로 쓰이게 된다. 구하는 식이 제곱의 합이므로 0이상의 값을 갖게 된다. 이 분산에 루트를 씌운 것을 standard variation(표준 편차)이라고 부른다. 2. Variance of 1D datasets 데이터셋의 평균,..
· PCA/1주차
1. Mean of a dataset 데이터가 늘어날수록 흐려진다(blur) mean은 데이터를 대표하는 값으로 데이터셋에 포함되지 않는 값이 mean이 될 수 있다. 어떤 데이터셋의 모든 원소를 더하고 그 개수로 나누어주면 mean(평균)이 된다. 설명했던 것처럼 데이터셋에 포함되지 않는 값인 3.8이 이 데이터셋을 대표하는 값이 된다. 2. Mean of datasets 단순한 집합의 평균을 구하기(1문제) 벡터끼리의 평균을 구하기(3문제) 벡터에 scalar를 더하거나 곱한 뒤에는 평균이 어떻게 변할까? 표본 평균 구하기(1문제) n-1번째의 표본 평균에 특정 데이터가 추가되었을 경우 n번째의 표본 평균을 식으로 나타내기 평균(mean)의 정의를 전개하여 식을 조작해야 한다. 2차원을 1차원으로 ..
chanmuzi
'PCA/1주차' 카테고리의 글 목록