1. Effect on the mean
- 원래의 dataset에 2를 더하면 mean(평균)에 어떤 변화가 생길까?
- 아주 간단하게 평균값이 2만큼 더 커진 것을 확인할 수 있다.
- 원래의 dataset에 2를 곱하면 mean(평균)에 어떤 변화가 생길까?
- 원래의 평균의 2배가 되는 것을 알 수 있다.
- 이를 일반화한식이 마지막에 적혀있다.
2. Effect on the (co)variance
- variance는 데이터가 얼마나 흩어져있는지 모여있는지를 파악하는 지표이기 때문에 특정 값을 더한다고 하더라도 분산 자체는 변하지 않는다.
- 하지만 variance를 구하는 방식이 '데이터들이 평균으로부터 떨어진 거리의 제곱 합'이므로,
특정 값을 곱하게 되면 분산은 그 값의 제곱만큼 커지게 된다. - 이를 2차원 이상(다차원)으로 확장하게 되면 맨 마지막과 같은 일반화된 식이 성립한다.
2차원 이상은 벡터로 표현되기 때문에 행렬의 곱을 위해 transpose함 또한 잊지 않도록 한다.
이에 대한 증명은 아래와 같다.
3. NumPy Tutorial
- numpy는 주로 np로 축약해 import한다.
- np.array를 통해 array를 생성할 수 있다.
- shape를 통해 array의 모양을 파악할 수 있다.
4. Mean/covariance of a dataset + effect of a linear transformation
- 위에서 공부한 내용들을 주피터 노트북을 통해 구현하는 과제였다.
모든 것을 구현하는 것은 아니지만 애초에 내용 자체를 아직 이해하지 못한 것이 많아 다른 자료들을 많이 참고했다. - 한 가지 오류가 있어서 주의할 점이 있다.
과제를 제출하면 분명히 assertion error를 발견하지 못했음에도 불구하고 0점으로 채점이 된다.
forum에서 찾아보니 과제 제출 오류임을 확인할 수 있었다.
이를 해결하기 위해서는 작성한 주피터 노트북 파일을 local(내 컴퓨터)에 저장하고,
과제 목록에서 직접 '내 제출'에 들어가 '제출 자료 작성'을 누른 뒤 파일을 업로드해야 한다. - 아무래도 사전 지식이 많이 필요한 강의다보니 내용은 간단한데 과제를 수행하는게 굉~~장히 어렵다고 느낀다.
빨리 이전 강의들을 수강해야 그나마 비벼볼 수 있을 것 같다 ㅜㅜ
출처: Coursera, Mathematics for Machine Learning: PCA, Imperial College London.
'PCA > 1주차' 카테고리의 다른 글
Variances and covariances (2) | 2022.09.25 |
---|---|
Mean values (0) | 2022.09.24 |