1. Mean of a dataset
- 데이터가 늘어날수록 흐려진다(blur)
- mean은 데이터를 대표하는 값으로 데이터셋에 포함되지 않는 값이 mean이 될 수 있다.
- 어떤 데이터셋의 모든 원소를 더하고 그 개수로 나누어주면 mean(평균)이 된다.
- 설명했던 것처럼 데이터셋에 포함되지 않는 값인 3.8이 이 데이터셋을 대표하는 값이 된다.
2. Mean of datasets
- 단순한 집합의 평균을 구하기(1문제)
- 벡터끼리의 평균을 구하기(3문제)
- 벡터에 scalar를 더하거나 곱한 뒤에는 평균이 어떻게 변할까?
- 표본 평균 구하기(1문제)
- n-1번째의 표본 평균에 특정 데이터가 추가되었을 경우 n번째의 표본 평균을 식으로 나타내기
- 평균(mean)의 정의를 전개하여 식을 조작해야 한다.
- 2차원을 1차원으로 표현하는 코드 작성하기(1문제)
- 어려운 것은 아니고 numpy의 함수 중 차원을 낮춰주는 함수를 사용하면 된다.
- 나는 reshape(-1)을 사용했는데 flatten을 사용해도 될 것 같다.
출처: Coursera, Mathematics for Machine Learning: PCA, Imperial College London.
'PCA > 1주차' 카테고리의 다른 글
Linear transformation of datasets (2) | 2022.09.25 |
---|---|
Variances and covariances (2) | 2022.09.25 |