1. Multivariate chain rule
- t에 관한 n개의 함수 x로 구성된 함수 f를 t에 대해 미분하는 것은 chain rule로 표현 가능하다.
- 이때 편미분벡터와 미분벡터를 내적하는 꼴이 된다.
2. More multivariate chain rule
- 앞서 배운 내용처럼 chain rule은 원래 단변수함수를 바로 미분한 것과 동일한 결과를 가진다.
- 하지만 벡터를 원소로 가지는 경우 위처럼 행렬의 편미분과 미분의 곱으로 표현된다.
- 위 예시에서 앞의 두 개는 Jacobian(편미분을 모아놓은 벡터)이고 행렬의 곱에 따라 1 x 1 사이즈의 결과가 나타난다.
따라서 계산결과는 scalar값이 된다.
3. Multivariate chain rule exercise
- multivariate chain rule을 적용하면 Jacobian의 곱으로 표현되는 것을 이용하면 된다.(5문제)
- 변수 2개, 3개로 구성된 f에 대해 미분하는 것인데 단순히 편미분 결과만 잘 보면 된다.
출처: Coursera, Mathematics for Machine Learning: Multivariate Calculus, Imperial College London.
'Multivariate Calculus > 3주차' 카테고리의 다른 글
Neural Networks (2) | 2022.10.06 |
---|