1. Landmark Detection
- 사람의 얼굴은 여러 가지 특징을 갖고 있습니다.
우리는 이 특징들을 기반으로 윤곽을 잡는 등 인식의 정확도를 높일 수 있죠. - 예를 들어 눈의 가장 자리, 코의 가장 자리, 입의 가장 자리 등을 캐치할 수 있습니다.
- 이를 landmark라고 부릅니다.
이 예시에서는 얼굴이라는 사물에 64개의 landmark가 존재하는 경우를 보고 있습니다.- 따라서 출력 차원의 벡터는, '이 사진에 얼굴이 있는지 없는지'와 'x, y' 좌표 64개쌍을 포함합니다.
- 결과적으로 129 차원이 됩니다.
- 이와 같은 개념을 사람의 신체 구조를 따는데도 적용할 수 있습니다.
2. Object Detction
Car detection example
- 이번에는 한 이미지 내에서 여러 개의 사물을 탐지해내는 상황을 살펴봅시다.
- Training set은 각각 이미지와 이미지 내에 사물이 존재하는지가 쌍으로 구성되어 있습니다.
- 하나의 이미지에 대해 여러 개의 레이블이 존재한다는 뜻인지.. 잘 이해가 안되네요.
Sliding windows detection
- 마치 convolutional neural network에서 이미지에 대해 filter를 적용하는 것과 유사합니다.
이 window를 계속해서 이동하면서 해당 위치에 사물이 존재하는지 그렇지 않은지를 확인하고 학습을 진행합니다. - 이 window 사이즈도 변경을 하면서 학습을 거듭하면 정확도를 높일 수 있습니다.
- 그러나 computational cost 문제가 존재합니다.
즉, 하나의 이미지에 대해서도 엄청나게 많은 횟수의 연산이 수행되기 때문에 자원이 많이 필요하다는 뜻이죠.
이를 해결하기 위한 좋은 방법들이 존재하는데 이후 강의에서 다룬다고 합니다.
출처: Coursera, Convolutional Neural Networks, DeepLearning.AI
'Convolutional Neural Networks > 3주차' 카테고리의 다른 글
Anchor Boxes (0) | 2023.03.31 |
---|---|
Intersection Over Union, Non-max Suppression (0) | 2023.03.31 |
Bounding Box Predictions (0) | 2023.03.31 |
Convolutional Implementation of Sliding Windows (0) | 2023.03.30 |
Object Localization (0) | 2023.03.30 |