Training
- 지금까지의 내용을 종합한 YOLO 알고리즘에 대한 예시입니다.
- 이전 예시와 마찬가지로 anchor box는 두 개이고 class는 세 개이므로 출력 차원은 (3, 3, 16)이 됩니다.
- 기본적으로 anchor box 한 개는 Pc, x, y, h, w 다섯 개의 정보를 가지고 있습니다.
- 여기에 클래스의 개수 3을 더하면 각 anchor box는 8차원이 됩니다.
- 3 x 3 은 이미지를 9개의 cell로 쪼갰기 때문입니다. 실제로는 19 x 19 라고 이전 강의에서 언급되었습니다.
Making predictions
- 이전 내용을 기억하실지 모르겠습니다만, Pc=0인 경우 bounding box나 class에 대한 결과는 무시됩니다.
- don't care라는 표현을 썼었습니다.
- 그렇지 않고 Pc=1인 경우, 각 예측 결과와의 차이를 통해 loss를 구할 수 있습니다.
Outputting the non-max supressed outputs
- 마지막으로 non-max suppression까지 적용하면 위와 같은 결과를 볼 수 있습니다.
- 다시 한 번 내용을 상기하면,
- anchor box를 기준으로 IoC가 낮은 예측 결과들은 아예 삭제합니다.
- 확률값이 가장 높은 예측 결과를 기준으로 삼아 반복적으로 IoC가 낮은 결과들을 삭제합니다.
- 마지막으로 non-max suppression을 적용하면 가장 이상적인 bounding box가 도출됩니다.
출처: Coursera, Convolutional Neural Networks, DeepLearning.AI
'Convolutional Neural Networks > 3주차' 카테고리의 다른 글
Semantic Segmentation with U-Net (0) | 2023.04.01 |
---|---|
Region Proposals (Optional) (0) | 2023.03.31 |
Anchor Boxes (0) | 2023.03.31 |
Intersection Over Union, Non-max Suppression (0) | 2023.03.31 |
Bounding Box Predictions (0) | 2023.03.31 |