What are localization and detection?
- 이번에 공부할 내용은 Image classification / Classification with localization입니다.
이는 나중에 배울 Detection에서와 달리 이미지 중앙에 큰 이미지 하나가 있고 이것이 자동차인지 아닌지 구분하는 것이라고 이해하면 쉽습니다. - 나중에는 여러 개의 물체가 존재하는 상황에서 차를 인식할 수 있는지에 대해 배우게 됩니다.
Classification with localization
- 만약 이미지를 보행자 / 차 / 오토바이 / 배경, 네 가지로 구분하는 태스크라면 마지막 출력층에서 softmax를 통해 4개 중 가장 확률이 높은 것을 정답으로 고르면 될 것입니다.
- 하지만 우리는 localization, 즉 사물의 위치를 알아내고 싶기 때문에, 출력차원에서 위치에 관련된 정보, bounding box에 대한 정보가 포함되어야 합니다.
- 이는 bx, by, bw, bh 로 구성되어 있습니다.
- 각각은 사물의 중앙 x 좌표 / 사물의 중앙 y 좌표 / 사물의 폭 / 사물의 높이 입니다.
Defining the target label y
- 지금 단계에서는 이미지 내에 '단 한 개'의 물체가 존재하는지 그렇지 아닌지를 확인하고 있습니다.
따라서 출력 벡터의 차원은 8이 됩니다. - 맨 위에는 물체가 존재한다면 1, 그렇지 않으면 0이 사용됩니다.
- 만약 물체가 존재하지 않아 Pc = 0인 경우, 나머지 값들은 고려하지 않습니다.
즉, loss 계산에서 제외한다는 뜻입니다. - 좌측의 Loss 계산식을 참고하면 좋습니다.
- 만약 물체가 존재하지 않아 Pc = 0인 경우, 나머지 값들은 고려하지 않습니다.
- 그리고 나머지 네 개는 bounding box에 대한 정보입니다.
- 나머지 세 개는 순서대로 c1, c2, c3인데 각각 class 1, 2, 3를 의미합니다.
따라서 이미지에 차가 존재하는 경우 1, 3은 0이 되고 2만 1이 됩니다.
출처: Coursera, Convolutional Neural Networks, DeepLearning.AI
'Convolutional Neural Networks > 3주차' 카테고리의 다른 글
Anchor Boxes (0) | 2023.03.31 |
---|---|
Intersection Over Union, Non-max Suppression (0) | 2023.03.31 |
Bounding Box Predictions (0) | 2023.03.31 |
Convolutional Implementation of Sliding Windows (0) | 2023.03.30 |
Landmark / Object Detection (0) | 2023.03.30 |