귀퉁이 서재

컴퓨터 비전 - 3. 객체 Localization 개요 본문

딥러닝 컴퓨터 비전

컴퓨터 비전 - 3. 객체 Localization 개요

Baek Kyun Shin 2022. 4. 25. 21:03

※ 이 글은 권철민 님의 딥러닝 컴퓨터 비전 완벽 가이드 강의를 바탕으로 작성했습니다.

객체 탐지를 설계하려면 먼저 객체 Localization을 알아야 합니다. 이번 시간에는 객체 Localization이 무엇인지 알아봅니다.

객체 Localization 개요

지난 시간에 Localization은 객체의 위치 좌표를 찾는 작업이라고 했습니다. 아래는 이미지 분류와 Localization을 동시에 수행한 예시입니다.

그럼 어떤 방식으로 분류와 Localization을 수행하는지 알아보시죠.

첫 번째는 이미지 분류를 수행하는 방식입니다. CNN을 활용해 원본 이미지에서 특성을 추출하고, 최종적으로 Softmax로 확률을 예측합니다. 위 예시에서는 고양이일 확률 90%, 개일 확률 10%로 나왔네요. 이렇듯 분류 작업은 해당 이미지가 어떤 객체(물체)인지 확률로 판별합니다. 우리가 흔히 신경망으로 하는 작업이죠.

Localization은 물체의 위치 좌표를 찾는 일이라고 했죠. 이미지 분류와 더불어 Localization까지 수행하려면 출력 단계의 신경망 구조를 조금 바꿔야 합니다. 곧, 경계 박스의 좌표를 나타내는 네 가지 출력을 더해야 합니다. 곧, 회귀 구조를 더해야 합니다. 경계 박스의 좌표값을 찾아주는 '경계 박스 회귀'를 수행하는 방식입니다. 이때는 원본 이미지와 함께 Annotation(객체 클래스명과 경계 박스 위치 좌표값 등의 정보)이 데이터로 필요합니다. 그래야 해당 객체가 어떤 위치에 있는지 학습할 수 있습니다. Localization을 수행하도록 신경망의 마지막 계층을 조금 수정해주면 최종적으로 객체 예측 확률과 경계 박스 좌표까지 출력합니다. 이렇게 네 가지 경계 박스 좌표 변수를 더해서 객체 분류 확률뿐 아니라 경계 박스의 위치를 나타내는 네 가지 변수도 함께 학습하는 것입니다.

참고 자료

C4W3L01 Object Localization

0 Comments
댓글쓰기 폼