목록r-cnn (2)
귀퉁이 서재
초창기 객체 탐지 모델인 R-CNN, SPP-net, Fast R-CNN, Faster R-CNN에 관해 알아보겠습니다. 각 객체 탐지 모델의 논문 전체를 따로 정리해 놓았는데, 자세한 내용이 궁금한 분은 아래 링크를 참고해주세요. 논문 리뷰 - R-CNN 톺아보기 논문 리뷰 - SPP-net 톺아보기 논문 리뷰 - Fast R-CNN 톺아보기 논문 리뷰 - Faster R-CNN 톺아보기 이 글에서는 R-CNN, SPP-net, Fast R-CNN, Faster R-CNN의 핵심 구조를 알아보겠습니다. 1. R-CNN 기존 localization 구조의 문제점과 해결 방안 객체 localization을 할 때 원본 이미지와 annotation 정보를 활용합니다. 원본 이미지를 활용해 이미지 분류를 수행..
본 글에서 주요 내용 위주로 SPP-net 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 저자: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun 개정 발표: 2015년 4월 (첫 발표: 2014년 6월) Abstract 심층 합성곱 신경망(CNN)에는 고정된 크기(ex. 224 x 224)를 갖는 이미지를 입력해야 합니다. CNN의 전결합 계층 크기가 일정해서 입력 이미지의 크기도 고정되어야 합니다. 기존 R-CNN에서 warping을 하는 이유..