목록논문 리뷰 (7)
귀퉁이 서재
캐스케이드 검출기는 물체(특히 얼굴)를 탐지하는 데 사용하는 검출기입니다. 통합 이미지(integral image), AdaBoost를 활용한 피처 선택, 캐스케이드 구조를 사용한다는 특징이 있는 검출기죠. 캐스케이드 검출기에 관한 논문은 CVPR(Computer Vision and Pattern Recognition) 2001에서 발표되었습니다. 캐스케이드 검출기 논문을 번역/설명해 봤습니다. 논문에 나온 글을 번역하면서 추가로 필요한 설명도 상세하게 덧붙였고요. 틀린 내용이 있으면 피드백 부탁드립니다(퇴고를 하지 않아 문장이 매끄럽진 않을 수도 있습니다). 논문 제목: Rapid Object Detection using a Boosted Cascade of Simple Features 저자: Paul..
SSD는 여러 합성곱 계층의 피처 맵마다 디폴트 박스로 객체를 탐지하는 모델입니다. 본 글에서 주요 내용 위주로 SSD 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: SSD: Single Shot MultiBox Detector 저자: Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg 개정 발표: 2016년 12월 (첫 발표: 2015년 12월) Abstract 본 연구진은 단일 깊은 신경망(single deep neural network)을 사용한 객체 탐지 기법, SSD를 제안합니..
Faster R-CNN은 기존 Fast R-CNN에 영역 추정 네트워크(RPN)를 더해 속도와 성능을 끌어올린 모델입니다. Faster R-CNN에 와서야 비로소 모든 객체 탐지 구조를 딥러닝으로 훈련할 수 있었습니다. 본 글에서 주요 내용 위주로 Faster R-CNN 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 저자: Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun 개정 발표: 2016년 1월 (첫 발표: 2015년 6월) Abst..
본 글에서 주요 내용 위주로 Fast R-CNN 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: Fast R-CNN 저자: Ross Girshick 기관: Microsoft Research 개정 발표: 2015년 9월 (첫 발표: 2015년 4월) Abstract 본 논문에서는 '빠른 공간 기반 합성곱 신경망 모델(Fast Region-based Convolutional Network method, Fast R-CNN)'을 소개합니다. Fast R-CNN은 이전의 R-CNN이나 SPP-net과 비교해, 속도도 빠르고 성능도 좋습니다. Fast R-CNN은 PASCAL VOC 2012에서 R-CNN보다 VGG16 네트워크를 9..
본 글에서 주요 내용 위주로 SPP-net 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 저자: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun 개정 발표: 2015년 4월 (첫 발표: 2014년 6월) Abstract 심층 합성곱 신경망(CNN)에는 고정된 크기(ex. 224 x 224)를 갖는 이미지를 입력해야 합니다. CNN의 전결합 계층 크기가 일정해서 입력 이미지의 크기도 고정되어야 합니다. 기존 R-CNN에서 warping을 하는 이유..
최초로 객체 탐지에 CNN을 적용한 알고리즘이 R-CNN입니다. 본 글에서 주요 내용 위주로 R-CNN 논문을 번역/정리했습니다. 글 중간에 로 부연 설명을 달아놓기도 했습니다. 틀린 내용이 있으면 피드백 부탁드립니다. 논문 제목: Rich feature hierarchies for accurate object detection and semantic segmentation 저자: Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik 기관: UC Berkeley 개정 발표: 2014년 10월 (첫 발표: 2013년 11월) Abstract 객체 탐지(Object Detection) 성능은 (2014년을 기준으로) 지난 몇 년 간 정체되었습니다. 본 논..
본 글은 YOLO 논문 전체를 번역 및 설명해놓은 글입니다. 크게 중요하지 않은 부분을 제외하고는 대부분의 글을 번역했고 필요하다면 부가적인 설명도 추가했습니다. 내용이 긴 섹션 끝에는 요약도 추가했습니다. 번역이 이상하다거나 틀린 내용이 있다면 피드백 부탁드립니다. Abstract YOLO 연구진은 객체 검출(object detection)에 새로운 접근방식을 적용했습니다. 기존의 multi-task 문제를 하나의 회귀(regression) 문제로 재정의했습니다. YOLO는 이미지 전체에 대해서 하나의 신경망(a single neural network)이 한 번의 계산만으로 bounding box와 클래스 확률(class probability)을 예측합니다. -> bounding box란 객체의 위치를..