본문 바로가기

R-CNN3

RoI(Region of Interest) Pooling 이해하기 객체 탐지 모델을 공부하다보면, 객체를 분류함과 동시에 bbox를 추론하여 제안해야하기 때문에 일반적인 task들과는 달리 부수적인 알고리즘들이 많은 것 같습니다. Fast R-CNN 논문 리뷰 중 나왔던 RoI Pooling에 대해서 살펴봅니다. 1. RoI Pooling을 왜 쓸까? 2. RoI Pooling 원리 1. RoI( Region of Interest ) Pooling을 왜 쓸까? 객체 탐지 모델을 기준으로 설명합니다. 객체 탐지 모델은 CNN으로부터 획득한 Feature map을 원본 영상의 관심영역인 RoI 부분만큼만 이용합니다. RoI 내에 어떤 객체가 있는지 확인하려는 목적입니다. 해당 부분만 분류하기 위해서는 FC layer로 입력해야하는데, fc layer 고정길이의 벡터만 입력.. 2022. 12. 1.
[논문 리뷰] SPPNet(2014) 설명 (Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition) R-CNN에 이어 SPPNet 논문을 리뷰합니다. 사실 SPPNet은 풀링기법을 제안하는 논문이라서 object detection뿐만 아니라 CNN에 전부 적용할 수 있지만, R-CNN에서의 큰 단점을 커버하면서 추천되는 object detection논문들에서 빠지지 않습니다. 해당 논문에서는 "SPP-Net for Object Detection"부분이 있습니다. 이 부분을 위주로 어떻게 적용하는지에 대해 포스팅합니다. 이전 R-CNN 포스팅 1. Abstract 2. 기존 CNN의 문제점 3. Spatial Pyramid Pooling Layer 작동원리 4. R-CNN 적용 5. 문제점 1. Abstract 당시 CNN은 고정된 사이즈의 224x224 해상도의 이미지만 입력 받았습니다. 이 조건은 굉.. 2022. 11. 3.
[논문 리뷰] R-CNN (2014) 설명 위 계보대로 Obj Detection 모델들의 논문을 리뷰해볼까 합니다. Yolo시리즈부터는 조금 자세히 쓰고 그 이전 모델들은 너무 옛날이라 작동방식 정도만 리뷰합니다. 처음부터 공부하시는 분들은 가장 많이 쓰는 최신모델 Yolo만 공부하지 왜 다 읽나? 싶을 수 있는데 우선 저는 그냥 위 순서대로 공부했고, 아마 백그라운드 없이 최신 YoLo부터 보시면 이게뭐야~ 하면서 탑다운으로 쭉 내려와 2-stage detection모델부터 볼 확률이 높습니다 ㅎㅎ.. 특히 YoLov4 논문은... 2-stage detection모델인 R-CNN(2014)부터 리뷰합니다. 1. 1-stage detectior & 2-stage detectior 2. Abstract 3. R-CNN 구조 & 동작 원리 4. 문제.. 2022. 11. 2.