[베이스리뷰 2주차] 간단정리 – SPP (Spatial Pyramid Pooling)

  • SPP: Fast R-CNN에서 참고한 개념. SPPNet에서 제안
  • 요약: Conv Layer에서는 사실 Resolution이 문제되지 않으나, 마지막 FC Layer의 입력 Size는 고정입니다. 이로 인해 Input Image는 무조건 같은 크기로 Resizing해서 모델에 입력해야하는 제약 조건이 생겨나게 되었는데, SPP는 이를 같은 크기의 Feature로 조절해주는 Pooling을 제안합니다.

알고리즘

  1. Input Feature Map을, 미리 정해진 영역 (4×4, 2×2, 1×1 등)으로 분할합니다. 이 때, 분할한 각 영역을 Pyramid라고 합니다.
  2. 여기서는 Pyramid의 갯수가 3개입니다. 이 때 피라미드 내 한 칸(하나의 cell)을 bin이라고 합니다.
  3. 실제 Feature의 크기보다 bin이 더 큰 영역을 나타냅니다. Feature의 각 bin에 해당하는 부분에서 MaxPooling을 수행합니다.
  4. 결과 bin을 Flatten하여 이어붙입니다.
  5. 결과적으로 bin의 갯수는 동일하므로, FC-Layer의 입력은 항상 동일한 값이 됩니다!

“[베이스리뷰 2주차] 간단정리 – SPP (Spatial Pyramid Pooling)”에 대한 한개의 댓글

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다