카메라 기반 물체 검출 딥러닝 기술 심화
Q) 카메라 기반 물체 검출을 하게 되면 물체가 나타났는데 물체 검출을 못 하는 경우도 있고, 물체가 없는데도 물체가 있다고 하는 경우도 있다. 어떤 경우가 더 중요한가?
→ 두 경우는 서로 반대 관계에 있다. 어느 한쪽의 경우의 확률을 높이면 다른 한쪽 경우의 확률은 낮아진다. 상황에 따라 적절하게 결정.
학습 내용)
1.
카메라 기반 물체 검출 기술 개요
2.
카메라 기반 물체 검출 딥러닝 기술
keyword 1)
카메라 기반 물체 검출 기술
→ 카메라 영상에서 단일, 혹은 다중의 물체의 종류와 위치를 추정하는 기술
keyword 2)
데이터 Augmentation 기법
→ 트레이닝 데이터를 인공적으로 가공하여 추가적인 데이터셋 생성
keyword 3)
물체 검출기 성능 평가
→ 정답 박스와 출력 박스 사이에 겹치는 면적을 기반으로 평가
카메라 기반 물체 검출 기술 개요
•
카메라 영상에서 단일, 혹은 다중의 물체의 종류와 위치를 추정하는 기술
•
물체의 위치는 물체를 포함하는 2차원 바운딩 박스로 표현
Convolutional Neural Network (CNN) 사용
→ 카메라 영상으로부터 추상적인 특징 지도 추출
•
각 원소마다 앵커 박스 이용
◦
앵커 박스 : 각 원소마다의 기준 박스
•
상대 변위 추정, 물체 분류 수행
카메라 기반 물체 검출 딥러닝 기술
1차 검출기
•
YOLO, SSD, RetinaNet
2차 검출기
•
RoI Pooling : 물체가 존재한다고 생각되는 영역의 특징값 추출
•
Faster RCNN, Mask R-CNN, Cascade R-CNN
2차 검출기 구조
•
백본 네트워크
◦
카메라 영상에서 원하는 특징값 추출
◦
VGGNet, ResNet 등의 CNN 모델 사용
◦
ImageNet 데이터셋으로 미리 훈련된 가중치를 초기값으로 사용
•
RPN (Region Proposal Network)
◦
백본 네트워크를 통해 나온 특징맵을 이용해 물체의 존재 유무와 위치 검출
◦
앵커 박스를 기준으로 하여 상대 변위 추정
•
RoI Pooling
◦
RPN에서 출력된 박스를 이용하여 백본 네트워크에서 얻은 특징 지도로부터 해당 영역의 특징값 추출
•
Refinement Network
◦
RoI Pooling을 통해 얻은 특징값을 이용해 물체의 정확한 종류 판별 및 위치 추정값 개선
물체 검출 딥러닝 모델의 트레이닝 과정
•
물체의 바운딩박스 라벨링이 되어 있는 트레이닝 데이터 이용
◦
손실합수를 최소가 되도록 종단간(end-to-end) 학습 수행
◦
손실함수의 지역적 최소값을 찾아가야 함
▪
Back Propagation 이용
•
데이터 Augmentation 기법
물체 검출기 성능 평가
성능 평가
•
정답 박스와 출력 박스 사이에 겹치는 면적(IoU)을 기반으로 판별
•
물체검출기의 성능을 Mean Average Precision(mAP)를 기준으로 판별
Precision
◦
물체라고 한 것 중에서 몇개나 맞았는가?
Recall
◦
실제로 물체인 것 중에 몇개나 맞았는가?
•
이 검출기의 성능은 mAP를 계산해서 평가