안녕하세요. 위기의코딩맨입니다.
오늘은 YOLO에 관해 간단하게 알아보도록 하겠습니다.
You Only Look Once
넌 한번만 보면 된다는 의미를 갖고있는 YOLO..!
난 여러번 봐야되던데...
[ YOLO ]
YOLO가 나왔을 당시 , Faster R-CNN, SSD 등 많은 모델이 있었는데
YOLO는 정확도는 다른 모델에 비해 떨어졌지만, 속도 측면에서 많이 높은 결과로 인해 인기가 올라갔습니다.
간단하게 YOLO는 입력 이미지를 N X N Grid Cell로 나누고 Cell 별로 X개의 Bounding Box를 예측하는 작업을 의미합니다.
YOLO Output = N X N X (5 * B+C) + (5: x,y,w,h,confidence)
N은 Cell 개수, B는 bounding Box 개수, c는 Class 개수,
x,y,w,h 는 아웃풋 Bounding Box의 좌표, confidence는 해당 Bounding Box안에 객체가 존재하는 정도를 나타냅니다.
GoogleNet의 모델을 기반으로 24개의 Convolutions Layer, 2개 Fully Connected layers 로 구성이 되어있습니다.
Detection Procedure와 같은 CNN 모델의 아웃풋을 발생시키는 것이 YOLO라고 할 수 있습니다.
아웃풋이 7*7*30을 의미하는 것은 Grid cell 7*7의 30차원을 의미합니다.
30차원의 백터안에는 아까 YOLO의 Bounding Box에 대한 값들이 들어가있습니다.
처음 5차원은 첫번째 Bounding Box의 값들이 들어가있습니다.
다음 5차원은 다음 Bounding Box의 값들이 들어가 있습니다.
나머지 20개의 차원은 class에 대한 conditional class 확률을 나타냅니다.
해당 데이터들을 토대로
첫번째의 Bounding Box의 Confidence의 값과 conditional class 확률과 곱해서 나오는 outout을 20차원의 벡터로 출력합니다.
마찬가지로 2번째 Bounding Box도 같은 작업을 반복해줍니다.
그렇게되면 모든 Grid cell에 작업을 진행하면 7*7*2 총 98개의 결과값이 나옵니다.
이렇게나온 결과 값을 토대로 Non-MaximumSupperssion을 진행합니다.
Non-Maximum Supperssion의 작업은
위 작업을 진행하면 Output이미지에 총 98개의 Bounding Box가 그려지게 되는데
객체에 대표성을 띄울수 있는 Bounding Box만 남기는 작업을 의미합니다.
오늘은 간단하게 YOLO에 관해 알아보았습니다.
앞으로 천천히 더 깊게 알아가보도록 하겠습니다.
YOLO 논문 내용이 궁금하시면 밑에 블로그를 참고하시면 됩니다.
'AI논문' 카테고리의 다른 글
[We-Co] Training - YOLO, Tensorflow논문 (0) | 2021.10.19 |
---|---|
[We-Co] Unified Detection, Network Design - YOLO, Tensorflow 논문 (0) | 2021.10.17 |
[We-Co] Abstract, Conclusion, Introduction - YOLO, Tensorflow 논문 (0) | 2021.10.13 |
[We-Co] 딥러닝 논문 구성, YOLO 다운로드 - tensorflow, 논문 (0) | 2021.10.12 |
[We-Co] Object Detection Metric (0) | 2021.10.08 |