본문 바로가기
AI논문

[We-Co] YOLO -TensorFlow, 논문

by 위기의코딩맨 2021. 10. 9.
반응형

안녕하세요. 위기의코딩맨입니다.

오늘은 YOLO에 관해 간단하게 알아보도록 하겠습니다.

You Only Look Once 

넌 한번만 보면 된다는 의미를 갖고있는 YOLO..!

난 여러번 봐야되던데...

[ YOLO ]

YOLO가 나왔을 당시 , Faster R-CNN, SSD 등 많은 모델이 있었는데

YOLO 정확도는 다른 모델에 비해 떨어졌지만, 속도 측면에서 많이 높은 결과로 인해 인기가 올라갔습니다. 

 

간단하게 YOLO는 입력 이미지를 N X N Grid Cell로 나누고 Cell 별로  X개의 Bounding Box를 예측하는 작업 의미합니다.

 

YOLO Output = N X N X (5 * B+C) + (5: x,y,w,h,confidence)

N은 Cell 개수, B는 bounding Box 개수, c는 Class 개수, 

x,y,w,h 아웃풋 Bounding Box 좌표, confidence 해당 Bounding Box안에 객체가 존재하는 정도를 나타냅니다.

 

GoogleNet 모델을 기반으로 24개의 Convolutions Layer, 2 Fully Connected layers  구성이 되어있습니다

YOLO 구성

 

 

Detection Procedure와 같은 CNN 모델의 아웃풋을 발생시키는 것이 YOLO라고 할 수 있습니다. 

아웃풋이 7*7*30을 의미하는 것은 Grid cell 7*7의 30차원을 의미합니다.

30차원의 백터안에는 아까 YOLO의 Bounding Box에 대한 값들이 들어가있습니다.

처음 5차원은 첫번째 Bounding Box 값들이 들어가있습니다.

 

 

다음 5차원은 다음 Bounding Box 값들이 들어가 있습니다.

 

 

나머지 20개의 차원은 class 대한 conditional class 확률을 나타냅니다.

 

 

해당 데이터들을 토대로

첫번째의 Bounding Box Confidence 값과 conditional class 확률과 곱해서 나오는 outout 20차원의 벡터로 출력합니다.

마찬가지로 2번째  Bounding Box 같은 작업을 반복해줍니다.

 

 

 

 

그렇게되면 모든 Grid cell 작업을 진행하면 7*7*2 98개의 결과값이 나옵니다.

 

 

 

이렇게나온 결과 값을 토대로 Non-MaximumSupperssion을 진행합니다.

Non-Maximum Supperssion의 작업은

위 작업을 진행하면 Output이미지에 총 98개의 Bounding Box가 그려지게 되는데

객체에 대표성을 띄울수 있는 Bounding Box 남기는 작업을 의미합니다.

 

 

오늘은 간단하게 YOLO에 관해 알아보았습니다.

앞으로 천천히 더 깊게 알아가보도록 하겠습니다.

YOLO 논문 내용이 궁금하시면 밑에 블로그를 참고하시면 됩니다.

 

YOLO 논문설명_1

 

[We-Co] Abstract, Conclusion, Introduction - YOLO, Tensorflow 논문

YOLO [We-Co] YOLO -TensorFlow, 논문 안녕하세요. 위기의코딩맨입니다. 오늘은 YOLO에 관해 간단하게 알아보도록 하겠습니다. You Only Look Once 넌 한번만 보면 된다는 의미를 갖고있는 YOLO..! 난 여러번 봐야

we-co.tistory.com

 

반응형