본 논문에서는 이미지넷을 통해 만든 사전 훈련 모델을 사용하는 기존의 물체 검출 방법에서 벗어나서, 무에서 학습하는 SSD (Single Shot MultiBox Detector)기반의 격자형 밀집망 물체 검출기에 대해서 소개한다. 사전 훈련 모델을 이용하여 학습하는 것은 바이어스를 학습하는 과정에서 성능 하락을 유발하며, 소스 영역과 목표 영역의 차이로 물체 검출 과정에서 문제점을 야기한다. 게다가, 사전 훈련된 모델을 만드는 작업은 많은 매개변수가 요구되기 때문에 많은 시간과 용량이 들고, 이에 따라 모델의 일부분을 수정하는 작업조차도 굉장히 힘들다.
따라서, 이러한 문제들을 해결하고자 본 연구에서는 무에서 학습하는 물체 검출기를 제안하고자한다. 제안한 검출기의 특징 추출을 위한 서브 네트워크에서는 분류 분야에서 최고의 성능을 보이고 있는 밀집망의 구조를 변형한 격자형 밀집망 구조를 제안하여 사용하였다. 또한, 클래스와 위치의 예측을 위한 서브 네트워크에서는 기존의 SSD의 구조에서 밀집망의 개념을 적용한 밀집 특징 층을 사용하였다.
제안된 검출기의 성능을 검증하기 위해 PASCAL VOC 2007과 2012 데이터집합을 통해 실험을 진행하였다. 학습 시간을 줄여 더욱 빠른 성능 비교를 하기 위해서 우리는 기존의 DSOD (Learning Deeply Supervised Object Detectors from Scratch)모델의 층 깊이를 얕게 한 참조 모델을 만들어 제안한 검출기와 비교하였다. 그 결과, PASCAL VOC 데이터집합에서 기존의 SSD 에 비해 적은 매개변수를 사용하면서도 참조 모델에 비해 약 2%의 성능 향상을 보였다. 또한, 추가적으로 이미지 및 동영상에 제안한 알고리즘을 적용하여 실제적인 응용분야에 제안한 물체 검출기가 유용하게 사용될 수 있음을 확인하였다.