사용자에게 착용된 단일 깊이 카메라에 의해 촬영되는 손의 제 1 시퀀스 영상을 획득하는 단계; 획득한 제 1 시퀀스 영상 내 복수의 프레임으로부터 제 1 시공간 특징 벡터(spatio-temporal feature vector)를 획득하는 단계; 클릭 동작의 발생 여부 및 클릭 위치에 대한 정보를 알고 있는 손의 제 2 시퀀스 영상의 프레임으로부터 추출된 제 2 시공간 특징 벡터에 기초하여, 랜덤 포레스트(random forest)를 구성하는 단계; 및 제 1 시공간 특징 벡터를 랜덤 포레스트에 입력하여, 제 1 시퀀스 영상에서 손의 클릭 동작의 발생 여부 및 클릭 위치를 판단하는 단계를 포함하는 것을 특징으로 하는, 본 발명의 일 실시예에 따른 클릭 감지 장치에 의한 클릭 감지 방법이 개시된다.