CoEM: 청각-시각 잠재 표현형을 위한 대조적 임베딩 변환자CoEM: Contrastive Embedding Mapper for Audio-visual Latents

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 93
  • Download : 0
DC FieldValueLanguage
dc.contributor.author이기훈ko
dc.contributor.author이경채ko
dc.contributor.author정민찬ko
dc.contributor.author이명진ko
dc.contributor.author윤세영ko
dc.contributor.author윤찬현ko
dc.date.accessioned2023-11-25T09:02:07Z-
dc.date.available2023-11-25T09:02:07Z-
dc.date.created2023-11-25-
dc.date.issued2023-01-
dc.identifier.citation정보과학회논문지, v.50, no.1, pp.80 - 86-
dc.identifier.issn2383-630X-
dc.identifier.urihttp://hdl.handle.net/10203/315181-
dc.description.abstract인간의 지각은 청각-시각 정보를 연관 지어 청각 정보로부터 시각 정보를 연상할 수 있고 그 역도 가능한다. 이러한 능력은 청각-시각 정보가 관련되어 있는 상황을 경험하며 자연스럽게 획득할 수 있지만, 두 유형의 정보가 충분히 결합된 영상 데이터는 각 장면의 맥락에 따라 두 가지 레이블을 동시에 만들어주어야 하므로 데이터셋을 만들기 어렵다. 본 논문에서는 같은 카테고리에 대해 한 가지 유형에 대한 임베딩에서 다른 유형으로 변환(mapping)할 수 있는 Contrastive Embedding Mapper (CoEM)을 제안한다. 청각-시각 정보를 쌍으로 짝지을 필요 없이 CoEM은 카테고리에 따라 변환된 임베딩을 대조하는 방식으로 학습한다. 우리는 청각과 시각 데이터셋에 대한 CoEM의 효력을 확인하기 위해 20가지의 카테고리에 대해 실험했다. 실험에서 CoEM에 의해 변환되어 연결된 임베딩들은 다른 도메인에서의 검색 성능의 경우 이웃하는 기준점이 충분한 경우(20개) 약 90%의 성능을 보였다. 또한, 연결된 도메인에서의 데이터 재 생성이 가능함을 확인했다.-
dc.languageKorean-
dc.publisher한국정보과학회-
dc.titleCoEM: 청각-시각 잠재 표현형을 위한 대조적 임베딩 변환자-
dc.title.alternativeCoEM: Contrastive Embedding Mapper for Audio-visual Latents-
dc.typeArticle-
dc.type.rimsART-
dc.citation.volume50-
dc.citation.issue1-
dc.citation.beginningpage80-
dc.citation.endingpage86-
dc.citation.publicationname정보과학회논문지-
dc.identifier.doi10.5626/JOK.2023.50.1.80-
dc.identifier.kciidART002925558-
dc.contributor.localauthor윤세영-
dc.contributor.localauthor윤찬현-
dc.description.isOpenAccessN-
dc.subject.keywordAuthor청각-시각 학습-
dc.subject.keywordAuthor대조 학습-
dc.subject.keywordAuthor교차 도메인-
dc.subject.keywordAuthor임베딩 변환-
dc.subject.keywordAuthoraudio-visual learning-
dc.subject.keywordAuthorcontrastive learning-
dc.subject.keywordAuthorcross-domain-
dc.subject.keywordAuthorembedding mapping-
Appears in Collection
AI-Journal Papers(저널논문)EE-Journal Papers(저널논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0