메타 강화 학습을 이용한 인간 행동패턴 및 행동전략 추정 시스템 및 방법SYSTEM AND METHOD FOR PREDICTING HUMAN CHOICE BEHAVIOR AND UNDERLYING STRATEGY USING META-REINFORCEMENT LEARNING

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 198
  • Download : 0
메타 강화 학습을 이용한 인간 행동패턴 및 행동전략 추정 시스템 및 방법이 제시된다. 일 실시예에 따른 메타 강화 학습을 이용한 인간 행동패턴 및 행동전략 추정 시스템은, 보상 함수(reward function)를 학습하는 모델-프리(model-free, MF) 강화 학습부; 상기 보상 함수 및 상태-천이 함수(state-transition function)를 학습하며, 상기 상기 모델-프리(MF) 강화 학습부와 동적으로 상호 작용하는 모델-기반(model-based, MB) 강화 학습부; 및 상기 모델-프리(MF) 강화 학습부 및 상기 모델-기반(MB) 강화 학습부에 가중치를 동적으로 부여함에 따라 계층적으로 제어하여 인간의 의사 결정을 예측하는 계층적 제어부를 포함하여 이루어질 수 있다.
Assignee
한국과학기술원
Country
KO (South Korea)
Application Date
2019-01-07
Application Number
10-2019-0001557
Registration Date
2020-12-08
Registration Number
10-2190584-0000
URI
http://hdl.handle.net/10203/278190
Appears in Collection
BiS-Patent(특허)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0