강화학습 내 연계변수를 통한 전술방책 에이전트 구현Course of actions agents using successor features in reinforcement learning

Cited 0 time in webofscience Cited 0 time in scopus
  • Hit : 102
  • Download : 0
최근 인공지능의 대두에 따라 워게임에서 적용되는 강화학습 기반의 전술방책 에이전트를 구현하기 위한 노력들이 이어지고 있다. 효과적인 전술방책 에이전트를 구현하기 위해서는 방책의 특징이 반영된 학습방법의 적용이 필요하다. 본 학위논문에서는 방책의 특징이 고려된 학습방법의 모습을 제시하고, 다중에이전트 보편적 연계변수 기반으로 한 새로운 구조를 제시하여 전술방책 에이전트를 구현할 수 있음을 확인한다.
Advisors
정송researcherChong, Songresearcher
Description
한국과학기술원 :김재철AI대학원,
Publisher
한국과학기술원
Issue Date
2023
Identifier
325007
Language
kor
Description

학위논문(석사) - 한국과학기술원 : 김재철AI대학원, 2023.2,[iii, 20 p. :]

Keywords

연계변수▼a전이학습▼a다중에이전트 강화학습▼a군사방책▼a워게임; Successor features▼aTransfer learning▼aMulti-agent reinforcement▼aMilitary course of actions▼aWar-game

URI
http://hdl.handle.net/10203/308205
Link
http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=1032333&flag=dissertation
Appears in Collection
AI-Theses_Master(석사논문)
Files in This Item
There are no files associated with this item.

qr_code

  • mendeley

    citeulike


rss_1.0 rss_2.0 atom_1.0