DC Field | Value | Language |
---|---|---|
dc.contributor.author | 윤세영 | ko |
dc.contributor.author | 이용식 | ko |
dc.contributor.author | 오지환 | ko |
dc.contributor.author | 김준기 | ko |
dc.date.accessioned | 2023-10-18T08:00:24Z | - |
dc.date.available | 2023-10-18T08:00:24Z | - |
dc.identifier.uri | http://hdl.handle.net/10203/313517 | - |
dc.description.abstract | 본 발명은 컴퓨팅 장치가 수행하는 전장 상황에서의 방책 추천을 위한 강화학습 방법에 있어서, 전장 상황 시뮬레이터로부터 방책에 대한 상태(state) 정보 내의 관찰(observation) 정보를 획득하는 단계; 상기 관찰 정보를 기초로 행동(action)을 선택하여 상기 전장 상황 시뮬레이터로 전달하는 단계; 상기 전장 상황 시뮬레이터로부터 상기 행동을 기반으로 한 보상(reward)을 획득하면서 상기 행동을 표현하는 정책을 설정하는 단계; 및 상기 보상을 누적하되, 누적되는 보상이 최대가 되는 정책을 설정하도록 상기 컴퓨팅 장치 내의 학습 모델을 학습시키는 단계;를 포함할 수 있다. | - |
dc.title | 전장 상황에서의 방책 추천을 위한 강화학습 방법 및 시스템, 이를 위한 컴퓨팅 장치 | - |
dc.title.alternative | reinforcement-learning method and system for recommend optimal policy in battle-field, computing apparatus for recommend optimal policy | - |
dc.type | Patent | - |
dc.type.rims | PAT | - |
dc.contributor.localauthor | 윤세영 | - |
dc.contributor.assignee | 한국과학기술원, 국방과학연구소 | - |
dc.identifier.iprsType | 특허 | - |
dc.identifier.patentApplicationNumber | 10-2022-0171478 | - |
dc.identifier.patentRegistrationNumber | 10-2567928-0000 | - |
dc.date.application | 2022-12-09 | - |
dc.date.registration | 2023-08-11 | - |
dc.publisher.country | KO | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.