DC Field | Value | Language |
---|---|---|
dc.contributor.advisor | 김기응 | - |
dc.contributor.advisor | Kim, Kee-Eung | - |
dc.contributor.author | 오은수 | - |
dc.contributor.author | Oh, Eun-Soo | - |
dc.date.accessioned | 2013-09-12T01:51:44Z | - |
dc.date.available | 2013-09-12T01:51:44Z | - |
dc.date.issued | 2011 | - |
dc.identifier.uri | http://library.kaist.ac.kr/search/detail/view.do?bibCtrlNo=467947&flag=dissertation | - |
dc.identifier.uri | http://hdl.handle.net/10203/180578 | - |
dc.description | 학위논문(석사) - 한국과학기술원 : 전산학과, 2011.2, [ iv, 33 p. ] | - |
dc.description.abstract | Markov Decision Processes(MDPs)는 확률적인 환경에서 연속적인 의사 결정을 필요로 하는 문제를 다루는 데에 매우 효과적인 모델이다. MDP로 모델링 한 문제는 value iteration, policy iteration과 같은 알고리즘을 통해 최적행동정책을 구함으로써 효과적인 의사 결정을 할 수가 있다. 그러나 해결하고자 하는 문제를 MDP 모델로 구체화 하는 일은 상당히 어려운 일이다. 또한 모델링한 MDP의 매개변수의 값들은 불확실성을 포함하고 있을 수 있으며 그 불확실성에 의해 최적행동정책이 변할 수 있다. MDP의 민감도분석이란 모델링한 MDP의 매개변수들이 불확실성에 의해서 모델링한 값과 실제 값에 차이가 존재할 경우 그 차이가 최적행동정책의 변화에 미치는 영향을 분석하는 것이다. MDP의 민감도분석을 통해 주어진 문제의 구체화에 불확실성이 포함되어 있어서 전이확률함수 혹은 보상함수의 값이 실제 값과 차이가 존재하더라도 현재 구체화한 모델의 최적행동정책이 여전히 최적일 수 있는 차이의 범위를 알 수 있게 된다. 그리고 그 결과를 통해 모델의 불확실성에 대해 안정적인(robust) 행동정책을 구할 수 있다. 본 논문에서는 보상함수에 불확실성이 존재하는 MDP에 대해서 민감도분석을 수행하는 방법을 제안할 것이다. 또한 이를 통해 안정적인 행동정책을 구하는 데에 있어서 기존에 제안된 알고리즘보다 속도가 빠른 새로운 알고리즘을 제안할 것이다. | kor |
dc.language | kor | - |
dc.publisher | 한국과학기술원 | - |
dc.subject | 마르코프 의사 결정 | - |
dc.subject | 민감도 분석 | - |
dc.subject | 안정적인 행동정책 | - |
dc.subject | 미니맥스 후회값 | - |
dc.subject | MDP | - |
dc.subject | Sensitivity Analysis | - |
dc.subject | Robust Policy | - |
dc.subject | Minimax Regret | - |
dc.subject | Markov Decision Process | - |
dc.title | 민감도분석을 이용한 보상함수가 불확실한 MDP의 미니맥스 후회값 행동정책 탐색기법 | - |
dc.title.alternative | Minimax regret policy search in reward-uncertain MDPs using sensitivity analysis | - |
dc.type | Thesis(Master) | - |
dc.identifier.CNRN | 467947/325007 | - |
dc.description.department | 한국과학기술원 : 전산학과, | - |
dc.identifier.uid | 020093301 | - |
dc.contributor.localauthor | 김기응 | - |
dc.contributor.localauthor | Kim, Kee-Eung | - |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.