Showing results 1 to 3 of 3
Online actor-critic method based on incrementally generated radial basis functions = 점진적으로 생성되는 방사형 기저함수 기반 온라인 액터-크리틱 방법link Lee, Dong-Hyun; 이동현; et al, 한국과학기술원, 2013 |
Online neural Q-Learning using heuristic weight assignment algorithm and optimization method = 휴리스틱한 가중치 배당 알고리즘과 최적화 방법을 이용한 온라인 Neural Q-Learninglink Kim, Yeon-Seob; 김연섭; et al, 한국과학기술원, 2013 |
강화학습에 기반한 이족보행 패턴에 대한 연구 = A study on bipedal walking pattern based on the reinforcement learninglink 한상훈; Sanghoon Han; 김수현; SooHyun Kim; et al, 한국과학기술원, 2015 |
Discover