Showing results 66 to 71 of 71
Transient activation of midbrain dopamine neurons by reward risk. Fiorillo, Christopher D., NEUROSCIENCE, v.197, pp.162 - 171, 2011-12 |
Utilizing Skipped Frames in Action Repeats for Improving Sample Efficiency in Reinforcement Learning Luu, Tung M.; Nguyen, Thanh; Vu, Thang; Yoo, Chang-Dong, IEEE ACCESS, v.10, pp.64965 - 64975, 2022 |
강화 학습을 이용한 비전 기반의강인한 손 모양 인식에 대한 연구 장효영; 변증남, 전자공학회논문지 - CI, v.43, no.3, pp.39 - 49, 2006-05 |
강화학습에 기반한 이족보행 패턴에 대한 연구 = A study on bipedal walking pattern based on the reinforcement learninglink 한상훈; Sanghoon Han; 김수현; SooHyun Kim; et al, 한국과학기술원, 2015 |
심층 강화학습기반 연속상태공간 제어를 위한 보상 함수 분석 강민구; 김기응, 정보과학회논문지, v.47, no.1, pp.78 - 87, 2020-01 |
제약을 갖는 POMDP를 위한 휴리스틱 검색 가치 반복 알고리즘 = Heuristic search value iteration for constrained POMDPslink 고봉석; Goh, Bong-Seok; et al, 한국과학기술원, 2013 |
Discover