Showing results 1 to 2 of 2
Post-hoc policy adjustment for offline actor-critic reinforcement learning methods = 오프라인 강화학습을 위한 사후 정책 보정 기법link Ban, Seonghyun; 반성현; et al, 한국과학기술원, 2024 |
해석 가능한 프롬프트 최적화에 관한 강화학습 연구 최윤선; 김기응; 반성현, 2023 한국소프트웨어종합학술대회 (KSC2023), 한국정보과학회, 2023-12-20 |
Discover