온라인 추천 시스템으로서, 사용자와 항목이 매핑된 상호작용들을 기초로 훈련된 파라미터들을 이용하여, 사용자의 관심 항목을 추천하는 추천기, 그리고 상기 추천기를 업데이트하기 위한 새로운 상호작용들을 입력받고, 상기 새로운 상호작용들에 대한 상기 추천기의 손실 그리고 과거 상호작용들을 이용하여, 새로운 상호작용과 파라미터 쌍마다의 최적 학습률(learning rate)을 결정하는 학습률 생성기를 포함한다. 상기 추천기는 상기 최적 학습률을 기초로 현재 파라미터들을 업데이트한다.