Reflexion: Language Agents withVerbal Reinforcement Learning 논문리뷰
1. Introduction예를 들어, 그림 1에서 Reflexion 에이전트는 시도, 오류 및 자기 성찰(trial, error, self-reflect)을 통해 의사결정, 프로그래밍 및 추론 작업을 해결하기 위해 자신의 행동을 최적화하는 방법을 학습한다. 유용한 성찰 피드백을 생성하는 것은 모델이 어디서 실수를 했는지에 대한 이해(즉, the credit assignment problem)뿐만 아니라 개선을 위한 actionable insight을 포함한 요약을 생성할 수 있는 능력을 필요로 하기 때문에 challenging 우리는 이를 수행하기 위해 세 가지 방법을 탐구한다 –1) simple binary environment feedback2) pre-defined heuristics for co..