카테고리 없음
agent는 성능이 보통 20 % 미만인데 이는 test-time computation for exploration , multi-step planning의 능력이 부족하기 때문이다