agent 23

octo-planner 논문리뷰

nvidia A100 gpu 1개 사용 planner-action 프레임워크두개의 요소로 나눠진다1. planner agent엣지 디바이스를 위해 최적화된 octo-planner2. action agentfunction 실행을 위한 octupus 모델을 사용한 action agent 서브 스텝들(sub-steps)의 시퀸스로 나눠진 task의 질문(query)에 대한 응답을 planner가 생성하고 이를 실제로 실행하는 과정으로 이루어진다리소스가 제한된 환경에서 실행(성능 최적화 및, 컴퓨팅 최적화)시키기 위해 in-context 능력에 집중하기 보단(스케일링의 증가로 나타남) finetuning을 통한 모델을 사용한다.실제 데스크탑에서 12퍼센트 모바일 앱에서 46퍼였던 성능이 파인튜닝이후 훈련 데이터..

mixture of agents 논문 리뷰

mixture of agents (MoA) 여러개의 LLM을 하나로  2024년 6월 7일 - togetherAI https://arxiv.org/pdf/2406.04692 MoA 모델이 gpt4o보다 alphacaEval 2.0 벤치마크에서 매우 큰 성능 증가를 보였다 (그 외 MT-bench, FLASK) 원리 : 첫 레이어의 LLM이 생성한 답변 -> 다음 레이어의 프롬프트로 활용 ->이 사이클의 반복 중요한점 : MoA 레어어마다의 적절한 LLM 선택이 중요 기준 1.각 레이어의 성능을 metric으로 평가해 다음 레이어의 LLM을 선택2. 모델 결과값의 다양성 중요 (한 모델의 결과값보다 여러 모델에서의 다양한 response가 결과에 크게 기여)이를 통해 LLM끼리 협력해서 결과값 생성의 질을..

agent/multi - agent 2024.06.23