분류 전체보기 251

MACNET - Scaling Large-Language-Model-based Multi-Agent Collaboration 논문리뷰

https://arxiv.org/pdf/2406.07155LLM의 power law와 같이 agent의 수를 늘린다고 해서 emergent capability가 생기는가?Inspired by the neural scaling law, a natural question arises: does increasing agents in multi-agent collaboration exhibit emergent capabilities? 3. Multi-Agent Collaboration Network This arrangement ensures that each node-occupied agent ai precedes its corresponding edge-occupied agent aij , and aij p..

agent/multi - agent 2024.08.05

Reflexion: Language Agents withVerbal Reinforcement Learning 논문리뷰

1. Introduction예를 들어, 그림 1에서 Reflexion 에이전트는 시도, 오류 및 자기 성찰(trial, error, self-reflect)을 통해 의사결정, 프로그래밍 및 추론 작업을 해결하기 위해 자신의 행동을 최적화하는 방법을 학습한다. 유용한 성찰 피드백을 생성하는 것은 모델이 어디서 실수를 했는지에 대한 이해(즉, the credit assignment problem)뿐만 아니라 개선을 위한 actionable insight을 포함한 요약을 생성할 수 있는 능력을 필요로 하기 때문에 challenging 우리는 이를 수행하기 위해 세 가지 방법을 탐구한다 –1) simple binary environment feedback2) pre-defined heuristics for co..

agent/multi - agent 2024.08.03

ReAcT 논문리뷰 SYNERGIZING REASONING AND ACTING INLANGUAGE MODELS

https://arxiv.org/pdf/2210.0362  Alfworld 벤치마크 문제를 해결하기 위한 ReAct 예시인데일단 어떤 task를 solve 하기 위해 우리는 환경으로부터 observation을 받아 action(following the specific policy)을 생성하는데 이떄 context가 다음과 같다. Learning a policy is challenging when the mapping c → a is highly implicit and requires extensive computation ReAcT는 이 a ( agent’s action space = 이 경우 space of language)를 augment하는 것 obeservation이나 외부 환경에 이 action..

agent 2024.08.03

mind search 논문리뷰

mindsearch 논문리뷰최근의 recent work는 검색엔진을 LLM과 통합시킬려는 시도함하지만 3가지 문제를 직면(1) 복잡한 request은 검색 엔진에서 한 번에 정확하고 완전하게 retrieve되기 어렵다 (e.g 19세기 러시아 문학이 20세기 프랑스 철학에 미친 영향)(2) 통합해야될 관련 정보가 대량의 노이즈와 함께 여러 웹 페이지에 분산되어 있다.(3) 긴 contents을 가진 많은 웹 페이지는 LLM의 최대 컨텍스트 길이를 초과할 수 있다 (위키피디아처럼 길면 한번에 분석 x)https://arxiv.org/pdf/2407.20183WebSearcherWebPlanner기존의 연구에는 검색 과정을 RAG task로 보는 경우도 있지만 웹 기반 정보 검색의 깊이와 복잡성을 super..

agent/multi - agent 2024.08.01

CRITIC: LARGE LANGUAGE MODELS CAN SELFCORRECT WITH TOOL-INTERACTIVE CRITIQUING 논문리뷰

llm의 결과를 cross check하는( e.g 인터넷 검색엔진에 확인, 생성한 코드가 올바른지 인터프리터로 실행해 디버깅과정과 유사한 시스템 More specifically, starting with an initial output, CRITIC interacts with appropriate tools to evaluate certain aspects of the text, and then revises the output based on the feedback obtained during this validation process 정확히는 text를 evaluate하고 이과정을 통해 구한 feedback을 업데이트하는것 QA에서의 활용사례 first QA result without any feed..

agent/multi - agent 2024.07.29