Archon:An Architecture Search Framework for Inference-Time Techniques 논문리뷰
https://arxiv.org/pdf/2409.15254Archon:An Architecture Search Framework for Inference-Time Techniques 논문리뷰2024년 10월 1일자 논문 challenge1) inference-time compute budge에 관한 최적의 컴퓨팅량2) 다양한 inference-time 기술 사이의 interaction에 대한 이해3) model choice의 큰 공간(범위)을 효율적으로 search해 best 답변을 내놓기에 대한 challenge가 존재 아직 taskinstruction-following tasks (MT Bench, AlpacaEval 2.0, Arena-Hard-Auto)reasoning tasks (MixEval,..