이진욱님의 블로그

  • 홈
  • 태그
  • 방명록
  • 빅테크 리포트
  • LLM
  • 멀티모달
  • 디퓨전 모델

VLM

An interactive agent foundation model 논문리뷰

jinuklee 2024. 9. 14. 14:46

https://arxiv.org/pdf/2402.05929

'VLM' 카테고리의 다른 글

VideoLLaMA 2Advancing Spatial-Temporal Modeling and AudioUnderstanding in Video-LLM  (0) 2024.09.30
INTERNVIDEO2: SCALING FOUNDATION MODELS FORMULTIMODAL VIDEO UNDERSTANDING 논문리뷰  (0) 2024.09.30
VideoPrism: A Foundational Visual Encoder for Video Understanding  (0) 2024.09.30
Qwen2-VL: Enhancing Vision-Language Model’s Perceptionof the World at Any Resolution  (0) 2024.09.21

'VLM'의 다른글

  • 현재글An interactive agent foundation model 논문리뷰

관련글

  • VideoLLaMA 2Advancing Spatial-Temporal Modeling and AudioUnderstanding in Video-LLM 2024.09.30
  • INTERNVIDEO2: SCALING FOUNDATION MODELS FORMULTIMODAL VIDEO UNDERSTANDING 논문리뷰 2024.09.30
  • VideoPrism: A Foundational Visual Encoder for Video Understanding 2024.09.30
  • Qwen2-VL: Enhancing Vision-Language Model’s Perceptionof the World at Any Resolution 2024.09.21
프로필사진

이진욱님의 블로그

ai research memo for reference

  • 분류 전체보기 (287)
    • inference-time, RLHF (41)
      • STaR, ReST (4)
      • STaR, ResT - LMM (17)
      • search (language) (10)
      • search (multimodal) (2)
      • Process reward model (6)
      • scalable oversight (1)
      • red-team (1)
    • VLM (5)
    • RLFH (2)
    • 프롬프팅 (3)
    • interpretability (2)
    • agent (23)
      • on-device agent (1)
      • multi - agent (17)
      • 멀티 에이젼트 결과 (2)
    • PEFT (1)
      • LoRA (1)
    • multi-step reasoning(수학, 코딩.. (7)
      • 멀티모달 cot (5)
    • 한계 limitation (1)
    • 데이터셋 (3)
      • 합성데이터 (1)
    • 3D, real world, game, VR (2)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/06   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바