이진욱님의 블로그
홈
태그
방명록
빅테크 리포트
LLM
멀티모달
디퓨전 모델
inference-time, RLHF/STaR, ResT - LMM
REVISIT LARGE-SCALE IMAGE-CAPTION DATA IN PRETRAINING MULTIMODAL FOUNDATION MODELS 논문리뷰
jinuklee
2024. 10. 9. 14:11
https://arxiv.org/pdf/2410.02740
공유하기
게시글 관리
이진욱님의 블로그
'
inference-time, RLHF
>
STaR, ResT - LMM
' 카테고리의 다른 글
GLOV: GUIDED LARGE LANGUAGE MODELS AS IMPLICIT OPTIMIZERS FOR VISION LANGUAGE MODELS 논문리뷰
(0)
2024.10.12
LMM의 DPO : Aligning Modalities in Vision Large Language Models via Preference Fine-tuning 논문리뷰
(0)
2024.10.09
[CVPR 2024] Rich Human Feedback for Text-to-Image Generation 논문리뷰
(0)
2024.10.09
LLaVA-Video-178K : Video Instruction Tuning With Synthetic Data 논문리뷰
(0)
2024.10.09
llava-critic 논문리뷰
(0)
2024.10.09
티스토리툴바
이진욱님의 블로그
구독하기