Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data 논문리뷰

카테고리 없음

jinuklee 2024. 8. 19. 18:23

현재글Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data 논문리뷰

이진욱님의 블로그

ai research memo for reference

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이진욱님의 블로그