RL on Incorrect Synthetic Data Scales theEfficiency of LLM Math Reasoning by Eight-Fold 논문리뷰

카테고리 없음

jinuklee 2024. 8. 18. 01:16

현재글RL on Incorrect Synthetic Data Scales theEfficiency of LLM Math Reasoning by Eight-Fold 논문리뷰

이진욱님의 블로그

ai research memo for reference

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이진욱님의 블로그