x = question , a1 = 첫번째 대답, a2 = 두번째 대답
y = a1, a2 중에 뭐가 좋은지 = pseudo-labeling
we only select those data where the model exhibits high confidence
x = question , a1 = 첫번째 대답, a2 = 두번째 대답
y = a1, a2 중에 뭐가 좋은지 = pseudo-labeling
we only select those data where the model exhibits high confidence