Wyniki wyszukiwania dla: RLHF
Nie znaleźliśmy wyników w tym kontekście ale mamy wyniki w innym!
Pozostałe wyniki Pokaż wszystkie wyniki (1)
Wyniki wyszukiwania dla: RLHF
-
WikiPrefs: human preferences dataset build from text edits
Dane BadawczeThe WikiPrefs dataset is a human preferences dataset for Large Language Models alignment. It was built using the EditPrefs method from historical edits of Wikipedia featured articles