RegularizedSelfPlay
/

sppo_forward1reverse5-0.1-Llama-3-8B-Instruct-RSPO-Iter1

Model card Files Files and versions

sppo_forward1reverse5-0.1-Llama-3-8B-Instruct-RSPO-Iter1

Commit History

initial commit

d7b42d6
verified

Sangwoong commited on Mar 28, 2025