trl-lib
/

pythia-1b-deduped-tldr-online-dpo

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

pythia-1b-deduped-tldr-online-dpo / tokenizer.json

edbeeching's picture

edbeeching HF staff

Add vwxyzjn/online_dpo_tldr-main checkpoint

83e2e55 verified 4 months ago

history contribute delete

2.11 MB

File too large to display, you can check the raw version instead.