ikimhope
/

pythia-1b-tldr-online-dpo-mark-peft

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-tldr-online-dpo-mark-peft / README.md

Commit History

End of training

646b0cf
verified

ikimhope commited on 16 days ago

Model save

4eb4ea8
verified

ikimhope commited on 16 days ago