ikimhope
/

pythia-1b-tldr-online-dpo-mark-peft

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-tldr-online-dpo-mark-peft

1 contributor

History: 5 commits

This model has 1 file scanned as suspicious.

ikimhope's picture

End of training

646b0cf verified 16 days ago

.gitattributes

1.52 kB

initial commit 16 days ago
README.md

2.43 kB

End of training 16 days ago
adapter_config.json

654 Bytes

Training in progress, step 500 16 days ago
adapter_model.safetensors

33.6 MB
LFS

Training in progress, step 684 16 days ago
special_tokens_map.json

579 Bytes

Training in progress, step 500 16 days ago
tokenizer.json

3.56 MB

Training in progress, step 684 16 days ago
tokenizer_config.json

5.3 kB

Training in progress, step 500 16 days ago
training_args.bin
Detected Pickle imports (9)
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "torch.device",
- "transformers.trainer_utils.HubStrategy",
- "trl.trainer.online_dpo_config.OnlineDPOConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.training_args.OptimizerNames"
How to fix it?
5.5 kB
LFS

Training in progress, step 500 16 days ago