Model save

Browse files

Files changed (3) hide show

README.md +22 -26
model.safetensors +1 -1
runs/Mar30_20-39-35_gweltaz-NUC10i7FNK/events.out.tfevents.1711827585.gweltaz-NUC10i7FNK +2 -2

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilbert/distilgpt2](https://huggingface.co/distilbert/distilgpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.6959
 ## Model description
@@ -34,42 +34,38 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0004
 - train_batch_size: 16
 - eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
-- num_epochs: 5
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
-| 5.966         | 0.21  | 1000  | 5.0526          |
-| 4.8376        | 0.42  | 2000  | 4.6063          |
-| 4.5265        | 0.63  | 3000  | 4.3822          |
-| 4.3549        | 0.84  | 4000  | 4.2353          |
-| 4.1914        | 1.05  | 5000  | 4.1234          |
-| 3.9985        | 1.26  | 6000  | 4.0512          |
-| 3.9496        | 1.47  | 7000  | 3.9737          |
-| 3.9029        | 1.68  | 8000  | 3.9040          |
-| 3.8636        | 1.89  | 9000  | 3.8523          |
-| 3.7011        | 2.1   | 10000 | 3.8414          |
-| 3.5776        | 2.31  | 11000 | 3.8034          |
-| 3.5683        | 2.52  | 12000 | 3.7755          |
-| 3.5686        | 2.73  | 13000 | 3.7375          |
-| 3.5352        | 2.94  | 14000 | 3.7042          |
-| 3.3404        | 3.15  | 15000 | 3.7406          |
-| 3.2763        | 3.36  | 16000 | 3.7177          |
-| 3.2792        | 3.56  | 17000 | 3.7004          |
-| 3.2808        | 3.77  | 18000 | 3.6864          |
-| 3.2816        | 3.98  | 19000 | 3.6639          |
-| 3.0586        | 4.19  | 20000 | 3.7184          |
-| 3.0485        | 4.4   | 21000 | 3.7085          |
-| 3.0446        | 4.61  | 22000 | 3.7014          |
-| 3.0407        | 4.82  | 23000 | 3.6959          |
 ### Framework versions

 This model is a fine-tuned version of [distilbert/distilgpt2](https://huggingface.co/distilbert/distilgpt2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.6213
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.001
 - train_batch_size: 16
 - eval_batch_size: 32
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500
+- training_steps: 19000
 ### Training results
 | Training Loss | Epoch | Step  | Validation Loss |
 |:-------------:|:-----:|:-----:|:---------------:|
+| 5.7274        | 0.21  | 1000  | 4.9308          |
+| 4.7191        | 0.42  | 2000  | 4.5347          |
+| 4.4579        | 0.63  | 3000  | 4.3432          |
+| 4.2769        | 0.84  | 4000  | 4.1893          |
+| 4.1086        | 1.05  | 5000  | 4.0861          |
+| 3.9327        | 1.26  | 6000  | 3.9992          |
+| 3.8812        | 1.47  | 7000  | 3.9216          |
+| 3.8298        | 1.68  | 8000  | 3.8648          |
+| 3.7785        | 1.89  | 9000  | 3.8126          |
+| 3.6099        | 2.1   | 10000 | 3.7931          |
+| 3.471         | 2.31  | 11000 | 3.7539          |
+| 3.4651        | 2.52  | 12000 | 3.7141          |
+| 3.4451        | 2.73  | 13000 | 3.6754          |
+| 3.4251        | 2.94  | 14000 | 3.6327          |
+| 3.1855        | 3.15  | 15000 | 3.6779          |
+| 3.0962        | 3.36  | 16000 | 3.6757          |
+| 3.0971        | 3.56  | 17000 | 3.6437          |
+| 3.0816        | 3.77  | 18000 | 3.6287          |
+| 3.0582        | 3.98  | 19000 | 3.6213          |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:28dd73569d355dd93a139f7b40921392f1c54bec183cca7913526c7aaaf354cf
 size 327657928

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7c7c6ac303206d745901d30f6a267247424b82b8898df54484ea329b67a92a5
 size 327657928

runs/Mar30_20-39-35_gweltaz-NUC10i7FNK/events.out.tfevents.1711827585.gweltaz-NUC10i7FNK CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b7d51e22d64042c284ea8a2377c6c654cfd6e4a57cac8f32c98492b463c6b0f7
-size 12826

 version https://git-lfs.github.com/spec/v1
+oid sha256:d688021a3a593912cd02419fe1640aef650dbd8a831b1982199ef73d82542ba1
+size 14444