End of training

Browse files

Files changed (4) hide show

README.md +14 -17
adapter_model.bin +1 -1
tokenizer.json +1 -6
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0039
 ## Model description
@@ -43,28 +43,25 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- training_steps: 600
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.1052        | 0.12  | 40   | 0.0312          |
-| 0.0269        | 0.25  | 80   | 0.0266          |
-| 0.0243        | 0.37  | 120  | 0.0226          |
-| 0.0219        | 0.5   | 160  | 0.0183          |
-| 0.0177        | 0.62  | 200  | 0.0162          |
-| 0.0152        | 0.74  | 240  | 0.0139          |
-| 0.0137        | 0.87  | 280  | 0.0125          |
-| 0.0117        | 0.99  | 320  | 0.0098          |
-| 0.0074        | 1.12  | 360  | 0.0096          |
-| 0.0072        | 1.24  | 400  | 0.0083          |
-| 0.0054        | 1.36  | 440  | 0.0074          |
-| 0.0047        | 1.49  | 480  | 0.0062          |
-| 0.0038        | 1.61  | 520  | 0.0057          |
-| 0.0032        | 1.74  | 560  | 0.0044          |
-| 0.0022        | 1.86  | 600  | 0.0039          |
 ### Framework versions

 This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0444
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- training_steps: 500
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.1289        | 0.36  | 40   | 0.0339          |
+| 0.0345        | 0.72  | 80   | 0.0300          |
+| 0.0304        | 1.08  | 120  | 0.0256          |
+| 0.0198        | 1.44  | 160  | 0.0261          |
+| 0.022         | 1.8   | 200  | 0.0249          |
+| 0.0157        | 2.16  | 240  | 0.0286          |
+| 0.0115        | 2.52  | 280  | 0.0279          |
+| 0.011         | 2.88  | 320  | 0.0295          |
+| 0.0066        | 3.24  | 360  | 0.0372          |
+| 0.005         | 3.6   | 400  | 0.0362          |
+| 0.0036        | 3.96  | 440  | 0.0423          |
+| 0.0018        | 4.32  | 480  | 0.0444          |
 ### Framework versions

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:02579b894044dcc962e9bae60935e1ab52d3867a51add726296ffab690bf17e3
 size 268528394

 version https://git-lfs.github.com/spec/v1
+oid sha256:d4e98911a51b9526afb2d2e200948ffb77f431836cb977929dc7c99750fbc30a
 size 268528394

tokenizer.json CHANGED Viewed

@@ -1,11 +1,6 @@
 {
   "version": "1.0",
-  "truncation": {
-    "direction": "Right",
-    "max_length": 256,
-    "strategy": "LongestFirst",
-    "stride": 0
-  },
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e59536812d5beee73a373bdc6c23abc18944306f581ec0fefb7830ec3439ef2f
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:8944be6d69028282994545af3394230058c8ed222c5a2f61d0186e92dd5263c2
 size 4984