Shakhovak
/

llama-7b-absa-MT-restaurants

Generated from Trainer

Model card Files Files and versions Community

Shakhovak commited on Apr 23

Commit

c60e9cf

•

1 Parent(s): 449eca2

End of training

Browse files

Files changed (3) hide show

README.md +32 -17
adapter_model.bin +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0061
 ## Model description
@@ -43,28 +43,43 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- training_steps: 600
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.0939        | 0.13  | 40   | 0.0302          |
-| 0.0258        | 0.25  | 80   | 0.0237          |
-| 0.0223        | 0.38  | 120  | 0.0208          |
-| 0.0198        | 0.51  | 160  | 0.0182          |
-| 0.0159        | 0.63  | 200  | 0.0163          |
-| 0.0158        | 0.76  | 240  | 0.0137          |
-| 0.0125        | 0.89  | 280  | 0.0126          |
-| 0.0118        | 1.01  | 320  | 0.0111          |
-| 0.0078        | 1.14  | 360  | 0.0098          |
-| 0.0059        | 1.27  | 400  | 0.0095          |
-| 0.006         | 1.39  | 440  | 0.0091          |
-| 0.0052        | 1.52  | 480  | 0.0078          |
-| 0.0059        | 1.65  | 520  | 0.0068          |
-| 0.0045        | 1.77  | 560  | 0.0066          |
-| 0.0044        | 1.9   | 600  | 0.0061          |
 ### Framework versions

 This model is a fine-tuned version of [baffo32/decapoda-research-llama-7B-hf](https://huggingface.co/baffo32/decapoda-research-llama-7B-hf) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0011
 ## Model description
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- training_steps: 1200
 - mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.086         | 0.13  | 40   | 0.0322          |
+| 0.0272        | 0.25  | 80   | 0.0212          |
+| 0.0208        | 0.38  | 120  | 0.0182          |
+| 0.0179        | 0.51  | 160  | 0.0171          |
+| 0.0176        | 0.63  | 200  | 0.0150          |
+| 0.0161        | 0.76  | 240  | 0.0125          |
+| 0.0129        | 0.89  | 280  | 0.0118          |
+| 0.013         | 1.01  | 320  | 0.0113          |
+| 0.0078        | 1.14  | 360  | 0.0092          |
+| 0.007         | 1.27  | 400  | 0.0081          |
+| 0.0065        | 1.39  | 440  | 0.0087          |
+| 0.0064        | 1.52  | 480  | 0.0091          |
+| 0.007         | 1.65  | 520  | 0.0063          |
+| 0.0048        | 1.77  | 560  | 0.0053          |
+| 0.005         | 1.9   | 600  | 0.0055          |
+| 0.004         | 2.03  | 640  | 0.0051          |
+| 0.0025        | 2.15  | 680  | 0.0040          |
+| 0.002         | 2.28  | 720  | 0.0042          |
+| 0.0021        | 2.41  | 760  | 0.0044          |
+| 0.0018        | 2.53  | 800  | 0.0035          |
+| 0.0015        | 2.66  | 840  | 0.0029          |
+| 0.0011        | 2.78  | 880  | 0.0022          |
+| 0.0012        | 2.91  | 920  | 0.0018          |
+| 0.0011        | 3.04  | 960  | 0.0015          |
+| 0.0002        | 3.16  | 1000 | 0.0013          |
+| 0.0003        | 3.29  | 1040 | 0.0015          |
+| 0.0002        | 3.42  | 1080 | 0.0014          |
+| 0.0004        | 3.54  | 1120 | 0.0012          |
+| 0.0002        | 3.67  | 1160 | 0.0011          |
+| 0.0002        | 3.8   | 1200 | 0.0011          |
 ### Framework versions

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ca196defb4a050cca7a987d37c5e84ee7b60d34461e57c6ffd8fdab4b32fef29
 size 268528394

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b3e63f02b46c5e4a42b6c4d89613db5413bc1d3a0a46c59c314a461b53fa865
 size 268528394

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5cd1692eca84d268b8028ce5704098898ae67a3d5c38d6dd1e3b59de6aaa82cf
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:88db30135de728d1c9ef61d0cbb03ec3bae6803809713c5693c24ad571d6242d
 size 4984