Marcos12886 commited on Sep 10

Commit

a0c9418

•

1 Parent(s): 08fe348

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

README.md +15 -15
checkpoint-121/model.safetensors +1 -1
checkpoint-121/optimizer.pt +1 -1
checkpoint-121/scheduler.pt +1 -1
checkpoint-121/trainer_state.json +43 -43
checkpoint-121/training_args.bin +1 -1
checkpoint-145/model.safetensors +1 -1
checkpoint-145/optimizer.pt +1 -1
checkpoint-145/scheduler.pt +1 -1
checkpoint-145/trainer_state.json +51 -51
checkpoint-145/training_args.bin +1 -1
checkpoint-169/model.safetensors +1 -1
checkpoint-169/optimizer.pt +1 -1
checkpoint-169/rng_state.pth +1 -1
checkpoint-169/scheduler.pt +1 -1
checkpoint-169/trainer_state.json +73 -97
checkpoint-169/training_args.bin +1 -1
checkpoint-194/model.safetensors +1 -1
checkpoint-194/optimizer.pt +1 -1
checkpoint-194/scheduler.pt +1 -1
checkpoint-194/trainer_state.json +68 -68
checkpoint-194/training_args.bin +1 -1
checkpoint-218/model.safetensors +1 -1
checkpoint-218/optimizer.pt +1 -1
checkpoint-218/scheduler.pt +1 -1
checkpoint-218/trainer_state.json +76 -76
checkpoint-218/training_args.bin +1 -1
checkpoint-24/model.safetensors +1 -1
checkpoint-24/optimizer.pt +1 -1
checkpoint-24/scheduler.pt +1 -1
checkpoint-24/trainer_state.json +11 -11
checkpoint-24/training_args.bin +1 -1
checkpoint-240/config.json +85 -0
checkpoint-240/model.safetensors +3 -0
checkpoint-240/optimizer.pt +3 -0
checkpoint-240/rng_state.pth +3 -0
checkpoint-240/scheduler.pt +3 -0
checkpoint-240/trainer_state.json +162 -0
checkpoint-240/training_args.bin +3 -0
checkpoint-48/model.safetensors +1 -1
checkpoint-48/optimizer.pt +1 -1
checkpoint-48/scheduler.pt +1 -1
checkpoint-48/trainer_state.json +19 -19
checkpoint-48/training_args.bin +1 -1
checkpoint-72/model.safetensors +1 -1
checkpoint-72/optimizer.pt +1 -1
checkpoint-72/scheduler.pt +1 -1
checkpoint-72/trainer_state.json +27 -27
checkpoint-72/training_args.bin +1 -1
checkpoint-97/model.safetensors +1 -1

README.md CHANGED Viewed

@@ -21,11 +21,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4003
-- Accuracy: 0.8603
-- Precision: 0.8644
-- Recall: 0.8603
-- F1: 0.8611
 ## Model description
@@ -59,16 +59,16 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
-| No log        | 0.9617 | 22   | 1.1426          | 0.4877   | 0.3200    | 0.4877 | 0.3244 |
-| No log        | 1.9672 | 45   | 0.8035          | 0.6877   | 0.6781    | 0.6877 | 0.6726 |
-| No log        | 2.9727 | 68   | 0.5866          | 0.7370   | 0.7267    | 0.7370 | 0.7179 |
-| No log        | 3.9781 | 91   | 0.5180          | 0.7945   | 0.7922    | 0.7945 | 0.7853 |
-| No log        | 4.9836 | 114  | 0.6972          | 0.7233   | 0.7954    | 0.7233 | 0.7300 |
-| No log        | 5.9891 | 137  | 0.5580          | 0.8055   | 0.8052    | 0.8055 | 0.7958 |
-| No log        | 6.9945 | 160  | 0.3853          | 0.8603   | 0.8584    | 0.8603 | 0.8584 |
-| No log        | 8.0    | 183  | 0.4090          | 0.8301   | 0.8415    | 0.8301 | 0.8318 |
-| No log        | 8.9617 | 205  | 0.3923          | 0.8630   | 0.8660    | 0.8630 | 0.8633 |
-| No log        | 9.6175 | 220  | 0.4003          | 0.8603   | 0.8644    | 0.8603 | 0.8611 |
 ### Framework versions

 This model is a fine-tuned version of [ntu-spml/distilhubert](https://huggingface.co/ntu-spml/distilhubert) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.4341
+- Accuracy: 0.8656
+- Precision: 0.8628
+- Recall: 0.8656
+- F1: 0.8629
 ## Model description
 | Training Loss | Epoch  | Step | Validation Loss | Accuracy | Precision | Recall | F1     |
 |:-------------:|:------:|:----:|:---------------:|:--------:|:---------:|:------:|:------:|
+| No log        | 0.9897 | 24   | 1.1718          | 0.4832   | 0.2335    | 0.4832 | 0.3148 |
+| No log        | 1.9794 | 48   | 0.7551          | 0.7235   | 0.7164    | 0.7235 | 0.7026 |
+| No log        | 2.9691 | 72   | 0.6834          | 0.7313   | 0.7621    | 0.7313 | 0.7074 |
+| No log        | 4.0    | 97   | 0.9938          | 0.6202   | 0.6844    | 0.6202 | 0.6161 |
+| No log        | 4.9897 | 121  | 0.4973          | 0.7881   | 0.7961    | 0.7881 | 0.7854 |
+| No log        | 5.9794 | 145  | 0.5254          | 0.7804   | 0.7843    | 0.7804 | 0.7817 |
+| No log        | 6.9691 | 169  | 0.4264          | 0.8475   | 0.8558    | 0.8475 | 0.8504 |
+| No log        | 8.0    | 194  | 0.4415          | 0.8656   | 0.8670    | 0.8656 | 0.8628 |
+| No log        | 8.9897 | 218  | 0.4115          | 0.8656   | 0.8651    | 0.8656 | 0.8649 |
+| No log        | 9.8969 | 240  | 0.4341          | 0.8656   | 0.8628    | 0.8656 | 0.8629 |
 ### Framework versions

checkpoint-121/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:61738703583616f26bc5974045f101b4badf661cb1bd5759b55ffedbf42f8309
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:70018b912cc31f04407d1e82b6579b497cb0a4c9d1fe58cce991fc2459540c94
 size 94765560

checkpoint-121/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a04d7aa37706181567dea5d9c17d0a79ae70a3f43b546fd604def5a5c896f325
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:997c0052dc18c15b0c00ff6b7f5f979b1f10ee85d5dd478ac31aec3c59104615
 size 189556666

checkpoint-121/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c4a0a93ff2c02ad8dfec37403a0eff289573d406127ab0a60fb4386bc8bcb2b
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f9c5f2a04362b085af0242d72c5af05a769e7bae4cee46ee7d346c9df7f1eba
 size 1064

checkpoint-121/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8010335917312662,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 4.989690721649485,
   "eval_steps": 500,
@@ -10,69 +10,69 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7881136950904393,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 4.989690721649485,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
       "step": 121
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-121/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-145/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62b1cac8d8be6152086485540750316f43a58660bddd11c298bb50d0f3f5f531
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9b4c786da0e0851be69580368fd5d534a86467be3071d9ea96324ca5e0176a7
 size 94765560

checkpoint-145/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f74fa4c7ca2e76ec752e5b913444b39e61cef0b5760afb453b5c55805b47cacc
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:a673f8f7ab1809cc9b549b3982b0a64589cbdccccf65a873c995d3b5ba6af28d
 size 189556666

checkpoint-145/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:62e2160d5bd28532b533e3efabec8ccad052eb12401ff324f1c912ac3e74c929
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:4ce77a15ff28da0b94b70192478b0d3dfb304ac1b9a3e90e47f0a9e682aca696
 size 1064

checkpoint-145/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.8010335917312662,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 5.979381443298969,
   "eval_steps": 500,
@@ -10,81 +10,81 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7881136950904393,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-121",
   "epoch": 5.979381443298969,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.7803617571059431,
+      "eval_f1": 0.781727235222138,
+      "eval_loss": 0.5254013538360596,
+      "eval_precision": 0.7843017570642586,
+      "eval_recall": 0.7803617571059431,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 240.428,
+      "eval_steps_per_second": 30.442,
       "step": 145
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-145/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-169/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57abe97d93d5519d7d9477681f8db2f99cf47daf96fd63ca516ef55b3e3f9045
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:0ddbb394005b9ac70d5bc17bcb01362284d0d2278a1e44b6ce7c3513e050d418
 size 94765560

checkpoint-169/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4802e1fb9625031658b7796945aeb5ba21b25214affa519eae03e83c38d1acc7
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:9e66e987ee75130be9aa72386f5d1880fcb1b2c247117c7798a2a85074ab7eba
 size 189556666

checkpoint-169/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0b9f68c26a4ae1b782074e23956e72eabe9fc24b5e5668651fa004052923dfaa
 size 14308

 version https://git-lfs.github.com/spec/v1
+oid sha256:b3d85d4b435d4ac4552bb46f32d5f63a55dbc65baaa5af6a14b6b39e968f4b8e
 size 14308

checkpoint-169/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e420c01bd37908254d6db59a8dc2bbd2ef1511c17e4668e659e1910a4f12ae20
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:df821f017f2db25687bec6d111c0161751da33a1a44b650c4ff88a56a7c16d8f
 size 1064

checkpoint-169/trainer_state.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-  "best_metric": 0.8145695364238411,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-169",
-  "epoch": 8.95364238410596,
   "eval_steps": 500,
   "global_step": 169,
   "is_hyper_param_search": false,
@@ -9,116 +9,92 @@
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.9536423841059603,
-      "eval_accuracy": 0.5298013245033113,
-      "eval_f1": 0.43216404525386315,
-      "eval_loss": 1.1326755285263062,
-      "eval_precision": 0.5213817284211205,
-      "eval_recall": 0.5298013245033113,
-      "eval_runtime": 1.2241,
-      "eval_samples_per_second": 246.709,
-      "eval_steps_per_second": 31.043,
-      "step": 18
     },
     {
-      "epoch": 1.9602649006622517,
-      "eval_accuracy": 0.6423841059602649,
-      "eval_f1": 0.5806184720425087,
-      "eval_loss": 0.9228919744491577,
-      "eval_precision": 0.5520930002801896,
-      "eval_recall": 0.6423841059602649,
-      "eval_runtime": 1.2236,
-      "eval_samples_per_second": 246.807,
-      "eval_steps_per_second": 31.055,
-      "step": 37
     },
     {
-      "epoch": 2.966887417218543,
-      "eval_accuracy": 0.7086092715231788,
-      "eval_f1": 0.6539391094940458,
-      "eval_loss": 0.7409619688987732,
-      "eval_precision": 0.752516290193287,
-      "eval_recall": 0.7086092715231788,
-      "eval_runtime": 1.2459,
-      "eval_samples_per_second": 242.403,
-      "eval_steps_per_second": 30.501,
-      "step": 56
     },
     {
-      "epoch": 3.9735099337748343,
-      "eval_accuracy": 0.7450331125827815,
-      "eval_f1": 0.7012377717797856,
-      "eval_loss": 0.6461689472198486,
-      "eval_precision": 0.7242129191632504,
-      "eval_recall": 0.7450331125827815,
-      "eval_runtime": 1.229,
-      "eval_samples_per_second": 245.723,
-      "eval_steps_per_second": 30.919,
-      "step": 75
     },
     {
-      "epoch": 4.9801324503311255,
-      "eval_accuracy": 0.7980132450331126,
-      "eval_f1": 0.7903709596982513,
-      "eval_loss": 0.5553261041641235,
-      "eval_precision": 0.7925903096412185,
-      "eval_recall": 0.7980132450331126,
-      "eval_runtime": 1.2897,
-      "eval_samples_per_second": 234.157,
-      "eval_steps_per_second": 29.463,
-      "step": 94
     },
     {
-      "epoch": 5.986754966887418,
-      "eval_accuracy": 0.7781456953642384,
-      "eval_f1": 0.7717607879297459,
-      "eval_loss": 0.5255588293075562,
-      "eval_precision": 0.7771454278224522,
-      "eval_recall": 0.7781456953642384,
-      "eval_runtime": 1.2928,
-      "eval_samples_per_second": 233.597,
-      "eval_steps_per_second": 29.393,
-      "step": 113
     },
     {
-      "epoch": 6.993377483443709,
-      "eval_accuracy": 0.7980132450331126,
-      "eval_f1": 0.7833793670187674,
-      "eval_loss": 0.5077652335166931,
-      "eval_precision": 0.7917508237685551,
-      "eval_recall": 0.7980132450331126,
-      "eval_runtime": 1.2898,
-      "eval_samples_per_second": 234.154,
-      "eval_steps_per_second": 29.463,
-      "step": 132
-    },
-    {
-      "epoch": 8.0,
-      "eval_accuracy": 0.8112582781456954,
-      "eval_f1": 0.8021247299665692,
-      "eval_loss": 0.4742371141910553,
-      "eval_precision": 0.8054865043662888,
-      "eval_recall": 0.8112582781456954,
-      "eval_runtime": 1.381,
-      "eval_samples_per_second": 218.682,
-      "eval_steps_per_second": 27.516,
-      "step": 151
-    },
-    {
-      "epoch": 8.95364238410596,
-      "eval_accuracy": 0.8145695364238411,
-      "eval_f1": 0.805819805920304,
-      "eval_loss": 0.4742475152015686,
-      "eval_precision": 0.8065208989148904,
-      "eval_recall": 0.8145695364238411,
-      "eval_runtime": 1.2663,
-      "eval_samples_per_second": 238.482,
-      "eval_steps_per_second": 30.008,
       "step": 169
     }
   ],
   "logging_steps": 500,
-  "max_steps": 180,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 10,
   "save_steps": 500,
@@ -143,7 +119,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.472539116032e+16,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.8475452196382429,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-169",
+  "epoch": 6.969072164948454,
   "eval_steps": 500,
   "global_step": 169,
   "is_hyper_param_search": false,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
+      "step": 24
     },
     {
+      "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
+      "step": 48
     },
     {
+      "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
+      "step": 72
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
+      "step": 97
     },
     {
+      "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
+      "step": 121
     },
     {
+      "epoch": 5.979381443298969,
+      "eval_accuracy": 0.7803617571059431,
+      "eval_f1": 0.781727235222138,
+      "eval_loss": 0.5254013538360596,
+      "eval_precision": 0.7843017570642586,
+      "eval_recall": 0.7803617571059431,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 240.428,
+      "eval_steps_per_second": 30.442,
+      "step": 145
     },
     {
+      "epoch": 6.969072164948454,
+      "eval_accuracy": 0.8475452196382429,
+      "eval_f1": 0.8504309219603966,
+      "eval_loss": 0.42636802792549133,
+      "eval_precision": 0.8557626671638175,
+      "eval_recall": 0.8475452196382429,
+      "eval_runtime": 1.6741,
+      "eval_samples_per_second": 231.171,
+      "eval_steps_per_second": 29.27,
       "step": 169
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 10,
   "save_steps": 500,
       "attributes": {}
     }
   },
+  "total_flos": 2.45957602464e+16,
   "train_batch_size": 8,
   "trial_name": null,
   "trial_params": null

checkpoint-169/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b8f2331f3c3c1c25969cfb888574c70dd0e5a19519d8cecb6198afe5225b5a53
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-194/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d03ee65315496952ebb447ef8a2d41c18b1e5e1649887b43e9d670daab42cd79
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:a3a627702cd14b16dbfa2578e7673bd3814fac0eb9375d373c2f06a0a1d5a738
 size 94765560

checkpoint-194/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:21b9a71b29339ce815e0272ac73c5e9382e8e4b94e000d00c2c15c46fcaf1bb1
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:96506f68c35bc380113ed68f683cfdb89562b8e18cd99f04207e7f2cf6c07543
 size 189556666

checkpoint-194/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6cf3f9f9e1b079187c143133062b7476177d05ae3b26e39797b7b8deffda481f
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9baadb1a4e65e06e7e3878b0e06173eb575209134ab9848c9fd367b8c2a762e0
 size 1064

checkpoint-194/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8397932816537468,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-169",
   "epoch": 8.0,
   "eval_steps": 500,
   "global_step": 194,
@@ -10,105 +10,105 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.8656330749354005,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.0,
   "eval_steps": 500,
   "global_step": 194,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.7803617571059431,
+      "eval_f1": 0.781727235222138,
+      "eval_loss": 0.5254013538360596,
+      "eval_precision": 0.7843017570642586,
+      "eval_recall": 0.7803617571059431,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 240.428,
+      "eval_steps_per_second": 30.442,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.8475452196382429,
+      "eval_f1": 0.8504309219603966,
+      "eval_loss": 0.42636802792549133,
+      "eval_precision": 0.8557626671638175,
+      "eval_recall": 0.8475452196382429,
+      "eval_runtime": 1.6741,
+      "eval_samples_per_second": 231.171,
+      "eval_steps_per_second": 29.27,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8627731371728347,
+      "eval_loss": 0.4414582848548889,
+      "eval_precision": 0.8670254176803228,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6573,
+      "eval_samples_per_second": 233.512,
+      "eval_steps_per_second": 29.566,
       "step": 194
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-194/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-218/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f22baf06235c468452afb48784bcfe17b8d6b16547f92c897a6b83b9d4be1927
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:28660ecbedd8800f912a5673efca37a66998ebce7acd99c4bc922036560b2975
 size 94765560

checkpoint-218/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3b107c786ae699e053540620707226aced653806a534f7bf2c3d041d5a799d0d
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:22cdbaee61cabc6fda6bb731be8bc654cb40396c4c4e2be92d86d4a184ef0728
 size 189556666

checkpoint-218/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e51016c1626b13f8e0c2274df9c63eb74ef480d103cd1eaea425e0978c8cf392
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:05468f3e42af9ca556e835b8f8bb03232840d74963a2a7b94013d776ea21eb80
 size 1064

checkpoint-218/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.8475452196382429,
-  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-218",
   "epoch": 8.989690721649485,
   "eval_steps": 500,
   "global_step": 218,
@@ -10,117 +10,117 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.7984496124031008,
-      "eval_f1": 0.7873621619744228,
-      "eval_loss": 0.5430988073348999,
-      "eval_precision": 0.79180344284319,
-      "eval_recall": 0.7984496124031008,
-      "eval_runtime": 1.7027,
-      "eval_samples_per_second": 227.289,
-      "eval_steps_per_second": 28.778,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
-      "eval_accuracy": 0.8010335917312662,
-      "eval_f1": 0.7974946178390901,
-      "eval_loss": 0.5268548130989075,
-      "eval_precision": 0.8005965453214461,
-      "eval_recall": 0.8010335917312662,
-      "eval_runtime": 1.6829,
-      "eval_samples_per_second": 229.957,
-      "eval_steps_per_second": 29.116,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.7551329793037762,
-      "eval_loss": 0.5810549259185791,
-      "eval_precision": 0.7802262423287315,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6999,
-      "eval_samples_per_second": 227.658,
-      "eval_steps_per_second": 28.825,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
-      "eval_accuracy": 0.8397932816537468,
-      "eval_f1": 0.8354840008265724,
-      "eval_loss": 0.44080850481987,
-      "eval_precision": 0.8365717854569443,
-      "eval_recall": 0.8397932816537468,
-      "eval_runtime": 1.6785,
-      "eval_samples_per_second": 230.56,
-      "eval_steps_per_second": 29.192,
       "step": 169
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.8191214470284238,
-      "eval_f1": 0.8167837576120855,
-      "eval_loss": 0.46871018409729004,
-      "eval_precision": 0.8187643627479353,
-      "eval_recall": 0.8191214470284238,
-      "eval_runtime": 1.6719,
-      "eval_samples_per_second": 231.477,
-      "eval_steps_per_second": 29.308,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
-      "eval_accuracy": 0.8475452196382429,
-      "eval_f1": 0.8473710740005564,
-      "eval_loss": 0.4363822937011719,
-      "eval_precision": 0.8483238707679635,
-      "eval_recall": 0.8475452196382429,
-      "eval_runtime": 1.6838,
-      "eval_samples_per_second": 229.835,
-      "eval_steps_per_second": 29.101,
       "step": 218
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.8656330749354005,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
   "epoch": 8.989690721649485,
   "eval_steps": 500,
   "global_step": 218,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
       "step": 72
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
       "step": 97
     },
     {
       "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
       "step": 121
     },
     {
       "epoch": 5.979381443298969,
+      "eval_accuracy": 0.7803617571059431,
+      "eval_f1": 0.781727235222138,
+      "eval_loss": 0.5254013538360596,
+      "eval_precision": 0.7843017570642586,
+      "eval_recall": 0.7803617571059431,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 240.428,
+      "eval_steps_per_second": 30.442,
       "step": 145
     },
     {
       "epoch": 6.969072164948454,
+      "eval_accuracy": 0.8475452196382429,
+      "eval_f1": 0.8504309219603966,
+      "eval_loss": 0.42636802792549133,
+      "eval_precision": 0.8557626671638175,
+      "eval_recall": 0.8475452196382429,
+      "eval_runtime": 1.6741,
+      "eval_samples_per_second": 231.171,
+      "eval_steps_per_second": 29.27,
       "step": 169
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8627731371728347,
+      "eval_loss": 0.4414582848548889,
+      "eval_precision": 0.8670254176803228,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6573,
+      "eval_samples_per_second": 233.512,
+      "eval_steps_per_second": 29.566,
       "step": 194
     },
     {
       "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8648808138390941,
+      "eval_loss": 0.4115408658981323,
+      "eval_precision": 0.8650901526054525,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6461,
+      "eval_samples_per_second": 235.106,
+      "eval_steps_per_second": 29.768,
       "step": 218
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-218/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-24/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2a3bee6833ba8b12da8d51850147bb3c3b153eec346dfd3b0fda4ff730aa9026
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:d95db9670c0e00359e684b13ba791d256154dc75e057deabe4d20fd9d0554235
 size 94765560

checkpoint-24/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:856d9a47a6db002c6e55d97a99db231cee10d1fef5c0909f7d527b86c30af746
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:a82ca177e922f7eb2017da7cfd0f85cb2f6f94396cd239a01bca3e3798f310b8
 size 189556666

checkpoint-24/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a45410ab60db58a246b1af794984e39ea7655e4cee627c4cdfe5bd40727f72a
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:199b7ea3cf1a15c2128c334c968f9f4a32fee4fdb9c39d77658a7126eada7cf8
 size 1064

checkpoint-24/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.6356589147286822,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-24",
   "epoch": 0.9896907216494846,
   "eval_steps": 500,
@@ -10,21 +10,21 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.48320413436692505,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-24",
   "epoch": 0.9896907216494846,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-24/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-240/config.json ADDED Viewed

	@@ -0,0 +1,85 @@

+{
+  "_name_or_path": "ntu-spml/distilhubert",
+  "activation_dropout": 0.1,
+  "apply_spec_augment": false,
+  "architectures": [
+    "HubertForSequenceClassification"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "sum",
+  "ctc_zero_infinity": false,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.0,
+  "feat_proj_layer_norm": false,
+  "final_dropout": 0.0,
+  "finetuning_task": "audio-classification",
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "1s_normal",
+    "1": "1s_pain",
+    "2": "1s_hunger",
+    "3": "1s_asphyxia"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "1s_asphyxia": 3,
+    "1s_hunger": 2,
+    "1s_normal": 0,
+    "1s_pain": 1
+  },
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "model_type": "hubert",
+  "num_attention_heads": 12,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 2,
+  "pad_token_id": 0,
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.2",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32
+}

checkpoint-240/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:92d699cc9f111730f27e926e204d785c6edcdaa6db0e4e31a03b31178120be85
+size 94765560

checkpoint-240/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02265945a9b9df7108c893934c9f1e83b666674d8cf2044e05bfb54774f0ec5e
+size 189556666

checkpoint-240/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa08735989c33a0829468f970a7eea2caca2871ec3d3c1f5b6fd56289f75077f
+size 14308

checkpoint-240/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aa3fb3e2f8633048c1c6df5f62d8f415873cae8a8bc433ff826bcb996ed1b35b
+size 1064

checkpoint-240/trainer_state.json ADDED Viewed

	@@ -0,0 +1,162 @@

+{
+  "best_metric": 0.8656330749354005,
+  "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-194",
+  "epoch": 9.896907216494846,
+  "eval_steps": 500,
+  "global_step": 240,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
+      "step": 24
+    },
+    {
+      "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
+      "step": 48
+    },
+    {
+      "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
+      "step": 72
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.6201550387596899,
+      "eval_f1": 0.616059564047211,
+      "eval_loss": 0.9937827587127686,
+      "eval_precision": 0.6843785822798868,
+      "eval_recall": 0.6201550387596899,
+      "eval_runtime": 1.5998,
+      "eval_samples_per_second": 241.901,
+      "eval_steps_per_second": 30.628,
+      "step": 97
+    },
+    {
+      "epoch": 4.989690721649485,
+      "eval_accuracy": 0.7881136950904393,
+      "eval_f1": 0.7854190251131377,
+      "eval_loss": 0.4972754120826721,
+      "eval_precision": 0.7961139879912458,
+      "eval_recall": 0.7881136950904393,
+      "eval_runtime": 1.5913,
+      "eval_samples_per_second": 243.196,
+      "eval_steps_per_second": 30.792,
+      "step": 121
+    },
+    {
+      "epoch": 5.979381443298969,
+      "eval_accuracy": 0.7803617571059431,
+      "eval_f1": 0.781727235222138,
+      "eval_loss": 0.5254013538360596,
+      "eval_precision": 0.7843017570642586,
+      "eval_recall": 0.7803617571059431,
+      "eval_runtime": 1.6096,
+      "eval_samples_per_second": 240.428,
+      "eval_steps_per_second": 30.442,
+      "step": 145
+    },
+    {
+      "epoch": 6.969072164948454,
+      "eval_accuracy": 0.8475452196382429,
+      "eval_f1": 0.8504309219603966,
+      "eval_loss": 0.42636802792549133,
+      "eval_precision": 0.8557626671638175,
+      "eval_recall": 0.8475452196382429,
+      "eval_runtime": 1.6741,
+      "eval_samples_per_second": 231.171,
+      "eval_steps_per_second": 29.27,
+      "step": 169
+    },
+    {
+      "epoch": 8.0,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8627731371728347,
+      "eval_loss": 0.4414582848548889,
+      "eval_precision": 0.8670254176803228,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6573,
+      "eval_samples_per_second": 233.512,
+      "eval_steps_per_second": 29.566,
+      "step": 194
+    },
+    {
+      "epoch": 8.989690721649485,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8648808138390941,
+      "eval_loss": 0.4115408658981323,
+      "eval_precision": 0.8650901526054525,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6461,
+      "eval_samples_per_second": 235.106,
+      "eval_steps_per_second": 29.768,
+      "step": 218
+    },
+    {
+      "epoch": 9.896907216494846,
+      "eval_accuracy": 0.8656330749354005,
+      "eval_f1": 0.8628955278832856,
+      "eval_loss": 0.43414339423179626,
+      "eval_precision": 0.8627959308862513,
+      "eval_recall": 0.8656330749354005,
+      "eval_runtime": 1.6443,
+      "eval_samples_per_second": 235.354,
+      "eval_steps_per_second": 29.799,
+      "step": 240
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 240,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "EarlyStoppingCallback": {
+      "args": {
+        "early_stopping_patience": 3,
+        "early_stopping_threshold": 0.0
+      },
+      "attributes": {
+        "early_stopping_patience_counter": 0
+      }
+    },
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 3.478884368832e+16,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-240/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
+size 5240

checkpoint-48/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:874cfd79e7f8f79117c607a043371e2575cea36eabf3fab57dfe6214765f959e
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:6b9973cea0a92ccc3ba76ebb1572eeb391cb070cd494b1e82ef996c7e69204f3
 size 94765560

checkpoint-48/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d792dfa624618623c122f4b38eba2876c358b26c734e775720bedeee75004233
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:33f1b47628687588437ef703f63052450c7ccfdc0cef0369b13f2275efdac0b9
 size 189556666

checkpoint-48/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee8b157b5f1b2ae4a4ed28de279e432d640c2b1a56a597116f40e8a0eb7df070
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6157ea2d7163d9ac50ea4f077ca9c7fa0d3ce8899911031b31211d905abbd26
 size 1064

checkpoint-48/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.7157622739018088,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-48",
   "epoch": 1.9793814432989691,
   "eval_steps": 500,
@@ -10,33 +10,33 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7235142118863049,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-48",
   "epoch": 1.9793814432989691,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-48/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-72/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7319a5906007abccfee6b3903d9644c4f1555218c42143551e3fdc5ddafdaeff
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:6fafe5e8d3a221adf5fdc2f30cb4c69093527425a911ded5ed478ac7f0fbbab8
 size 94765560

checkpoint-72/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:07d214f9dd1fc10263bc5278f794a09463e71a214c7c58fea77ceb2220d3d450
 size 189556666

 version https://git-lfs.github.com/spec/v1
+oid sha256:5253a07ab7d3da8498ae929967529fe03141787454a800994517fb089f02a794
 size 189556666

checkpoint-72/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ee44eb10c5d626424dbeae30798ab223335ff2f90371a9f029e92a7d6ba8ece6
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:dfa659e6db81ea93ae5bc5128ce82974afbbc53d7f1ac1e100d0fe2f646dac9c
 size 1064

checkpoint-72/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.7493540051679587,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-72",
   "epoch": 2.9690721649484537,
   "eval_steps": 500,
@@ -10,45 +10,45 @@
   "log_history": [
     {
       "epoch": 0.9896907216494846,
-      "eval_accuracy": 0.6356589147286822,
-      "eval_f1": 0.5920563016978556,
-      "eval_loss": 0.980873703956604,
-      "eval_precision": 0.5920482291587493,
-      "eval_recall": 0.6356589147286822,
-      "eval_runtime": 1.6668,
-      "eval_samples_per_second": 232.175,
-      "eval_steps_per_second": 29.397,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
-      "eval_accuracy": 0.7157622739018088,
-      "eval_f1": 0.6905410405322238,
-      "eval_loss": 0.7444477081298828,
-      "eval_precision": 0.6992377248989063,
-      "eval_recall": 0.7157622739018088,
-      "eval_runtime": 1.6941,
-      "eval_samples_per_second": 228.443,
-      "eval_steps_per_second": 28.924,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
-      "eval_accuracy": 0.7493540051679587,
-      "eval_f1": 0.744898505571463,
-      "eval_loss": 0.6171658039093018,
-      "eval_precision": 0.7437592422989429,
-      "eval_recall": 0.7493540051679587,
-      "eval_runtime": 1.6943,
-      "eval_samples_per_second": 228.408,
-      "eval_steps_per_second": 28.92,
       "step": 72
     }
   ],
   "logging_steps": 500,
-  "max_steps": 360,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

 {
+  "best_metric": 0.7312661498708011,
   "best_model_checkpoint": "distilhubert-finetuned-mixed-data/checkpoint-72",
   "epoch": 2.9690721649484537,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 0.9896907216494846,
+      "eval_accuracy": 0.48320413436692505,
+      "eval_f1": 0.31484032448297905,
+      "eval_loss": 1.1717983484268188,
+      "eval_precision": 0.23348623546928937,
+      "eval_recall": 0.48320413436692505,
+      "eval_runtime": 1.6682,
+      "eval_samples_per_second": 231.984,
+      "eval_steps_per_second": 29.373,
       "step": 24
     },
     {
       "epoch": 1.9793814432989691,
+      "eval_accuracy": 0.7235142118863049,
+      "eval_f1": 0.7025965349533153,
+      "eval_loss": 0.7550917863845825,
+      "eval_precision": 0.7163905403042491,
+      "eval_recall": 0.7235142118863049,
+      "eval_runtime": 1.6003,
+      "eval_samples_per_second": 241.836,
+      "eval_steps_per_second": 30.62,
       "step": 48
     },
     {
       "epoch": 2.9690721649484537,
+      "eval_accuracy": 0.7312661498708011,
+      "eval_f1": 0.7074435618655927,
+      "eval_loss": 0.6834394335746765,
+      "eval_precision": 0.7620582207432803,
+      "eval_recall": 0.7312661498708011,
+      "eval_runtime": 1.604,
+      "eval_samples_per_second": 241.278,
+      "eval_steps_per_second": 30.549,
       "step": 72
     }
   ],
   "logging_steps": 500,
+  "max_steps": 240,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 10,
   "save_steps": 500,
   "stateful_callbacks": {
     "EarlyStoppingCallback": {

checkpoint-72/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:347144964cf2be899f8dce858b11b47f463178200e095ec0ecada560c69f675a
 size 5240

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2ff390684074a66989eebeff6ed959257b86635b10b23f58026b7546138ab89
 size 5240

checkpoint-97/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c8acff5615edba2b47fa24da4e5111226931a4f7f775b8443933bf1c1b200335
 size 94765560

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c696fbcea3f1eabb848deb6435364111d0671928df2bef22696b10348e54c32
 size 94765560