End of training

Browse files

Files changed (5) hide show

all_results.json +9 -9
eval_results.json +5 -5
runs/Dec16_18-49-35_129-146-104-29/events.out.tfevents.1671218042.129-146-104-29.141275.2 +3 -0
train_results.json +5 -5
trainer_state.json +81 -12

all_results.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "epoch": 100.0,
-    "eval_loss": 1.2280755043029785,
-    "eval_runtime": 477.4146,
-    "eval_samples_per_second": 1.072,
-    "eval_steps_per_second": 0.067,
     "eval_wer": 56.651029055690074,
-    "train_loss": 0.0004244298700775419,
-    "train_runtime": 836.7871,
-    "train_samples_per_second": 53.538,
-    "train_steps_per_second": 0.837
 }

 {
+    "epoch": 114.29,
+    "eval_loss": 1.227304458618164,
+    "eval_runtime": 520.721,
+    "eval_samples_per_second": 0.983,
+    "eval_steps_per_second": 0.031,
     "eval_wer": 56.651029055690074,
+    "train_loss": 0.0002984794275835156,
+    "train_runtime": 870.3377,
+    "train_samples_per_second": 58.828,
+    "train_steps_per_second": 0.919
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 100.0,
-    "eval_loss": 1.2280755043029785,
-    "eval_runtime": 477.4146,
-    "eval_samples_per_second": 1.072,
-    "eval_steps_per_second": 0.067,
     "eval_wer": 56.651029055690074
 }

 {
+    "epoch": 114.29,
+    "eval_loss": 1.227304458618164,
+    "eval_runtime": 520.721,
+    "eval_samples_per_second": 0.983,
+    "eval_steps_per_second": 0.031,
     "eval_wer": 56.651029055690074
 }

runs/Dec16_18-49-35_129-146-104-29/events.out.tfevents.1671218042.129-146-104-29.141275.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f788da650b08ffb9209415d679779a83d79ba0758e68bcd848249eb8b2bd3fcc
+size 358

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
-    "epoch": 100.0,
-    "train_loss": 0.0004244298700775419,
-    "train_runtime": 836.7871,
-    "train_samples_per_second": 53.538,
-    "train_steps_per_second": 0.837
 }

 {
+    "epoch": 114.29,
+    "train_loss": 0.0002984794275835156,
+    "train_runtime": 870.3377,
+    "train_samples_per_second": 58.828,
+    "train_steps_per_second": 0.919
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 56.651029055690074,
   "best_model_checkpoint": "./checkpoint-600",
-  "epoch": 100.0,
-  "global_step": 700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -383,18 +383,87 @@
       "step": 700
     },
     {
-      "epoch": 100.0,
-      "step": 700,
-      "total_flos": 4.53742824923136e+18,
-      "train_loss": 0.0004244298700775419,
-      "train_runtime": 836.7871,
-      "train_samples_per_second": 53.538,
-      "train_steps_per_second": 0.837
     }
   ],
-  "max_steps": 700,
-  "num_train_epochs": 100,
-  "total_flos": 4.53742824923136e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 56.651029055690074,
   "best_model_checkpoint": "./checkpoint-600",
+  "epoch": 114.28571428571429,
+  "global_step": 800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 700
     },
     {
+      "epoch": 101.43,
+      "learning_rate": 3.133333333333334e-06,
+      "loss": 0.0026,
+      "step": 710
+    },
+    {
+      "epoch": 102.86,
+      "learning_rate": 2.8000000000000003e-06,
+      "loss": 0.0025,
+      "step": 720
+    },
+    {
+      "epoch": 104.29,
+      "learning_rate": 2.466666666666667e-06,
+      "loss": 0.0025,
+      "step": 730
+    },
+    {
+      "epoch": 105.71,
+      "learning_rate": 2.133333333333334e-06,
+      "loss": 0.0024,
+      "step": 740
+    },
+    {
+      "epoch": 107.14,
+      "learning_rate": 1.8000000000000001e-06,
+      "loss": 0.0024,
+      "step": 750
+    },
+    {
+      "epoch": 108.57,
+      "learning_rate": 1.4666666666666669e-06,
+      "loss": 0.0023,
+      "step": 760
+    },
+    {
+      "epoch": 110.0,
+      "learning_rate": 1.1333333333333334e-06,
+      "loss": 0.0023,
+      "step": 770
+    },
+    {
+      "epoch": 111.43,
+      "learning_rate": 8.000000000000001e-07,
+      "loss": 0.0023,
+      "step": 780
+    },
+    {
+      "epoch": 112.86,
+      "learning_rate": 4.666666666666667e-07,
+      "loss": 0.0023,
+      "step": 790
+    },
+    {
+      "epoch": 114.29,
+      "learning_rate": 1.3333333333333336e-07,
+      "loss": 0.0023,
+      "step": 800
+    },
+    {
+      "epoch": 114.29,
+      "eval_loss": 1.2710366249084473,
+      "eval_runtime": 511.2588,
+      "eval_samples_per_second": 1.001,
+      "eval_steps_per_second": 0.031,
+      "eval_wer": 56.75696125907991,
+      "step": 800
+    },
+    {
+      "epoch": 114.29,
+      "step": 800,
+      "total_flos": 6.3156914860032e+18,
+      "train_loss": 0.0002984794275835156,
+      "train_runtime": 870.3377,
+      "train_samples_per_second": 58.828,
+      "train_steps_per_second": 0.919
     }
   ],
+  "max_steps": 800,
+  "num_train_epochs": 115,
+  "total_flos": 6.3156914860032e+18,
   "trial_name": null,
   "trial_params": null
 }