Upload 12 files

Browse files

Files changed (7) hide show

optimizer.pt +1 -1
pytorch_model.bin +1 -1
rng_state.pth +2 -2
scaler.pt +1 -1
scheduler.pt +1 -1
trainer_state.json +32 -128
training_args.bin +1 -1

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bed063b4186f03787edb99c074dbb586b99f5162085d5c16e0db4cbcb0a4f632
 size 2490594117

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5acf3b5453e7ae9cf209df888fb143d9f2da40adf070d6a3d025caa438f8739
 size 2490594117

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9a5e177135e49a5cecca9645170889d50c62923d9a76429da7138d06c224d1da
 size 1262168365

 version https://git-lfs.github.com/spec/v1
+oid sha256:71bda9f90725233cac8670bf36b60117f18383968a3933b4a0555a23b7c15279
 size 1262168365

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b5477abcf468982052803c535d0ca7e85d3b5529a3db76f938926b09683583b
-size 14575

 version https://git-lfs.github.com/spec/v1
+oid sha256:bb7602cd5e8794b2d59d7a8b65b5ec6bf6159ef05734d0ad6928196a70d07daf
+size 14639

scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25b49edd22c6273e0961ea9beb65cba08c556a16b608c3406a5432bac4cb2a57
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8cbeae9563088ca9bba5c5c22688b1f3ca3cf93bb99af3f85f8c6cc9cab6fa6
 size 557

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d955e432a5975234ea4c4b68a9fcfc654a3b35487b3555ca89a82642063ca66b
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:e6b46c84ae4fe317e348faba65da33d430fc6f16849dfa16b90ea095086de29d
 size 627

trainer_state.json CHANGED Viewed

@@ -1,163 +1,67 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 26.314754098360655,
-  "global_step": 3000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 1.31,
-      "learning_rate": 9.99957013773138e-06,
-      "loss": 0.029,
       "step": 150
     },
     {
-      "epoch": 2.63,
-      "learning_rate": 9.998254232827442e-06,
-      "loss": 0.0249,
       "step": 300
     },
     {
-      "epoch": 3.94,
-      "learning_rate": 9.996938327923503e-06,
-      "loss": 0.0239,
       "step": 450
     },
     {
-      "epoch": 5.26,
-      "learning_rate": 9.995622423019565e-06,
-      "loss": 0.0223,
       "step": 600
     },
     {
-      "epoch": 6.58,
-      "learning_rate": 9.994306518115625e-06,
-      "loss": 0.0219,
       "step": 750
     },
     {
-      "epoch": 7.89,
-      "learning_rate": 9.992990613211686e-06,
-      "loss": 0.0215,
       "step": 900
     },
     {
-      "epoch": 8.77,
-      "eval_loss": 0.21139128506183624,
-      "eval_runtime": 432.0782,
-      "eval_samples_per_second": 9.443,
-      "eval_steps_per_second": 1.18,
-      "eval_wer": 0.1666585139167441,
-      "step": 1000
-    },
-    {
-      "epoch": 9.21,
-      "learning_rate": 9.991674708307746e-06,
-      "loss": 0.0207,
       "step": 1050
     },
     {
-      "epoch": 10.52,
-      "learning_rate": 9.990358803403808e-06,
-      "loss": 0.0209,
-      "step": 1200
-    },
-    {
-      "epoch": 11.84,
-      "learning_rate": 9.989042898499869e-06,
-      "loss": 0.0193,
-      "step": 1350
-    },
-    {
-      "epoch": 13.16,
-      "learning_rate": 9.98772699359593e-06,
-      "loss": 0.02,
-      "step": 1500
-    },
-    {
-      "epoch": 14.47,
-      "learning_rate": 9.986411088691991e-06,
-      "loss": 0.0191,
-      "step": 1650
-    },
-    {
-      "epoch": 15.79,
-      "learning_rate": 9.985095183788054e-06,
-      "loss": 0.0189,
-      "step": 1800
-    },
-    {
-      "epoch": 17.1,
-      "learning_rate": 9.983779278884114e-06,
-      "loss": 0.0185,
-      "step": 1950
-    },
-    {
-      "epoch": 17.54,
-      "eval_loss": 0.2301694005727768,
-      "eval_runtime": 231.0348,
-      "eval_samples_per_second": 17.66,
-      "eval_steps_per_second": 2.207,
-      "eval_wer": 0.16558235092696766,
-      "step": 2000
-    },
-    {
-      "epoch": 18.42,
-      "learning_rate": 9.982463373980174e-06,
-      "loss": 0.0184,
-      "step": 2100
-    },
-    {
-      "epoch": 19.73,
-      "learning_rate": 9.981147469076235e-06,
-      "loss": 0.0186,
-      "step": 2250
-    },
-    {
-      "epoch": 21.05,
-      "learning_rate": 9.979831564172297e-06,
-      "loss": 0.0174,
-      "step": 2400
-    },
-    {
-      "epoch": 22.37,
-      "learning_rate": 9.978515659268357e-06,
-      "loss": 0.0175,
-      "step": 2550
-    },
-    {
-      "epoch": 23.68,
-      "learning_rate": 9.977199754364418e-06,
-      "loss": 0.0169,
-      "step": 2700
-    },
-    {
-      "epoch": 25.0,
-      "learning_rate": 9.97588384946048e-06,
-      "loss": 0.0174,
-      "step": 2850
-    },
-    {
-      "epoch": 26.31,
-      "learning_rate": 9.974567944556542e-06,
-      "loss": 0.0175,
-      "step": 3000
-    },
-    {
-      "epoch": 26.31,
-      "eval_loss": 0.23709918558597565,
-      "eval_runtime": 224.4917,
-      "eval_samples_per_second": 18.174,
-      "eval_steps_per_second": 2.272,
-      "eval_wer": 0.16504426943207945,
-      "step": 3000
     }
   ],
-  "max_steps": 1140000,
   "num_train_epochs": 10000,
-  "total_flos": 8.535940964167849e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 12.087431693989071,
+  "global_step": 1100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 1.64,
+      "learning_rate": 4.999725244532367e-06,
+      "loss": 0.0243,
       "step": 150
     },
     {
+      "epoch": 3.3,
+      "learning_rate": 4.998900978129465e-06,
+      "loss": 0.0192,
       "step": 300
     },
     {
+      "epoch": 4.94,
+      "learning_rate": 4.998076711726564e-06,
+      "loss": 0.0175,
       "step": 450
     },
     {
+      "epoch": 6.59,
+      "learning_rate": 4.997252445323663e-06,
+      "loss": 0.0174,
       "step": 600
     },
     {
+      "epoch": 8.24,
+      "learning_rate": 4.996428178920761e-06,
+      "loss": 0.0168,
       "step": 750
     },
     {
+      "epoch": 9.89,
+      "learning_rate": 4.995609407627212e-06,
+      "loss": 0.0175,
       "step": 900
     },
     {
+      "epoch": 11.54,
+      "learning_rate": 4.994785141224311e-06,
+      "loss": 0.0168,
       "step": 1050
     },
     {
+      "epoch": 12.09,
+      "eval_loss": 0.23020002245903015,
+      "eval_runtime": 433.719,
+      "eval_samples_per_second": 9.407,
+      "eval_steps_per_second": 1.176,
+      "eval_wer": 0.16092909535452324,
+      "step": 1100
     }
   ],
+  "max_steps": 910000,
   "num_train_epochs": 10000,
+  "total_flos": 3.930570221142893e+19,
   "trial_name": null,
   "trial_params": null
 }

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:38fe6647c74d4bfa083d20aefd98944f22f415066e1f9f366d882e66134054bf
 size 3323

 version https://git-lfs.github.com/spec/v1
+oid sha256:ac89f9984dd853509f158f5c63d67654b0bc1d76d097b923ea0fef638f790ce5
 size 3323