End of training

Files changed (7) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 30.0,
+    "eval_cer": 0.13557177967326875,
+    "eval_loss": 0.5598823428153992,
+    "eval_runtime": 13.1271,
+    "eval_samples_per_second": 49.287,
+    "eval_steps_per_second": 6.17,
+    "eval_wer": 0.31477832512315274,
+    "predict_samples": 647,
+    "train_loss": 1.155013433122852,
+    "train_runtime": 1766.4943,
+    "train_samples": 2550,
+    "train_samples_per_second": 43.306,
+    "train_steps_per_second": 0.679
+}

config.json CHANGED Viewed

@@ -99,7 +99,7 @@
     1,
     1
   ],
-  "torch_dtype": "float32",
   "transformers_version": "4.18.0.dev0",
   "use_weighted_layer_sum": false,
   "vocab_size": 60,

     1,
     1
   ],
+  "torch_dtype": "float16",
   "transformers_version": "4.18.0.dev0",
   "use_weighted_layer_sum": false,
   "vocab_size": 60,

predict_results.json ADDED Viewed

+{
+    "epoch": 30.0,
+    "eval_cer": 0.13557177967326875,
+    "eval_loss": 0.5598823428153992,
+    "eval_runtime": 13.1271,
+    "eval_samples_per_second": 49.287,
+    "eval_steps_per_second": 6.17,
+    "eval_wer": 0.31477832512315274,
+    "predict_samples": 647
+}

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ac4c92e046036478dab89d42e824431ab1137aadf8469a9d8e88839ef6d85088
-size 1262172273

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b7512897c93bb57be775272565263faf5e6f675275fb059051b66d5466c7005
+size 631171825

runs/Apr28_10-44-54_anton-xtreme-s/events.out.tfevents.1651144619.anton-xtreme-s.31733.2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f00af37b65d9acf2f699954ecb493aa06c54c5a0a6cdbabd07a6e4d0394dce7
+size 830

train_results.json ADDED Viewed

+{
+    "epoch": 30.0,
+    "train_loss": 1.155013433122852,
+    "train_runtime": 1766.4943,
+    "train_samples": 2550,
+    "train_samples_per_second": 43.306,
+    "train_steps_per_second": 0.679
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff