jikaixuan
/

zephyr-ds

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c4d27920bc2b739a86b45b5d78876cde77b5ebbfffbcd54acbedb78aceb29bdb
 size 109086672

 version https://git-lfs.github.com/spec/v1
+oid sha256:00939d9330e0ca755ea426cd1027d9495c60be5fc0f3709bd197a1640cb76326
 size 109086672

all_results.json CHANGED Viewed

@@ -10,14 +10,14 @@
     "eval_rewards/chosen": 0.03307868540287018,
     "eval_rewards/margins": 0.06870328634977341,
     "eval_rewards/rejected": -0.03562460467219353,
-    "eval_runtime": 441.6525,
     "eval_samples": 2000,
-    "eval_samples_per_second": 4.528,
-    "eval_steps_per_second": 0.283,
     "eval_use_label": 9174.8564453125,
     "train_loss": 0.6567496789063458,
-    "train_runtime": 24439.922,
     "train_samples": 61135,
-    "train_samples_per_second": 2.501,
     "train_steps_per_second": 0.039
 }

     "eval_rewards/chosen": 0.03307868540287018,
     "eval_rewards/margins": 0.06870328634977341,
     "eval_rewards/rejected": -0.03562460467219353,
+    "eval_runtime": 469.8823,
     "eval_samples": 2000,
+    "eval_samples_per_second": 4.256,
+    "eval_steps_per_second": 0.266,
     "eval_use_label": 9174.8564453125,
     "train_loss": 0.6567496789063458,
+    "train_runtime": 24286.6837,
     "train_samples": 61135,
+    "train_samples_per_second": 2.517,
     "train_steps_per_second": 0.039
 }

eval_results.json CHANGED Viewed

@@ -10,9 +10,9 @@
     "eval_rewards/chosen": 0.03307868540287018,
     "eval_rewards/margins": 0.06870328634977341,
     "eval_rewards/rejected": -0.03562460467219353,
-    "eval_runtime": 441.6525,
     "eval_samples": 2000,
-    "eval_samples_per_second": 4.528,
-    "eval_steps_per_second": 0.283,
     "eval_use_label": 9174.8564453125
 }

     "eval_rewards/chosen": 0.03307868540287018,
     "eval_rewards/margins": 0.06870328634977341,
     "eval_rewards/rejected": -0.03562460467219353,
+    "eval_runtime": 469.8823,
     "eval_samples": 2000,
+    "eval_samples_per_second": 4.256,
+    "eval_steps_per_second": 0.266,
     "eval_use_label": 9174.8564453125
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
     "train_loss": 0.6567496789063458,
-    "train_runtime": 24439.922,
     "train_samples": 61135,
-    "train_samples_per_second": 2.501,
     "train_steps_per_second": 0.039
 }

 {
     "epoch": 1.0,
     "train_loss": 0.6567496789063458,
+    "train_runtime": 24286.6837,
     "train_samples": 61135,
+    "train_samples_per_second": 2.517,
     "train_steps_per_second": 0.039
 }

trainer_state.json CHANGED Viewed

@@ -180,9 +180,9 @@
       "eval_rewards/chosen": 0.03307868540287018,
       "eval_rewards/margins": 0.06870328634977341,
       "eval_rewards/rejected": -0.03562460467219353,
-      "eval_runtime": 443.034,
-      "eval_samples_per_second": 4.514,
-      "eval_steps_per_second": 0.282,
       "eval_use_label": 8966.8564453125,
       "step": 955
     },
@@ -191,15 +191,15 @@
       "step": 955,
       "total_flos": 0.0,
       "train_loss": 0.6567496789063458,
-      "train_runtime": 24439.922,
-      "train_samples_per_second": 2.501,
       "train_steps_per_second": 0.039
     }
   ],
   "logging_steps": 100,
   "max_steps": 955,
   "num_train_epochs": 1,
-  "save_steps": 500,
   "total_flos": 0.0,
   "trial_name": null,
   "trial_params": null

       "eval_rewards/chosen": 0.03307868540287018,
       "eval_rewards/margins": 0.06870328634977341,
       "eval_rewards/rejected": -0.03562460467219353,
+      "eval_runtime": 474.2549,
+      "eval_samples_per_second": 4.217,
+      "eval_steps_per_second": 0.264,
       "eval_use_label": 8966.8564453125,
       "step": 955
     },
       "step": 955,
       "total_flos": 0.0,
       "train_loss": 0.6567496789063458,
+      "train_runtime": 24286.6837,
+      "train_samples_per_second": 2.517,
       "train_steps_per_second": 0.039
     }
   ],
   "logging_steps": 100,
   "max_steps": 955,
   "num_train_epochs": 1,
+  "save_steps": 10,
   "total_flos": 0.0,
   "trial_name": null,
   "trial_params": null