chchen
/

Gemma-7B-It-ORPO-SALT-HALF

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb88e9c53ef93ae370de68f5b28a2d3ae6636d5f26c8dcfea0ff2f7724d33136
 size 100059752

 version https://git-lfs.github.com/spec/v1
+oid sha256:5451de8abad4ddfe562585cff039d9c6ef103125c847f89ca57348ec62d7a46f
 size 100059752

trainer_log.jsonl CHANGED Viewed

@@ -49,3 +49,54 @@
 {"current_steps": 490, "total_steps": 1770, "loss": 1.3752, "accuracy": 0.581250011920929, "learning_rate": 4.11287244177176e-06, "epoch": 0.8298052497883149, "percentage": 27.68, "elapsed_time": "1:44:44", "remaining_time": "4:33:37"}
 {"current_steps": 500, "total_steps": 1770, "loss": 1.422, "accuracy": 0.5687500238418579, "learning_rate": 4.078714909616215e-06, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:46:52", "remaining_time": "4:31:27"}
 {"current_steps": 500, "total_steps": 1770, "eval_loss": 1.3895596265792847, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:50:34", "remaining_time": "4:40:52"}

 {"current_steps": 490, "total_steps": 1770, "loss": 1.3752, "accuracy": 0.581250011920929, "learning_rate": 4.11287244177176e-06, "epoch": 0.8298052497883149, "percentage": 27.68, "elapsed_time": "1:44:44", "remaining_time": "4:33:37"}
 {"current_steps": 500, "total_steps": 1770, "loss": 1.422, "accuracy": 0.5687500238418579, "learning_rate": 4.078714909616215e-06, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:46:52", "remaining_time": "4:31:27"}
 {"current_steps": 500, "total_steps": 1770, "eval_loss": 1.3895596265792847, "epoch": 0.8467400508044031, "percentage": 28.25, "elapsed_time": "1:50:34", "remaining_time": "4:40:52"}
+{"current_steps": 510, "total_steps": 1770, "loss": 1.4082, "accuracy": 0.6187499761581421, "learning_rate": 4.044059990272125e-06, "epoch": 0.8636748518204911, "percentage": 28.81, "elapsed_time": "1:52:51", "remaining_time": "4:38:49"}
+{"current_steps": 520, "total_steps": 1770, "loss": 1.453, "accuracy": 0.543749988079071, "learning_rate": 4.0089186020584345e-06, "epoch": 0.8806096528365792, "percentage": 29.38, "elapsed_time": "1:55:01", "remaining_time": "4:36:30"}
+{"current_steps": 530, "total_steps": 1770, "loss": 1.355, "accuracy": 0.612500011920929, "learning_rate": 3.973301816560124e-06, "epoch": 0.8975444538526672, "percentage": 29.94, "elapsed_time": "1:57:06", "remaining_time": "4:34:00"}
+{"current_steps": 540, "total_steps": 1770, "loss": 1.3383, "accuracy": 0.543749988079071, "learning_rate": 3.937220855140021e-06, "epoch": 0.9144792548687553, "percentage": 30.51, "elapsed_time": "1:59:11", "remaining_time": "4:31:28"}
+{"current_steps": 550, "total_steps": 1770, "loss": 1.3057, "accuracy": 0.53125, "learning_rate": 3.900687085403418e-06, "epoch": 0.9314140558848434, "percentage": 31.07, "elapsed_time": "2:01:16", "remaining_time": "4:29:00"}
+{"current_steps": 560, "total_steps": 1770, "loss": 1.4043, "accuracy": 0.581250011920929, "learning_rate": 3.863712017616614e-06, "epoch": 0.9483488569009314, "percentage": 31.64, "elapsed_time": "2:03:31", "remaining_time": "4:26:54"}
+{"current_steps": 570, "total_steps": 1770, "loss": 1.436, "accuracy": 0.512499988079071, "learning_rate": 3.826307301080504e-06, "epoch": 0.9652836579170194, "percentage": 32.2, "elapsed_time": "2:05:31", "remaining_time": "4:24:15"}
+{"current_steps": 580, "total_steps": 1770, "loss": 1.3661, "accuracy": 0.5062500238418579, "learning_rate": 3.7884847204603775e-06, "epoch": 0.9822184589331076, "percentage": 32.77, "elapsed_time": "2:07:50", "remaining_time": "4:22:17"}
+{"current_steps": 590, "total_steps": 1770, "loss": 1.5094, "accuracy": 0.5375000238418579, "learning_rate": 3.750256192073058e-06, "epoch": 0.9991532599491956, "percentage": 33.33, "elapsed_time": "2:10:08", "remaining_time": "4:20:17"}
+{"current_steps": 600, "total_steps": 1770, "loss": 1.285, "accuracy": 0.5687500238418579, "learning_rate": 3.7116337601325715e-06, "epoch": 1.0160880609652836, "percentage": 33.9, "elapsed_time": "2:12:19", "remaining_time": "4:18:02"}
+{"current_steps": 610, "total_steps": 1770, "loss": 1.3216, "accuracy": 0.5375000238418579, "learning_rate": 3.6726295929555154e-06, "epoch": 1.0330228619813717, "percentage": 34.46, "elapsed_time": "2:14:26", "remaining_time": "4:15:39"}
+{"current_steps": 620, "total_steps": 1770, "loss": 1.3014, "accuracy": 0.5874999761581421, "learning_rate": 3.6332559791273307e-06, "epoch": 1.0499576629974599, "percentage": 35.03, "elapsed_time": "2:16:36", "remaining_time": "4:13:23"}
+{"current_steps": 630, "total_steps": 1770, "loss": 1.34, "accuracy": 0.574999988079071, "learning_rate": 3.593525323630681e-06, "epoch": 1.0668924640135478, "percentage": 35.59, "elapsed_time": "2:18:49", "remaining_time": "4:11:13"}
+{"current_steps": 640, "total_steps": 1770, "loss": 1.282, "accuracy": 0.59375, "learning_rate": 3.5534501439371615e-06, "epoch": 1.083827265029636, "percentage": 36.16, "elapsed_time": "2:21:01", "remaining_time": "4:09:00"}
+{"current_steps": 650, "total_steps": 1770, "loss": 1.3556, "accuracy": 0.5687500238418579, "learning_rate": 3.5130430660635633e-06, "epoch": 1.100762066045724, "percentage": 36.72, "elapsed_time": "2:23:11", "remaining_time": "4:06:43"}
+{"current_steps": 660, "total_steps": 1770, "loss": 1.3296, "accuracy": 0.5375000238418579, "learning_rate": 3.4723168205939444e-06, "epoch": 1.117696867061812, "percentage": 37.29, "elapsed_time": "2:25:15", "remaining_time": "4:04:18"}
+{"current_steps": 670, "total_steps": 1770, "loss": 1.4141, "accuracy": 0.512499988079071, "learning_rate": 3.431284238668754e-06, "epoch": 1.1346316680779, "percentage": 37.85, "elapsed_time": "2:27:21", "remaining_time": "4:01:56"}
+{"current_steps": 680, "total_steps": 1770, "loss": 1.4306, "accuracy": 0.59375, "learning_rate": 3.389958247942274e-06, "epoch": 1.1515664690939882, "percentage": 38.42, "elapsed_time": "2:29:28", "remaining_time": "3:59:36"}
+{"current_steps": 690, "total_steps": 1770, "loss": 1.3792, "accuracy": 0.5562499761581421, "learning_rate": 3.3483518685096588e-06, "epoch": 1.168501270110076, "percentage": 38.98, "elapsed_time": "2:31:39", "remaining_time": "3:57:22"}
+{"current_steps": 700, "total_steps": 1770, "loss": 1.3902, "accuracy": 0.518750011920929, "learning_rate": 3.306478208804839e-06, "epoch": 1.1854360711261642, "percentage": 39.55, "elapsed_time": "2:33:39", "remaining_time": "3:54:52"}
+{"current_steps": 710, "total_steps": 1770, "loss": 1.2531, "accuracy": 0.6000000238418579, "learning_rate": 3.264350461470608e-06, "epoch": 1.2023708721422524, "percentage": 40.11, "elapsed_time": "2:35:38", "remaining_time": "3:52:22"}
+{"current_steps": 720, "total_steps": 1770, "loss": 1.2266, "accuracy": 0.643750011920929, "learning_rate": 3.2219818992021685e-06, "epoch": 1.2193056731583405, "percentage": 40.68, "elapsed_time": "2:37:52", "remaining_time": "3:50:13"}
+{"current_steps": 730, "total_steps": 1770, "loss": 1.2166, "accuracy": 0.5625, "learning_rate": 3.1793858705654595e-06, "epoch": 1.2362404741744284, "percentage": 41.24, "elapsed_time": "2:40:04", "remaining_time": "3:48:03"}
+{"current_steps": 740, "total_steps": 1770, "loss": 1.3549, "accuracy": 0.53125, "learning_rate": 3.1365757957915787e-06, "epoch": 1.2531752751905165, "percentage": 41.81, "elapsed_time": "2:42:13", "remaining_time": "3:45:47"}
+{"current_steps": 750, "total_steps": 1770, "loss": 1.3886, "accuracy": 0.550000011920929, "learning_rate": 3.093565162548633e-06, "epoch": 1.2701100762066047, "percentage": 42.37, "elapsed_time": "2:44:18", "remaining_time": "3:43:28"}
+{"current_steps": 760, "total_steps": 1770, "loss": 1.2364, "accuracy": 0.550000011920929, "learning_rate": 3.0503675216923294e-06, "epoch": 1.2870448772226926, "percentage": 42.94, "elapsed_time": "2:46:29", "remaining_time": "3:41:15"}
+{"current_steps": 770, "total_steps": 1770, "loss": 1.3081, "accuracy": 0.5062500238418579, "learning_rate": 3.0069964829966748e-06, "epoch": 1.3039796782387807, "percentage": 43.5, "elapsed_time": "2:48:41", "remaining_time": "3:39:05"}
+{"current_steps": 780, "total_steps": 1770, "loss": 1.2996, "accuracy": 0.5687500238418579, "learning_rate": 2.963465710866094e-06, "epoch": 1.3209144792548688, "percentage": 44.07, "elapsed_time": "2:50:55", "remaining_time": "3:36:57"}
+{"current_steps": 790, "total_steps": 1770, "loss": 1.3598, "accuracy": 0.5062500238418579, "learning_rate": 2.919788920030357e-06, "epoch": 1.337849280270957, "percentage": 44.63, "elapsed_time": "2:53:15", "remaining_time": "3:34:55"}
+{"current_steps": 800, "total_steps": 1770, "loss": 1.3164, "accuracy": 0.5687500238418579, "learning_rate": 2.8759798712236303e-06, "epoch": 1.3547840812870449, "percentage": 45.2, "elapsed_time": "2:55:29", "remaining_time": "3:32:47"}
+{"current_steps": 810, "total_steps": 1770, "loss": 1.3613, "accuracy": 0.512499988079071, "learning_rate": 2.8320523668490507e-06, "epoch": 1.371718882303133, "percentage": 45.76, "elapsed_time": "2:57:34", "remaining_time": "3:30:27"}
+{"current_steps": 820, "total_steps": 1770, "loss": 1.3141, "accuracy": 0.5375000238418579, "learning_rate": 2.7880202466301597e-06, "epoch": 1.388653683319221, "percentage": 46.33, "elapsed_time": "2:59:43", "remaining_time": "3:28:13"}
+{"current_steps": 830, "total_steps": 1770, "loss": 1.2387, "accuracy": 0.5687500238418579, "learning_rate": 2.7438973832505854e-06, "epoch": 1.405588484335309, "percentage": 46.89, "elapsed_time": "3:01:48", "remaining_time": "3:25:54"}
+{"current_steps": 840, "total_steps": 1770, "loss": 1.2952, "accuracy": 0.48750001192092896, "learning_rate": 2.699697677983341e-06, "epoch": 1.4225232853513972, "percentage": 47.46, "elapsed_time": "3:03:55", "remaining_time": "3:23:38"}
+{"current_steps": 850, "total_steps": 1770, "loss": 1.3605, "accuracy": 0.512499988079071, "learning_rate": 2.6554350563111115e-06, "epoch": 1.4394580863674853, "percentage": 48.02, "elapsed_time": "3:06:08", "remaining_time": "3:21:28"}
+{"current_steps": 860, "total_steps": 1770, "loss": 1.1998, "accuracy": 0.5687500238418579, "learning_rate": 2.611123463538913e-06, "epoch": 1.4563928873835732, "percentage": 48.59, "elapsed_time": "3:08:19", "remaining_time": "3:19:16"}
+{"current_steps": 870, "total_steps": 1770, "loss": 1.4085, "accuracy": 0.574999988079071, "learning_rate": 2.566776860400514e-06, "epoch": 1.4733276883996613, "percentage": 49.15, "elapsed_time": "3:10:28", "remaining_time": "3:17:03"}
+{"current_steps": 880, "total_steps": 1770, "loss": 1.3537, "accuracy": 0.48750001192092896, "learning_rate": 2.522409218659989e-06, "epoch": 1.4902624894157492, "percentage": 49.72, "elapsed_time": "3:12:40", "remaining_time": "3:14:51"}
+{"current_steps": 890, "total_steps": 1770, "loss": 1.3254, "accuracy": 0.574999988079071, "learning_rate": 2.4780345167097976e-06, "epoch": 1.5071972904318374, "percentage": 50.28, "elapsed_time": "3:14:54", "remaining_time": "3:12:43"}
+{"current_steps": 900, "total_steps": 1770, "loss": 1.358, "accuracy": 0.643750011920929, "learning_rate": 2.4336667351667747e-06, "epoch": 1.5241320914479255, "percentage": 50.85, "elapsed_time": "3:17:00", "remaining_time": "3:10:26"}
+{"current_steps": 910, "total_steps": 1770, "loss": 1.2975, "accuracy": 0.543749988079071, "learning_rate": 2.3893198524674264e-06, "epoch": 1.5410668924640136, "percentage": 51.41, "elapsed_time": "3:19:13", "remaining_time": "3:08:16"}
+{"current_steps": 920, "total_steps": 1770, "loss": 1.3585, "accuracy": 0.512499988079071, "learning_rate": 2.345007840463904e-06, "epoch": 1.5580016934801018, "percentage": 51.98, "elapsed_time": "3:21:28", "remaining_time": "3:06:09"}
+{"current_steps": 930, "total_steps": 1770, "loss": 1.3436, "accuracy": 0.5874999761581421, "learning_rate": 2.3007446600220572e-06, "epoch": 1.5749364944961897, "percentage": 52.54, "elapsed_time": "3:23:43", "remaining_time": "3:04:00"}
+{"current_steps": 940, "total_steps": 1770, "loss": 1.3592, "accuracy": 0.4937500059604645, "learning_rate": 2.2565442566229507e-06, "epoch": 1.5918712955122776, "percentage": 53.11, "elapsed_time": "3:25:53", "remaining_time": "3:01:48"}
+{"current_steps": 950, "total_steps": 1770, "loss": 1.3211, "accuracy": 0.6187499761581421, "learning_rate": 2.2124205559692195e-06, "epoch": 1.6088060965283657, "percentage": 53.67, "elapsed_time": "3:28:04", "remaining_time": "2:59:35"}
+{"current_steps": 960, "total_steps": 1770, "loss": 1.3311, "accuracy": 0.6187499761581421, "learning_rate": 2.168387459597666e-06, "epoch": 1.6257408975444538, "percentage": 54.24, "elapsed_time": "3:30:20", "remaining_time": "2:57:28"}
+{"current_steps": 970, "total_steps": 1770, "loss": 1.2882, "accuracy": 0.543749988079071, "learning_rate": 2.1244588404994648e-06, "epoch": 1.642675698560542, "percentage": 54.8, "elapsed_time": "3:32:27", "remaining_time": "2:55:13"}
+{"current_steps": 980, "total_steps": 1770, "loss": 1.3423, "accuracy": 0.518750011920929, "learning_rate": 2.08064853874936e-06, "epoch": 1.65961049957663, "percentage": 55.37, "elapsed_time": "3:34:39", "remaining_time": "2:53:02"}
+{"current_steps": 990, "total_steps": 1770, "loss": 1.2163, "accuracy": 0.6312500238418579, "learning_rate": 2.0369703571452387e-06, "epoch": 1.676545300592718, "percentage": 55.93, "elapsed_time": "3:36:53", "remaining_time": "2:50:53"}
+{"current_steps": 1000, "total_steps": 1770, "loss": 1.3103, "accuracy": 0.59375, "learning_rate": 1.993438056859441e-06, "epoch": 1.6934801016088061, "percentage": 56.5, "elapsed_time": "3:39:04", "remaining_time": "2:48:41"}
+{"current_steps": 1000, "total_steps": 1770, "eval_loss": 1.3313392400741577, "epoch": 1.6934801016088061, "percentage": 56.5, "elapsed_time": "3:42:46", "remaining_time": "2:51:32"}