{
  "best_metric": null,
  "best_model_checkpoint": null,
  "epoch": 27.657824933687003,
  "global_step": 5200,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.53,
      "learning_rate": 0.0001,
      "loss": 0.9903,
      "step": 100
    },
    {
      "epoch": 0.53,
      "eval_loss": 0.3881553113460541,
      "eval_runtime": 209.4743,
      "eval_samples_per_second": 19.344,
      "eval_steps_per_second": 2.42,
      "eval_wer": 0.4149805202965942,
      "step": 100
    },
    {
      "epoch": 1.06,
      "learning_rate": 9.933897408778425e-05,
      "loss": 0.6655,
      "step": 200
    },
    {
      "epoch": 1.06,
      "eval_loss": 0.33381059765815735,
      "eval_runtime": 209.3188,
      "eval_samples_per_second": 19.358,
      "eval_steps_per_second": 2.422,
      "eval_wer": 0.35063466130451176,
      "step": 200
    },
    {
      "epoch": 1.59,
      "learning_rate": 9.867794817556849e-05,
      "loss": 0.5789,
      "step": 300
    },
    {
      "epoch": 1.59,
      "eval_loss": 0.30856332182884216,
      "eval_runtime": 210.7573,
      "eval_samples_per_second": 19.226,
      "eval_steps_per_second": 2.406,
      "eval_wer": 0.34303129320095516,
      "step": 300
    },
    {
      "epoch": 2.13,
      "learning_rate": 9.801692226335273e-05,
      "loss": 0.5539,
      "step": 400
    },
    {
      "epoch": 2.13,
      "eval_loss": 0.3059796392917633,
      "eval_runtime": 210.5815,
      "eval_samples_per_second": 19.242,
      "eval_steps_per_second": 2.408,
      "eval_wer": 0.31789619203217295,
      "step": 400
    },
    {
      "epoch": 2.66,
      "learning_rate": 9.735589635113697e-05,
      "loss": 0.5041,
      "step": 500
    },
    {
      "epoch": 2.66,
      "eval_loss": 0.3157837688922882,
      "eval_runtime": 211.1395,
      "eval_samples_per_second": 19.191,
      "eval_steps_per_second": 2.401,
      "eval_wer": 0.3104813371873822,
      "step": 500
    },
    {
      "epoch": 3.19,
      "learning_rate": 9.669487043892121e-05,
      "loss": 0.4771,
      "step": 600
    },
    {
      "epoch": 3.19,
      "eval_loss": 0.3155499994754791,
      "eval_runtime": 213.4785,
      "eval_samples_per_second": 18.981,
      "eval_steps_per_second": 2.375,
      "eval_wer": 0.32072389091366094,
      "step": 600
    },
    {
      "epoch": 3.72,
      "learning_rate": 9.603384452670545e-05,
      "loss": 0.448,
      "step": 700
    },
    {
      "epoch": 3.72,
      "eval_loss": 0.29987651109695435,
      "eval_runtime": 213.1151,
      "eval_samples_per_second": 19.013,
      "eval_steps_per_second": 2.379,
      "eval_wer": 0.3066482342591429,
      "step": 700
    },
    {
      "epoch": 4.25,
      "learning_rate": 9.537281861448969e-05,
      "loss": 0.4454,
      "step": 800
    },
    {
      "epoch": 4.25,
      "eval_loss": 0.3030799925327301,
      "eval_runtime": 214.1216,
      "eval_samples_per_second": 18.924,
      "eval_steps_per_second": 2.368,
      "eval_wer": 0.32084956641950485,
      "step": 800
    },
    {
      "epoch": 4.79,
      "learning_rate": 9.471179270227393e-05,
      "loss": 0.3857,
      "step": 900
    },
    {
      "epoch": 4.79,
      "eval_loss": 0.29331761598587036,
      "eval_runtime": 214.8248,
      "eval_samples_per_second": 18.862,
      "eval_steps_per_second": 2.36,
      "eval_wer": 0.2947718989568933,
      "step": 900
    },
    {
      "epoch": 5.32,
      "learning_rate": 9.405076679005818e-05,
      "loss": 0.3722,
      "step": 1000
    },
    {
      "epoch": 5.32,
      "eval_loss": 0.28789493441581726,
      "eval_runtime": 214.8964,
      "eval_samples_per_second": 18.856,
      "eval_steps_per_second": 2.359,
      "eval_wer": 0.28578610028905366,
      "step": 1000
    },
    {
      "epoch": 5.85,
      "learning_rate": 9.338974087784242e-05,
      "loss": 0.371,
      "step": 1100
    },
    {
      "epoch": 5.85,
      "eval_loss": 0.2818315625190735,
      "eval_runtime": 215.1931,
      "eval_samples_per_second": 18.83,
      "eval_steps_per_second": 2.356,
      "eval_wer": 0.2755435465627749,
      "step": 1100
    },
    {
      "epoch": 6.38,
      "learning_rate": 9.272871496562666e-05,
      "loss": 0.358,
      "step": 1200
    },
    {
      "epoch": 6.38,
      "eval_loss": 0.30174919962882996,
      "eval_runtime": 215.3959,
      "eval_samples_per_second": 18.812,
      "eval_steps_per_second": 2.354,
      "eval_wer": 0.2778685434208873,
      "step": 1200
    },
    {
      "epoch": 6.91,
      "learning_rate": 9.20676890534109e-05,
      "loss": 0.3459,
      "step": 1300
    },
    {
      "epoch": 6.91,
      "eval_loss": 0.2872300148010254,
      "eval_runtime": 216.2384,
      "eval_samples_per_second": 18.739,
      "eval_steps_per_second": 2.345,
      "eval_wer": 0.27422395375141384,
      "step": 1300
    },
    {
      "epoch": 7.45,
      "learning_rate": 9.140666314119514e-05,
      "loss": 0.3293,
      "step": 1400
    },
    {
      "epoch": 7.45,
      "eval_loss": 0.31064674258232117,
      "eval_runtime": 216.4276,
      "eval_samples_per_second": 18.722,
      "eval_steps_per_second": 2.343,
      "eval_wer": 0.2762347618449164,
      "step": 1400
    },
    {
      "epoch": 7.98,
      "learning_rate": 9.074563722897938e-05,
      "loss": 0.3305,
      "step": 1500
    },
    {
      "epoch": 7.98,
      "eval_loss": 0.2984163761138916,
      "eval_runtime": 216.6335,
      "eval_samples_per_second": 18.704,
      "eval_steps_per_second": 2.34,
      "eval_wer": 0.2746638180218675,
      "step": 1500
    },
    {
      "epoch": 8.51,
      "learning_rate": 9.008461131676362e-05,
      "loss": 0.322,
      "step": 1600
    },
    {
      "epoch": 8.51,
      "eval_loss": 0.3066250681877136,
      "eval_runtime": 217.5565,
      "eval_samples_per_second": 18.625,
      "eval_steps_per_second": 2.33,
      "eval_wer": 0.2688199070001257,
      "step": 1600
    },
    {
      "epoch": 9.04,
      "learning_rate": 8.942358540454786e-05,
      "loss": 0.3051,
      "step": 1700
    },
    {
      "epoch": 9.04,
      "eval_loss": 0.3064703941345215,
      "eval_runtime": 218.1465,
      "eval_samples_per_second": 18.575,
      "eval_steps_per_second": 2.324,
      "eval_wer": 0.26743747643584265,
      "step": 1700
    },
    {
      "epoch": 9.57,
      "learning_rate": 8.87625594923321e-05,
      "loss": 0.2906,
      "step": 1800
    },
    {
      "epoch": 9.57,
      "eval_loss": 0.2988126277923584,
      "eval_runtime": 218.1544,
      "eval_samples_per_second": 18.574,
      "eval_steps_per_second": 2.324,
      "eval_wer": 0.26209626743747644,
      "step": 1800
    },
    {
      "epoch": 10.11,
      "learning_rate": 8.810153358011635e-05,
      "loss": 0.2908,
      "step": 1900
    },
    {
      "epoch": 10.11,
      "eval_loss": 0.31721261143684387,
      "eval_runtime": 217.8764,
      "eval_samples_per_second": 18.598,
      "eval_steps_per_second": 2.327,
      "eval_wer": 0.26448410204851075,
      "step": 1900
    },
    {
      "epoch": 10.64,
      "learning_rate": 8.744050766790059e-05,
      "loss": 0.2644,
      "step": 2000
    },
    {
      "epoch": 10.64,
      "eval_loss": 0.328941285610199,
      "eval_runtime": 217.9159,
      "eval_samples_per_second": 18.594,
      "eval_steps_per_second": 2.327,
      "eval_wer": 0.25851451552092497,
      "step": 2000
    },
    {
      "epoch": 11.17,
      "learning_rate": 8.677948175568483e-05,
      "loss": 0.2895,
      "step": 2100
    },
    {
      "epoch": 11.17,
      "eval_loss": 0.32557472586631775,
      "eval_runtime": 218.4939,
      "eval_samples_per_second": 18.545,
      "eval_steps_per_second": 2.32,
      "eval_wer": 0.25681789619203216,
      "step": 2100
    },
    {
      "epoch": 11.7,
      "learning_rate": 8.611845584346907e-05,
      "loss": 0.2764,
      "step": 2200
    },
    {
      "epoch": 11.7,
      "eval_loss": 0.31102919578552246,
      "eval_runtime": 221.5496,
      "eval_samples_per_second": 18.289,
      "eval_steps_per_second": 2.288,
      "eval_wer": 0.2536760085459344,
      "step": 2200
    },
    {
      "epoch": 12.23,
      "learning_rate": 8.545742993125331e-05,
      "loss": 0.2712,
      "step": 2300
    },
    {
      "epoch": 12.23,
      "eval_loss": 0.31744903326034546,
      "eval_runtime": 229.9509,
      "eval_samples_per_second": 17.621,
      "eval_steps_per_second": 2.205,
      "eval_wer": 0.25920573080306647,
      "step": 2300
    },
    {
      "epoch": 12.76,
      "learning_rate": 8.479640401903755e-05,
      "loss": 0.2688,
      "step": 2400
    },
    {
      "epoch": 12.76,
      "eval_loss": 0.3221331238746643,
      "eval_runtime": 231.8744,
      "eval_samples_per_second": 17.475,
      "eval_steps_per_second": 2.187,
      "eval_wer": 0.25826316450923714,
      "step": 2400
    },
    {
      "epoch": 13.3,
      "learning_rate": 8.413537810682179e-05,
      "loss": 0.2509,
      "step": 2500
    },
    {
      "epoch": 13.3,
      "eval_loss": 0.32597509026527405,
      "eval_runtime": 232.2681,
      "eval_samples_per_second": 17.445,
      "eval_steps_per_second": 2.183,
      "eval_wer": 0.2532989820284027,
      "step": 2500
    },
    {
      "epoch": 13.83,
      "learning_rate": 8.34809624537282e-05,
      "loss": 0.2419,
      "step": 2600
    },
    {
      "epoch": 13.83,
      "eval_loss": 0.3077153265476227,
      "eval_runtime": 232.0814,
      "eval_samples_per_second": 17.459,
      "eval_steps_per_second": 2.185,
      "eval_wer": 0.25530979012190524,
      "step": 2600
    },
    {
      "epoch": 14.36,
      "learning_rate": 8.281993654151243e-05,
      "loss": 0.2429,
      "step": 2700
    },
    {
      "epoch": 14.36,
      "eval_loss": 0.32647523283958435,
      "eval_runtime": 232.8137,
      "eval_samples_per_second": 17.404,
      "eval_steps_per_second": 2.178,
      "eval_wer": 0.2588287042855347,
      "step": 2700
    },
    {
      "epoch": 14.89,
      "learning_rate": 8.215891062929667e-05,
      "loss": 0.2358,
      "step": 2800
    },
    {
      "epoch": 14.89,
      "eval_loss": 0.3333515226840973,
      "eval_runtime": 232.1937,
      "eval_samples_per_second": 17.451,
      "eval_steps_per_second": 2.184,
      "eval_wer": 0.25380168405177833,
      "step": 2800
    },
    {
      "epoch": 15.42,
      "learning_rate": 8.149788471708092e-05,
      "loss": 0.2415,
      "step": 2900
    },
    {
      "epoch": 15.42,
      "eval_loss": 0.3471778631210327,
      "eval_runtime": 232.185,
      "eval_samples_per_second": 17.452,
      "eval_steps_per_second": 2.184,
      "eval_wer": 0.24921452808847555,
      "step": 2900
    },
    {
      "epoch": 15.95,
      "learning_rate": 8.083685880486515e-05,
      "loss": 0.2384,
      "step": 3000
    },
    {
      "epoch": 15.95,
      "eval_loss": 0.3481573760509491,
      "eval_runtime": 232.291,
      "eval_samples_per_second": 17.444,
      "eval_steps_per_second": 2.183,
      "eval_wer": 0.2548070880985296,
      "step": 3000
    },
    {
      "epoch": 16.49,
      "learning_rate": 8.017583289264939e-05,
      "loss": 0.2316,
      "step": 3100
    },
    {
      "epoch": 16.49,
      "eval_loss": 0.3469015955924988,
      "eval_runtime": 232.5701,
      "eval_samples_per_second": 17.423,
      "eval_steps_per_second": 2.18,
      "eval_wer": 0.24695236898328515,
      "step": 3100
    },
    {
      "epoch": 17.02,
      "learning_rate": 7.951480698043363e-05,
      "loss": 0.225,
      "step": 3200
    },
    {
      "epoch": 17.02,
      "eval_loss": 0.3405754566192627,
      "eval_runtime": 220.3171,
      "eval_samples_per_second": 18.392,
      "eval_steps_per_second": 2.301,
      "eval_wer": 0.2588915420384567,
      "step": 3200
    },
    {
      "epoch": 17.55,
      "learning_rate": 7.885378106821787e-05,
      "loss": 0.2108,
      "step": 3300
    },
    {
      "epoch": 17.55,
      "eval_loss": 0.34463852643966675,
      "eval_runtime": 223.0068,
      "eval_samples_per_second": 18.17,
      "eval_steps_per_second": 2.273,
      "eval_wer": 0.25072263415860246,
      "step": 3300
    },
    {
      "epoch": 18.08,
      "learning_rate": 7.819275515600211e-05,
      "loss": 0.2179,
      "step": 3400
    },
    {
      "epoch": 18.08,
      "eval_loss": 0.34099045395851135,
      "eval_runtime": 221.6762,
      "eval_samples_per_second": 18.279,
      "eval_steps_per_second": 2.287,
      "eval_wer": 0.248586150559256,
      "step": 3400
    },
    {
      "epoch": 18.62,
      "learning_rate": 7.753172924378636e-05,
      "loss": 0.2056,
      "step": 3500
    },
    {
      "epoch": 18.62,
      "eval_loss": 0.33803310990333557,
      "eval_runtime": 221.1741,
      "eval_samples_per_second": 18.32,
      "eval_steps_per_second": 2.292,
      "eval_wer": 0.248586150559256,
      "step": 3500
    },
    {
      "epoch": 19.15,
      "learning_rate": 7.687731359069276e-05,
      "loss": 0.2088,
      "step": 3600
    },
    {
      "epoch": 19.15,
      "eval_loss": 0.33515065908432007,
      "eval_runtime": 221.8587,
      "eval_samples_per_second": 18.264,
      "eval_steps_per_second": 2.285,
      "eval_wer": 0.24437602111348497,
      "step": 3600
    },
    {
      "epoch": 19.68,
      "learning_rate": 7.6216287678477e-05,
      "loss": 0.1994,
      "step": 3700
    },
    {
      "epoch": 19.68,
      "eval_loss": 0.3439195454120636,
      "eval_runtime": 222.8182,
      "eval_samples_per_second": 18.185,
      "eval_steps_per_second": 2.275,
      "eval_wer": 0.2422395375141385,
      "step": 3700
    },
    {
      "epoch": 20.21,
      "learning_rate": 7.555526176626125e-05,
      "loss": 0.2027,
      "step": 3800
    },
    {
      "epoch": 20.21,
      "eval_loss": 0.37243127822875977,
      "eval_runtime": 222.5733,
      "eval_samples_per_second": 18.205,
      "eval_steps_per_second": 2.278,
      "eval_wer": 0.24337061706673369,
      "step": 3800
    },
    {
      "epoch": 20.74,
      "learning_rate": 7.489423585404549e-05,
      "loss": 0.2044,
      "step": 3900
    },
    {
      "epoch": 20.74,
      "eval_loss": 0.3538868725299835,
      "eval_runtime": 222.1787,
      "eval_samples_per_second": 18.238,
      "eval_steps_per_second": 2.282,
      "eval_wer": 0.2501570943823049,
      "step": 3900
    },
    {
      "epoch": 21.28,
      "learning_rate": 7.423320994182971e-05,
      "loss": 0.1932,
      "step": 4000
    },
    {
      "epoch": 21.28,
      "eval_loss": 0.34956350922584534,
      "eval_runtime": 221.2804,
      "eval_samples_per_second": 18.312,
      "eval_steps_per_second": 2.291,
      "eval_wer": 0.25304763101671485,
      "step": 4000
    },
    {
      "epoch": 21.81,
      "learning_rate": 7.357218402961397e-05,
      "loss": 0.1903,
      "step": 4100
    },
    {
      "epoch": 21.81,
      "eval_loss": 0.3472049832344055,
      "eval_runtime": 221.4938,
      "eval_samples_per_second": 18.294,
      "eval_steps_per_second": 2.289,
      "eval_wer": 0.2465753424657534,
      "step": 4100
    },
    {
      "epoch": 22.34,
      "learning_rate": 7.291115811739821e-05,
      "loss": 0.1895,
      "step": 4200
    },
    {
      "epoch": 22.34,
      "eval_loss": 0.34313011169433594,
      "eval_runtime": 222.6794,
      "eval_samples_per_second": 18.197,
      "eval_steps_per_second": 2.277,
      "eval_wer": 0.24286791504335806,
      "step": 4200
    },
    {
      "epoch": 22.87,
      "learning_rate": 7.225013220518244e-05,
      "loss": 0.1865,
      "step": 4300
    },
    {
      "epoch": 22.87,
      "eval_loss": 0.3476735055446625,
      "eval_runtime": 222.0492,
      "eval_samples_per_second": 18.248,
      "eval_steps_per_second": 2.283,
      "eval_wer": 0.24481588538393867,
      "step": 4300
    },
    {
      "epoch": 23.4,
      "learning_rate": 7.158910629296669e-05,
      "loss": 0.1851,
      "step": 4400
    },
    {
      "epoch": 23.4,
      "eval_loss": 0.3553401231765747,
      "eval_runtime": 223.2051,
      "eval_samples_per_second": 18.154,
      "eval_steps_per_second": 2.271,
      "eval_wer": 0.23922332537388463,
      "step": 4400
    },
    {
      "epoch": 23.93,
      "learning_rate": 7.092808038075093e-05,
      "loss": 0.179,
      "step": 4500
    },
    {
      "epoch": 23.93,
      "eval_loss": 0.3559369742870331,
      "eval_runtime": 226.903,
      "eval_samples_per_second": 17.858,
      "eval_steps_per_second": 2.234,
      "eval_wer": 0.24255372627874827,
      "step": 4500
    },
    {
      "epoch": 24.47,
      "learning_rate": 7.026705446853516e-05,
      "loss": 0.1797,
      "step": 4600
    },
    {
      "epoch": 24.47,
      "eval_loss": 0.3819045424461365,
      "eval_runtime": 222.3201,
      "eval_samples_per_second": 18.226,
      "eval_steps_per_second": 2.28,
      "eval_wer": 0.24644966695990952,
      "step": 4600
    },
    {
      "epoch": 25.0,
      "learning_rate": 6.960602855631942e-05,
      "loss": 0.1889,
      "step": 4700
    },
    {
      "epoch": 25.0,
      "eval_loss": 0.3539634346961975,
      "eval_runtime": 224.8629,
      "eval_samples_per_second": 18.02,
      "eval_steps_per_second": 2.255,
      "eval_wer": 0.24073143144401157,
      "step": 4700
    },
    {
      "epoch": 25.53,
      "learning_rate": 6.894500264410366e-05,
      "loss": 0.1679,
      "step": 4800
    },
    {
      "epoch": 25.53,
      "eval_loss": 0.3614364564418793,
      "eval_runtime": 233.686,
      "eval_samples_per_second": 17.34,
      "eval_steps_per_second": 2.17,
      "eval_wer": 0.2404172426794018,
      "step": 4800
    },
    {
      "epoch": 26.06,
      "learning_rate": 6.828397673188788e-05,
      "loss": 0.1667,
      "step": 4900
    },
    {
      "epoch": 26.06,
      "eval_loss": 0.3456764817237854,
      "eval_runtime": 234.7624,
      "eval_samples_per_second": 17.26,
      "eval_steps_per_second": 2.16,
      "eval_wer": 0.24230237526706044,
      "step": 4900
    },
    {
      "epoch": 26.59,
      "learning_rate": 6.762295081967214e-05,
      "loss": 0.1652,
      "step": 5000
    },
    {
      "epoch": 26.59,
      "eval_loss": 0.35390254855155945,
      "eval_runtime": 235.3962,
      "eval_samples_per_second": 17.214,
      "eval_steps_per_second": 2.154,
      "eval_wer": 0.23991454065602613,
      "step": 5000
    },
    {
      "epoch": 27.13,
      "learning_rate": 6.696192490745638e-05,
      "loss": 0.1745,
      "step": 5100
    },
    {
      "epoch": 27.13,
      "eval_loss": 0.3428182601928711,
      "eval_runtime": 234.2975,
      "eval_samples_per_second": 17.294,
      "eval_steps_per_second": 2.164,
      "eval_wer": 0.2343219806459721,
      "step": 5100
    },
    {
      "epoch": 27.66,
      "learning_rate": 6.630089899524061e-05,
      "loss": 0.1596,
      "step": 5200
    },
    {
      "epoch": 27.66,
      "eval_loss": 0.33925893902778625,
      "eval_runtime": 236.9973,
      "eval_samples_per_second": 17.097,
      "eval_steps_per_second": 2.139,
      "eval_wer": 0.234447656151816,
      "step": 5200
    }
  ],
  "max_steps": 15228,
  "num_train_epochs": 81,
  "total_flos": 2.2833398907064197e+19,
  "trial_name": null,
  "trial_params": null
}