hung200504
/

bert-30

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [deepset/bert-base-cased-squad2](https://huggingface.co/deepset/bert-base-cased-squad2) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 10.2808
 ## Model description
@@ -34,7 +34,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 4e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
@@ -46,49 +46,49 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 10.3001       | 0.02  | 5    | 12.2937         |
-| 11.3113       | 0.05  | 10   | 12.1993         |
-| 11.9879       | 0.07  | 15   | 12.1069         |
-| 10.7429       | 0.09  | 20   | 12.0165         |
-| 11.3554       | 0.11  | 25   | 11.9292         |
-| 10.2321       | 0.14  | 30   | 11.8443         |
-| 11.1008       | 0.16  | 35   | 11.7623         |
-| 10.9742       | 0.18  | 40   | 11.6810         |
-| 10.7344       | 0.21  | 45   | 11.6019         |
-| 10.9955       | 0.23  | 50   | 11.5246         |
-| 9.2042        | 0.25  | 55   | 11.4512         |
-| 10.2688       | 0.28  | 60   | 11.3810         |
-| 9.8818        | 0.3   | 65   | 11.3127         |
-| 10.6999       | 0.32  | 70   | 11.2461         |
-| 10.7308       | 0.34  | 75   | 11.1818         |
-| 9.8682        | 0.37  | 80   | 11.1196         |
-| 10.8196       | 0.39  | 85   | 11.0594         |
-| 9.593         | 0.41  | 90   | 11.0016         |
-| 10.1361       | 0.44  | 95   | 10.9466         |
-| 9.8119        | 0.46  | 100  | 10.8934         |
-| 10.3661       | 0.48  | 105  | 10.8424         |
-| 9.5482        | 0.5   | 110  | 10.7934         |
-| 9.7784        | 0.53  | 115  | 10.7476         |
-| 9.9489        | 0.55  | 120  | 10.7027         |
-| 9.2101        | 0.57  | 125  | 10.6609         |
-| 9.1377        | 0.6   | 130  | 10.6216         |
-| 9.4856        | 0.62  | 135  | 10.5843         |
-| 9.323         | 0.64  | 140  | 10.5497         |
-| 9.583         | 0.67  | 145  | 10.5167         |
-| 10.0577       | 0.69  | 150  | 10.4856         |
-| 9.4803        | 0.71  | 155  | 10.4569         |
-| 9.6417        | 0.73  | 160  | 10.4304         |
-| 9.0708        | 0.76  | 165  | 10.4061         |
-| 9.6586        | 0.78  | 170  | 10.3842         |
-| 9.1787        | 0.8   | 175  | 10.3638         |
-| 8.6618        | 0.83  | 180  | 10.3460         |
-| 10.0594       | 0.85  | 185  | 10.3302         |
-| 8.4156        | 0.87  | 190  | 10.3166         |
-| 9.2773        | 0.89  | 195  | 10.3054         |
-| 9.0625        | 0.92  | 200  | 10.2959         |
-| 9.1544        | 0.94  | 205  | 10.2888         |
-| 8.6885        | 0.96  | 210  | 10.2837         |
-| 8.6336        | 0.99  | 215  | 10.2808         |
 ### Framework versions

 This model is a fine-tuned version of [deepset/bert-base-cased-squad2](https://huggingface.co/deepset/bert-base-cased-squad2) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 11.3111
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 10.3108       | 0.02  | 5    | 12.3310         |
+| 11.3688       | 0.05  | 10   | 12.2842         |
+| 12.0992       | 0.07  | 15   | 12.2377         |
+| 10.8808       | 0.09  | 20   | 12.1923         |
+| 11.5554       | 0.11  | 25   | 12.1480         |
+| 10.4562       | 0.14  | 30   | 12.1059         |
+| 11.3704       | 0.16  | 35   | 12.0646         |
+| 11.2796       | 0.18  | 40   | 12.0239         |
+| 11.0892       | 0.21  | 45   | 11.9839         |
+| 11.3659       | 0.23  | 50   | 11.9453         |
+| 9.552         | 0.25  | 55   | 11.9083         |
+| 10.7276       | 0.28  | 60   | 11.8726         |
+| 10.3388       | 0.3   | 65   | 11.8381         |
+| 11.2353       | 0.32  | 70   | 11.8045         |
+| 11.3283       | 0.34  | 75   | 11.7717         |
+| 10.4237       | 0.37  | 80   | 11.7398         |
+| 11.4335       | 0.39  | 85   | 11.7099         |
+| 10.1757       | 0.41  | 90   | 11.6803         |
+| 10.8343       | 0.44  | 95   | 11.6522         |
+| 10.4633       | 0.46  | 100  | 11.6252         |
+| 11.1111       | 0.48  | 105  | 11.5994         |
+| 10.2398       | 0.5   | 110  | 11.5743         |
+| 10.5394       | 0.53  | 115  | 11.5506         |
+| 10.7319       | 0.55  | 120  | 11.5279         |
+| 9.9385        | 0.57  | 125  | 11.5065         |
+| 9.8785        | 0.6   | 130  | 11.4861         |
+| 10.2925       | 0.62  | 135  | 11.4670         |
+| 10.1561       | 0.64  | 140  | 11.4492         |
+| 10.4524       | 0.67  | 145  | 11.4327         |
+| 10.9644       | 0.69  | 150  | 11.4166         |
+| 10.3769       | 0.71  | 155  | 11.4020         |
+| 10.5732       | 0.73  | 160  | 11.3882         |
+| 9.9129        | 0.76  | 165  | 11.3757         |
+| 10.593        | 0.78  | 170  | 11.3643         |
+| 10.1119       | 0.8   | 175  | 11.3541         |
+| 9.5165        | 0.83  | 180  | 11.3448         |
+| 11.0571       | 0.85  | 185  | 11.3366         |
+| 9.2427        | 0.87  | 190  | 11.3295         |
+| 10.1903       | 0.89  | 195  | 11.3240         |
+| 9.9867        | 0.92  | 200  | 11.3187         |
+| 10.1191       | 0.94  | 205  | 11.3151         |
+| 9.5425        | 0.96  | 210  | 11.3126         |
+| 9.5164        | 0.99  | 215  | 11.3111         |
 ### Framework versions

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b43121d05d1b471ed64b9bb143348cebb00a2e8b3c09897c36ffb1039270a728
 size 430952617

 version https://git-lfs.github.com/spec/v1
+oid sha256:9df90d9e5f9e364cbdafc8b7d630b98cc034d49d89690d3370c55b60149b4186
 size 430952617

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43844ba856929d9b1c8d305ffcb14e963a95e3d90a6c0bd2e0a6dc95efb81cd0
 size 4027

 version https://git-lfs.github.com/spec/v1
+oid sha256:01d99687aca72988b22197d0ac0fed531eb54bc435fd76e4d73fbb65bc079d60
 size 4027