commit files to HF hub

Browse files

Files changed (5) hide show

README.md +19 -79
eval/metric.first.answer.paragraph_answer.question.lmqg_qg_frquad.default.json +1 -1
eval/metric.first.sentence.paragraph_answer.question.lmqg_qg_frquad.default.json +1 -1
eval/samples.test.hyp.paragraph_answer.question.lmqg_qg_frquad.default.txt +0 -0
eval/samples.validation.hyp.paragraph_answer.question.lmqg_qg_frquad.default.txt +0 -0

README.md CHANGED Viewed

@@ -33,55 +33,19 @@ model-index:
     metrics:
     - name: BLEU4 (Question Generation)
       type: bleu4_question_generation
-      value: 0.72
     - name: ROUGE-L (Question Generation)
       type: rouge_l_question_generation
-      value: 16.4
     - name: METEOR (Question Generation)
       type: meteor_question_generation
-      value: 7.78
     - name: BERTScore (Question Generation)
       type: bertscore_question_generation
-      value: 71.48
     - name: MoverScore (Question Generation)
       type: moverscore_question_generation
-      value: 50.35
-    - name: QAAlignedF1Score-BERTScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_f1_score_bertscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 81.27
-    - name: QAAlignedRecall-BERTScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_recall_bertscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 81.25
-    - name: QAAlignedPrecision-BERTScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_precision_bertscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 81.29
-    - name: QAAlignedF1Score-MoverScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_f1_score_moverscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 55.61
-    - name: QAAlignedRecall-MoverScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_recall_moverscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 55.6
-    - name: QAAlignedPrecision-MoverScore (Question & Answer Generation (with Gold Answer)) [Gold Answer]
-      type: qa_aligned_precision_moverscore_question_answer_generation_with_gold_answer_gold_answer
-      value: 55.61
-    - name: QAAlignedF1Score-BERTScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_f1_score_bertscore_question_answer_generation_gold_answer
-      value: 75.55
-    - name: QAAlignedRecall-BERTScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_recall_bertscore_question_answer_generation_gold_answer
-      value: 77.16
-    - name: QAAlignedPrecision-BERTScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_precision_bertscore_question_answer_generation_gold_answer
-      value: 74.04
-    - name: QAAlignedF1Score-MoverScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_f1_score_moverscore_question_answer_generation_gold_answer
-      value: 51.75
-    - name: QAAlignedRecall-MoverScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_recall_moverscore_question_answer_generation_gold_answer
-      value: 52.52
-    - name: QAAlignedPrecision-MoverScore (Question & Answer Generation) [Gold Answer]
-      type: qa_aligned_precision_moverscore_question_answer_generation_gold_answer
-      value: 51.03
 ---
 # Model Card of `lmqg/mbart-large-cc25-frquad-qg`
@@ -125,38 +89,14 @@ output = pipe("Créateur » (Maker), lui aussi au singulier, « <hl> le Suprême
 |            |   Score | Type    | Dataset                                                          |
 |:-----------|--------:|:--------|:-----------------------------------------------------------------|
-| BERTScore  |   71.48 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| Bleu_1     |   14.36 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| Bleu_2     |    3.58 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| Bleu_3     |    1.45 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| Bleu_4     |    0.72 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| METEOR     |    7.78 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| MoverScore |   50.35 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| ROUGE_L    |   16.4  | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-- ***Metric (Question & Answer Generation, Reference Answer)***: Each question is generated from *the gold answer*. [raw metric file](https://huggingface.co/lmqg/mbart-large-cc25-frquad-qg/raw/main/eval/metric.first.answer.paragraph.questions_answers.lmqg_qg_frquad.default.json)
-|                                 |   Score | Type    | Dataset                                                          |
-|:--------------------------------|--------:|:--------|:-----------------------------------------------------------------|
-| QAAlignedF1Score (BERTScore)    |   81.27 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedF1Score (MoverScore)   |   55.61 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedPrecision (BERTScore)  |   81.29 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedPrecision (MoverScore) |   55.61 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedRecall (BERTScore)     |   81.25 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedRecall (MoverScore)    |   55.6  | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-- ***Metric (Question & Answer Generation, Pipeline Approach)***: Each question is generated on the answer generated by [`lmqg/mbart-large-cc25-frquad-ae`](https://huggingface.co/lmqg/mbart-large-cc25-frquad-ae). [raw metric file](https://huggingface.co/lmqg/mbart-large-cc25-frquad-qg/raw/main/eval_pipeline/metric.first.answer.paragraph.questions_answers.lmqg_qg_frquad.default.lmqg_mbart-large-cc25-frquad-ae.json)
-|                                 |   Score | Type    | Dataset                                                          |
-|:--------------------------------|--------:|:--------|:-----------------------------------------------------------------|
-| QAAlignedF1Score (BERTScore)    |   75.55 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedF1Score (MoverScore)   |   51.75 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedPrecision (BERTScore)  |   74.04 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedPrecision (MoverScore) |   51.03 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedRecall (BERTScore)     |   77.16 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
-| QAAlignedRecall (MoverScore)    |   52.52 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
@@ -165,18 +105,18 @@ output = pipe("Créateur » (Maker), lui aussi au singulier, « <hl> le Suprême
 The following hyperparameters were used during fine-tuning:
  - dataset_path: lmqg/qg_frquad
  - dataset_name: default
- - input_types: ['paragraph_answer']
- - output_types: ['question']
  - prefix_types: None
  - model: facebook/mbart-large-cc25
  - max_length: 512
  - max_length_output: 32
- - epoch: 8
- - batch: 4
- - lr: 0.001
  - fp16: False
  - random_seed: 1
- - gradient_accumulation_steps: 16
  - label_smoothing: 0.15
 The full configuration can be found at [fine-tuning config file](https://huggingface.co/lmqg/mbart-large-cc25-frquad-qg/raw/main/trainer_config.json).

     metrics:
     - name: BLEU4 (Question Generation)
       type: bleu4_question_generation
+      value: 9.47
     - name: ROUGE-L (Question Generation)
       type: rouge_l_question_generation
+      value: 30.62
     - name: METEOR (Question Generation)
       type: meteor_question_generation
+      value: 19.8
     - name: BERTScore (Question Generation)
       type: bertscore_question_generation
+      value: 81.75
     - name: MoverScore (Question Generation)
       type: moverscore_question_generation
+      value: 57.96
 ---
 # Model Card of `lmqg/mbart-large-cc25-frquad-qg`
 |            |   Score | Type    | Dataset                                                          |
 |:-----------|--------:|:--------|:-----------------------------------------------------------------|
+| BERTScore  |   81.75 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| Bleu_1     |   30.64 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| Bleu_2     |   19.09 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| Bleu_3     |   13.26 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| Bleu_4     |    9.47 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| METEOR     |   19.8  | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| MoverScore |   57.96 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
+| ROUGE_L    |   30.62 | default | [lmqg/qg_frquad](https://huggingface.co/datasets/lmqg/qg_frquad) |
 The following hyperparameters were used during fine-tuning:
  - dataset_path: lmqg/qg_frquad
  - dataset_name: default
+ - input_types: paragraph_answer
+ - output_types: question
  - prefix_types: None
  - model: facebook/mbart-large-cc25
  - max_length: 512
  - max_length_output: 32
+ - epoch: 7
+ - batch: 16
+ - lr: 0.0002
  - fp16: False
  - random_seed: 1
+ - gradient_accumulation_steps: 4
  - label_smoothing: 0.15
 The full configuration can be found at [fine-tuning config file](https://huggingface.co/lmqg/mbart-large-cc25-frquad-qg/raw/main/trainer_config.json).

eval/metric.first.answer.paragraph_answer.question.lmqg_qg_frquad.default.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"validation": {"Bleu_1": 0.~~15266974606897177~~, "Bleu_2": 0.~~032315652726206935~~, "Bleu_3": 0.~~01242272000629668~~, "Bleu_4": 0.~~005639579702145279~~}, "test": {"Bleu_1": 0.~~14319611140546562~~, "Bleu_2": 0.~~03550101836852145~~, "Bleu_3": 0.~~014304205020402904~~, "Bleu_4": 0.~~007136815650060918~~}}


1	+ {"validation": {"Bleu_1": 0.3100079744816499, "Bleu_2": 0.1864790045549178, "Bleu_3": 0.127381730709651, "Bleu_4": 0.09041409589904609}, "test": {"Bleu_1": 0.30524955201080156, "Bleu_2": 0.19005737843582, "Bleu_3": 0.1321122729640997, "Bleu_4": 0.09440059249803767}}

eval/metric.first.sentence.paragraph_answer.question.lmqg_qg_frquad.default.json CHANGED Viewed

@@ -1 +1 @@

- {"validation": {"Bleu_1": 0.~~15390469643777396~~, "Bleu_2": 0.~~032738698795741726~~, "Bleu_3": 0.~~012638666968838693~~, "Bleu_4": 0.~~005749977493630156~~, "METEOR": 0.~~07530493765743741~~, "ROUGE_L": 0.~~1803680529492586~~, "BERTScore": 0.~~7121313798282017~~, "MoverScore": 0.~~5039723302559359~~}, "test": {"Bleu_1": 0.~~1435759891766124~~, "Bleu_2": 0.~~03577421097785861~~, "Bleu_3": 0.~~014463809488654859~~, "Bleu_4": 0.~~007249735123112426~~, "METEOR": 0.~~07782490144091612~~, "ROUGE_L": 0.~~16404130481401358~~, "BERTScore": 0.~~7148478843440516~~, "MoverScore": 0.~~5034779936072653~~}}

+ {"validation": {"Bleu_1": 0.31183109270653203, "Bleu_2": 0.18792193517614694, "Bleu_3": 0.1285923759543279, "Bleu_4": 0.09139932689525869, "METEOR": 0.2003735134108025, "ROUGE_L": 0.32654333131001667, "BERTScore": 0.8112381537155198, "MoverScore": 0.5767622342106911}, "test": {"Bleu_1": 0.306424741768385, "Bleu_2": 0.1908808322930319, "Bleu_3": 0.1326252420714428, "Bleu_4": 0.09468344912075398, "METEOR": 0.19795720123707838, "ROUGE_L": 0.3062119155590123, "BERTScore": 0.8174732348101039, "MoverScore": 0.5795739024172827}}

eval/samples.test.hyp.paragraph_answer.question.lmqg_qg_frquad.default.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff

eval/samples.validation.hyp.paragraph_answer.question.lmqg_qg_frquad.default.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff