ibm-granite
/

granite-3.0-2b-instruct

@@ -12,8 +12,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: instruction-following
-        name: IFEval
     metrics:
     - name: pass@1
       type: pass@1
@@ -22,8 +22,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: instruction-following
-        name: MT-Bench
     metrics:
     - name: pass@1
       type: pass@1
@@ -32,8 +32,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: AGI-Eval
     metrics:
     - name: pass@1
       type: pass@1
@@ -42,8 +42,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: MMLU
     metrics:
     - name: pass@1
       type: pass@1
@@ -52,8 +52,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: MMLU-Pro
     metrics:
     - name: pass@1
       type: pass@1
@@ -62,18 +62,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: OBQA
     metrics:
     - name: pass@1
       type: pass@1
-      value: 43.20
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: SIQA
     metrics:
     - name: pass@1
       type: pass@1
@@ -82,8 +82,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: Hellaswag
     metrics:
     - name: pass@1
       type: pass@1
@@ -92,18 +92,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: WinoGrande
     metrics:
     - name: pass@1
       type: pass@1
-      value: 71.90
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: TruthfulQA
     metrics:
     - name: pass@1
       type: pass@1
@@ -112,8 +112,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reading-comprehension
-        name: BoolQ
     metrics:
     - name: pass@1
       type: pass@1
@@ -122,8 +122,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reading-comprehension
-        name: SQuAD 2.0
     metrics:
     - name: pass@1
       type: pass@1
@@ -132,8 +132,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: ARC-C
     metrics:
     - name: pass@1
       type: pass@1
@@ -142,8 +142,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: GPQA
     metrics:
     - name: pass@1
       type: pass@1
@@ -152,8 +152,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: BBH
     metrics:
     - name: pass@1
       type: pass@1
@@ -162,8 +162,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalSynthesis
     metrics:
     - name: pass@1
       type: pass@1
@@ -172,8 +172,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalExplain
     metrics:
     - name: pass@1
       type: pass@1
@@ -182,8 +182,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalFix
     metrics:
     - name: pass@1
       type: pass@1
@@ -192,53 +192,55 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: MBPP
     metrics:
     - name: pass@1
       type: pass@1
-      value: 41.00
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: math
-        name: GSM8K
     metrics:
     - name: pass@1
       type: pass@1
       value: 59.66
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: math
-        name: MATH
     metrics:
     - name: pass@1
       type: pass@1
       value: 23.66
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: multilingual
-        name: PAWS-X (7 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 61.42
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: multilingual
-        name: MGSM (6 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 37.13
-      veriefied: false
 ---
 <!-- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62cd5057674cdb524450093d/1hzxoPwqkBJXshKVVe6_9.png) -->

   - task:
       type: text-generation
     dataset:
+      type: instruction-following
+      name: IFEval
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: instruction-following
+      name: MT-Bench
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: AGI-Eval
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: MMLU
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: MMLU-Pro
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: OBQA
     metrics:
     - name: pass@1
       type: pass@1
+      value: 43.2
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: SIQA
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: Hellaswag
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: WinoGrande
     metrics:
     - name: pass@1
       type: pass@1
+      value: 71.9
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: TruthfulQA
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reading-comprehension
+      name: BoolQ
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reading-comprehension
+      name: SQuAD 2.0
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: ARC-C
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: GPQA
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: BBH
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalSynthesis
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalExplain
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalFix
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: MBPP
     metrics:
     - name: pass@1
       type: pass@1
+      value: 41
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: math
+      name: GSM8K
     metrics:
     - name: pass@1
       type: pass@1
       value: 59.66
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: math
+      name: MATH
     metrics:
     - name: pass@1
       type: pass@1
       value: 23.66
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: multilingual
+      name: PAWS-X (7 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 61.42
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: multilingual
+      name: MGSM (6 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 37.13
+      veriefied: false
+base_model:
+- ibm-granite/granite-3.0-2b-base
 ---
 <!-- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62cd5057674cdb524450093d/1hzxoPwqkBJXshKVVe6_9.png) -->