neuralmagic
/

Meta-Llama-3.1-405B-Instruct-quantized.w4a16

Text Generation

compressed-tensors

Model card Files Files and versions Community

abhinavnmagic commited on Aug 12

Commit

91a872b

•

1 Parent(s): a8c9e50

Update README.md

Files changed (1) hide show

README.md +18 -14

README.md CHANGED Viewed

@@ -28,7 +28,7 @@ license: llama3.1
 - **Model Developers:** Neural Magic
 Quantized version of [Meta-Llama-3.1-405B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct).
-It achieves an average score of x.x on the [OpenLLM](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard) benchmark (version 1), whereas the unquantized model achieves x.x.
 ### Model Optimizations
@@ -146,11 +146,11 @@ This version of the lm-evaluation-harness includes versions of ARC-Challenge, GS
   <tr>
    <td>MMLU (5-shot)
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx%
    </td>
   </tr>
   <tr>
@@ -176,37 +176,41 @@ This version of the lm-evaluation-harness includes versions of ARC-Challenge, GS
   <tr>
    <td>Hellaswag (10-shot)
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx%
    </td>
   </tr>
   <tr>
    <td>Winogrande (5-shot)
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot)
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx
    </td>
-   <td>xx.xx%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
-   <td><strong>xx.xx</strong>
    </td>
-   <td><strong>xx.xx</strong>
    </td>
-   <td><strong>xx.xx%</strong>
    </td>
   </tr>
 </table>

 - **Model Developers:** Neural Magic
 Quantized version of [Meta-Llama-3.1-405B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3.1-405B-Instruct).
+It achieves an average score of 86.01 on the [OpenLLM](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard) benchmark (version 1), whereas the unquantized model achieves 86.63.
 ### Model Optimizations
   <tr>
    <td>MMLU (5-shot)
    </td>
+   <td>86.25
    </td>
+   <td>85.97
    </td>
+   <td>99.67%
    </td>
   </tr>
   <tr>
   <tr>
    <td>Hellaswag (10-shot)
    </td>
+   <td>88.33
    </td>
+  <td>88.16
+   </td>
+   <td>99.80%
    </td>
   </tr>
   <tr>
    <td>Winogrande (5-shot)
    </td>
+   <td>87.21
+   </td>
+  <td>85.95
    </td>
+   <td>98.55%
    </td>
   </tr>
   <tr>
    <td>TruthfulQA (0-shot)
    </td>
+   <td>64.64
    </td>
+   <td>64.75
    </td>
+   <td>100.17%
    </td>
   </tr>
   <tr>
    <td><strong>Average</strong>
    </td>
+   <td><strong>86.63</strong>
    </td>
+   <td><strong>86.01</strong>
    </td>
+   <td><strong>99.28%</strong>
    </td>
   </tr>
 </table>