ShinojiResearch
/

Senku-70B-Full

Generated from Trainer

Model card Files Files and versions Community

Adding Evaluation Results

#7

by leaderboard-pr-bot - opened Mar 4

base: refs/heads/main

←

from: refs/pr/7

Discussion Files changed

Files changed (1) hide show

README.md +17 -4

README.md CHANGED Viewed

@@ -1,14 +1,14 @@
 ---
 library_name: peft
 tags:
 - generated_from_trainer
 base_model: 152334H/miqu-1-70b-sf
 model-index:
 - name: Senku-70B-Full
   results: []
-license: cc0-1.0
-datasets:
-- Open-Orca/SlimOrca
 ---
 # ShinojiResearch/Senku-70B-Full
@@ -167,4 +167,17 @@ The following hyperparameters were used during training:
 - Transformers 4.38.0.dev0
 - Pytorch 2.1.2+cu118
 - Datasets 2.16.1
-- Tokenizers 0.15.0

 ---
+license: cc0-1.0
 library_name: peft
 tags:
 - generated_from_trainer
+datasets:
+- Open-Orca/SlimOrca
 base_model: 152334H/miqu-1-70b-sf
 model-index:
 - name: Senku-70B-Full
   results: []
 ---
 # ShinojiResearch/Senku-70B-Full
 - Transformers 4.38.0.dev0
 - Pytorch 2.1.2+cu118
 - Datasets 2.16.1
+- Tokenizers 0.15.0
+# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
+Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/details_ShinojiResearch__Senku-70B-Full)
+|             Metric              |Value|
+|---------------------------------|----:|
+|Avg.                             |75.44|
+|AI2 Reasoning Challenge (25-Shot)|71.50|
+|HellaSwag (10-Shot)              |87.88|
+|MMLU (5-Shot)                    |75.20|
+|TruthfulQA (0-shot)              |61.96|
+|Winogrande (5-shot)              |84.77|
+|GSM8k (5-shot)                   |71.34|