cognitivecomputations
/

minotaur-llama2-13b-qlora

Model card Files Files and versions Community

minotaur-llama2-13b-qlora / README.md

leaderboard-pr-bot's picture

leaderboard-pr-bot

Adding Evaluation Results

85347f8 12 months ago

|

2.24 kB

metadata

library_name: peft
base_model: TheBloke/Llama-2-13B-fp16

Training procedure

The following bitsandbytes quantization config was used during training:

load_in_8bit: False
load_in_4bit: True
llm_int8_threshold: 6.0
llm_int8_skip_modules: None
llm_int8_enable_fp32_cpu_offload: False
llm_int8_has_fp16_weight: False
bnb_4bit_quant_type: nf4
bnb_4bit_use_double_quant: True
bnb_4bit_compute_dtype: float32

The following bitsandbytes quantization config was used during training:

load_in_8bit: False
load_in_4bit: True
llm_int8_threshold: 6.0
llm_int8_skip_modules: None
llm_int8_enable_fp32_cpu_offload: False
llm_int8_has_fp16_weight: False
bnb_4bit_quant_type: nf4
bnb_4bit_use_double_quant: True
bnb_4bit_compute_dtype: float32

The following bitsandbytes quantization config was used during training:

load_in_8bit: False
load_in_4bit: True
llm_int8_threshold: 6.0
llm_int8_skip_modules: None
llm_int8_enable_fp32_cpu_offload: False
llm_int8_has_fp16_weight: False
bnb_4bit_quant_type: nf4
bnb_4bit_use_double_quant: True
bnb_4bit_compute_dtype: float32

The following bitsandbytes quantization config was used during training:

load_in_8bit: False
load_in_4bit: True
llm_int8_threshold: 6.0
llm_int8_skip_modules: None
llm_int8_enable_fp32_cpu_offload: False
llm_int8_has_fp16_weight: False
bnb_4bit_quant_type: nf4
bnb_4bit_use_double_quant: True
bnb_4bit_compute_dtype: float32

Framework versions

PEFT 0.5.0.dev0
PEFT 0.5.0.dev0
PEFT 0.5.0.dev0
PEFT 0.5.0.dev0

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	49.54
ARC (25-shot)	60.07
HellaSwag (10-shot)	82.42
MMLU (5-shot)	55.87
TruthfulQA (0-shot)	45.57
Winogrande (5-shot)	76.24
GSM8K (5-shot)	12.05
DROP (3-shot)	14.53