jiangfeibo commited on
Commit
c932521
1 Parent(s): 504117b
README.assets/clip_image002.gif ADDED
README.assets/clip_image004.gif ADDED
README.assets/clip_image006.gif ADDED
README.assets/clip_image008.gif ADDED
README.md CHANGED
@@ -22,11 +22,11 @@ DPO训练:采用动态提示优化技术,进一步优化模型在特定任
22
 
23
  ## 安装与加载
24
 
25
- 克隆本项目到本地:
26
 
27
  git clone
28
 
29
- cd llama-3.1-8b-it-ch-dpo
30
 
31
 
32
 
@@ -38,16 +38,16 @@ C-Eval 是一个全面的中文基础模型评估套件。它包含了大量的
38
 
39
  | C-Eval | Average | Average(hard) | STEM | Social Sciences | Humanities | Other |
40
  | ------ | ------- | ------------- | ---- | --------------- | ---------- | ----- |
41
- | 原模型 | 25.2 | 23.6 | 25 | 26.5 | 25.1 | 24.3 |
42
- | 训练后 | 44.0 | 32.5 | 41.6 | 51.9 | 41.1 | 44.0 |
43
 
44
  #### Cmmlu
45
  CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。
46
 
47
  | CMMLU | Average | STEM | Social Sciences | Humanities | Other |
48
  | ------ | ------- | ----- | --------------- | ---------- | ----- |
49
- | 原模型 | 24.99 | 26.04 | 24.84 | 25.23 | 24.05 |
50
- | 训练后 | 44.63 | 37.5 | 45.21 | 45.76 | 49.14 |
51
 
52
 
53
 
@@ -55,7 +55,7 @@ CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在
55
 
56
  微调数据集:
57
 
58
- | | |
59
  | --------------------- | ------------------------------------------------------------ |
60
  | 中文微调数据集 | https://modelscope.cn/datasets/zhuangxialie/Llama3-Chinese-Dataset/files |
61
  | train_1M_CN | https://huggingface.co/datasets/BelleGroup/train_1M_CN |
@@ -86,6 +86,6 @@ Training loss:
86
 
87
  ![img](README.assets/clip_image006.gif)
88
 
89
- Training rewards:
90
 
91
  ![img](README.assets/clip_image008.gif)
 
22
 
23
  ## 安装与加载
24
 
25
+ 克隆本项目到本地:https://huggingface.co/jiangfb/llama-3.1-chinese-8b-it-dpo
26
 
27
  git clone
28
 
29
+ cd llama-3.1-chinese-8b-it-dpo
30
 
31
 
32
 
 
38
 
39
  | C-Eval | Average | Average(hard) | STEM | Social Sciences | Humanities | Other |
40
  | ------ | ------- | ------------- | ---- | --------------- | ---------- | ----- |
41
+ | 原模型 | 24.1 | 23.5 | 23.9 | 25.3 | 24.6 | 22.7 |
42
+ | 训练后 | 44.7 | 32.9 | 41.8 | 52.7 | 42.0 | 44.5 |
43
 
44
  #### Cmmlu
45
  CMMLU是一个综合性的中文评估基准,专门用于评估语言模型在中文语境下的知识和推理能力。CMMLU涵盖了从基础学科到高级专业水平的67个主题。它包括:需要计算和推理的自然科学,需要知识的人文科学和社会科学,以及需要生活常识的中国驾驶规则等。
46
 
47
  | CMMLU | Average | STEM | Social Sciences | Humanities | Other |
48
  | ------ | ------- | ----- | --------------- | ---------- | ----- |
49
+ | 原模型 | 25.3 | 26.04 | 25.19 | 25.79 | 25.26 |
50
+ | 训练后 | 46.54 | 39.31 | 47.21 | 47.41 | 51.34 |
51
 
52
 
53
 
 
55
 
56
  微调数据集:
57
 
58
+ | | |
59
  | --------------------- | ------------------------------------------------------------ |
60
  | 中文微调数据集 | https://modelscope.cn/datasets/zhuangxialie/Llama3-Chinese-Dataset/files |
61
  | train_1M_CN | https://huggingface.co/datasets/BelleGroup/train_1M_CN |
 
86
 
87
  ![img](README.assets/clip_image006.gif)
88
 
89
+ Training rewards:
90
 
91
  ![img](README.assets/clip_image008.gif)