Mxode commited on
Commit
aa37ca0
1 Parent(s): c727437

Update README_zh-CN.md

Browse files
Files changed (1) hide show
  1. README_zh-CN.md +2 -2
README_zh-CN.md CHANGED
@@ -8,14 +8,14 @@
8
 
9
  为了探究小模型的潜能,我尝试构建一系列小模型,并存放于 [NanoLM Collections](https://huggingface.co/collections/Mxode/nanolm-66d6d75b4a69536bca2705b2)。
10
 
11
- 这是 NanoLM-0.3B-Instruct-v1,即 NanoLM-0.3B-Instruct 的第一个版本。目前模型支持中英双语。
12
 
13
 
14
 
15
  ## Model Details
16
  NanoLM-0.3B-Instruct-v1 的 tokenizer 与模型结构均与 [Qwen/Qwen2-0.5B](https://huggingface.co/Qwen/Qwen2-0.5B) 一致,但是层数从 24 变为了 12。因此,NanoLM-0.3B-Instruct-v1 仅有 0.3B,其中 non-embedding 参数仅有约 180M。但 NanoLM-0.3B-Instruct-v1 仍然有着良好的指令遵循能力。
17
 
18
- 下面是一些示例,出于 reproduction 的考虑,我将 `do_sample` 设置为 `False`。
19
 
20
  首先您应当先加载模型,如下:
21
 
 
8
 
9
  为了探究小模型的潜能,我尝试构建一系列小模型,并存放于 [NanoLM Collections](https://huggingface.co/collections/Mxode/nanolm-66d6d75b4a69536bca2705b2)。
10
 
11
+ 这是 NanoLM-0.3B-Instruct-v1,即 NanoLM-0.3B-Instruct 的第一个版本。目前模型支持**中英双语**。
12
 
13
 
14
 
15
  ## Model Details
16
  NanoLM-0.3B-Instruct-v1 的 tokenizer 与模型结构均与 [Qwen/Qwen2-0.5B](https://huggingface.co/Qwen/Qwen2-0.5B) 一致,但是层数从 24 变为了 12。因此,NanoLM-0.3B-Instruct-v1 仅有 0.3B,其中 non-embedding 参数仅有约 180M。但 NanoLM-0.3B-Instruct-v1 仍然有着良好的指令遵循能力。
17
 
18
+ 下面是一些示例,出于 reproduction 的考虑,我将 `do_sample` 设置为 `False`。但实际使用中,您应当设置合适的采样参数。
19
 
20
  首先您应当先加载模型,如下:
21