|
---
|
|
license: apache-2.0
|
|
---
|
|
# Mengzi3-8B |
|
|
|
以创新为引擎,驱动 AI 生态的可持续发展! |
|
|
|
在 Mengzi3-13B 大模型 3 月底开源后不久,澜舟科技全新推出的又一款轻量化大模型——Mengzi3-8B,现已正式开源!并同样支持免费商用。这款模型在多个应用场景中,包括写作、代码、摘要以及阅读理解等,均展现出与 Mengzi3-13B 相媲美的性能,而模型参数规模更为精简,更适合个人开发者和 AI 爱好者使用。 |
|
|
|
Mengzi3-8B 适用于多种自然语言处理任务,主要包括: |
|
|
|
- 文本生成:能够轻松产出高质量、多样化的中文文本内容,涵盖写作,摘要,问答,翻译,阅读理解等多种文本生成场景; |
|
- 对话系统:为用户提供高效、智能的交互体验,让对话更加流畅自然; |
|
- 代码生成:协助开发者提升编码效率,激发创新灵感。 |
|
|
|
### 核心优势 |
|
|
|
- 低显存高推理,具备更高效能 |
|
|
|
Mengzi3-8B 是一款高效、低显存需求的 AI 大模型,半精度下显存占用小于 16G,适用于 PC(如 MacBook)和大部分消费级显卡(如 RTX 4090、RTX 4080、RTX 4070Ti)。此外,Mengzi3-8B 的原生推理速度在同级别模型中处于领先地位,特别适合个人开发者和 AI 爱好者使用,真正实现了高效、低成本的 AI 体验。 |
|
|
|
![](static/ATZpb67dooTt6NxlRyKcoYkrnze.png) |
|
|
|
- 知识处理效果卓越 |
|
|
|
Mengzi3-8B 在中文能力(CMMLU)、英语、世界知识(MMLU)、编程及数学等多个领域的知识处理和问题解决能力中,均显著超越同尺寸开源模型,展现出全面的领先实力。 |
|
|
|
| **评测集** | **Mengzi3-8B-Base** | **Mistral-7B** | **Llama3-8B** | **Baichuan2-7B** | **Yi-1.5-9B** | **Qwen1.5-7B** | |
|
| ------------- | ------------------- | -------------- | ------------- | ---------------- | ------------- | -------------- | |
|
| **MMLU** | 73.67 | 64.1 | 66.6 | 54.16 | 69.5 | 61.0 | |
|
| **CMMLU** | 77.54 | 44.7 | 49.21 | 57.07 | 74.8 | 73.1 | |
|
| **GSM8K** | 76.29 | 47.5 | 50.04 | 9.17 | 73.7 | 62.5 | |
|
| **HUMANEVAL** | 48.78 | 27.4 | 36.59 | 9.20 | 41.4 | 36.0 | |
|
| **MBPP** | 43.20 | 38.6 | 34.2 | 6.60 | 61.1 | 37.4 | |
|
|
|
### 使用指南 |
|
|
|
**开源地址**: |
|
|
|
欢迎大家访问 Mengzi3-8B 的开源仓库以获取更多信息并下载使用,体验其强大的功能。 |
|
|
|
- Huggingface: [https://huggingface.co/Langboat/Mengzi3-8B-Base](https://huggingface.co/Langboat/Mengzi3-8B-Base) |
|
- ModelScope: [https://www.modelscope.cn/models/langboat/Mengzi3-8B-Base/summary](https://www.modelscope.cn/models/langboat/Mengzi3-8B-Base/summary) |
|
|
|
**快速开始:** |
|
|
|
```python |
|
import torch |
|
from transformers import AutoModelForCausalLM, AutoTokenizer |
|
|
|
tokenizer = AutoTokenizer.from_pretrained("Langboat/Mengzi3-8B-Base", use_fast=False, trust_remote_code=True) |
|
model = AutoModelForCausalLM.from_pretrained("Langboat/Mengzi3-8B-Base", device_map="auto", trust_remote_code=True) |
|
inputs = tokenizer('输入:介绍一下孟子。输出:', return_tensors='pt') |
|
if torch.cuda.is_available(): |
|
inputs = inputs.to('cuda') |
|
pred = model.generate(**inputs, max_new_tokens=512, repetition_penalty=1.01, eos_token_id=tokenizer.eos_token_id) |
|
print(tokenizer.decode(pred[0], skip_special_tokens=True)) |
|
"""孟子(约公元前372年—约公元前289年),名轲,字子舆,战国时期邹国人,伟大的思想家、教育家,儒家学派的代表人物,与孔子并称“孔孟”。孟子继承和发展了孔子的思想,成为仅次于孔子的一代儒家宗师,对后世中国文化的影 |
|
响全面而巨大,有“亚圣”之称,与孔子合称为“孔孟”。""" |
|
``` |
|
|
|
我们很诚挚地邀请各位 AI 开发者和爱好者体验使用 Mengzi3-8B 模型,如在使用过程中遇到任何问题或希望给予宝贵的反馈,请随时与我们联系。对于企业用户,对稳定性和模型参数量有更高需求的,建议了解 [Mengzi3-13B](https://github.com/Langboat/Mengzi3)。 |
|
|
|
大模型的开源不仅为 AI 创新注入了新的活力,更在不断完善开源生态的进程中发挥着关键作用。我们希望能在推动技术创新、促进业务场景应用、完善数字经济与开源生态等方面积极贡献,以期更好地应对未来 AI 技术的挑战,共同推动行业的持续进步和发展。 |
|
|
|
**👇 扫码加入孟子开源社区微信群** |
|
|
|
![](static/U6B5bCHmaosqmxx7dW3cax9Qnob.png) |
|
|