sakuraumi's picture
Update README.md
7810b37 verified
|
raw
history blame
2.43 kB
---
license: cc-by-nc-sa-4.0
---
1.0版本——功能性更新:
- 改善翻译质量,提高翻译准确率,尤其是人称的准确率。
- 支持术语表(GPT字典),以保持专有名词和人称的一致性。
- 提高部分简单控制符的保留能力,尤其是单行内存在\n的情况下保留\n的能力。降低行数与原文不一致的概率。
- 由于底模使用GQA,推理速度和显存占用显著改善,可实现更快的多线程推理。关于多线程推理,可参考[Sakura启动器GUI使用教程](https://books.fishhawk.top/forum/656d60530286f15e3384fcf8)或[SakuraLLMServer](https://github.com/neavo/SakuraLLMServer)。
prompt格式:
```python
gpt_dict = [{
"src": "原文1",
"dst": "译文1",
"info": "注释信息1",
},]
gpt_dict_text_list = []
for gpt in gpt_dict:
src = gpt['src']
dst = gpt['dst']
info = gpt['info'] if "info" in gpt.keys() else None
if info:
single = f"{src}->{dst} #{info}"
else:
single = f"{src}->{dst}"
gpt_dict_text_list.append(single)
gpt_dict_raw_text = "\n".join(gpt_dict_text_list)
user_prompt = "根据以下术语表(可以为空):\n" + gpt_dict_raw_text + "\n" + "将下面的日文文本根据对应关系和备注翻译成中文:" + japanese
prompt = "<|im_start|>system\n你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。<|im_end|>\n" \ # system prompt
+ "<|im_start|>user\n" + user_prompt + "<|im_end|>\n" \ # user prompt
+ "<|im_start|>assistant\n" # assistant prompt start
# 如果术语表为空,也可以使用如下prompt(在术语表为空时更加推荐)
user_prompt = "将下面的日文文本翻译成中文:" + japanese
prompt = "<|im_start|>system\n你是一个轻小说翻译模型,可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文,并联系上下文正确使用人称代词,不擅自添加原文中没有的代词。<|im_end|>\n" \ # system prompt
+ "<|im_start|>user\n" + user_prompt + "<|im_end|>\n" \ # user prompt
+ "<|im_start|>assistant\n" # assistant prompt start
```