SakuraLLM
/

Sakura-14B-Qwen2.5-v1.0-GGUF

Inference Endpoints

Model card Files Files and versions Community

Sakura-14B-Qwen2.5-v1.0-GGUF / README.md

sakuraumi's picture

Update README.md

7810b37 verified 9 days ago

|

2.43 kB

	---
	license: cc-by-nc-sa-4.0
	---
	1.0版本——功能性更新：

	- 改善翻译质量，提高翻译准确率，尤其是人称的准确率。
	- 支持术语表(GPT字典)，以保持专有名词和人称的一致性。
	- 提高部分简单控制符的保留能力，尤其是单行内存在\n的情况下保留\n的能力。降低行数与原文不一致的概率。
	- 由于底模使用GQA，推理速度和显存占用显著改善，可实现更快的多线程推理。关于多线程推理，可参考[Sakura启动器GUI使用教程](https://books.fishhawk.top/forum/656d60530286f15e3384fcf8)或[SakuraLLMServer](https://github.com/neavo/SakuraLLMServer)。

	prompt格式：
	```python
	gpt_dict = [{
	"src": "原文1",
	"dst": "译文1",
	"info": "注释信息1",
	},]
	gpt_dict_text_list = []
	for gpt in gpt_dict:
	src = gpt['src']
	dst = gpt['dst']
	info = gpt['info'] if "info" in gpt.keys() else None
	if info:
	single = f"{src}->{dst} #{info}"
	else:
	single = f"{src}->{dst}"
	gpt_dict_text_list.append(single)

	gpt_dict_raw_text = "\n".join(gpt_dict_text_list)

	user_prompt = "根据以下术语表（可以为空）：\n" + gpt_dict_raw_text + "\n" + "将下面的日文文本根据对应关系和备注翻译成中文：" + japanese
	prompt = "<\|im_start\|>system\n你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。<\|im_end\|>\n" \ # system prompt
	+ "<\|im_start\|>user\n" + user_prompt + "<\|im_end\|>\n" \ # user prompt
	+ "<\|im_start\|>assistant\n" # assistant prompt start

	# 如果术语表为空，也可以使用如下prompt（在术语表为空时更加推荐）
	user_prompt = "将下面的日文文本翻译成中文：" + japanese
	prompt = "<\|im_start\|>system\n你是一个轻小说翻译模型，可以流畅通顺地以日本轻小说的风格将日文翻译成简体中文，并联系上下文正确使用人称代词，不擅自添加原文中没有的代词。<\|im_end\|>\n" \ # system prompt
	+ "<\|im_start\|>user\n" + user_prompt + "<\|im_end\|>\n" \ # user prompt
	+ "<\|im_start\|>assistant\n" # assistant prompt start

	```