File size: 3,112 Bytes
4a8fb62
61734fc
 
 
 
 
 
 
 
 
 
4a8fb62
61734fc
 
 
 
 
 
 
 
 
 
4a8fb62
 
61734fc
4a8fb62
 
 
 
61734fc
4a8fb62
61734fc
4a8fb62
61734fc
 
4a8fb62
 
61734fc
4a8fb62
61734fc
4a8fb62
61734fc
4a8fb62
 
61734fc
4a8fb62
61734fc
 
 
4a8fb62
61734fc
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4a8fb62
 
61734fc
4a8fb62
61734fc
4a8fb62
 
61734fc
 
 
 
 
 
4a8fb62
61734fc
 
4a8fb62
61734fc
4a8fb62
61734fc
4a8fb62
61734fc
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
---
language:
- en
- jp
- de
- fr
- it
- pt
- hi
- es
- th
library_name: transformers
license: llama3.2
base_model:
- meta-llama/Llama-3.2-3B-Instruct
tags:
- facebook
- meta
- pytorch
- llama
- llama-3
pipeline_tag: text-generation
---

# AXCXEPT/EZO-Llama-3.2-3B-Instruct-dpoE

<!-- Provide a quick summary of what the model is/does. -->


![image/png](https://cdn-uploads.huggingface.co/production/uploads/657e900beaad53ff67ba84db/VXfxBWOGMiAsQIOM0GGFE.png)

## モデル情報 / Model Information

このモデルは、Meta AI の Llama 3.2 をベースに、日本語タスクでの性能を向上させるためにファインチューニングを行ったものです。
ベースとなるLlama-3.2-3B-Instructをもとに、日英のデータセットで性能向上を行いました。


## 法的通知 / Legal Notice

This model is subject to the Llama 3.2 Community License Agreement. For detailed information, please refer to the official Llama license page: [Llama 3.2 License](https://github.com/meta-llama/llama-models/blob/main/models/llama3_2/LICENSE)

このモデルは Llama 3.2 Community License Agreement に従います。詳細については、Llama の公式ライセンスページをご参照ください。


## 使用方法 / Usage

```python
import torch
from transformers import pipeline

model_id = "AXCXEPT/EZO-Llama-3.2-3B-Instruct-dpoE"
pipe = pipeline(
    "text-generation",
    model=model_id,
    torch_dtype=torch.bfloat16,
    device_map="auto",
)
messages = [
    {"role": "system", "content": "You are a pirate chatbot who always responds in pirate speak!"},
    {"role": "user", "content": "Who are you?"},
]
outputs = pipe(
    messages,
    max_new_tokens=256,
)
print(outputs[0]["generated_text"][-1])
```


## ベンチマーク結果 / Benchmark Results

![image/png](https://cdn-uploads.huggingface.co/production/uploads/657e900beaad53ff67ba84db/mxHX0fSlGrbRo1s-oTktP.png)


### [Disclaimer]
このモデルは研究開発のみを目的として提供されるものであり、実験的なプロトタイプとみなされるべきモデルです。
商業的な使用やミッションクリティカルな環境への配備を意図したものではありません。
本モデルの使用は、使用者の責任において行われるものとし、その性能および結果は保証されません。
Axcxept株式会社は、直接的、間接的、特別、偶発的、結果的な損害、または本モデルの使用から生じるいかなる損失に対しても、得られた結果にかかわらず、一切の責任を負いません。
利用者は、本モデルの使用に伴うリスクを十分に理解し、自己の判断で使用するものとします。

### [Hardware]
H100 × 8(Running in 3h)

## クレジット / Credits

This model is based on Meta AI's Llama 3.2. We acknowledge and thank the Meta AI team for their work on the base model.

このモデルは Meta AI の Llama 3.2 をベースにしています。ベースモデルの開発に携わった Meta AI チームに感謝と尊敬の意を表します。