|
--- |
|
library_name: transformers |
|
license: llama3 |
|
base_model: beomi/Llama-3-Open-Ko-8B |
|
datasets: |
|
- beomi/KoAlpaca-v1.1a |
|
- kyujinpy/OpenOrca-KO |
|
- nlpai-lab/openassistant-guanaco-ko |
|
language: |
|
- ko |
|
pipeline_tag: text-generation |
|
--- |
|
|
|
# Model Card |
|
|
|
<!-- Provide a quick summary of what the model is/does. --> |
|
|
|
~์์ค์ง~ |
|
|
|
## Model Details |
|
|
|
### Model Description |
|
|
|
<!-- Provide a longer summary of what this model is. --> |
|
|
|
[beomi/Llama-3-Open-Ko-8B](https://huggingface.co/beomi/Llama-3-Open-Ko-8B) (์ต์ ๋ฒ์ )์ Instruction tuning ๋ฒ์ ๋ชจ๋ธ์
๋๋ค. |
|
|
|
- Dataset: |
|
- [beomi/Ko**A**lpaca-v1.1a](https://huggingface.co/datasets/beomi/KoAlpaca-v1.1a) |
|
- [kyujinpy/Open**O**rca-KO](https://huggingface.co/datasets/kyujinpy/OpenOrca-KO) |
|
- [nlpai-lab/openassistant-**g**uanaco-ko](https://huggingface.co/datasets/nlpai-lab/openassistant-guanaco-ko) |
|
|
|
- Instruction format: |
|
- alpaca |
|
|
|
### Dataset |
|
|
|
- ์์
์ ์ผ๋ก ์ด์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์
์ ์ฌ์ฉํ์์ต๋๋ค. |
|
- ํฅํ ๋น๊ต๋ฅผ ์ํ์ฌ, ์ํ/์ฝ๋ฉ ๊ด๋ จ ์ง๋ฌธ์ด ๋ง์ ๋ฐ์ดํฐ ์
(ex: kyujinpy/KOpen-platypus)์ ์ ์ธํ์์ต๋๋ค. |
|
- ๋ฉํฐ ํด ๋ํ ๋ฐ์ดํฐ(nlpai-lab/openassistant-guanaco-ko)๋ฅผ ์ถ๊ฐํด๋ณด์์ต๋๋ค. |
|
|
|
- beomi/KoAlpaca-v1.1a |
|
- 80% ํ๋ฅ ๋ก instruction ์ถ๊ฐ("๋น์ ์ ์ธ๊ณต์ง๋ฅ ๋น์์
๋๋ค. ์ฌ์ฉ์๊ฐ ๋ต์ ์ดํดํ๊ธฐ ์ํด ์ธ๋ถ์์ ๊ฒ์ํ ํ์๊ฐ ์๋๋ก ์์ธํ ๋ต๋ณ์ ์ ๊ณตํ์ธ์.") |
|
|
|
- kyujinpy/OpenOrca-KO |
|
- ๋ณ๊ฒฝ์ฌํญ ์์ |
|
|
|
- nlpai-lab/openassistant-guanaco-ko |
|
- ๋ฉํฐ ํด ๋ํ์ ๊ฒฝ์ฐ, ๋ง์ง๋ง Assistant์ ๋ต๋ณ์ ๋ชฉํ๋ก ํจ |
|
- Alpaca format์ ๋ง์ถฐ ์ด์ ๋ํ ๋ด์ฉ์ ๋ํ ์ ์ฒ๋ฆฌ ์ํ |
|
- 80% ํ๋ฅ ๋ก instruction ์ถ๊ฐ ("๋น์ ์ ์ธ๊ณต์ง๋ฅ ๋น์์
๋๋ค. ์ฌ์ฉ์๊ฐ ๋ต์ ์ดํดํ๊ธฐ ์ํด ์ธ๋ถ์์ ๊ฒ์ํ ํ์๊ฐ ์๋๋ก ์์ธํ ๋ต๋ณ์ ์ ๊ณตํ์ธ์.") |
|
|
|
### Training details |
|
|
|
Training: Axolotl์ ์ด์ฉํด LoRA๋ก 3epoch ํ์ต ์์ผฐ์ต๋๋ค. |
|
- lora_r: 32 |
|
- lora_alpha: 32 |
|
- lora_dropout: 0.05 |
|
- gradient_accumulation_steps: 8 |
|
- micro_batch_size: 4 |
|
- num_epochs: 3 |
|
- learning_rate: 0.0002 (2e-4) |
|
- lr_scheduler: cosine |
|
- warmup_steps: 50 |
|
- sequence_len: 4096 |
|
- bf16 |
|
|
|
ํ์ต ์๊ฐ: 1xA100, ์ฝ 8์๊ฐ |
|
|
|
### Evaluation |
|
- boolq๋ฅผ ์ ์ธํ๋ฉด ํฐ ์ ํ๋ ํฅ์์ ์์์ต๋๋ค. |
|
- 5shot kobest (Accuracy) |
|
|
|
| Tasks |[werty1248/Llama-3-Ko-8B-OpenOrca](https://huggingface.co/werty1248/Llama-3-Ko-8B-OpenOrca)|[beomi/Llama-3-Open-Ko-8B](https://huggingface.co/beomi/Llama-3-Open-Ko-8B)|[werty1248/Llama-3-Ko-8B-Instruct-AOG](https://huggingface.co/beomi/Llama-3-Open-Ko-8B-Instruct-AOG)| |
|
|----------------|------:|------:|------:| |
|
|kobest_boolq |0.7158ยฑ0.0120|0.7963ยฑ0.0108|0.8312ยฑ0.0100| |
|
|kobest_copa |0.7620ยฑ0.0135|0.8110ยฑ0.0124|0.8120ยฑ0.0124| |
|
|kobest_hellaswag|0.4740ยฑ0.0224|0.4780ยฑ0.0224|0.4700ยฑ0.0223| |
|
|kobest_sentineg |0.9471ยฑ0.0112|0.9622ยฑ0.0096|0.9647ยฑ0.0093| |
|
|kobest_wic |0.6079ยฑ0.0138|0.5778ยฑ0.0139|0.5937ยฑ0.0138| |
|
|
|
### Format & Examples |
|
|
|
- Instruction - Input - Response ํํ๊ฐ ๊ถ์ฅ๋์ง๋ง, ๊ฒฝํ์ ์ผ๋ก Question - Instruction - Response๋ก ์ฌ์ฉํ๋ ๊ฒ์ด ๋ ๋์ ๊ฒ ๊ฐ์ต๋๋ค. |
|
|
|
- ์ ๋ ๋ต๋ณ ์์ |
|
|
|
``` |
|
input = """### Question: |
|
ํผ๋ณด๋์น ์์ด์ด ๋ญ์ผ? ๊ทธ๋ฆฌ๊ณ ํผ๋ณด๋์น ์์ด์ ๋ํด ํ์ด์ฌ ์ฝ๋๋ฅผ ์ง์ค๋ณผ๋? |
|
|
|
### Instruction: |
|
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์. |
|
|
|
### Response: |
|
""" |
|
|
|
ํผ๋ณด๋์น ์์ด์ 1์ฐจ์ 2์ฐจ ์๋ฅผ ์ฌ์ฉํด ๋ค์ ์๋ฅผ ๊ตฌํ๋ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ ์์ด์
๋๋ค. ์๋ฅผ๋ค๋ฉด ํผ๋ณด๋์น ์์ด์ ์ฒ์ 7๊ฐ ์์๋ 1, 1, 2, 3, 5, 8, 13์
๋๋ค. ํผ๋ณด๋์น ์์ด์ ๊ฐ ์์น์์ 2๊ฐ ์ด์ ์์น์ ์๋ฅผ ๋ํ์ฌ ์๋ก์ด ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. |
|
|
|
Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. |
|
|
|
def fibo(n): |
|
if n<2: |
|
return n |
|
else: |
|
return fibo(n-1)+fibo(n-2) |
|
|
|
์ด๋ ๊ฒ ์์ฑํจ์ผ๋ก์จ ํผ๋ณด๋์น ์์ด์ ์์น 0๋ถํฐ n๊น์ง ๊ฐ ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. 6์ด๋ผ๋ ์์น๋ก ๊ณ์ฐํ๋ ๊ฒฝ์ฐ ๋ค์๊ณผ ๊ฐ์ ์ถ๋ ฅ์ด ๋ํ๋ฉ๋๋ค: |
|
|
|
print(fibo(6)) |
|
|
|
fibonacci(6)==> 8<|end_of_text|> |
|
``` |
|
|
|
- ์๋ชป๋ ๋ต๋ณ(ํ ๋ฃจ์๋ค์ด์
) ์์ |
|
|
|
``` |
|
input = """### Question: |
|
์ธ์ข
๋์์ ์งํ์ ๋งฅ๋ถ ๋์ง ์ฌ๊ฑด์ ๋ํด์ ์๊ณ ์์ด? |
|
|
|
### Instruction: |
|
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์. |
|
|
|
### Response: |
|
""" |
|
|
|
๋ค, 2007๋
์ ์ธ์ข
๋์์ ์งํ์ ๋งฅ๋ถ ๋์ง ์ฌ๊ฑด์ด ์ผ์ด๋ฌ์ต๋๋ค. ๋ํ ์๊ฐ์ธ ์ด์ฃผ์์จ๊ฐ ๊น์ํฌ ์๊ฐ์ ์ฑ
์ ์งํํ๋ฉด์, ์ฑ
๋ด์ฉ์ ์๋ ์์๋ ์ธ์ข
๋์์ด ๋งฅ๋ถ์ ๋์ก๋ค๋ ๋ด์ฉ์ ์ ์ฌ๋ก ํด์ ์ถํํ์๊ณ , ์ด์ ๊น์ํฌ ์๊ฐ๋ ์งํ์ ์ด๋ ์ด๋ฆ์ผ๋ก ์ด์ฃผ์ ์๊ฐ์๊ฒ ๋ฒ์ ์์ก์ ๊ฑธ๊ฒ ๋์์ต๋๋ค. ๊ทธ๋ฌ๋ ๊ฒฐ๋ก ์ ์ผ๋ก, ๊น์ํฌ ์๊ฐ์ ์งํ์ ์ด๋ ๋จ์ด๋ ํน์ ๋จ์ฒด๋ ์ฅ์๋ง์ ๋ช
๋ฐฑํ๊ฒ ์ฌ์ฉํ๋ 'ํธ์นญ'์ ์ฑ๊ฒฉ๊ณผ ํจ๊ป ๋ค์์ ์งํ์ ์ฌ๋๋ค์ด ๊ณต๋ ์ฌ์ฉํ๋ 'ํ์ค'์ ์ฑ๊ฒฉ์ ๊ฐ์ก์ผ๋ฏ๋ก, ์ด์ฃผ์ ์๊ฐ์ ์ถํ ํ์๊ฐ ๋ช
์ํผ์์ ํด๋น๋๋์ง ์ฌ๋ถ๋ฅผ ํ๋จํ ๋์๋ ์ถํ ๋น์ ์งํ์ ์ด ์ผ๋ฐ์ ์ผ๋ก ์ด๋ค ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์์๋์ง๊ฐ ์ค์ํ ์์๋ก ๊ณ ๋ ค๋์์ต๋๋ค. ๋ฐ๋ผ์ ๋จ์ํ ์งํ์ ์ด ๊ฐ๊ณ์ ํน์ ๋จ์ฒด ๋ฐ ์ฅ์์ ๊ด๋ จ๋ ํธ์นญ์ผ๋ก๋ง ์ฌ์ฉ๋์ด์๋ค๋ฉด, ์ถํ ํ์๋ก ์ธํด ๋ช
์ํผ์์ ๋ฐ์๋ค๋ ๊น์ํฌ ์๊ฐ์ ์ฃผ์ฅ์ ๋ฐ์๋ค์ฌ์ง์ง ์์์ ์๋ ์์ต๋๋ค.<|end_of_text|> |
|
``` |
|
|
|
- ๋ฉํฐํด ๋ํ ์์ (์ ๋ขฐ๋ ๋ฎ์) |
|
|
|
``` |
|
"""### Question: |
|
ํผ๋ณด๋์น ์์ด์ด ๋ญ์ผ? ๊ทธ๋ฆฌ๊ณ ํผ๋ณด๋์น ์์ด์ ๋ํด ํ์ด์ฌ ์ฝ๋๋ฅผ ์ง์ค๋ณผ๋? |
|
### Response: |
|
ํผ๋ณด๋์น ์์ด์ 1์ฐจ์ 2์ฐจ ์๋ฅผ ์ฌ์ฉํด ๋ค์ ์๋ฅผ ๊ตฌํ๋ ๋ฐฉ์์ผ๋ก ๋ง๋ค์ด์ง๋ ์์ด์
๋๋ค. ์๋ฅผ๋ค๋ฉด ํผ๋ณด๋์น ์์ด์ ์ฒ์ 7๊ฐ ์์๋ 1, 1, 2, 3, 5, 8, 13์
๋๋ค. ํผ๋ณด๋์น ์์ด์ ๊ฐ ์์น์์ 2๊ฐ ์ด์ ์์น์ ์๋ฅผ ๋ํ์ฌ ์๋ก์ด ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. |
|
|
|
Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. |
|
|
|
def fibo(n): |
|
if n<2: |
|
return n |
|
else: |
|
return fibo(n-1)+fibo(n-2) |
|
|
|
์ด๋ ๊ฒ ์์ฑํจ์ผ๋ก์จ ํผ๋ณด๋์น ์์ด์ ์์น 0๋ถํฐ n๊น์ง ๊ฐ ์์๊ฐ ๊ณ์ฐ๋ฉ๋๋ค. 6์ด๋ผ๋ ์์น๋ก ๊ณ์ฐํ๋ ๊ฒฝ์ฐ ๋ค์๊ณผ ๊ฐ์ ์ถ๋ ฅ์ด ๋ํ๋ฉ๋๋ค: |
|
|
|
print(fibo(6)) |
|
|
|
fibonacci(6)==> 8 |
|
### Question: |
|
๋ ๋น ๋ฅธ ์๊ณ ๋ฆฌ์ฆ์ ์์๊น? |
|
|
|
### Instruction: |
|
์น์ ํ ์ฑ๋ด์ผ๋ก์ ์๋๋ฐฉ์ ์์ฒญ์ ์ต๋ํ ์์ธํ๊ณ ์น์ ํ๊ฒ ๋ตํ์. |
|
|
|
### Response: |
|
""" |
|
|
|
๋ค๋ฅธ Python ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค: |
|
def fibo(n): |
|
a, b = 0, 1 |
|
for _ in range(n): |
|
a, b = b, a+b |
|
return a |
|
|
|
์ด ์ฝ๋๋ ๋ ๊ฐ์ ๋ก์ปฌ ๋ณ์ a ๋ฐ b๋ฅผ ์ฌ์ฉํ๋ ์ดํฐ๋ ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ์ฐ์ ์ํํฉ๋๋ค. ์ด๊ธฐํ ์ a๋ ํผ๋ณด๋์น ์์ด์ ์์น 0์ ๊ฐ์ผ๋ก ์ค์ ๋๊ณ , b๋ ์ด์ ๊ณ์ฐ์์ ํผ๋ด ๊ณ์ด์ ์์น 0์ ๊ฐ(์์น 0์ ํฌํจํ๋ฉด 1๋จ๊ณ์์ 1์ด๋ฉฐ, ์์น 1์ ํฌํจํ๋ฉด 2๋จ๊ณ์์ 1)์ผ๋ก ์ค์ ๋ฉ๋๋ค. ๋ค์ ๊ฐ ๋ฐ๋ณต์์ a๋ ์ด์ ๋ก์ปฌ ๋ณ์ b์ ๊ฐ๊ณผ ์๋ก์ด ๊ฐ์ผ๋ก ๊ฐ์ด ๋ฐ๋๋๋ค. ๋ ๋ฒ์งธ ํ๋ผ๋ฏธํฐ __๋ ๊ฐ ๋ฐ๋ณต์์ ๊ฐ์ด ์ถ๋ ฅ๋์ง ์๋๋ค๋(๊ทธ๋ฌ๋ ์ฌ์ ํ ์ฌ์ฉ๋ฉ๋๋ค) ๊ฒ์ ๋ฐ์ํ๊ธฐ ์ํด ์ ํ๋์์ต๋๋ค.<|end_of_text|> |
|
|
|
|
|
``` |
|
|
|
### License: |
|
[https://llama.meta.com/llama3/license](https://llama.meta.com/llama3/license) |