Edit model card
YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

๋ชจ๋ธ ๊ฐœ์š”

์ด ์ฑ—๋ด‡์€ ๋Œ€ํ•œ๋ฏผ๊ตญ์—์„œ ๋ฐœ์ƒํ•œ ์˜๋ฃŒ ์ „๋ฌธ ์ธ๋ ฅ ๋ถ€์กฑ๊ณผ ์˜์‚ฌ ํŒŒ์—…์œผ๋กœ ์ธํ•œ ์˜๋ฃŒ ์œ„๊ธฐ๋ฅผ ๋Œ€์‘ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐœ๋ฐœ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์˜๋ฃŒ ๋ถ„์•ผ์˜ ์ „๋ฌธ ์ง€์‹์„ ํฌํ•จํ•œ ๋Œ€๊ทœ๋ชจ AI ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ํ™˜์ž๋“ค์—๊ฒŒ ์‹ ์†ํ•˜๊ณ  ์ •ํ™•ํ•œ ์˜๋ฃŒ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ ์ƒ์„ธ ์„ค๋ช…

  • ๋ชจ๋ธ๋ช…: RAFT + RAG ๊ธฐ๋ฐ˜ ์˜๋ฃŒ ์ƒ๋‹ด ์ฑ—๋ด‡
  • ๊ธฐ๋ฐ˜ ๋ชจ๋ธ: Gemma-2-2b-it
  • ํ•™์Šต ๋ฐฉ๋ฒ•: GPT 4o-mini๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๋ฐ RAFT ๋ฐฉ๋ฒ• ์ ์šฉ
  • ์•„ํ‚คํ…์ฒ˜: Gemma-2-2b-it๊ณผ ๋™์ผํ•œ ๊ตฌ์กฐ ์‚ฌ์šฉ

๋ฐ์ดํ„ฐ์…‹

  • ๋ฐ์ดํ„ฐ์…‹ ์ด๋ฆ„: ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ
  • ์ถœ์ฒ˜: AI ํ—ˆ๋ธŒ
  • ๋ฐ์ดํ„ฐ ๊ตฌ์„ฑ:
    • 40%: ์ •๋‹ต์ด ํฌํ•จ๋œ ๋ฌธ์„œ 1๊ฐœ + ์ •๋‹ต๊ณผ ๊ด€๋ จ ์—†๋Š” ๋ฌธ์„œ 1๊ฐœ
    • 60%: ์ •๋‹ต๊ณผ ๊ด€๋ จ ์—†๋Š” ๋ฌธ์„œ 2๊ฐœ

ํ•™์Šต ๋ฐฉ๋ฒ•

๋ชจ๋ธ์€ GPT 4o-mini๋ฅผ ํ™œ์šฉํ•œ ๋ฐ์ดํ„ฐ ์ฆ๊ฐ• ๊ธฐ๋ฒ•๊ณผ RAFT(Adapting Language Model to Domain Specific RAG) ๋ฐฉ๋ฒ•์„ ์ ์šฉํ•˜์—ฌ ํ•™์Šต๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด ๋ชจ๋ธ์€ ๋ณต์žกํ•œ ๋ฌธ๋งฅ ์ดํ•ด์™€ ์ •ํ™•ํ•œ ์ •๋ณด ๊ฒ€์ƒ‰ ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œ์ผฐ์Šต๋‹ˆ๋‹ค.

์˜ˆ์‹œ

<bos><start_of_turn>user
<Question>: ์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์„ ์œ„ํ•ด ์–ด๋–ค ์กฐ์น˜๋ฅผ ์ทจํ•ด์•ผ ํ•˜๋‚˜์š”?
<Documents>: [
  '์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์€ ๋ฐœ ๊ฑด๊ฐ•์„ ํšŒ๋ณตํ•˜๊ณ  ํ†ต์ฆ์„ ์™„ํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์–‘ํ•œ ์กฐ์น˜๋“ค์„ ์ทจํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค. ...',
  '์™ธ์ƒ ํ›„ ์ŠคํŠธ๋ ˆ์Šค ์žฅ์•  ์น˜๋ฃŒ๋ฅผ ์œ„ํ•ด ์•ฝ๋ฌผ ์น˜๋ฃŒ๊ฐ€ ์„ ํƒ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ...'
]
<end_of_turn>
<start_of_turn>model
<Answer>: ์กฑ์ € ๊ทผ๋ง‰์—ผ ์žฌํ™œ์„ ์œ„ํ•ด ์ทจํ•ด์•ผ ํ•  ์กฐ์น˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค: ...
<end_of_turn><eos>

์˜ˆ์‹œ

์งˆ๋ฌธ:

๋‘ํ†ต์ด ์ž์ฃผ ๋ฐœ์ƒํ•˜๋Š” ์ด์œ ๊ฐ€ ๊ถ๊ธˆํ•ฉ๋‹ˆ๋‹ค. ์ŠคํŠธ๋ ˆ์Šค ๋•Œ๋ฌธ์ผ๊นŒ์š”, ์•„๋‹ˆ๋ฉด ๋‹ค๋ฅธ ๊ฑด๊ฐ• ๋ฌธ์ œ์ผ๊นŒ์š”? ์–ด๋–ค ์ƒํ™ฉ์—์„œ ๋‘ํ†ต์ด ์‹ฌํ•ด์ง€๋Š”์ง€์™€ ํ•จ๊ป˜ ์ฃผ์˜ํ•  ์ ์„ ์•Œ๊ณ  ์‹ถ์–ด์š”.

๋‹ต๋ณ€:

## ๋‘ํ†ต์˜ ์›์ธ

๋‘ํ†ต์€ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ์›์ธ์œผ๋กœ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ผ๋ฐ˜์ ์ธ ์›์ธ์œผ๋กœ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒƒ๋“ค์ด ์žˆ์Šต๋‹ˆ๋‹ค:

1. **์ŠคํŠธ๋ ˆ์Šค**: ์ผ์ƒ์ƒํ™œ์—์„œ์˜ ์ŠคํŠธ๋ ˆ์Šค๋Š” ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—…๋ฌด๋‚˜ ํ•™์—…, ๊ฐ€์กฑ ๊ด€๊ณ„์—์„œ์˜ ์••๋ฐ•๊ฐ์ด ๋‘ํ†ต์„ ์•…ํ™”์‹œํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
2. **์‹ ์ฒด์  ์š”์ธ**: ๊ทผ์œก์˜ ๊ธด์žฅ, ํ˜ˆ์•ก ์ˆœํ™˜ ๋ฌธ์ œ, ํ˜ธ๋ฅด๋ชฌ ๋ณ€ํ™” ๋“ฑ ์‹ ์ฒด์ ์ธ ์š”์ธ๋„ ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
3. **์˜์–‘ ๊ฒฐํ•**: ๋น„ํƒ€๋ฏผ B6 ๊ฒฐํ•์ด๋‚˜ ๋‹จ๋ฐฑ์งˆ ๋ถ€์กฑ์€ ๋‘ํ†ต์„ ์ผ์œผํ‚ฌ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
4. **์•ฝ๋ฌผ**: ํŠน์ • ์•ฝ๋ฌผ, ํŠนํžˆ ํ•ญ์šฐ์šธ์ œ๋‚˜ ์ง„ํ†ต์ œ ๋“ฑ์ด ๋‘ํ†ต์„ ์œ ๋ฐœํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
5. **๋น„๋งŒ**: ์ฒด์ค‘์ด ๊ณผ๋‹คํ•˜๋ฉด ํ˜ˆ์•ก์ˆœํ™˜์ด ์ €ํ•˜๋˜์–ด ๋‘ํ†ต์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

## ๋‘ํ†ต์˜ ์ฃผ์˜์ 

๋‘ํ†ต์ด ์ž์ฃผ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ฃผ์˜์ ์„ ๋”ฐ๋ฅด๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค:

- **์ŠคํŠธ๋ ˆ์Šค ๊ด€๋ฆฌ**: ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๊ธฐ ์œ„ํ•ด ๋ช…์ƒ, ์š”๊ฐ€, ์‹ฌํ˜ธํก ๋“ฑ์˜ ๋ฐฉ๋ฒ•์„ ์‹œ๋„ํ•ด๋ณด์„ธ์š”.
- **๊ฑด๊ฐ•ํ•œ ์‹์Šต๊ด€**: ๊ท ํ˜• ์žกํžŒ ์‹์‚ฌ๋ฅผ ํ•˜๊ณ , ๊ณผ์‹์ด๋‚˜ ํƒ„์ˆ˜ํ™”๋ฌผ ๊ณผ๋‹ค ์„ญ์ทจ๋ฅผ ํ”ผํ•˜์„ธ์š”.
- **๊ทœ์น™์ ์ธ ์šด๋™**: ๋งค์ผ ์งง์€ ์šด๋™์„ ํ†ตํ•ด ํ˜ˆ์•ก์ˆœํ™˜์„ ๊ฐœ์„ ํ•˜๊ณ  ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.
- **์ถฉ๋ถ„ํ•œ ์ˆ˜๋ฉด**: ๊ทœ์น™์ ์ธ ์ˆ˜๋ฉด ํŒจํ„ด์„ ์œ ์ง€ํ•˜๊ณ , ์ž ์ž๊ธฐ ์ „์—๋Š” ์ŠคํŠธ๋ ˆ์Šค๋ฅผ ์ค„์ด๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.
- **์ „๋ฌธ๊ฐ€ ์ƒ๋‹ด**: ๋‘ํ†ต์ด ๋ฐ˜๋ณต์ ์œผ๋กœ ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์‹ฌ๊ฐํ•œ ์ฆ์ƒ์ด ์žˆ์„ ๊ฒฝ์šฐ, ์˜์‚ฌ์™€ ์ƒ๋‹ดํ•˜์—ฌ ์ ์ ˆํ•œ ์ง„๋‹จ๊ณผ ์น˜๋ฃŒ๋ฅผ ๋ฐ›๋Š” ๊ฒƒ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

๋‘ํ†ต์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์ผ์ƒ์ƒํ™œ์— ํฐ ์ง€์žฅ์„ ์ฃผ์ง€ ์•Š์ง€๋งŒ, ๋งŒ์•ฝ ์ž์ฃผ ๋ฐœ์ƒํ•˜๊ฑฐ๋‚˜ ์‹ฌ๊ฐํ•œ ์ฆ์ƒ์ด ๋‚˜ํƒ€๋‚œ๋‹ค๋ฉด ์ „๋ฌธ๊ฐ€์˜ ๋„์›€์„ ๋ฐ›๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.

ํ‰๊ฐ€ ๊ฒฐ๊ณผ

๋ณธ ์—ฐ๊ตฌ์—์„œ๋Š” RAFT + RAG ๋ชจ๋ธ๊ณผ ๊ธฐ์กด ๋ชจ๋ธ์ธ Gemma-2-2b-it์„ ๋น„๊ตํ•˜์—ฌ RAGAS: Automated Evaluation of Retrieval Augmented Generation ๋ฐฉ๋ฒ•๋ก ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋‹ต๋ณ€ ์œ ์‚ฌ๋„๋ฅผ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

  • Gemma-2-2b-it ๋ชจ๋ธ: ํ‰๊ท  79.98% ์˜ ์œ ์‚ฌ๋„ ๊ธฐ๋ก
  • RAFT + RAG ๋ชจ๋ธ: ํ‰๊ท  96.02% ์˜ ์œ ์‚ฌ๋„ ๊ธฐ๋ก
    • ์ตœ์†Œ ์œ ์‚ฌ๋„: 92.39%
    • ์ตœ๋Œ€ ์œ ์‚ฌ๋„: 98.56%

์•ฝ 16% ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์ด ํ™•์ธ๋˜์—ˆ์œผ๋ฉฐ, ์ด๋Š” RAFT + RAG ๋ชจ๋ธ์ด ๋ณต์žกํ•œ ๋ฌธ๋งฅ๊ณผ ์ •๋ณด ๊ฒ€์ƒ‰์—์„œ ์šฐ์ˆ˜ํ•œ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๋ณด์œ ํ•˜๊ณ  ์žˆ์Œ์„ ๋‚˜ํƒ€๋ƒ…๋‹ˆ๋‹ค.

image

์‚ฌ์šฉ ๋ฐฉ๋ฒ•

์‚ฌ์šฉ ๋ฐฉ๋ฒ•๊ณผ ์•„ํ‚คํ…์ฒ˜๋Š” Gemma-2-2b-it ๋ชจ๋ธ๊ณผ ๋™์ผํ•ฉ๋‹ˆ๋‹ค. ๋ชจ๋ธ์€ ํ•œ๊ตญ์–ด ์˜๋ฃŒ ์งˆ์˜์— ๋Œ€ํ•ด ์ „๋ฌธ์ ์ธ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

๋ชจ๋ธ ๋ฐ ์–‘์žํ™” ๋ฒ„์ „

์•„๋ž˜๋Š” ๋ณธ ๋ชจ๋ธ๊ณผ ์–‘์žํ™”ํ•œ ๋ฒ„์ „, ๊ทธ๋ฆฌ๊ณ  DSF(Domain-Specific Fine-tuning) ๋ชจ๋ธ์˜ ๋งํฌ์ž…๋‹ˆ๋‹ค:

์ œํ•œ ์‚ฌํ•ญ ๋ฐ ์ฃผ์˜์‚ฌํ•ญ

  • ์˜๋ฃŒ ์กฐ์–ธ: ์ด ๋ชจ๋ธ์€ ์˜๋ฃŒ ์ •๋ณด๋ฅผ ์ œ๊ณตํ•˜์ง€๋งŒ, ์ „๋ฌธ์ ์ธ ์˜๋ฃŒ ์ƒ๋‹ด์ด๋‚˜ ์ง„๋‹จ์„ ๋Œ€์ฒดํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๊ฑด๊ฐ• ๊ด€๋ จ ์˜์‚ฌ ๊ฒฐ์ •์€ ๋ฐ˜๋“œ์‹œ ์˜๋ฃŒ ์ „๋ฌธ๊ฐ€์™€ ์ƒ์˜ํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ํ•œ๊ณ„: ๋ชจ๋ธ์€ ํ•™์Šต๋œ ๋ฐ์ดํ„ฐ ๋ฒ”์œ„ ๋‚ด์—์„œ ๋‹ต๋ณ€์„ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค. ์ตœ์‹  ์˜๋ฃŒ ์ง€์นจ์ด๋‚˜ ๊ฐœ์ธ๋ณ„ ์ƒํ™ฉ์— ๋Œ€ํ•œ ๊ณ ๋ ค๋Š” ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ฑ…์ž„ ํ•œ๊ณ„: ์ด ๋ชจ๋ธ์˜ ์‚ฌ์šฉ์œผ๋กœ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฐ๊ณผ์— ๋Œ€ํ•ด ๊ฐœ๋ฐœ์ž๋Š” ์ฑ…์ž„์„ ์ง€์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์ธ์šฉ

์ด ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ์—ฐ๊ตฌ์— ์ฐธ๊ณ ํ•˜์‹ค ๊ฒฝ์šฐ ๋‹ค์Œ ๋ฌธํ—Œ์„ ์ธ์šฉํ•ด์ฃผ์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค:

  • ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ: AI ํ—ˆ๋ธŒ, ์ดˆ๊ฑฐ๋Œ€ AI ํ—ฌ์Šค์ผ€์–ด ์งˆ์˜์‘๋‹ต ๋ฐ์ดํ„ฐ
  • Gemma 2 ๋ชจ๋ธ: "Gemma 2: Improving Open Language Models at a Practical Size", 2023.
  • RAFT ๋ฐฉ๋ฒ•๋ก : Park et al., "Adapting Language Model to Domain Specific RAG", arXiv preprint arXiv:2403.10131, 2023.
  • RAGAS ํ‰๊ฐ€ ๋ฐฉ๋ฒ•๋ก : Kim et al., "RAGAS: Automated Evaluation of Retrieval Augmented Generation", 2023.

๋ผ์ด์„ ์Šค

์ด ๋ชจ๋ธ์€ ํ•ด๋‹น ๋ฐ์ดํ„ฐ์…‹๊ณผ ์›์ฒœ ๋ชจ๋ธ์˜ ๋ผ์ด์„ ์Šค ์กฐ๊ฑด์— ๋”ฐ๋ผ ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ ์ „์— ๋ฐ˜๋“œ์‹œ ๋ผ์ด์„ ์Šค ๋‚ด์šฉ์„ ํ™•์ธํ•˜์‹œ๊ธฐ ๋ฐ”๋ž๋‹ˆ๋‹ค.

Downloads last month
5
Safetensors
Model size
1.55B params
Tensor type
F32
ยท
FP16
ยท
U8
ยท
Inference API
Unable to determine this model's library. Check the docs .