RAG(Retrieval-Augmented Generation)๋Š” ๋‚ด LEG(Logical Enhanced Generation) ์œ„์—

by ๋ณ‘ํ˜„ on Sun Dec 14 2025

RAG(Retrieval-Augmented Generation)๋Š” ๋‚ด LEG(Logical Enhanced Generation) ์œ„์—

Overview

ํ•ด๋‹น๊ธ€์€ ์ž‘์„ฑ ์‹œ์ ์„ ๊ธฐ์ค€์œผ๋กœ 2025๋…„ 12์›” 13์ผ(KST)์— ์ž‘์„ฑ๋˜๊ณ  ์žˆ๋‹ค. 2025๋…„์„ ์‹œ์ž‘ํ•œ๊ฒŒ ์–ด์ œ ๊ฐ™์€๋ฐ ๋ฒŒ์จ ์—ฐ๋ง์ด ๋˜์—ˆ๋‹ค. 2025๋…„ ํ•œํ•ด ๋™์•ˆ ์ •๋ง๋กœ ๋งŽ์€์ผ์ด ์žˆ์—ˆ๋Š”๋ฐ, ๊ทธ ์ค‘ ์‚ฌ๋žŒ๋“ค์ด ๋ชจ๋‘ ๋™์˜ํ• ๋งŒํ•œ ์ฃผ์ œ๋ฅผ ๋ฝ‘์ž๋ฉด ๋ฐ”๋กœ AI ์ผ๊ฒƒ์ด๋‹ค. AI๋Š” ์ด์ œ ๋Œ€์ค‘์ด ์ธ์‹ํ•  ๋งŒํผ ์ฝ”์•ž์œผ๋กœ ๋‹ค๊ฐ€์™”๊ณ , ๋‚ด๊ฐ€ ์žฌํ•™์ค‘์ธ ํ•™๊ต ๊ธฐ์ˆ™์‚ฌ ์‚ฌ๊ฐ์„ ์ƒ๋‹˜๋„ ChatGPT, Gemini, Claude, Perplexity ๋“ฑ ์—ฌ๋Ÿฌ๊ฐ€์ง€ AI๋ฅผ ์Šค๋งˆํŠธํฐ์—์„œ ์‚ฌ์šฉํ•œ๋‹ค๊ณ  ํ•˜์‹œ๋‹ˆ ์ด์ œ ์ •๋ง ๋ชจ๋“  ์‚ฌ๋žŒ์ด AI๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ ๊ฐ™๋‹ค.

๋งŽ์€ ๋ถ„์•ผ์˜ ์ธ๊ณต์ง€๋Šฅ ๊ธฐ์ˆ ๋“ค์ด ๋ฐœ์ „ํ–ˆ์ง€๋งŒ, ๊ฒฐ๊ตญ ์˜ฌํ•ด๋„ Transformer ๊ธฐ๋ฐ˜์˜ LLM(Large Language Model)์ด ๋Œ€์„ธ์˜€๋‹ค. ํ˜„์žฌ Silicon Valley ์—์„œ๋Š” ๋งŽ์€ AI ์Šคํƒ€ํŠธ์—…์ด ์ถœํ˜„ํ•˜๊ณ  ์žˆ๋Š”๋ฐ, ์‚ฌ์‹ค์€ ๋Œ€๋ถ€๋ถ„์ด LLM API๋ฅผ ํ˜ธ์ถœํ•˜๋Š” ์‹œ์Šคํ…œ์ด ์•„๋‹ˆ๋ƒ๋Š” ์˜์‹ฌ์˜ ๋ชฉ์†Œ๋ฆฌ๋„ ๋‚˜์˜ค๊ธฐ๋„ ํ•œ๋‹ค. ์–ด์จŒ๋“  LLM์ด ์ด๋ ‡๊ฒŒ 2019๋…„์— ๋“ฑ์žฅํ•˜๊ณ  ์ง€๊ธˆ๊นŒ์ง€๋„ ์ธ๊ณต์ง€๋Šฅ์˜ ๊ฐ€์žฅ ํ™”์ œ์ด๊ณ , LLM์œผ๋กœ AGI๋ฅผ ๋‹ฌ์„ฑํ•˜๋ƒ๋งˆ๋ƒ ํ•˜๋Š” ์‹œ์ ์ธ ์ง€๊ธˆ LLM์ด ๋Œ€๋‹จํ•œ ๊ธฐ์ˆ ์ธ๊ฑด ์ธ์ •ํ•  ์ˆ˜ ๋ฐ–์— ์—†๋Š” ์‚ฌ์‹ค์ด๋‹ค.

๋˜ํ•œ ๋Œ€๋ถ€๋ถ„์˜ LLM ์„œ๋น„์Šค๋Š” ์ด์ œ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ์†์‰ฝ๊ฒŒ ๊ฐ€์ ธ์˜ฌ ์ˆ˜ ์žˆ๋„๋ก ์„ค๊ณ„๋˜์–ด์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์‚ฌ๋‚ด Database์— ๋ฌธ์„œ๋ฅผ ๊ฐ€์ ธ์™€ LLM์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๋Š”๋ฐ ์ด์šฉํ•œ๋‹ค๋˜์ง€, ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ๊ณผ ๊ฐ€์žฅ ์—ฐ๊ด€์žˆ๋Š” ๋‰ด์Šค๋ฐ์ดํ„ฐ๋“ค์„ ๋ช‡๊ฐœ ๊ฐ€์ ธ์˜จ๋‹ค๋˜์ง€. ์ด๋Ÿฐ ๊ธฐ์ˆ ๋“ค์€ ์ด์ œ ๋Œ€๋ถ€๋ถ„์˜ LLM ์„œ๋น„์Šค์—์„œ ์ œ๊ณตํ•œ๋‹ค.

ํ•˜์ง€๋งŒ ์ด๋Ÿฌํ•œ ๊ธฐ์ˆ ์€ ๋ชจ๋‘ RAG(Retrieval-Augmented Generation) ๋ผ๊ณ  ํ•˜๋Š” ๊ธฐ์ˆ ์ด ๊ธฐ๋ฐ˜์ด ๋˜์–ด ๊ฐ€๋Šฅํ•œ ๊ฒƒ๋“ค์ด๋‹ค. RAG๋Š” LLM์ด ํ•™์Šต์‹œ์ ์— ํ•™์Šตํ•˜์ง€ ๋ชปํ•œ ๋ฐ์ดํ„ฐ(ํ•™์Šต ์‹œ์  ์ดํ›„, ๋ผ์ด๋ธŒ ๋ฐ์ดํ„ฐ, ๋„๋ฉ”์ธ ์ง€์‹ ๋“ฑ)๋ฅผ ํ† ํฐ ์ƒ์„ฑ์‹œ์ ์— ์•Œ ์ˆ˜ ์žˆ๋„๋ก ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•ด์„œ ํ† ํฐ ์ƒ์„ฑ์„ โ€˜์ฆ๊ฐ•โ€™ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค.

๋”ฐ๋ผ์„œ ์˜ค๋Š˜์€ ์ด๋Ÿฌํ•œ RAG๊ฐ€ ๋“ฑ์žฅํ•œ ์ฒซ ๋…ผ๋ฌธ์„ ๋ฐ”ํƒ•์œผ๋กœ RAG์˜ ๊ทธ ๊ธฐ์ดˆ์ ์ธ ์›๋ฆฌ๋Š” ๋ฌด์—‡์ด๊ณ , ๊ทผ๋ณธ์€ ๋ฌด์—‡์ธ์ง€์— ๋Œ€ํ•ด์„œ ์‚ดํŽด๋ณด๋ ค๊ณ  ํ•œ๋‹ค.

RAGโ€™s Background: ์™œ RAG๊ฐ€ ํ•„์š”ํ–ˆ๋Š”๊ฐ€?

๋จผ์ € RAG๋ผ๋Š” ๊ธฐ์ˆ ์ด ์™œ ๋“ฑ์žฅํ•˜์˜€๋Š”์ง€๋ถ€ํ„ฐ ๊ทธ ๋ฐฐ๊ฒฝ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด์ž.

2017๋…„ Attention-Is-All-You-Need ๋…ผ๋ฌธ์—์„œ Transformer ์•„ํ‚คํ…์ฒ˜๊ฐ€ ์ œ์•ˆ๋˜๊ณ  ๋‚˜์„œ, 2019๋…„ Transformer Decoder base ๋ชจ๋ธ์ธ GPT-2์˜ ๋“ฑ์žฅ์œผ๋กœ CLM ๋ชจ๋ธ์ด ๋ฐฉ๋Œ€ํ•œ ์–‘์˜ ์ •๋ณด๋ฅผ ํŒŒ๋ผ๋ฏธํ„ฐ๋กœ ํ•™์Šตํ•˜์—ฌ Fine-Tuning ์—†์ด ์‚ฌ์ „ํ•™์Šต๋œ ๋ชจ๋ธ ๋งŽ์œผ๋กœ๋„ ๋ณด๋‹ค ๋งŽ์€ Tasks๋ฅผ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด ํ•™๊ณ„์— ์•Œ๋ ค์กŒ๋‹ค.

ํ•˜์ง€๋งŒ, ์ด๋Ÿฌํ•œ ์‚ฌ์ „ํ•™์Šต๋œ ์–ธ์–ด๋ชจ๋ธ์—๋Š” ์—ฌ์ „ํžˆ ํ•œ๊ณ„๊ฐ€ ์กด์žฌํ–ˆ๋‹ค. ๋ฐ”๋กœ โ€˜์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์˜ ๋ถ€์žฌโ€™ ์ด๋‹ค. ์–ธ์–ด ๋ชจ๋ธ์€ ํ•™์Šต ์‹œ์ ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๊นŠ๊ฒŒ ํ•™์Šตํ•œ๋‹ค. ๋•Œ๋ฌธ์— ํ•™์Šต์ด ๋๋‚œ ์ดํ›„์— ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋‚˜, ํ•™์Šต ๋ฐ์ดํ„ฐ์— ํฌํ•จ๋  ์ˆ˜ ์—†๋˜ Generic ํ•˜์ง€ ์•Š์€ Specific ํ•œ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•ด์„œ๋Š” ์•Œ ์ˆ˜ ์—†๊ณ , ํ™˜๊ฐ(Hallucination) ํ˜„์ƒ์„ ๋ณด์ผ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์˜ ๋ถ€์žฌ๋Š” ์™ธ๋ถ€๋ฐ์ดํ„ฐ๋ฅผ ํ•„์š”๋กœํ•˜๋Š” tasks์—์„œ critical ํ•˜๊ฒŒ ์ž‘์šฉํ–ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์–ธ์–ด๋ชจ๋ธ์˜ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ์˜ ๋ถ€์žฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ๋งŽ์€ ๋ฐฉ๋ฒ•๋ก ๋“ค์ด ๋“ฑ์žฅํ–ˆ๋‹ค. ODQA(Open-Domain Question-Answering) ์ด๋ผ๋Š” ๊ด‘๋ฒ”์œ„ํ•œ Domain ์ฝ”ํผ์Šค๋กœ๋ถ€ํ„ฐ ์งˆ๋ฌธ์— ๋Œ€ํ•œ ์—ฐ๊ด€ ์ฝ”ํผ์Šค๋ฅผ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” task๋ฅผ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ORQA, REALM ๊ฐ™์€ ๋ชจ๋ธ๋“ค์ด ๋“ฑ์žฅํ–ˆ๋‹ค.

ํ•˜์ง€๋งŒ ORQA, REALM ๊ฐ™์€ ๋ชจ๋ธ๋“ค์€ Encoder-Only ๊ตฌ์กฐ ๋ชจ๋ธ๋“ค์ด์˜€๊ธฐ ๋•Œ๋ฌธ์— โ€˜์ƒ์„ฑโ€™ํ•˜๋Š” ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ์–ด๋ ค์›Œํ–ˆ๊ณ , ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌธ์„œ ๋ฐ์ดํ„ฐ๋กœ ๋ถ€ํ„ฐ ์ƒ์„ฑ(ICT, Inverse-Cloze-Task) ํ•˜๋Š” ์ ‘๊ทผ๋ฒ•์€ ๊ณผ์—ฐ โ€˜๋ฌธ์„œ์˜ ๋ฌธ์žฅ์ด ์งˆ๋ฌธ์„ ๋Œ€๋ณ€ํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€โ€™์— ๋Œ€ํ•œ ์˜๋ฌธ์„ ํ•ด์†Œํ•˜์ง€ ๋ชปํ–ˆ๋‹ค.

์ด๋Ÿฌํ•œ ์‹œ์ ์—์„œ RAG๋Š” parmeticํ•œ ์ •๋ณด๋ฟ๋งŒ์ด ์•„๋‹Œ non-prameticํ•œ ์ •๋ณด๋ฅผ ์–ธ์–ด๋ชจ๋ธ, ํŠนํžˆ ์ƒ์„ฑํ˜• ์–ธ์–ด๋ชจ๋ธ์ด ์ธ์ง€ํ•˜๊ณ  ๋‹ต๋ณ€์— ํฌํ•จํ•  ์ˆ˜ ์žˆ๋„๋ก ๋ฐฉ๋ฒ•๋ก ์„ ์ œ์‹œํ•˜๋ฉฐ ๋“ฑ์žฅํ•˜๊ฒŒ ๋˜์—ˆ๋‹ค. ๋˜ํ•œ ์ƒ์„ฑํ˜• ์–ธ์–ด๋ชจ๋ธ์— ๊ฒ€์ƒ‰ ๋ชจ๋ธ์„ ํ†ตํ•ฉํ•˜์—ฌ task-specific retreive-and-extract ๊ตฌ์กฐ๋ฅผ ๋Šฅ๊ฐ€ํ•˜์—ฌ ์ด์ œ ์–ธ์–ด๋ชจ๋ธ์ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ํ•„์š”๋กœ ํ•˜๋Š” ์—ฌ๋Ÿฌ Task์—์„œ๋„ ํ•ด๋‹น ๊ธฐ์ˆ ์„ ํ†ตํ•ด ๋”์šฑ ์šฐ์œ„๋ฅผ ์ ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์„ ์ฆ๋ช…ํ–ˆ๋‹ค.

RAG Architecture

RAG๋Š” Retriever ์ปดํฌ๋„ŒํŠธ์™€ Generator ์ปดํฌ๋„ŒํŠธ๋ฅผ ๊ฐ€์ง€๋Š” ๊ตฌ์กฐ์ด๋‹ค. Retriever ์ปดํฌ๋„ŒํŠธ์—์„œ ์ •๋ณด๋ฅผ ์ฐพ๊ธฐ ์œ„ํ•œ ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ํ•ด์™€ ๋ฌธ์„œ๋ฅผ ์›๋ž˜ ์ž…๋ ฅ๊ฐ’(x)์™€ concatํ•œ ํ›„ Generator์—์„œ ๋ฌธ์„œ + ์ž…๋ ฅ์„ ํ†ตํ•ด ์˜ฌ๋ฐ”๋ฅธ ์ถœ๋ ฅ์„ ์ƒ์„ฑํ•ด๋‚ธ๋‹ค.

์กฐ๊ธˆ๋” ์ž์„ธํžˆ ์‚ดํŽด๋ณด๊ธฐ ์œ„ํ•ด ์›๋ณธ ๋…ผ๋ฌธ์˜ Figure๋ฅผ ์‚ดํŽด๋ณด๋ฉฐ ๊ฐ™์ด ์„ค๋ช…ํ•˜๊ฒ ๋‹ค.

์ถœ์ฒ˜: ๋…ผ๋ฌธ Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks Figure 1

Retriever

Retriever์˜ ๊ฒฝ์šฐ ์‚ฌ์šฉ์ž์˜ ์ž…๋ ฅ๊ฐ’($x$)๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ํ•˜๋Š” component์ด๋‹ค. ์›๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” ํ•ด๋‹น Retriever component๋ฅผ DPR based์˜ Bi-Encoder๋กœ ๊ตฌ์„ฑํ–ˆ๋‹ค.

DPR(Dense Passage Retrieval) ์€ Dense ํ•˜๊ฒŒ Vector๋ฅผ Search ํ•˜๋Š” ๋ชจ๋ธ์œผ๋กœ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋‚ธ๋‹ค. Sparse ํ•œ ๋ฐฉ์‹์œผ๋กœ Retriever์„ ์ˆ˜ํ–‰ํ•˜๋Š” BM25, TF-IDF ๋“ฑ ๋ณด๋‹ค ์„ฑ๋Šฅ์ด ์ข‹์œผ๋ฉฐ, ODQA์—์„œ๋„ ORQA, REALM๋ณด๋‹ค ์ข‹์€ ๋ฒค์น˜๋งˆํฌ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋‹ค.

์ถœ์ฒ˜: ์ž์ฒด ์ œ์ž‘ by Excalidraw

์œ„ ์‚ฌ์ง„์€ DPR์˜ Bi-Encoder ๊ตฌ์กฐ๋ฅผ ๋„์‹ํ™”ํ•œ ๊ทธ๋ฆผ์ด๋‹ค. Bi-Encoder๋Š” ์‚ฌ์ง„๊ณผ ๊ฐ™์ด ๋‘๊ฐœ์˜ BERT ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ๋‹ค. ํ•œ๊ฐœ์˜ BERT๋Š” ์ž…๋ ฅ(input(x))์— ๋Œ€ํ•ด Self-Attention์„ ํ†ตํ•ด Dense Vector๋ฅผ ์ƒ์„ฑํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋œ๋‹ค. ๋‹ค๋ฅธ ํ•˜๋‚˜์˜ BERT๋Š” ์™ธ๋ถ€ ๋ฌธ์„œ(z)์— ๋Œ€ํ•ด Self-Attention์„ ํ†ตํ•ด Dense Vector๋ฅผ ์ƒ์„ฑํ•ด๋‚ธ๋‹ค. ์ดํ›„ ์ƒ์„ฑ๋œ ๊ฐ๊ฐ์˜ Dense Vector๋“ค์„ ๋‚ด์  ์—ฐ์‚ฐํ•˜์—ฌ Score ๊ฐ€ ๋†’์€ Top-K๊ฐœ์˜ ๋ฌธ์„œ๋ฅผ ์„ ํƒํ•œ๋‹ค.

์ด ๋•Œ ๋‚ด์  ์—ฐ์‚ฐ์ด ์•„๋‹Œ ์ฝ”์‚ฌ์ธ ์œ ์‚ฌ๋„๋‚˜ L2 ๊ธฐ๋ฐ˜์˜ ์œ ์‚ฌ์„ฑ ํŒ๋‹จ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ์„ฑ๋Šฅ์ด ๋น„์Šทํ•˜๋ฏ€๋กœ ๊ฐ„๋‹จํ•œ ๋‚ด์ (Dot) ์—ฐ์‚ฐ์„ ์‚ฌ์šฉํ–ˆ๋‹ค๊ณ  ํ•œ๋‹ค.

์ด๋ ‡๊ฒŒ ์„ ์ •๋œ Top-K๊ฐœ์˜ ๋ฌธ์„œ๋Š” ์ž…๋ ฅ๊ณผ Concat๋˜์–ด ๋‹ค์Œ Generator Component๋กœ ์ „๋‹ฌ๋œ๋‹ค.

Generator

Generator๋Š” Parameticํ•œ ์ •๋ณด๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์–ธ์–ด๋ชจ๋ธ๋กœ, ์‘๋‹ต์„ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•œ component์ด๋‹ค. Retrieval Component์—์„œ ์„ ์ •๋œ Top-K์˜ ๋ฌธ์„œ๊ฐ€ ์›๋ณธ ์ž…๋ ฅ(x)๊ณผ ํ•จ๊ป˜ Concat ๋˜์—ˆ๊ธฐ ๋•Œ๋ฌธ์— ์–ธ์–ด๋ชจ๋ธ์˜ ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด๊ฐ€๋ฉด ์–ธ์–ด๋ชจ๋ธ์ด ์ •๋ณด๋ฅผ ์ฐธ๊ณ ํ•˜๊ณ  non-parameticํ•œ ์ •๋ณด๋ฅผ ๋ฐ›์•„๋“ค์ž„์œผ๋กœ์จ ์ž˜๋ชป๋œ ์ •๋ณด๋‚˜ Specificํ•œ ์ •๋ณด๋ฅผ ์ด์šฉํ•ด ํ† ํฐ ์ƒ์„ฑ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.

์›๋ณธ ๋…ผ๋ฌธ์—์„œ๋Š” Generator๋กœ ์‚ฌ์ „ ํ•™์Šต๋œ Seq2Seq based transformer์ธ BART-large ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ํ•™์Šต ๋ฐ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ–ˆ๋‹ค.

ํ•ด๋‹น ๋…ผ๋ฌธ์—์„œ๋Š” Generator๋ฅผ Modelingํ•  ์ˆ˜ ์žˆ๋Š” ๋‘๊ฐ€์ง€ ๋ฐฉ๋ฒ•๋ก ์— ๋Œ€ํ•ด์„œ ์„ค๋ช…ํ•˜๊ณ  ์žˆ๋‹ค.

  • RAG-Sequence: Generator๋กœ ํ† ํฐ์„ ์ƒ์„ฑํ• ๋•Œ, ํ•œ๊ฐ€์ง€ ๋ฌธ์„œ๋งŒ์„ ์ฐธ๊ณ ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ๋ฌธ์„œ๋ฅผ ์„ ํƒํ•œ ์ดํ›„์—๋Š” ํ•ด๋‹น ๋ฌธ์žฅ์˜ ๋งˆ์ง€๋ง‰ ํ† ํฐ ์ƒ์„ฑ ์‹œ์ ๊นŒ์ง€ ๋‹ค๋ฅธ ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜์ง€ ์•Š์œผ๋ฉฐ ์„ ํƒ๋œ ๋ฌธ์„œ๋งŒ์˜ ์ •๋ณด๋ฅผ ์ฐธ๊ณ ํ•œ๋‹ค.
  • RAG-Token: Generator๋กœ ํ† ํฐ์„ ์ƒ์„ฑํ• ๋•Œ, ๊ฐ ํ† ํฐ ์ƒ์„ฑ ์‹œ์ ๋งˆ๋‹ค ๊ฐ€์žฅ ์ ํ•ฉํ•œ ๋ฌธ์„œ๋ฅผ ์ฐธ๊ณ ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ํ˜„์žฌ ํ† ํฐ์„ ์ƒ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ€์žฅ ์ฐธ๊ณ ํ•˜๊ธฐ ์ข‹์€ ๋ฌธ์„œ๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์ ํ•ฉ๋„๋ฅผ ํŒ๋‹จํ•˜์—ฌ ๋ชจ๋“  ๋ฌธ์„œ๋ฅผ ๋น„๊ตํ•ด ์„ ํƒ๋œ ๋ฌธ์„œ์˜ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ† ํฐ์„ ์ƒ์„ฑํ•œ๋‹ค.

๊ฐ ๋ฐฉ์‹์˜ ๋”ฐ๋ผ trade-off๊ฐ€ ์กด์žฌํ•˜๊ธฐ์— ์ด๋ฅผ ๊ณ ๋ คํ•˜๊ณ  modeling ํ•ด์•ผํ•  ๊ฒƒ์ด๋‹ค.

Conclusion

์ด๋ฒˆ article์—์„œ๋Š” ์ด๋ ‡๊ฒŒ ์•„์ฃผ ๊ฐ„๋‹จํ•˜๊ฒŒ RAG์˜ ๋“ฑ์žฅ ๋ฐฐ๊ฒฝ๊ณผ RAG์˜ ์›๋ณธ ๋…ผ๋ฌธ์—์„œ ์†Œ๊ฐœ๋œ Architecture์— ๋Œ€ํ•ด์„œ ์•Œ์•„๋ณด์•˜๋‹ค. 2025๋…„ ๊ธฐ์ค€ ํ˜„๋Œ€ ๋Œ€๋ถ€๋ถ„์˜ RAG๋Š” ํ•ด๋‹น ๋…ผ๋ฌธ์—์„œ ์†Œ๊ฐœ๋œ RAG๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์„ฑ์žฅํ•˜์˜€๋‹ค. ์‹ค์ œ๋กœ ํ•ด๋‹น ๋…ผ๋ฌธ์€ ์ธ์šฉํšŸ์ˆ˜๊ฐ€ ์•ฝ 400ํšŒ๊ฐ€ ๋„˜์„ ์ •๋„๋กœ ์–ธ์–ด ๋ชจ๋ธ์ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ์ฐธ๊ณ ํ•˜๋Š” ๋ฐฉ์‹์„ ํš๊ธฐ์ ์œผ๋กœ ๋ณ€ํ™”์‹œํ‚จ ๊ธฐ๋…๋น„์ ์ธ ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

ํ˜„๋Œ€ ๋Œ€๋ถ€๋ถ„์˜ RAG๋Š” Frozen-RAG ์ฆ‰, ํ•™์Šต์—†์ด ์กด์žฌํ•˜๋Š” ๋ฐ์ดํ„ฐ๋กœ๋งŒ ์ˆ˜ํ–‰ํ•˜๋Š” RAG์ธ๋ฐ, ์ด๋Š” ์–ธ์–ด๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ๋ฐœ์ „ํ•จ์— ๋”ฐ๋ผ ์ ๋‹นํ•œ ์ˆ˜์ค€์˜ RAG ๋งŒ์œผ๋กœ๋„ ๋ฌธ์„œ๊ฐ€ ์ ์ ˆํ•œ ์ •๋ณด๋ฅผ ์ฐธ๊ณ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํŒจ๋Ÿฌ๋‹ค์ž„์ด ๋ณ€ํ™”ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ธ๋ฐ, ์ถ”ํ›„์— ์ด๋ฅผ ๋‹ค๋ค„๋ด๋„ ์ข‹์„ ๊ฒƒ ๊ฐ™๋‹ค.

๊ฐœ์ธ์ ์ธ ์ด์•ผ๊ธฐ์ด์ง€๋งŒ, ์ด๋ฒˆ Article์—์„œ ์†Œ๊ฐœํ•œ ๋…ผ๋ฌธ โ€˜Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasksโ€™๋ฅผ ๊ธฐ์ ์œผ๋กœ ์•„๋งˆ ํ•„์ž๊ฐ€ ์ฝ๋Š” 2025๋…„์˜ ๋งˆ์ง€๋ง‰ ๋…ผ๋ฌธ์ด ๋  ๊ฒƒ ๊ฐ™๋‹ค. ์˜ฌํ•ด๋ฅผ ์ƒ๊ฐํ•ด๋ณด๋ฉด Attention-Is-All-You-Need๋ฅผ ์‹œ์ž‘์œผ๋กœ GPT-2, BERT, DPR, RAG, MoR(Mixture-of-Recursion) ๋“ฑ 10๊ฐœ ์ •๋„ ๋˜๋Š” ๋…ผ๋ฌธ์„ ์ฝ์—ˆ๋‹ค. ํ•„์ž๊ฐ€ ์˜ฌํ•ด ์ดˆ์— ๋…ผ๋ฌธ์ด ์ •ํ™•ํžˆ ๋ฌด์—‡์ธ์ง€๋„ ๋ชฐ๋ž๋˜๊ฒƒ์„ ๊ฐ์•ˆํ•˜๋ฉด ์˜๋ฏธ์žˆ๋Š” ๋ฐœ์ „์ด ์•„๋‹Œ๊ฐ€ ์‹ถ๋‹ค.

ํ•˜์ง€๋งŒ ์•ž์œผ๋กœ ํ•„์ž๋Š” ๋…ผ๋ฌธ์„ ์ฝ๋Š” ๋ฐฉ๋ฒ•์˜ ์ƒˆ๋กœ์šด ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๋ถ€์—ฌํ•˜๊ณ ์ž ํ•œ๋‹ค. ๋‚ด๊ฐ€ ๋…ผ๋ฌธ์„ ์ง€๊ธˆ๊ป ์ฝ๋Š” ๋ฐฉ์‹์€ ๋…ผ๋ฌธ์›๋ณธ์„ LLM์„ ์ด์šฉํ•ด ํ•œ๋ฒˆ ์š”์•ฝํ•˜๊ณ , ํ•ด๋‹น ๋…ผ๋ฌธ์„ ์š”์•ฝํ•˜๊ฑฐ๋‚˜ ๋ฆฌ๋ทฐํ•œ ๋ธ”๋กœ๊ทธ๋‚˜ ์œ ํŠœ๋ธŒ๋ฅผ ์ฐพ์•„๋ณด๋Š” ๋ฐฉ์‹์ด์˜€๋‹ค. ํ•„์ž๋Š” ๊ณ ๋“ฑํ•™์ƒ์ด๊ณ , ์˜์–ด์— ๋Šฅ์ˆ™ํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๋Š” ํ•‘๊ณ„๋กœ ์ง€๊ธˆ๊ป ์ด๋Ÿฐ ๋ฐฉ์‹์œผ๋กœ ๋…ผ๋ฌธ์„ ์ ‘ํ•ด์™”๋Š”๋ฐ, ์ด์ œ๋Š” ๋ฐ”๋€”๋•Œ๊ฐ€ ๋œ๊ฒƒ ๊ฐ™๋‹ค.

๋ฌผ๋ก  ์ด๋ฏธ ๋…ผ๋ฌธ์„ ์ •๋ฆฌํ•œ ๊ธ€๋“ค์ด ์ข‹์ง€ ์•Š์€ ๊ฒƒ์€ ์•„๋‹ˆ๋‹ค. ๊ทธ๋“ค์€ ํ›Œ๋ฅญํ•œ ๅ…ˆ็”Ÿ์ด ๋˜์–ด์ฃผ์—ˆ๋‹ค. ํ•˜์ง€๋งŒ ๋‚˜์˜ ๋ณด๋‹ค ๊นŠ์ด์žˆ๊ณ  ์˜๊ฐ์žˆ๋Š” ํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ์ด์ œ ๋‚˜ํ˜ผ์ž ์Šค์Šค๋กœ์˜ ํž˜์œผ๋กœ๋ผ๋„ ๋…ผ๋ฌธ์„ ์ฝ์–ด์•ผํ•  ๊ฒƒ์ด๋‹ค. ์˜์–ด๊ฐ€ ์–ด๋ ต๋”๋ผ๊ณ  ๋ฒˆ์—ญ๊ธฐ๋กœ ํ•œ๋‹จ์–ด ํ•œ๋‹จ์–ด ๋ฒˆ์—ญํ•ด์„œ๋ผ๋„ ์ฝ๊ฒ ๋‹ค. ์ด๋Š” ์›๋ž˜ ๊ทธ๋ ‡๊ฒŒ ํ–ˆ์–ด์•ผํ•œ๋‹ค๊ณ  ์ƒ๊ฐํ•œ๋‹ค. ๋งˆ์น˜ ์ฑ…์„ ์ฝ์„๋•Œ ์ฑ… ๋ฆฌ๋ทฐ ์œ ํŠœ๋ธŒ ์˜์ƒ์„ ๋ณด๊ณ  ์ฑ…์„ ๋‹ค ์ฝ์—ˆ๋‹ค๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ํ–‰๋™ํ•˜๊ธฐ ์‹ซ๋‹ค.

์•„๋งˆ ๋‹ค์Œ ๊ธ€๋ถ€ํ„ฐ๋Š” ๊ธ€์˜ ํ€„๋ฆฌํ‹ฐ๊ฐ€ 2๋ฐฐ๊ฐ€ ๋˜์„œ ์˜ค์ง€ ์•Š์„๊นŒ ์‹ถ๋‹ค ๐Ÿค—

Refrence

Tagged: NLPAITransformerBARTRAGODQAKIT