RAG(Retrieval-Augmented Generation)๋ ๋ด LEG(Logical Enhanced Generation) ์์
by ๋ณํ on Sun Dec 14 2025
Overview
ํด๋น๊ธ์ ์์ฑ ์์ ์ ๊ธฐ์ค์ผ๋ก 2025๋ 12์ 13์ผ(KST)์ ์์ฑ๋๊ณ ์๋ค. 2025๋ ์ ์์ํ๊ฒ ์ด์ ๊ฐ์๋ฐ ๋ฒ์จ ์ฐ๋ง์ด ๋์๋ค. 2025๋ ํํด ๋์ ์ ๋ง๋ก ๋ง์์ผ์ด ์์๋๋ฐ, ๊ทธ ์ค ์ฌ๋๋ค์ด ๋ชจ๋ ๋์ํ ๋งํ ์ฃผ์ ๋ฅผ ๋ฝ์๋ฉด ๋ฐ๋ก AI ์ผ๊ฒ์ด๋ค. AI๋ ์ด์ ๋์ค์ด ์ธ์ํ ๋งํผ ์ฝ์์ผ๋ก ๋ค๊ฐ์๊ณ , ๋ด๊ฐ ์ฌํ์ค์ธ ํ๊ต ๊ธฐ์์ฌ ์ฌ๊ฐ์ ์๋๋ ChatGPT, Gemini, Claude, Perplexity ๋ฑ ์ฌ๋ฌ๊ฐ์ง AI๋ฅผ ์ค๋งํธํฐ์์ ์ฌ์ฉํ๋ค๊ณ ํ์๋ ์ด์ ์ ๋ง ๋ชจ๋ ์ฌ๋์ด AI๋ฅผ ์ฌ์ฉํ๋ ๊ฒ ๊ฐ๋ค.
๋ง์ ๋ถ์ผ์ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ๋ค์ด ๋ฐ์ ํ์ง๋ง, ๊ฒฐ๊ตญ ์ฌํด๋ Transformer ๊ธฐ๋ฐ์ LLM(Large Language Model)์ด ๋์ธ์๋ค. ํ์ฌ Silicon Valley ์์๋ ๋ง์ AI ์คํํธ์ ์ด ์ถํํ๊ณ ์๋๋ฐ, ์ฌ์ค์ ๋๋ถ๋ถ์ด LLM API๋ฅผ ํธ์ถํ๋ ์์คํ ์ด ์๋๋๋ ์์ฌ์ ๋ชฉ์๋ฆฌ๋ ๋์ค๊ธฐ๋ ํ๋ค. ์ด์จ๋ LLM์ด ์ด๋ ๊ฒ 2019๋ ์ ๋ฑ์ฅํ๊ณ ์ง๊ธ๊น์ง๋ ์ธ๊ณต์ง๋ฅ์ ๊ฐ์ฅ ํ์ ์ด๊ณ , LLM์ผ๋ก AGI๋ฅผ ๋ฌ์ฑํ๋๋ง๋ ํ๋ ์์ ์ธ ์ง๊ธ LLM์ด ๋๋จํ ๊ธฐ์ ์ธ๊ฑด ์ธ์ ํ ์ ๋ฐ์ ์๋ ์ฌ์ค์ด๋ค.
๋ํ ๋๋ถ๋ถ์ LLM ์๋น์ค๋ ์ด์ ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์์ฝ๊ฒ ๊ฐ์ ธ์ฌ ์ ์๋๋ก ์ค๊ณ๋์ด์๋ค. ์๋ฅผ ๋ค์ด, ์ฌ๋ด Database์ ๋ฌธ์๋ฅผ ๊ฐ์ ธ์ LLM์ด ๋ฐ์ดํฐ๋ฅผ ํตํด ์๋ต์ ์์ฑํ๋๋ฐ ์ด์ฉํ๋ค๋์ง, ์ฌ์ฉ์์ ์ง๋ฌธ๊ณผ ๊ฐ์ฅ ์ฐ๊ด์๋ ๋ด์ค๋ฐ์ดํฐ๋ค์ ๋ช๊ฐ ๊ฐ์ ธ์จ๋ค๋์ง. ์ด๋ฐ ๊ธฐ์ ๋ค์ ์ด์ ๋๋ถ๋ถ์ LLM ์๋น์ค์์ ์ ๊ณตํ๋ค.
ํ์ง๋ง ์ด๋ฌํ ๊ธฐ์ ์ ๋ชจ๋ RAG(Retrieval-Augmented Generation) ๋ผ๊ณ ํ๋ ๊ธฐ์ ์ด ๊ธฐ๋ฐ์ด ๋์ด ๊ฐ๋ฅํ ๊ฒ๋ค์ด๋ค. RAG๋ LLM์ด ํ์ต์์ ์ ํ์ตํ์ง ๋ชปํ ๋ฐ์ดํฐ(ํ์ต ์์ ์ดํ, ๋ผ์ด๋ธ ๋ฐ์ดํฐ, ๋๋ฉ์ธ ์ง์ ๋ฑ)๋ฅผ ํ ํฐ ์์ฑ์์ ์ ์ ์ ์๋๋ก ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํด์ ํ ํฐ ์์ฑ์ โ์ฆ๊ฐโ ํ ์ ์๋๋ก ํ๋ค.
๋ฐ๋ผ์ ์ค๋์ ์ด๋ฌํ RAG๊ฐ ๋ฑ์ฅํ ์ฒซ ๋ ผ๋ฌธ์ ๋ฐํ์ผ๋ก RAG์ ๊ทธ ๊ธฐ์ด์ ์ธ ์๋ฆฌ๋ ๋ฌด์์ด๊ณ , ๊ทผ๋ณธ์ ๋ฌด์์ธ์ง์ ๋ํด์ ์ดํด๋ณด๋ ค๊ณ ํ๋ค.
RAGโs Background: ์ RAG๊ฐ ํ์ํ๋๊ฐ?
๋จผ์ RAG๋ผ๋ ๊ธฐ์ ์ด ์ ๋ฑ์ฅํ์๋์ง๋ถํฐ ๊ทธ ๋ฐฐ๊ฒฝ์ ๋ํด ์์๋ณด์.
2017๋ Attention-Is-All-You-Need ๋ ผ๋ฌธ์์ Transformer ์ํคํ ์ฒ๊ฐ ์ ์๋๊ณ ๋์, 2019๋ Transformer Decoder base ๋ชจ๋ธ์ธ GPT-2์ ๋ฑ์ฅ์ผ๋ก CLM ๋ชจ๋ธ์ด ๋ฐฉ๋ํ ์์ ์ ๋ณด๋ฅผ ํ๋ผ๋ฏธํฐ๋ก ํ์ตํ์ฌ Fine-Tuning ์์ด ์ฌ์ ํ์ต๋ ๋ชจ๋ธ ๋ง์ผ๋ก๋ ๋ณด๋ค ๋ง์ Tasks๋ฅผ ์ํํ ์ ์๋ค๋ ๊ฒ์ด ํ๊ณ์ ์๋ ค์ก๋ค.
ํ์ง๋ง, ์ด๋ฌํ ์ฌ์ ํ์ต๋ ์ธ์ด๋ชจ๋ธ์๋ ์ฌ์ ํ ํ๊ณ๊ฐ ์กด์ฌํ๋ค. ๋ฐ๋ก โ์ธ๋ถ ๋ฐ์ดํฐ์ ๋ถ์ฌโ ์ด๋ค. ์ธ์ด ๋ชจ๋ธ์ ํ์ต ์์ ์ ๋ฐ์ดํฐ๋ฅผ ๊น๊ฒ ํ์ตํ๋ค. ๋๋ฌธ์ ํ์ต์ด ๋๋ ์ดํ์ ์๋ก์ด ๋ฐ์ดํฐ๋, ํ์ต ๋ฐ์ดํฐ์ ํฌํจ๋ ์ ์๋ Generic ํ์ง ์์ Specific ํ ๋ฐ์ดํฐ์ ๋ํด์๋ ์ ์ ์๊ณ , ํ๊ฐ(Hallucination) ํ์์ ๋ณด์ผ ์ ์๋ค. ์ด๋ฌํ ์ธ๋ถ ๋ฐ์ดํฐ์ ๋ถ์ฌ๋ ์ธ๋ถ๋ฐ์ดํฐ๋ฅผ ํ์๋กํ๋ tasks์์ critical ํ๊ฒ ์์ฉํ๋ค.
์ด๋ฌํ ์ธ์ด๋ชจ๋ธ์ ์ธ๋ถ ๋ฐ์ดํฐ์ ๋ถ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ง์ ๋ฐฉ๋ฒ๋ก ๋ค์ด ๋ฑ์ฅํ๋ค. ODQA(Open-Domain Question-Answering) ์ด๋ผ๋ ๊ด๋ฒ์ํ Domain ์ฝํผ์ค๋ก๋ถํฐ ์ง๋ฌธ์ ๋ํ ์ฐ๊ด ์ฝํผ์ค๋ฅผ ๊ฒ์ํ์ฌ ๋ต๋ณ์ ์์ฑํ๋ task๋ฅผ ๋ฌ์ฑํ๊ธฐ ์ํด ORQA, REALM ๊ฐ์ ๋ชจ๋ธ๋ค์ด ๋ฑ์ฅํ๋ค.
ํ์ง๋ง ORQA, REALM ๊ฐ์ ๋ชจ๋ธ๋ค์ Encoder-Only ๊ตฌ์กฐ ๋ชจ๋ธ๋ค์ด์๊ธฐ ๋๋ฌธ์ โ์์ฑโํ๋ ์์ ์ ์ํํ๊ธฐ ์ด๋ ค์ํ๊ณ , ํ์ต ๋ฐ์ดํฐ๋ฅผ ๋ฌธ์ ๋ฐ์ดํฐ๋ก ๋ถํฐ ์์ฑ(ICT, Inverse-Cloze-Task) ํ๋ ์ ๊ทผ๋ฒ์ ๊ณผ์ฐ โ๋ฌธ์์ ๋ฌธ์ฅ์ด ์ง๋ฌธ์ ๋๋ณํ ์ ์๋๊ฐโ์ ๋ํ ์๋ฌธ์ ํด์ํ์ง ๋ชปํ๋ค.
์ด๋ฌํ ์์ ์์ RAG๋ parmeticํ ์ ๋ณด๋ฟ๋ง์ด ์๋ non-prameticํ ์ ๋ณด๋ฅผ ์ธ์ด๋ชจ๋ธ, ํนํ ์์ฑํ ์ธ์ด๋ชจ๋ธ์ด ์ธ์งํ๊ณ ๋ต๋ณ์ ํฌํจํ ์ ์๋๋ก ๋ฐฉ๋ฒ๋ก ์ ์ ์ํ๋ฉฐ ๋ฑ์ฅํ๊ฒ ๋์๋ค. ๋ํ ์์ฑํ ์ธ์ด๋ชจ๋ธ์ ๊ฒ์ ๋ชจ๋ธ์ ํตํฉํ์ฌ task-specific retreive-and-extract ๊ตฌ์กฐ๋ฅผ ๋ฅ๊ฐํ์ฌ ์ด์ ์ธ์ด๋ชจ๋ธ์ด ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ํ์๋ก ํ๋ ์ฌ๋ฌ Task์์๋ ํด๋น ๊ธฐ์ ์ ํตํด ๋์ฑ ์ฐ์๋ฅผ ์ ํ ์ ์๋ค๋ ์ฌ์ค์ ์ฆ๋ช ํ๋ค.
RAG Architecture
RAG๋ Retriever ์ปดํฌ๋ํธ์ Generator ์ปดํฌ๋ํธ๋ฅผ ๊ฐ์ง๋ ๊ตฌ์กฐ์ด๋ค. Retriever ์ปดํฌ๋ํธ์์ ์ ๋ณด๋ฅผ ์ฐพ๊ธฐ ์ํ ๋ฌธ์๋ฅผ ๊ฒ์ํด์ ๋ฌธ์๋ฅผ ์๋ ์ ๋ ฅ๊ฐ(x)์ concatํ ํ Generator์์ ๋ฌธ์ + ์ ๋ ฅ์ ํตํด ์ฌ๋ฐ๋ฅธ ์ถ๋ ฅ์ ์์ฑํด๋ธ๋ค.
์กฐ๊ธ๋ ์์ธํ ์ดํด๋ณด๊ธฐ ์ํด ์๋ณธ ๋ ผ๋ฌธ์ Figure๋ฅผ ์ดํด๋ณด๋ฉฐ ๊ฐ์ด ์ค๋ช ํ๊ฒ ๋ค.
![]()
Retriever
Retriever์ ๊ฒฝ์ฐ ์ฌ์ฉ์์ ์ ๋ ฅ๊ฐ($x$)๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ฌธ์๋ฅผ ๊ฒ์ํ๋ component์ด๋ค. ์๋ณธ ๋ ผ๋ฌธ์์๋ ํด๋น Retriever component๋ฅผ DPR based์ Bi-Encoder๋ก ๊ตฌ์ฑํ๋ค.
DPR(Dense Passage Retrieval) ์ Dense ํ๊ฒ Vector๋ฅผ Search ํ๋ ๋ชจ๋ธ์ผ๋ก ์ข์ ์ฑ๋ฅ์ ๋ธ๋ค. Sparse ํ ๋ฐฉ์์ผ๋ก Retriever์ ์ํํ๋ BM25, TF-IDF ๋ฑ ๋ณด๋ค ์ฑ๋ฅ์ด ์ข์ผ๋ฉฐ, ODQA์์๋ ORQA, REALM๋ณด๋ค ์ข์ ๋ฒค์น๋งํฌ ์ฑ๋ฅ์ ๋ณด์๋ค.

์ ์ฌ์ง์ DPR์ Bi-Encoder ๊ตฌ์กฐ๋ฅผ ๋์ํํ ๊ทธ๋ฆผ์ด๋ค. Bi-Encoder๋ ์ฌ์ง๊ณผ ๊ฐ์ด ๋๊ฐ์ BERT ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค. ํ๊ฐ์ BERT๋ ์ ๋ ฅ(input(x))์ ๋ํด Self-Attention์ ํตํด Dense Vector๋ฅผ ์์ฑํ๋๋ฐ ์ฌ์ฉ๋๋ค. ๋ค๋ฅธ ํ๋์ BERT๋ ์ธ๋ถ ๋ฌธ์(z)์ ๋ํด Self-Attention์ ํตํด Dense Vector๋ฅผ ์์ฑํด๋ธ๋ค. ์ดํ ์์ฑ๋ ๊ฐ๊ฐ์ Dense Vector๋ค์ ๋ด์ ์ฐ์ฐํ์ฌ Score ๊ฐ ๋์ Top-K๊ฐ์ ๋ฌธ์๋ฅผ ์ ํํ๋ค.
์ด ๋ ๋ด์ ์ฐ์ฐ์ด ์๋ ์ฝ์ฌ์ธ ์ ์ฌ๋๋ L2 ๊ธฐ๋ฐ์ ์ ์ฌ์ฑ ํ๋จ์ ์ํํ ์ ์์ง๋ง, ์ฑ๋ฅ์ด ๋น์ทํ๋ฏ๋ก ๊ฐ๋จํ ๋ด์ (Dot) ์ฐ์ฐ์ ์ฌ์ฉํ๋ค๊ณ ํ๋ค.
์ด๋ ๊ฒ ์ ์ ๋ Top-K๊ฐ์ ๋ฌธ์๋ ์ ๋ ฅ๊ณผ Concat๋์ด ๋ค์ Generator Component๋ก ์ ๋ฌ๋๋ค.
Generator
Generator๋ Parameticํ ์ ๋ณด๋ฅผ ๊ฐ์ง๊ณ ์๋ ์ธ์ด๋ชจ๋ธ๋ก, ์๋ต์ ์์ฑํ๊ธฐ ์ํ component์ด๋ค. Retrieval Component์์ ์ ์ ๋ Top-K์ ๋ฌธ์๊ฐ ์๋ณธ ์ ๋ ฅ(x)๊ณผ ํจ๊ป Concat ๋์๊ธฐ ๋๋ฌธ์ ์ธ์ด๋ชจ๋ธ์ ์ ๋ ฅ์ผ๋ก ๋ค์ด๊ฐ๋ฉด ์ธ์ด๋ชจ๋ธ์ด ์ ๋ณด๋ฅผ ์ฐธ๊ณ ํ๊ณ non-parameticํ ์ ๋ณด๋ฅผ ๋ฐ์๋ค์์ผ๋ก์จ ์๋ชป๋ ์ ๋ณด๋ Specificํ ์ ๋ณด๋ฅผ ์ด์ฉํด ํ ํฐ ์์ฑ์ ์ํํ ์ ์๊ฒ ๋๋ค.
์๋ณธ ๋ ผ๋ฌธ์์๋ Generator๋ก ์ฌ์ ํ์ต๋ Seq2Seq based transformer์ธ BART-large ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ํ์ต ๋ฐ ์ถ๋ก ์ ์ํํ๋ค.
ํด๋น ๋ ผ๋ฌธ์์๋ Generator๋ฅผ Modelingํ ์ ์๋ ๋๊ฐ์ง ๋ฐฉ๋ฒ๋ก ์ ๋ํด์ ์ค๋ช ํ๊ณ ์๋ค.
- RAG-Sequence: Generator๋ก ํ ํฐ์ ์์ฑํ ๋, ํ๊ฐ์ง ๋ฌธ์๋ง์ ์ฐธ๊ณ ํ๋ ๋ฐฉ๋ฒ์ด๋ค. ๋ฌธ์๋ฅผ ์ ํํ ์ดํ์๋ ํด๋น ๋ฌธ์ฅ์ ๋ง์ง๋ง ํ ํฐ ์์ฑ ์์ ๊น์ง ๋ค๋ฅธ ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์ง ์์ผ๋ฉฐ ์ ํ๋ ๋ฌธ์๋ง์ ์ ๋ณด๋ฅผ ์ฐธ๊ณ ํ๋ค.
- RAG-Token: Generator๋ก ํ ํฐ์ ์์ฑํ ๋, ๊ฐ ํ ํฐ ์์ฑ ์์ ๋ง๋ค ๊ฐ์ฅ ์ ํฉํ ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ๋ ๋ฐฉ๋ฒ์ด๋ค. ํ์ฌ ํ ํฐ์ ์์ฑํ๊ธฐ ์ํด ๊ฐ์ฅ ์ฐธ๊ณ ํ๊ธฐ ์ข์ ๋ฌธ์๊ฐ ๋ฌด์์ธ์ง ์ ํฉ๋๋ฅผ ํ๋จํ์ฌ ๋ชจ๋ ๋ฌธ์๋ฅผ ๋น๊ตํด ์ ํ๋ ๋ฌธ์์ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ํ ํฐ์ ์์ฑํ๋ค.
๊ฐ ๋ฐฉ์์ ๋ฐ๋ผ trade-off๊ฐ ์กด์ฌํ๊ธฐ์ ์ด๋ฅผ ๊ณ ๋ คํ๊ณ modeling ํด์ผํ ๊ฒ์ด๋ค.
Conclusion
์ด๋ฒ article์์๋ ์ด๋ ๊ฒ ์์ฃผ ๊ฐ๋จํ๊ฒ RAG์ ๋ฑ์ฅ ๋ฐฐ๊ฒฝ๊ณผ RAG์ ์๋ณธ ๋ ผ๋ฌธ์์ ์๊ฐ๋ Architecture์ ๋ํด์ ์์๋ณด์๋ค. 2025๋ ๊ธฐ์ค ํ๋ ๋๋ถ๋ถ์ RAG๋ ํด๋น ๋ ผ๋ฌธ์์ ์๊ฐ๋ RAG๋ฅผ ๋ฐํ์ผ๋ก ์ฑ์ฅํ์๋ค. ์ค์ ๋ก ํด๋น ๋ ผ๋ฌธ์ ์ธ์ฉํ์๊ฐ ์ฝ 400ํ๊ฐ ๋์ ์ ๋๋ก ์ธ์ด ๋ชจ๋ธ์ด ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ์ฐธ๊ณ ํ๋ ๋ฐฉ์์ ํ๊ธฐ์ ์ผ๋ก ๋ณํ์ํจ ๊ธฐ๋ ๋น์ ์ธ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์๋ค.
ํ๋ ๋๋ถ๋ถ์ RAG๋ Frozen-RAG ์ฆ, ํ์ต์์ด ์กด์ฌํ๋ ๋ฐ์ดํฐ๋ก๋ง ์ํํ๋ RAG์ธ๋ฐ, ์ด๋ ์ธ์ด๋ชจ๋ธ์ ์ฑ๋ฅ์ด ๋ฐ์ ํจ์ ๋ฐ๋ผ ์ ๋นํ ์์ค์ RAG ๋ง์ผ๋ก๋ ๋ฌธ์๊ฐ ์ ์ ํ ์ ๋ณด๋ฅผ ์ฐธ๊ณ ํ ์ ์๋๋ก ํจ๋ฌ๋ค์์ด ๋ณํํ๊ธฐ ๋๋ฌธ์ธ๋ฐ, ์ถํ์ ์ด๋ฅผ ๋ค๋ค๋ด๋ ์ข์ ๊ฒ ๊ฐ๋ค.
๊ฐ์ธ์ ์ธ ์ด์ผ๊ธฐ์ด์ง๋ง, ์ด๋ฒ Article์์ ์๊ฐํ ๋ ผ๋ฌธ โRetrieval-Augmented Generation for Knowledge-Intensive NLP Tasksโ๋ฅผ ๊ธฐ์ ์ผ๋ก ์๋ง ํ์๊ฐ ์ฝ๋ 2025๋ ์ ๋ง์ง๋ง ๋ ผ๋ฌธ์ด ๋ ๊ฒ ๊ฐ๋ค. ์ฌํด๋ฅผ ์๊ฐํด๋ณด๋ฉด Attention-Is-All-You-Need๋ฅผ ์์์ผ๋ก GPT-2, BERT, DPR, RAG, MoR(Mixture-of-Recursion) ๋ฑ 10๊ฐ ์ ๋ ๋๋ ๋ ผ๋ฌธ์ ์ฝ์๋ค. ํ์๊ฐ ์ฌํด ์ด์ ๋ ผ๋ฌธ์ด ์ ํํ ๋ฌด์์ธ์ง๋ ๋ชฐ๋๋๊ฒ์ ๊ฐ์ํ๋ฉด ์๋ฏธ์๋ ๋ฐ์ ์ด ์๋๊ฐ ์ถ๋ค.
ํ์ง๋ง ์์ผ๋ก ํ์๋ ๋ ผ๋ฌธ์ ์ฝ๋ ๋ฐฉ๋ฒ์ ์๋ก์ด ํจ๋ฌ๋ค์์ ๋ถ์ฌํ๊ณ ์ ํ๋ค. ๋ด๊ฐ ๋ ผ๋ฌธ์ ์ง๊ธ๊ป ์ฝ๋ ๋ฐฉ์์ ๋ ผ๋ฌธ์๋ณธ์ LLM์ ์ด์ฉํด ํ๋ฒ ์์ฝํ๊ณ , ํด๋น ๋ ผ๋ฌธ์ ์์ฝํ๊ฑฐ๋ ๋ฆฌ๋ทฐํ ๋ธ๋ก๊ทธ๋ ์ ํ๋ธ๋ฅผ ์ฐพ์๋ณด๋ ๋ฐฉ์์ด์๋ค. ํ์๋ ๊ณ ๋ฑํ์์ด๊ณ , ์์ด์ ๋ฅ์ํ์ง ์๊ธฐ ๋๋ฌธ์ด๋ผ๋ ํ๊ณ๋ก ์ง๊ธ๊ป ์ด๋ฐ ๋ฐฉ์์ผ๋ก ๋ ผ๋ฌธ์ ์ ํด์๋๋ฐ, ์ด์ ๋ ๋ฐ๋๋๊ฐ ๋๊ฒ ๊ฐ๋ค.
๋ฌผ๋ก ์ด๋ฏธ ๋ ผ๋ฌธ์ ์ ๋ฆฌํ ๊ธ๋ค์ด ์ข์ง ์์ ๊ฒ์ ์๋๋ค. ๊ทธ๋ค์ ํ๋ฅญํ ๅ ็์ด ๋์ด์ฃผ์๋ค. ํ์ง๋ง ๋์ ๋ณด๋ค ๊น์ด์๊ณ ์๊ฐ์๋ ํ์ต์ ์ํด์๋ ์ด์ ๋ํผ์ ์ค์ค๋ก์ ํ์ผ๋ก๋ผ๋ ๋ ผ๋ฌธ์ ์ฝ์ด์ผํ ๊ฒ์ด๋ค. ์์ด๊ฐ ์ด๋ ต๋๋ผ๊ณ ๋ฒ์ญ๊ธฐ๋ก ํ๋จ์ด ํ๋จ์ด ๋ฒ์ญํด์๋ผ๋ ์ฝ๊ฒ ๋ค. ์ด๋ ์๋ ๊ทธ๋ ๊ฒ ํ์ด์ผํ๋ค๊ณ ์๊ฐํ๋ค. ๋ง์น ์ฑ ์ ์ฝ์๋ ์ฑ ๋ฆฌ๋ทฐ ์ ํ๋ธ ์์์ ๋ณด๊ณ ์ฑ ์ ๋ค ์ฝ์๋ค๋ ๊ฒ์ฒ๋ผ ํ๋ํ๊ธฐ ์ซ๋ค.
์๋ง ๋ค์ ๊ธ๋ถํฐ๋ ๊ธ์ ํ๋ฆฌํฐ๊ฐ 2๋ฐฐ๊ฐ ๋์ ์ค์ง ์์๊น ์ถ๋ค ๐ค
Refrence
- [๋ ผ๋ฌธ๋ฆฌ๋ทฐ] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | JiYeop Kim
- RAG: Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | Original paper
- [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | Everyday Log blog
- [๋ ผ๋ฌธ ๋ฆฌ๋ทฐ] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | ๊ธธ๋ฐ๋ฅAI
- Dense Passage Retrieval for Open-Domain Question Answering| Original paper
- ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ) DPR : Dense Passage Retrieval for Open-Domain Question Answering | Introduce AI blog
- 6๊ธฐ ๋ ผ๋ฌธ ๋ฆฌ๋ทฐ ๐ RAG(2021.04): Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks | ์ต๋ฏผ์ง๋
- [Paper Review] Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks (RAG) | ๊น์ฌํฌ๋