본문 바로가기
컴퓨터 일반/IT용어

RAG(Retrieval-Augmented Generation, 검색 증강 생성)

by 건티 2025. 4. 3.
728x90

※대규모 언어 모델(LLM)에 쌓인 데이터와 별개의 외부 데이터를 이용해 답변 정확도를 높여주는 기술

캐나다 인공지능(AI) 기업 코히어(Cohere)의 패트릭 루이스(Patrick Lewis) 박사가 2020년에 발간한 논문에서 처음 사용한 것으로 알려졌다.

대규모 언어 모델(LLM: Large Language Model)의 최대 단점은 허위 정보를 제공 하거나, 과거 정보를 최신 정보처럼 속여 제공하는 ‘환각(hallucination)’이다. 환각 현상은 AI 시스템이 실제 데이터나 사실에 기반하지 않고 내놓는 허위 정보 생성 현상을 의미한다. LLM을 기반으로 한 챗봇은 신뢰할 수 없는 답변을 내놓으며 이용자를 혼란에 빠트린다.

RAG는 이러한 LLM의 단점을 보완하는 역할을 한다. 이용자의 프롬프트 (prompt)에 맞는 외부 정보를 LLM에게 함께 제공해 근거가 없거나 관련이 없는 답변을 생성하는 경향을 크게 줄여준다. 특히 답변을 내놓기 전에 언론사 뉴스나 별도 지식 베이스를 참고하기 때문에 전문성도 갖췄다.

또 LLM의 답변에 추가 설명이나 세부 정보를 직접 확인할 수 있고 필요할 경우 소스 문서도 직접 찾아볼 수 있다. LLM이 오래전 학습된 데이터에 의존하지 않도록 해줌으로써 답변을 최신화해 주는 역할을 한다.

생성형 AI 시장에 뛰어든 기업들도 앞다퉈 RAG를 도입하고 있다. 베스핀글로벌 (Bespin Global)은 자사 대화형 AI 플랫폼 ‘헬프나우(HelpNow)’에 RAG를 도입했다. 온라인 법률 플랫폼 ‘로톡(LawTalk)’ 운영사 로앤컴퍼니는 판례 제공 서비스인 ‘빅케이스(Bigcase) GPT’에, LG유플러스는 챗 에이전트(Chat Agent) 플랫폼 4종에 모두 RAG를 활용했다.

 

출처]

한국정보통신기술협회(최신 ICT 시사용어 2025) : RAG(검색 증강 생성)

 

 

 

 

※ 10월 25일은 독도의 날입니다.

대한민국의 아름다운 영토, 독도의 여름

 

 

 

반응형

'컴퓨터 일반 > IT용어' 카테고리의 다른 글

CLOVA X  (2) 2025.04.04
MCP(Model Context Protocol)  (0) 2025.04.04
Gemini(제미나이)  (2) 2025.04.02
DNN(Deep Neural Network, 심층 신경망)  (0) 2025.04.01
LLM(Large Language Model, 대규모 언어 모델)  (1) 2025.04.01

댓글