AI
RAG(Retrieval-Augmented Generation)란?
junnnhhh
2024. 2. 7. 14:08
728x90
대규모 언어 모델(LLM)의 출력을 최적화 하여 응답을 생성하기 전에 학습 데이터 소스 외부에 있고, 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스.
RAG가 중요한 이유
LLM은 지능형 챗봇 및 기타 자연어 처리(NLP) 애플리케이션을 지원하는 핵심 AI 기술이다.
LLM의 문제점으로는 다음과 같다.
- 정확한 답변을 할 수 없다고 판단이 되면, 관련이 없는 정보를 가지고 그럴듯한 답변을 꾸며내어 제공함.
- 질문자가 최신 정보를 토대로 한 답변을 기대를 하지만, 최신 정보로 학습이 되어 있지 않다면, 학습된 데이터 중 가장 최신의 것을 토대로 답변을 제공함.
- 신뢰할 수 없는 출처로부터 답변을 생성.
- 용어 혼동으로 인해 답변이 정확하지 않음. 다양한 훈련 소스가 동일한 용어을 사용하는데 그 의미가 다른 내용로 이루어진 경우.
→ RAG는 이러한 문제 중 일부를 해결하기 위한 한 가지 접근 방식. LLM을 리디렉션하여 신뢰할 수 있는 지식 출처에서 관련 정보를 검색.
RAG 이점
- 비용 효율적인 구현
- 최신 정보
- 사용자 신뢰 강화
- 개발자 제어 강화
RAG 동작 방식
→ RAG가 없는 경우, LLM은 사용자 입력을 받아 훈련한 정보 또는 이미 알고 있는 정보를 기반으로 답변 생성. RAG에는 사용자 입력을 활용하여 새 데이터 소스에서 정보를 가져오는 검색 구성요소가 도임됨.
- 외부 데이터 생성
- 관련 정보 검색
- LLM 프롬프트 확장
- 외부 데이터 업데이트
728x90