728x90

ai 3

RAG(Retrieval-Augmented Generation)란?

대규모 언어 모델(LLM)의 출력을 최적화 하여 응답을 생성하기 전에 학습 데이터 소스 외부에 있고, 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스. RAG가 중요한 이유 LLM은 지능형 챗봇 및 기타 자연어 처리(NLP) 애플리케이션을 지원하는 핵심 AI 기술이다. LLM의 문제점으로는 다음과 같다. 정확한 답변을 할 수 없다고 판단이 되면, 관련이 없는 정보를 가지고 그럴듯한 답변을 꾸며내어 제공함. 질문자가 최신 정보를 토대로 한 답변을 기대를 하지만, 최신 정보로 학습이 되어 있지 않다면, 학습된 데이터 중 가장 최신의 것을 토대로 답변을 제공함. 신뢰할 수 없는 출처로부터 답변을 생성. 용어 혼동으로 인해 답변이 정확하지 않음. 다양한 훈련 소스가 동일한 용어을 사용하는데 그 의미가 다..

AI 2024.02.07

VectorDB란?

VectorDB는 수학적 표현으로 저장된 데이터의 모음. VectorDB를 사용하면 ML 모델이 이전 입력을 더 쉽게 기억하여 강력한 검색, 추천, 텍스트 생성 사용 사례에서 효과적으로 사용할 수 있다. 각 벡터는 단어, 이미지, 비디오, 동영상, 문서, 기타 데이터 등 개체 또는 항목에 해당한다. 이러한 벡터는 각 개체의 위치를 수십 또는 수백 개의 규모로 표현하기 때문에 길고 복잡할 수 있다. ex) 영화의 VectorDB는 러닝타임, 장르, 개봉 연도, 청소년 관람불가 등급 등의 기준에 따라 영화를 찾을 수 있다. 이러한 벡터가 정확하게 생성되면 유사한 영화가 VectorDB에 함께 클러스터링될 가능성이 높다. VectorDB 애플리케이션 AI/ML 애플리케이션 → VectorDB는 의미 정보 검색..

AI 2024.02.06

OpenAI API - Introduction

OpenAI API : 다양한 기능을 가진 AI 모델 사용 및 맞춤형 모델을 fine-tune할 수 있는 기능도 제공 ※ API를 통한 입력과 출력에 대해 모델을 교육하지 않는다고 나와 있음. 주요 개념 Text generation models → GPT(OpenAI의 텍스트 생성 모델 )는 자연어와 형식 언어를 이해하도록 훈련되어있다. 입력에 대한 응답으로 텍스트 출력을 하게 되는데 이 때, 모델에 대한 입력을 '프롬프트'라고 한다. GPT의 경우, 정해진 답을 도출하기 위해 사용되는 것 보다는 다양한 가능성을 염두해두고 관련된 아이디어를 얻는 방향으로 사용되는 것이 더 적절하다(ex 코드 생성, 요약, 대화, 창의적 글쓰기 등). Assistants → 개발자들이 AI를 활용하여 다양한 작업을 자동화..

AI 2024.01.16
728x90