728x90

AI 5

[VectorDB] Milvus 설치를 해보자!

Milvus는 현재 Pinecone과 더불어 대중적으로 인기가 많은 Vector DB 서비스이다. 로컬 또는 클라우드를 이용하여 스토리지를 설정할 수 있다. 나는 로컬로 Milvus Standalone을 설치해보겠다. 일단 나는 윈도우 환경이기 때문에 윈도우 환경에서 설치할 수 있게 필요한 프로그램들을 다운받아야 한다. 아래 링크에서 Minikube를 설치해보자. Minikube를 Windows에서 설치해보자. MiniKube란? 각 OS에서 로컬 k8s 클러스터를 빠르게 설정해주는 도구이다. k8s 클러스터를 실행하려면 최소한으로 구성을 해줘야 되는 부분들이 있다.(sceduler, controller, api-server, .. 등) 이러한 구성들 junnnhhh.tistory.com 이제 본격적으로..

AI 2024.03.01

[VectorDB] Chroma DB를 설치해보자.

Chroma DB 공식 홈페이지에서는 client 언어로 Python, NodeJS에 대한 가이드를 제공한다. 따라서, 나는 NodeJS를 사용해서 Chroma DB를 설치하는 작업을 진행할 예정이다. https://docs.trychroma.com/getting-started 🔑 Getting Started | Chroma Select a language docs.trychroma.com Visual Studio Code, Python, Microsoft Visual C++ 14 이상, NodeJS를 미리 설치를 해주고 다음 과정을 진행하자. 1. NodeJS에서 chromadb 패키지 다운로드 받기 npm init npm install --save chromadb 이제 chromadb에 서버를 구성을..

AI 2024.02.21

RAG(Retrieval-Augmented Generation)란?

대규모 언어 모델(LLM)의 출력을 최적화 하여 응답을 생성하기 전에 학습 데이터 소스 외부에 있고, 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스. RAG가 중요한 이유 LLM은 지능형 챗봇 및 기타 자연어 처리(NLP) 애플리케이션을 지원하는 핵심 AI 기술이다. LLM의 문제점으로는 다음과 같다. 정확한 답변을 할 수 없다고 판단이 되면, 관련이 없는 정보를 가지고 그럴듯한 답변을 꾸며내어 제공함. 질문자가 최신 정보를 토대로 한 답변을 기대를 하지만, 최신 정보로 학습이 되어 있지 않다면, 학습된 데이터 중 가장 최신의 것을 토대로 답변을 제공함. 신뢰할 수 없는 출처로부터 답변을 생성. 용어 혼동으로 인해 답변이 정확하지 않음. 다양한 훈련 소스가 동일한 용어을 사용하는데 그 의미가 다..

AI 2024.02.07

VectorDB란?

VectorDB는 수학적 표현으로 저장된 데이터의 모음. VectorDB를 사용하면 ML 모델이 이전 입력을 더 쉽게 기억하여 강력한 검색, 추천, 텍스트 생성 사용 사례에서 효과적으로 사용할 수 있다. 각 벡터는 단어, 이미지, 비디오, 동영상, 문서, 기타 데이터 등 개체 또는 항목에 해당한다. 이러한 벡터는 각 개체의 위치를 수십 또는 수백 개의 규모로 표현하기 때문에 길고 복잡할 수 있다. ex) 영화의 VectorDB는 러닝타임, 장르, 개봉 연도, 청소년 관람불가 등급 등의 기준에 따라 영화를 찾을 수 있다. 이러한 벡터가 정확하게 생성되면 유사한 영화가 VectorDB에 함께 클러스터링될 가능성이 높다. VectorDB 애플리케이션 AI/ML 애플리케이션 → VectorDB는 의미 정보 검색..

AI 2024.02.06

OpenAI API - Introduction

OpenAI API : 다양한 기능을 가진 AI 모델 사용 및 맞춤형 모델을 fine-tune할 수 있는 기능도 제공 ※ API를 통한 입력과 출력에 대해 모델을 교육하지 않는다고 나와 있음. 주요 개념 Text generation models → GPT(OpenAI의 텍스트 생성 모델 )는 자연어와 형식 언어를 이해하도록 훈련되어있다. 입력에 대한 응답으로 텍스트 출력을 하게 되는데 이 때, 모델에 대한 입력을 '프롬프트'라고 한다. GPT의 경우, 정해진 답을 도출하기 위해 사용되는 것 보다는 다양한 가능성을 염두해두고 관련된 아이디어를 얻는 방향으로 사용되는 것이 더 적절하다(ex 코드 생성, 요약, 대화, 창의적 글쓰기 등). Assistants → 개발자들이 AI를 활용하여 다양한 작업을 자동화..

AI 2024.01.16
728x90