AI

VectorDB란?

junnnhhh 2024. 2. 6. 10:26
728x90

VectorDB는 수학적 표현으로 저장된 데이터의 모음.

 

VectorDB를 사용하면 ML 모델이 이전 입력을 더 쉽게 기억하여 강력한 검색, 추천, 텍스트 생성 사용 사례에서

효과적으로 사용할 수 있다.

 

각 벡터는 단어, 이미지, 비디오, 동영상, 문서, 기타 데이터 등 개체 또는 항목에 해당한다.

이러한 벡터는 각 개체의 위치를 수십 또는 수백 개의 규모로 표현하기 때문에 길고 복잡할 수 있다.

ex) 영화의 VectorDB는 러닝타임, 장르, 개봉 연도, 청소년 관람불가 등급 등의 기준에 따라 영화를 찾을 수 있다.

이러한 벡터가 정확하게 생성되면 유사한 영화가 VectorDB에 함께 클러스터링될 가능성이 높다.

 

VectorDB 애플리케이션

  • AI/ML 애플리케이션
    → VectorDB는 의미 정보 검색 및 장기 기억을 통해 AI 기능 향상
  • NLP 애플리케이션
    → 벡터 유사성 검색은 자여어 처리 애플리케이션에 유용하다. 컴퓨터가 인간 또는 자연어를 이해할 수 있도록
    텍스트 임베딩 처리 가능
  • 이미지 인식 및 검색 애플리케이션
    → VectorDB는 이미지를 이미지 임베딩으로 변환, 유사성 검색을 통해 유사한 이미지를 검색하거나 일치하는 이미지를 식별 가능

VectorDB 이점

VectorDB 없이 ML 모델을 자체적으로 쿼리하는 것은 빠르지도 않고 비용 측면에서도 효율적이지 않다.

매번 컨텍스트를 모델에 전달해주어야 하기 때문에 매우 느리고, 모델이 동일한 데이터 구문을  분석하는 데

반복해서 컴퓨팅 성능을 소비해야 하므로 비용이 많이 든다.

이 때, VectorDB를 사용하게 되면 데이터 세트가 모델을 한 번만 통과하고 해당 데이터의 모델 임베딩이 VectorDB에 저장된다.

728x90

'AI' 카테고리의 다른 글

[VectorDB] Milvus 설치를 해보자!  (0) 2024.03.01
[VectorDB] Chroma DB를 설치해보자.  (0) 2024.02.21
RAG(Retrieval-Augmented Generation)란?  (0) 2024.02.07
OpenAI API - Introduction  (0) 2024.01.16