Baidu VectorDB

Baidu VectorDB 是一款強大、企業級的分散式資料庫服務，由百度智慧雲精心開發及全面託管。它以卓越的多維向量資料儲存、檢索和分析能力而著稱。VectorDB 的核心基於百度專有的「Mochow」向量資料庫核心，確保了高效能、高可用性和安全性，同時兼具出色的擴展性和使用者友善性。

這項資料庫服務支援多樣化的索引類型和相似度計算方法，可滿足各種使用案例。VectorDB 的一個突出特點是其管理高達 100 億龐大向量規模的能力，同時保持令人 впечатления 的查詢效能，支援每秒數百萬次查詢 (QPS)，且查詢延遲僅為毫秒級。

您需要安裝 langchain-community，使用 pip install -qU langchain-community 來使用此整合

此筆記本展示如何使用與 Baidu VectorDB 相關的功能。

若要執行，您應該擁有一個資料庫執行個體。

!pip3 install pymochow

from langchain_community.document_loaders import TextLoader
from langchain_community.embeddings.fake import FakeEmbeddings
from langchain_community.vectorstores import BaiduVectorDB
from langchain_community.vectorstores.baiduvectordb import ConnectionParams
from langchain_text_splitters import CharacterTextSplitter

API 參考：TextLoader | FakeEmbeddings | BaiduVectorDB | ConnectionParams | CharacterTextSplitter

loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)
embeddings = FakeEmbeddings(size=128)

conn_params = ConnectionParams(
    endpoint="http://192.168.xx.xx:xxxx", account="root", api_key="****"
)

vector_db = BaiduVectorDB.from_documents(
    docs, embeddings, connection_params=conn_params, drop_old=True
)

query = "What did the president say about Ketanji Brown Jackson"
docs = vector_db.similarity_search(query)
docs[0].page_content

vector_db = BaiduVectorDB(embeddings, conn_params)
vector_db.add_texts(["Ankush went to Princeton"])
query = "Where did Ankush go to college?"
docs = vector_db.max_marginal_relevance_search(query)
docs[0].page_content

向量儲存庫概念指南
向量儲存庫操作指南

相關連結​

此頁面是否對您有幫助？

相關連結