Meilisearch

Meilisearch 是一個開源、極速且高度相關的搜尋引擎。它具有出色的預設值，可協助開發人員建構靈活的搜尋體驗。

您可以自行託管 Meilisearch 或在 Meilisearch Cloud 上執行。

Meilisearch v1.3 支援向量搜尋。本頁面將引導您整合 Meilisearch 作為向量儲存庫，並使用它來執行向量搜尋。

您需要安裝 langchain-community 與 pip install -qU langchain-community 才能使用此整合功能

設定

啟動 Meilisearch 執行個體

您將需要一個正在運行的 Meilisearch 執行個體，以用作您的向量儲存庫。您可以在本機運行 Meilisearch 或建立 Meilisearch Cloud 帳戶。

從 Meilisearch v1.3 開始，向量儲存是一項實驗性功能。啟動您的 Meilisearch 執行個體後，您需要啟用向量儲存。對於自行託管的 Meilisearch，請閱讀有關啟用實驗性功能的文件。在 Meilisearch Cloud 上，透過您的專案「設定」頁面啟用「向量儲存庫」。

您現在應該有一個正在運行且啟用向量儲存的 Meilisearch 執行個體。🎉

憑證

為了與您的 Meilisearch 執行個體互動，Meilisearch SDK 需要主機（您的執行個體的 URL）和 API 金鑰。

主機

在本機中，預設主機為 localhost:7700
在 Meilisearch Cloud 上，在您的專案「設定」頁面中找到主機

API 金鑰

Meilisearch 執行個體預設提供您三個 API 金鑰

MASTER KEY — 應僅用於建立您的 Meilisearch 執行個體
ADMIN KEY — 僅在伺服器端使用它來更新您的資料庫及其設定
SEARCH KEY — 您可以在前端應用程式中安全地分享的金鑰

您可以根據需要建立其他 API 金鑰。

安裝依賴項

本指南使用 Meilisearch Python SDK。您可以透過運行以下命令來安裝它

%pip install --upgrade --quiet  meilisearch

如需更多資訊，請參閱 Meilisearch Python SDK 文件。

範例

有多種方法可以初始化 Meilisearch 向量儲存庫：提供 Meilisearch 用戶端或根據需要提供 URL 和 API 金鑰。在我們的範例中，憑證將從環境中載入。

您可以透過使用 os 和 getpass，使環境變數在您的 Notebook 環境中可用。您可以將此技術用於以下所有範例。

import getpass
import os

if "MEILI_HTTP_ADDR" not in os.environ:
    os.environ["MEILI_HTTP_ADDR"] = getpass.getpass(
        "Meilisearch HTTP address and port:"
    )
if "MEILI_MASTER_KEY" not in os.environ:
    os.environ["MEILI_MASTER_KEY"] = getpass.getpass("Meilisearch API Key:")

我們想要使用 OpenAIEmbeddings，因此我們必須取得 OpenAI API 金鑰。

if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")

新增文字和嵌入

此範例將文字新增至 Meilisearch 向量資料庫，而無需初始化 Meilisearch 向量儲存庫。

from langchain_community.vectorstores import Meilisearch
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import CharacterTextSplitter

embeddings = OpenAIEmbeddings()
embedders = {
    "default": {
        "source": "userProvided",
        "dimensions": 1536,
    }
}
embedder_name = "default"

API 參考：Meilisearch | OpenAIEmbeddings | CharacterTextSplitter

with open("../../how_to/state_of_the_union.txt") as f:
    state_of_the_union = f.read()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_text(state_of_the_union)

# Use Meilisearch vector store to store texts & associated embeddings as vector
vector_store = Meilisearch.from_texts(
    texts=texts, embedding=embeddings, embedders=embedders, embedder_name=embedder_name
)

在幕後，Meilisearch 會將文字轉換為多個向量。這將使我們得到與以下範例相同的結果。

新增文件和嵌入

在本範例中，我們將使用 Langchain TextSplitter 將文字分割成多個文件。然後，我們將儲存這些文件及其嵌入。

from langchain_community.document_loaders import TextLoader

# Load text
loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)

# Create documents
docs = text_splitter.split_documents(documents)

# Import documents & embeddings in the vector store
vector_store = Meilisearch.from_documents(
    documents=documents,
    embedding=embeddings,
    embedders=embedders,
    embedder_name=embedder_name,
)

# Search in our vector store
query = "What did the president say about Ketanji Brown Jackson"
docs = vector_store.similarity_search(query, embedder_name=embedder_name)
print(docs[0].page_content)

API 參考：TextLoader

透過建立 Meilisearch Vectorstore 新增文件

在此方法中，我們建立一個向量儲存庫物件並將文件新增至其中。

import meilisearch
from langchain_community.vectorstores import Meilisearch

client = meilisearch.Client(url="http://127.0.0.1:7700", api_key="***")
vector_store = Meilisearch(
    embedding=embeddings,
    embedders=embedders,
    client=client,
    index_name="langchain_demo",
    text_key="text",
)
vector_store.add_documents(documents)

API 參考：Meilisearch

具有分數的相似性搜尋

此特定方法允許您傳回文件以及查詢與文件之間的距離分數。 embedder_name 是應該用於語意搜尋的嵌入器名稱，預設為「default」。

docs_and_scores = vector_store.similarity_search_with_score(
    query, embedder_name=embedder_name
)
docs_and_scores[0]

依向量的相似性搜尋

embedder_name 是應該用於語意搜尋的嵌入器名稱，預設為「default」。

embedding_vector = embeddings.embed_query(query)
docs_and_scores = vector_store.similarity_search_by_vector(
    embedding_vector, embedder_name=embedder_name
)
docs_and_scores[0]

其他資源

文件

開源儲存庫

向量儲存庫概念指南
向量儲存庫操作指南

設定​

啟動 Meilisearch 執行個體​

憑證​

安裝依賴項​

範例​

新增文字和嵌入​

新增文件和嵌入​

透過建立 Meilisearch Vectorstore 新增文件​

具有分數的相似性搜尋​

依向量的相似性搜尋​

其他資源​

相關內容​

此頁面是否對您有幫助？

設定