Qdrant 的 FastEmbed

FastEmbed (來自 Qdrant) 是一個輕量級、快速的 Python 函式庫，專為嵌入生成而建置。

量化模型權重

ONNX Runtime，無 PyTorch 依賴性

CPU 優先設計

用於編碼大型資料集的資料平行處理。

依賴性

若要將 FastEmbed 與 LangChain 搭配使用，請安裝 fastembed Python 套件。

%pip install --upgrade --quiet  fastembed

from langchain_community.embeddings.fastembed import FastEmbedEmbeddings

model_name: str (預設值："BAAI/bge-small-en-v1.5")

要使用的 FastEmbedding 模型名稱。您可以在此處找到支援的模型清單。
max_length: int (預設值：512)

最大 token 數量。值 > 512 時行為未知。
cache_dir: Optional[str] (預設值：None)

快取目錄的路徑。預設為父目錄中的 local_cache。
threads: Optional[int] (預設值：None)

單一 onnxruntime 工作階段可以使用的執行緒數量。
doc_embed_type: Literal["default", "passage"] (預設值： "default")

“default”：使用 FastEmbed 的預設嵌入方法。

“passage”：在嵌入之前以 “passage” 作為文字前綴。
batch_size: int (預設值：256)

編碼的批次大小。值越高會使用更多記憶體，但速度會更快。
parallel: Optional[int] (預設值：None)

如果 >1，將使用資料平行編碼，建議用於大型資料集的離線編碼。如果 0，則使用所有可用的核心。如果 None，則不使用資料平行處理，而是使用預設的 onnxruntime 執行緒。

embeddings = FastEmbedEmbeddings()

document_embeddings = embeddings.embed_documents(
    ["This is a document", "This is some other document"]
)

query_embeddings = embeddings.embed_query("This is a query")