跳到主要內容

SpaCy

spaCy 是一個用於高級自然語言處理的開源軟體庫,使用程式語言 Python 和 Cython 編寫。

安裝與設定

%pip install --upgrade --quiet  spacy

導入必要的類別

from langchain_community.embeddings.spacy_embeddings import SpacyEmbeddings
API 參考:SpacyEmbeddings

範例

初始化 SpacyEmbeddings。這會將 Spacy 模型載入到記憶體中。

embedder = SpacyEmbeddings(model_name="en_core_web_sm")

定義一些範例文字。 這些可以是您想要分析的任何文件 - 例如,新聞文章、社交媒體帖子或產品評論。

texts = [
"The quick brown fox jumps over the lazy dog.",
"Pack my box with five dozen liquor jugs.",
"How vexingly quick daft zebras jump!",
"Bright vixens jump; dozy fowl quack.",
]

產生並印出文字的嵌入。 SpacyEmbeddings 類別會為每個文件產生一個嵌入,這是文件內容的數值表示。 這些嵌入可用於各種自然語言處理任務,例如文件相似性比較或文字分類。

embeddings = embedder.embed_documents(texts)
for i, embedding in enumerate(embeddings):
print(f"Embedding for document {i+1}: {embedding}")

為單段文字產生並印出嵌入。 您也可以為單段文字產生嵌入,例如搜尋查詢。 這對於諸如資訊檢索之類的任務非常有用,在資訊檢索中,您希望找到與給定查詢相似的文件。

query = "Quick foxes and lazy dogs."
query_embedding = embedder.embed_query(query)
print(f"Embedding for query: {query_embedding}")

此頁面是否對您有幫助?