跳到主要內容
Open In ColabOpen on GitHub

John Snow Labs

John Snow Labs NLP 和 LLM 生態系統包含用於大規模先進 AI、負責任的 AI、無程式碼 AI 的軟體庫,以及存取超過 20,000 個用於醫療保健、法律、金融等領域的模型。

模型透過 nlp.load 載入,而 spark 工作階段在底層透過 nlp.start() 啟動。如需所有 24,000 多個模型,請參閱 John Snow Labs Model Models Hub

設定

%pip install --upgrade --quiet  johnsnowlabs
# If you have a enterprise license, you can run this to install enterprise features
# from johnsnowlabs import nlp
# nlp.install()

範例

from langchain_community.embeddings.johnsnowlabs import JohnSnowLabsEmbeddings

初始化 Johnsnowlabs Embeddings 和 Spark 工作階段

embedder = JohnSnowLabsEmbeddings("en.embed_sentence.biobert.clinical_base_cased")

定義一些範例文字。這些可以是您想要分析的任何文件 - 例如,新聞文章、社群媒體貼文或產品評論。

texts = ["Cancer is caused by smoking", "Antibiotics aren't painkiller"]

為文字產生並列印嵌入。 JohnSnowLabsEmbeddings 類別為每個文件產生一個嵌入,這是文件內容的數值表示。這些嵌入可用於各種自然語言處理任務,例如文件相似度比較或文本分類。

embeddings = embedder.embed_documents(texts)
for i, embedding in enumerate(embeddings):
print(f"Embedding for document {i+1}: {embedding}")

為單段文字產生並列印嵌入。您也可以為單段文字(例如搜尋查詢)產生嵌入。這對於資訊檢索等任務非常有用,您可以在其中找到與給定查詢相似的文件。

query = "Cancer is caused by smoking"
query_embedding = embedder.embed_query(query)
print(f"Embedding for query: {query_embedding}")

此頁面是否對您有幫助?