百川文字嵌入
截至今日 (2024 年 1 月 25 日),百川文字嵌入在 C-MTEB(中文多任務嵌入基準)排行榜中排名第一。
排行榜(在 Overall -> Chinese 部分下):https://huggingface.co/spaces/mteb/leaderboard
官方網站:https://platform.baichuan-ai.com/docs/text-Embedding
使用此嵌入模型需要 API 金鑰。 您可以在 https://platform.baichuan-ai.com/docs/text-Embedding 註冊以取得。
百川文字嵌入支援 512 個 token 的視窗,並產生具有 1024 個維度的向量。
請注意,百川文字嵌入僅支援中文文字嵌入。 多語言支援即將推出。
from langchain_community.embeddings import BaichuanTextEmbeddings
embeddings = BaichuanTextEmbeddings(baichuan_api_key="sk-*")
API 參考:BaichuanTextEmbeddings
或者,您可以透過這種方式設定 API 金鑰
import os
os.environ["BAICHUAN_API_KEY"] = "YOUR_API_KEY"
text_1 = "今天天气不错"
text_2 = "今天阳光很好"
query_result = embeddings.embed_query(text_1)
query_result
doc_result = embeddings.embed_documents([text_1, text_2])
doc_result