vLLM 聊天
vLLM 可以部署為模擬 OpenAI API 協定的伺服器。 這允許 vLLM 作為使用 OpenAI API 的應用程式的直接替代品。 可以使用與 OpenAI API 相同的格式查詢此伺服器。
總覽
這將幫助您開始使用 vLLM 聊天模型,它利用了 langchain-openai
套件。 有關所有 ChatOpenAI
功能和配置的詳細文檔,請訪問 API 參考文檔。
整合細節
類別 (Class) | 套件 (Package) | 本地 (Local) | 可序列化 (Serializable) | JS 支援 | 套件下載次數 | 套件最新版本 |
---|---|---|---|---|---|---|
ChatOpenAI | langchain_openai | ✅ | beta (測試版) | ❌ |
模型功能
特定模型功能 (例如工具調用、對多模態輸入的支援、對 Token 層級串流的支援等) 將取決於託管的模型。
設定
請參閱 vLLM 文件 此處。
若要透過 LangChain 存取 vLLM 模型,您需要安裝 langchain-openai
整合套件。
憑證
驗證將取決於推論伺服器的具體情況。
如果您想獲得模型呼叫的自動追蹤,您也可以透過取消註釋下面的內容來設定您的 LangSmith API 金鑰
# os.environ["LANGCHAIN_TRACING_V2"] = "true"
# os.environ["LANGCHAIN_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")
安裝
LangChain vLLM 整合可以透過 langchain-openai
套件存取
%pip install -qU langchain-openai
實例化
現在我們可以實例化我們的模型物件並產生聊天完成
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.prompts.chat import (
ChatPromptTemplate,
HumanMessagePromptTemplate,
SystemMessagePromptTemplate,
)
from langchain_openai import ChatOpenAI
API 參考:HumanMessage (人類訊息) | SystemMessage (系統訊息) | ChatPromptTemplate (聊天提示範本) | HumanMessagePromptTemplate (人類訊息提示範本) | SystemMessagePromptTemplate (系統訊息提示範本) | ChatOpenAI
inference_server_url = "https://127.0.0.1:8000/v1"
llm = ChatOpenAI(
model="mosaicml/mpt-7b",
openai_api_key="EMPTY",
openai_api_base=inference_server_url,
max_tokens=5,
temperature=0,
)
調用
messages = [
SystemMessage(
content="You are a helpful assistant that translates English to Italian."
),
HumanMessage(
content="Translate the following sentence from English to Italian: I love programming."
),
]
llm.invoke(messages)
AIMessage(content=' Io amo programmare', additional_kwargs={}, example=False)
鏈接
我們可以像這樣 鏈接 我們的模型和提示範本
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate(
[
(
"system",
"You are a helpful assistant that translates {input_language} to {output_language}.",
),
("human", "{input}"),
]
)
chain = prompt | llm
chain.invoke(
{
"input_language": "English",
"output_language": "German",
"input": "I love programming.",
}
)
API 參考:ChatPromptTemplate (聊天提示範本)
API 參考
有關透過 langchain-openai
公開的所有功能和配置的詳細文檔,請訪問 API 參考文檔:https://langchain-python.dev.org.tw/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html
同時參閱 vLLM 文件。