跳至主要內容

vLLM 聊天

vLLM 可以部署為模擬 OpenAI API 協定的伺服器。 這允許 vLLM 作為使用 OpenAI API 的應用程式的直接替代品。 可以使用與 OpenAI API 相同的格式查詢此伺服器。

總覽

這將幫助您開始使用 vLLM 聊天模型,它利用了 langchain-openai 套件。 有關所有 ChatOpenAI 功能和配置的詳細文檔,請訪問 API 參考文檔

整合細節

類別 (Class)套件 (Package)本地 (Local)可序列化 (Serializable)JS 支援套件下載次數套件最新版本
ChatOpenAIlangchain_openaibeta (測試版)PyPI - DownloadsPyPI - Version

模型功能

特定模型功能 (例如工具調用、對多模態輸入的支援、對 Token 層級串流的支援等) 將取決於託管的模型。

設定

請參閱 vLLM 文件 此處

若要透過 LangChain 存取 vLLM 模型,您需要安裝 langchain-openai 整合套件。

憑證

驗證將取決於推論伺服器的具體情況。

如果您想獲得模型呼叫的自動追蹤,您也可以透過取消註釋下面的內容來設定您的 LangSmith API 金鑰

# os.environ["LANGCHAIN_TRACING_V2"] = "true"
# os.environ["LANGCHAIN_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")

安裝

LangChain vLLM 整合可以透過 langchain-openai 套件存取

%pip install -qU langchain-openai

實例化

現在我們可以實例化我們的模型物件並產生聊天完成

from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.prompts.chat import (
ChatPromptTemplate,
HumanMessagePromptTemplate,
SystemMessagePromptTemplate,
)
from langchain_openai import ChatOpenAI
inference_server_url = "https://127.0.0.1:8000/v1"

llm = ChatOpenAI(
model="mosaicml/mpt-7b",
openai_api_key="EMPTY",
openai_api_base=inference_server_url,
max_tokens=5,
temperature=0,
)

調用

messages = [
SystemMessage(
content="You are a helpful assistant that translates English to Italian."
),
HumanMessage(
content="Translate the following sentence from English to Italian: I love programming."
),
]
llm.invoke(messages)
AIMessage(content=' Io amo programmare', additional_kwargs={}, example=False)

鏈接

我們可以像這樣 鏈接 我們的模型和提示範本

from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate(
[
(
"system",
"You are a helpful assistant that translates {input_language} to {output_language}.",
),
("human", "{input}"),
]
)

chain = prompt | llm
chain.invoke(
{
"input_language": "English",
"output_language": "German",
"input": "I love programming.",
}
)

API 參考

有關透過 langchain-openai 公開的所有功能和配置的詳細文檔,請訪問 API 參考文檔:https://langchain-python.dev.org.tw/api_reference/openai/chat_models/langchain_openai.chat_models.base.ChatOpenAI.html

同時參閱 vLLM 文件


此頁面是否有幫助?