跳到主要內容

Browserbase

Browserbase 是一個開發者平台,可以可靠地運行、管理和監控無頭瀏覽器。

使用以下功能強化您的 AI 資料擷取

安裝與設定

  • browserbase.com 取得 API 金鑰和專案 ID,並將其設定在環境變數中 (BROWSERBASE_API_KEY, BROWSERBASE_PROJECT_ID)。
  • 安裝 Browserbase SDK
%pip install browserbase

載入文件

您可以使用 BrowserbaseLoader 將網頁載入 LangChain。您可以選擇性地設定 text_content 參數,將頁面轉換為純文字表示。

from langchain_community.document_loaders import BrowserbaseLoader
API 參考:BrowserbaseLoader
loader = BrowserbaseLoader(
urls=[
"https://example.com",
],
# Text mode
text_content=False,
)

docs = loader.load()
print(docs[0].page_content[:61])

載入器選項

  • urls 必填。要提取的 URL 清單。
  • text_content 僅檢索文字內容。預設為 False
  • api_key 選填。Browserbase API 金鑰。預設為 BROWSERBASE_API_KEY 環境變數。
  • project_id 選填。Browserbase 專案 ID。預設為 BROWSERBASE_PROJECT_ID 環境變數。
  • session_id 選填。提供現有的工作階段 ID。
  • proxy 選填。啟用/停用 Proxy。

載入圖片

您還可以載入網頁的螢幕截圖(作為位元組)以用於多模態模型。

使用 GPT-4V 的完整範例

from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()

screenshot = browser.screenshot("https://browserbase.com")

result = chat.invoke(
[
HumanMessage(
content=[
{"type": "text", "text": "What color is the logo?"},
GPT4VImage(screenshot, GPT4VImageDetail.auto),
]
)
]
)

print(result.content)
API 參考:HumanMessage | ChatOpenAI

此頁面是否對您有幫助?