Browserbase
Browserbase 是一個開發者平台,可可靠地執行、管理及監控無頭瀏覽器。
使用以下工具強化您的 AI 資料檢索
- 無伺服器基礎架構,提供可靠的瀏覽器以從複雜的 UI 中擷取資料
- 隱身模式,包含指紋辨識技術與自動驗證碼解謎
- 工作階段偵錯工具,可使用網路時間軸和記錄檢查您的瀏覽器工作階段
- 即時偵錯,可快速偵錯您的自動化
安裝與設定
- 從 browserbase.com 取得 API 金鑰和專案 ID,並將其設定在環境變數中 (
BROWSERBASE_API_KEY
、BROWSERBASE_PROJECT_ID
)。 - 安裝 Browserbase SDK
%pip install browserbase
載入文件
您可以使用 BrowserbaseLoader
將網頁載入 LangChain。您可以選擇性設定 text_content
參數,將頁面轉換為純文字表示。
from langchain_community.document_loaders import BrowserbaseLoader
API 參考:BrowserbaseLoader
loader = BrowserbaseLoader(
urls=[
"https://example.com",
],
# Text mode
text_content=False,
)
docs = loader.load()
print(docs[0].page_content[:61])
載入器選項
urls
必要。要擷取的 URL 清單。text_content
僅擷取文字內容。預設值為False
。api_key
選用。Browserbase API 金鑰。預設值為BROWSERBASE_API_KEY
環境變數。project_id
選用。Browserbase 專案 ID。預設值為BROWSERBASE_PROJECT_ID
環境變數。session_id
選用。提供現有的工作階段 ID。proxy
選用。啟用/停用 Proxy。
載入圖片
您也可以載入網頁螢幕截圖 (以位元組為單位),以用於多模態模型。
使用 GPT-4V 的完整範例
from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()
screenshot = browser.screenshot("https://browserbase.com")
result = chat.invoke(
[
HumanMessage(
content=[
{"type": "text", "text": "What color is the logo?"},
GPT4VImage(screenshot, GPT4VImageDetail.auto),
]
)
]
)
print(result.content)
API 參考:HumanMessage | ChatOpenAI