Browserbase

Browserbase 是一個開發者平台，可可靠地執行、管理及監控無頭瀏覽器。

使用以下工具強化您的 AI 資料檢索

無伺服器基礎架構，提供可靠的瀏覽器以從複雜的 UI 中擷取資料
隱身模式，包含指紋辨識技術與自動驗證碼解謎
工作階段偵錯工具，可使用網路時間軸和記錄檢查您的瀏覽器工作階段
即時偵錯，可快速偵錯您的自動化

安裝與設定

從 browserbase.com 取得 API 金鑰和專案 ID，並將其設定在環境變數中 (BROWSERBASE_API_KEY、BROWSERBASE_PROJECT_ID)。
安裝 Browserbase SDK

%pip install browserbase

載入文件

您可以使用 BrowserbaseLoader 將網頁載入 LangChain。您可以選擇性設定 text_content 參數，將頁面轉換為純文字表示。

from langchain_community.document_loaders import BrowserbaseLoader

API 參考：BrowserbaseLoader

loader = BrowserbaseLoader(
    urls=[
        "https://example.com",
    ],
    # Text mode
    text_content=False,
)

docs = loader.load()
print(docs[0].page_content[:61])

載入器選項

urls 必要。要擷取的 URL 清單。
text_content 僅擷取文字內容。預設值為 False。
api_key 選用。Browserbase API 金鑰。預設值為 BROWSERBASE_API_KEY 環境變數。
project_id 選用。Browserbase 專案 ID。預設值為 BROWSERBASE_PROJECT_ID 環境變數。
session_id 選用。提供現有的工作階段 ID。
proxy 選用。啟用/停用 Proxy。

載入圖片

您也可以載入網頁螢幕截圖 (以位元組為單位)，以用於多模態模型。

使用 GPT-4V 的完整範例

from browserbase import Browserbase
from browserbase.helpers.gpt4 import GPT4VImage, GPT4VImageDetail
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model="gpt-4-vision-preview", max_tokens=256)
browser = Browserbase()

screenshot = browser.screenshot("https://browserbase.com")

result = chat.invoke(
    [
        HumanMessage(
            content=[
                {"type": "text", "text": "What color is the logo?"},
                GPT4VImage(screenshot, GPT4VImageDetail.auto),
            ]
        )
    ]
)

print(result.content)

API 參考：HumanMessage | ChatOpenAI

文件載入器概念指南
文件載入器操作指南

安裝與設定​

載入文件​

載入器選項​

載入圖片​

相關內容​

此頁面是否對您有幫助？

安裝與設定

載入文件

載入器選項

載入圖片

相關內容