跳到主要內容
Open on GitHub

PullMd Loader

PullMd 是一項將網頁轉換為 Markdown 格式的服務。langchain-pull-md 套件利用此服務將 URL(尤其是使用 React、Angular 或 Vue.js 等 JavaScript 框架呈現的 URL)轉換為 Markdown,而無需本機呈現。

安裝與設定

若要開始使用 langchain-pull-md,您需要透過 pip 安裝套件

pip install langchain-pull-md

請參閱使用範例,以取得詳細的整合與使用說明。

文檔載入器

langchain-pull-md 中的 PullMdLoader 類別提供將 URL 轉換為 Markdown 的簡便方法。它對於從現代 Web 應用程式載入內容以在 LangChain 的處理功能中使用特別有用。

from langchain_pull_md import PullMdLoader

# Initialize the loader with a URL of a JavaScript-rendered webpage
loader = PullMdLoader(url='https://example.com')

# Load the content as a Document
documents = loader.load()

# Access the Markdown content
for document in documents:
print(document.page_content)

此載入器支援任何 URL,尤其擅長處理使用動態 JavaScript 建置的網站,使其成為資料處理工作流程中 Markdown 擷取的通用工具。

API 參考文檔

如需所有可用函數及其參數的完整指南,請造訪 API 參考文檔

其他資源


此頁面是否對您有幫助?