PullMd Loader
PullMd 是一項將網頁轉換為 Markdown 格式的服務。
langchain-pull-md
套件利用此服務將 URL(尤其是使用 React、Angular 或 Vue.js 等 JavaScript 框架呈現的 URL)轉換為 Markdown,而無需本機呈現。
安裝與設定
若要開始使用 langchain-pull-md
,您需要透過 pip 安裝套件
pip install langchain-pull-md
請參閱使用範例,以取得詳細的整合與使用說明。
文檔載入器
langchain-pull-md
中的 PullMdLoader
類別提供將 URL 轉換為 Markdown 的簡便方法。它對於從現代 Web 應用程式載入內容以在 LangChain 的處理功能中使用特別有用。
from langchain_pull_md import PullMdLoader
# Initialize the loader with a URL of a JavaScript-rendered webpage
loader = PullMdLoader(url='https://example.com')
# Load the content as a Document
documents = loader.load()
# Access the Markdown content
for document in documents:
print(document.page_content)
此載入器支援任何 URL,尤其擅長處理使用動態 JavaScript 建置的網站,使其成為資料處理工作流程中 Markdown 擷取的通用工具。
API 參考文檔
如需所有可用函數及其參數的完整指南,請造訪 API 參考文檔。