ReadTheDocs Documentation
Read the Docs 是一個開放原始碼的免費軟體文件託管平台。它使用
Sphinx
文件產生器產生文件。
本筆記本涵蓋如何從 HTML 載入內容,這些 HTML 是作為 Read-The-Docs 建置的一部分產生的。
如需實際應用的範例,請參閱此處。
這假設 HTML 已經被抓取到一個資料夾中。這可以通過取消註釋並運行以下命令來完成
%pip install --upgrade --quiet beautifulsoup4
#!wget -r -A.html -P rtdocs https://langchain-python.dev.org.tw/en/latest/
from langchain_community.document_loaders import ReadTheDocsLoader
API 參考:ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs")
docs = loader.load()