ReadTheDocs 文件
Read the Docs 是一個開源的免費軟體文件託管平台。它生成使用
Sphinx
文件生成器編寫的文件。
這個筆記本涵蓋了如何從 HTML 加載內容,這些 HTML 是作為 Read-The-Docs
建置的一部分生成的。
關於這個的一個實際例子,請參見這裡。
這假設 HTML 已經被抓取到一個文件夾中。 這可以通過取消註釋並運行以下命令來完成
%pip install --upgrade --quiet beautifulsoup4
#!wget -r -A.html -P rtdocs https://langchain-python.dev.org.tw/en/latest/
from langchain_community.document_loaders import ReadTheDocsLoader
API 參考:ReadTheDocsLoader
loader = ReadTheDocsLoader("rtdocs", features="html.parser")
docs = loader.load()