Arxiv
arXiv 是一個開放存取的檔案庫,收錄了物理學、數學、電腦科學、定量生物學、定量金融、統計學、電機工程與系統科學以及經濟學等領域的 200 萬篇學術文章。
安裝與設定
首先,您需要安裝 arxiv
python 套件。
pip install arxiv
其次,您需要安裝 PyMuPDF
python 套件,它將從 arxiv.org
網站下載的 PDF 檔案轉換為文字格式。
pip install pymupdf
文件載入器
請參閱使用範例。
from langchain_community.document_loaders import ArxivLoader
API 參考:ArxivLoader
檢索器
請參閱使用範例。
from langchain_community.retrievers import ArxivRetriever
API 參考:ArxivRetriever