rspace
這個筆記本展示了如何使用 RSpace 文件載入器將研究筆記和文件從 RSpace 電子實驗室筆記本匯入到 Langchain 管道中。
首先,您需要一個 RSpace 帳戶和一個 API 金鑰。
您可以在 https://community.researchspace.com 建立一個免費帳戶,或者使用您機構的 RSpace。
您可以從您的帳戶個人資料頁面取得 RSpace API 令牌。
%pip install --upgrade --quiet rspace_client
最好將您的 RSpace API 金鑰儲存為環境變數。
RSPACE_API_KEY=<YOUR_KEY>
您還需要設定您的 RSpace 安裝網址,例如:
RSPACE_URL=https://community.researchspace.com
如果您使用這些完全相同的環境變數名稱,它們將會被自動偵測到。
from langchain_community.document_loaders.rspace import RSpaceLoader
API 參考:RSpaceLoader
您可以從 RSpace 匯入各種項目
- 單個 RSpace 結構化或基本文檔。 這將以 1 對 1 的方式映射到 Langchain 文檔。
- 一個資料夾或筆記本。 筆記本或資料夾中的所有文檔都將作為 Langchain 文檔匯入。
- 如果您的 RSpace 圖庫中有 PDF 文件,這些文件也可以單獨匯入。 在底層,將會使用 Langchain 的 PDF 載入器,並且這會為每個 PDF 頁面建立一個 Langchain 文檔。
## replace these ids with some from your own research notes.
## Make sure to use global ids (with the 2 character prefix). This helps the loader know which API calls to make
## to RSpace API.
rspace_ids = ["NB1932027", "FL1921314", "SD1932029", "GL1932384"]
for rs_id in rspace_ids:
loader = RSpaceLoader(global_id=rs_id)
docs = loader.load()
for doc in docs:
## the name and ID are added to the 'source' metadata property.
print(doc.metadata)
print(doc.page_content[:500])
如果您不想像上面那樣使用環境變數,您可以將這些變數傳遞到 RSpaceLoader 中
loader = RSpaceLoader(
global_id=rs_id, api_key="MY_API_KEY", url="https://my.researchspace.com"
)