Azure Blob 儲存體容器
Azure Blob 儲存體 是微軟的雲端物件儲存解決方案。Blob 儲存體針對儲存大量非結構化資料進行了最佳化。非結構化資料是不遵循特定資料模型或定義的資料,例如文字或二進位資料。
Azure Blob 儲存體
設計用於
- 直接向瀏覽器提供圖片或文件。
- 儲存檔案以供分散式存取。
- 串流視訊和音訊。
- 寫入日誌檔案。
- 儲存資料以進行備份和還原、災難復原和封存。
- 儲存資料以供內部部署或 Azure 託管的服務進行分析。
本筆記本涵蓋如何從 Azure Blob 儲存體
上的容器載入文件物件。
%pip install --upgrade --quiet azure-storage-blob
from langchain_community.document_loaders import AzureBlobStorageContainerLoader
loader = AzureBlobStorageContainerLoader(conn_str="<conn_str>", container="<container>")
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': '/var/folders/y6/8_bzdg295ld6s1_97_12m4lr0000gn/T/tmpaa9xl6ch/fake.docx'}, lookup_index=0)]
指定前綴
您也可以指定前綴,以便更精細地控制要載入的檔案。
loader = AzureBlobStorageContainerLoader(
conn_str="<conn_str>", container="<container>", prefix="<prefix>"
)
loader.load()
[Document(page_content='Lorem ipsum dolor sit amet.', lookup_str='', metadata={'source': '/var/folders/y6/8_bzdg295ld6s1_97_12m4lr0000gn/T/tmpujbkzf_l/fake.docx'}, lookup_index=0)]