MongoDB
MongoDB 是一個 NoSQL,以文件為導向的資料庫,支援具有動態結構描述的 JSON 類型的文件。
概觀
MongoDB 文件載入器從 MongoDB 資料庫傳回 Langchain 文件清單。
載入器需要以下參數
- MongoDB 連接字串
- MongoDB 資料庫名稱
- MongoDB 集合名稱
- (可選) 內容篩選器字典
- (可選) 要包含在輸出中的欄位名稱清單
輸出採用以下格式
- pageContent= Mongo 文件
- metadata={'database': '[database_name]', 'collection': '[collection_name]'}
載入文件載入器
# add this import for running in jupyter notebook
import nest_asyncio
nest_asyncio.apply()
from langchain_community.document_loaders.mongodb import MongodbLoader
API 參考:MongodbLoader
loader = MongodbLoader(
connection_string="mongodb://127.0.0.1:27017/",
db_name="sample_restaurants",
collection_name="restaurants",
filter_criteria={"borough": "Bronx", "cuisine": "Bakery"},
field_names=["name", "address"],
)
docs = loader.load()
len(docs)
71
docs[0]
Document(page_content="Morris Park Bake Shop {'building': '1007', 'coord': [-73.856077, 40.848447], 'street': 'Morris Park Ave', 'zipcode': '10462'}", metadata={'database': 'sample_restaurants', 'collection': 'restaurants'})