Telegram
Telegram Messenger 是一款全球通用的免費增值、跨平台、加密、基於雲端和集中式的即時通訊服務。該應用程式還提供可選的端到端加密聊天和視訊通話、VoIP、檔案共享以及其他多項功能。
本筆記本涵蓋了如何從 Telegram 加載數據,轉換成可以被 LangChain 攝取的格式。
from langchain_community.document_loaders import (
TelegramChatApiLoader,
TelegramChatFileLoader,
)
API 參考文檔:TelegramChatApiLoader | TelegramChatFileLoader
loader = TelegramChatFileLoader("example_data/telegram.json")
loader.load()
[Document(page_content="Henry on 2020-01-01T00:00:02: It's 2020...\n\nHenry on 2020-01-01T00:00:04: Fireworks!\n\nGrace 🧤 ðŸ\x8d’ on 2020-01-01T00:00:05: You're a minute late!\n\n", metadata={'source': 'example_data/telegram.json'})]
TelegramChatApiLoader
直接從 Telegram 中任何指定的聊天室加載數據。為了導出數據,您需要驗證您的 Telegram 帳戶。
您可以從 https://my.telegram.org/auth?to=apps 取得 API_HASH 和 API_ID
chat_entity – 建議為頻道的實體 (entity)。
loader = TelegramChatApiLoader(
chat_entity="<CHAT_URL>", # recommended to use Entity here
api_hash="<API HASH >",
api_id="<API_ID>",
username="", # needed only for caching the session.
)
loader.load()