Athena

Amazon Athena 是一個伺服器less、互動式分析服務，建立在開放原始碼框架之上，支援開放表格和檔案格式。Athena 提供簡化、彈性的方式來分析 PB 級的資料所在地。使用 SQL 或 Python，從 Amazon Simple Storage Service (S3) 資料湖和 30 個資料來源（包括內部部署資料來源或其他雲端系統）分析資料或建置應用程式。Athena 建置在開放原始碼 Trino 和 Presto 引擎以及 Apache Spark 框架之上，無需佈建或設定工作。

本筆記本說明如何從 AWS Athena 載入文件。

設定

依照指示設定 AWS 帳戶。

安裝 Python 程式庫

! pip install boto3

範例

from langchain_community.document_loaders.athena import AthenaLoader

API 參考：AthenaLoader

database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
)

documents = loader.load()
print(documents)

包含中繼資料欄位的範例

database_name = "my_database"
s3_output_path = "s3://my_bucket/query_results/"
query = "SELECT * FROM my_table"
profile_name = "my_profile"
metadata_columns = ["_row", "_created_at"]

loader = AthenaLoader(
    query=query,
    database=database_name,
    s3_output_uri=s3_output_path,
    profile_name=profile_name,
    metadata_columns=metadata_columns,
)

documents = loader.load()
print(documents)

文件載入器概念指南
文件載入器操作指南

設定​

範例​

相關連結​

此頁面是否對您有幫助？

設定

範例

相關連結