與通過 AWS cli 執行的查詢相比，通過 boto3 python 客戶端執行的 Athena 查詢給出的結果更小

Question

我想通過 Athena 執行一個非常簡單的查詢。

查詢： select * from information_schema.tables

當我使用帶有以下代碼的 boto3 客戶端執行查詢時：

...

def run_query(query_string):
    query_execution_context = {"Catalog": "awsdatacatalog", "Database": "information_schema"}
    response = athena_client.start_query_execution(
        QueryString=query_string, QueryExecutionContext=query_execution_context, WorkGroup="primary"
    )
    return response

query_string_get_tables = "select * from information_schema.tables"
response = run_query(query_string_get_tables)

我在 0.6 秒內得到了 9 行的結果。

當我然后 go 到 AWS 控制台並重新運行相同的查詢時，我在 6 秒內得到了 500 行的結果。

AWS 控制台的結果是正確的。 如何使用 boto3 客戶端獲得相同的結果？

編輯：我下載了查詢歷史並比較了查詢字符串。 如您所見，它們完全相同。 我還在 boto3 客戶端調用中刪除了 QueryExecutionContext ，但這並沒有改變任何東西。 此外，我嘗試了所有單引號/雙引號的組合。

查詢歷史：

37b72ac5-3223-496f-8293-79eab8a661a0,select * from information_schema.tables,2022-12-02T18:23:09.738-08:00,SUCCEEDED,6.503 sec,39.01 KB,Athena engine version 2,'-

9d3a274a-8109-4988-aaf8-bba9c8733208,select * from information_schema.tables,2022-12-02T18:14:11.385-08:00,SUCCEEDED,520 ms,0.67 KB,Athena engine version 2,'-

Answer 1

正如評論中提到的，使用start_query_execution需要一些努力來啟動查詢執行，等待其完成，然后get_query_results （ https://boto3.amazonaws.com/v1/documentation/api/latest/reference/services/athena.html#Athena。客戶端.get_query_results ）。

為了讓您的生活更輕松，您可以使用開源庫 AWSWrangler 或AWS-SDK-Pandas 。 使用此庫可以以阻塞方式獲取結果：

# Retrieving the data from Amazon Athena
df = wr.athena.read_sql_query("SELECT * FROM my_table", database="my_db")

與通過 AWS cli 執行的查詢相比，通過 boto3 python 客戶端執行的 Athena 查詢給出的結果更小

問題描述

1 個解決方案

解決方案1
0 2022-12-06 23:15:58

與通過 AWS cli 執行的查詢相比，通過 boto3 python 客戶端執行的 Athena 查詢給出的結果更小

問題描述

1 個解決方案

解決方案1 0 2022-12-06 23:15:58

解決方案1
0 2022-12-06 23:15:58