簡體 English 中英

使用JDBC連接到EMR上的Spark SQL

[英]Connecting to Spark SQL on EMR using JDBC

原文 2016-11-18 18:05:49 9 1 amazon-web-services/ jdbc/ pyspark/ apache-spark-sql/ emr

我在EMR上運行了火花，我一直在嘗試使用JDBC hive驅動程序從SQLWorkbench連接到spark-SQL，但是徒勞無功。 我在EMR上啟動了thrift服務器，我可以從Tableau / SQL Workbench連接到端口10000（默認）上的Hive。 當我嘗試運行查詢時，它會觸發Tez / Hive作業。 但是，我想使用Spark運行查詢。 在EMR框中，我可以使用beeline連接到SparkSQL並將查詢作為spark作業運行。 資源管理器顯示直線查詢作為spark作業運行，而通過SQLWorkbench運行的查詢正在運行hive / Tez作業。

當我檢查日志時，我發現連接到spark的thrift服務器正在端口10001上運行（默認）。 當我直接啟動時，條目出現連接和我正在運行的sql。 但是，當使用相同的連接參數連接表單SQLWorkbench / Tableau時，它有一個沒有太多細節的異常。 例外，只是說連接已經結束。

我嘗試通過傳遞參數，直線工作在自定義端口上運行，但不通過jdbc連接。

有任何幫助來解決這個問題嗎？

1 個解決方案

我能夠解決這個問題。 我能夠從Tableau連接到SparkSQL，而我無法連接的原因是我們以root身份啟動了thrift服務。 不知道為什么它會重要，我不得不將日志文件夾的權限更改為當前用戶（而不是root）並啟動thrift服務，這使我能夠毫無問題地連接。

在EMR上將Postgresql JDBC源與Apache Spark結合使用

[英]Using Postgresql JDBC source with Apache Spark on EMR

在EMR上的Spark上使用Jupyter筆記本

[英]Using Jupyter notebook on Spark on EMR

無法通過AWS EMR實例通過spark訪問JDBC驅動程序

[英]Can't access JDBC driver through spark with AWS EMR instance

如何配置連接到AWS EMR spark集群的Java客戶端

[英]How to configure Java client connecting to AWS EMR spark cluster

運行EMR Spark腳本，Spark UI SQL選項卡消失

[英]Running an EMR Spark script, and the Spark UI SQL tab disappears

在EMR上使用Spark寫入S3中的文件

[英]Write to a file in S3 using Spark on EMR

如何使用 Terraform 在 EMR 上安裝 Spark，Hadoop？

[英]How to install Spark, Hadoop on EMR using Terraform?

帶有 AWS Glue 表分區的 EMR Notebook 出現 Spark SQL 錯誤

[英]Spark SQL error from EMR notebook with AWS Glue table partition

AWS EMR Spark 錯誤，“無法加載 driverClassName com.mysql.jdbc.Driver 的類”

[英]AWS EMR Spark error with `Failed to load class of driverClassName com.mysql.jdbc.Driver`

使用CLI將逗號分隔的參數傳遞給AWS EMR中的spark jar

[英]Pass comma separated argument to spark jar in AWS EMR using CLI

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在EMR上將Postgresql JDBC源與Apache Spark結合使用在EMR上的Spark上使用Jupyter筆記本無法通過AWS EMR實例通過spark訪問JDBC驅動程序如何配置連接到AWS EMR spark集群的Java客戶端運行EMR Spark腳本，Spark UI SQL選項卡消失在EMR上使用Spark寫入S3中的文件如何使用 Terraform 在 EMR 上安裝 Spark，Hadoop？帶有 AWS Glue 表分區的 EMR Notebook 出現 Spark SQL 錯誤 AWS EMR Spark 錯誤，“無法加載 driverClassName com.mysql.jdbc.Driver 的類” 使用CLI將逗號分隔的參數傳遞給AWS EMR中的spark jar

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM