繁体 English 中英

从Hive表中读取行并在Scala-Spark中写入文件

[英]Reading rows from Hive table and write to file in Scala-Spark

原文 2017-11-21 02:48:25 4 1 scala/ apache-spark

我想从spark-scala程序中的配置单元表之一读取数据行，之后，需要将相同的数据逐行写入文件。 实际上是逐行写入文件。 谁能分享指针？ Spark版本1.6，Hive1.2。

1 个解决方案

您可以像这样从表中读取...

val mydf = hiveContext.sql("select * from hive_table_name")

mydf.write.save.format("com.databricks.spark.csv").option("header", "true").save(hdfs_path_to_save)

如果在Spark 2.0之前的版本中，这是您需要的CSV解析器的帮助https://github.com/databricks/spark-csv

将scala-spark文件编译为jar文件

[英]compile scala-spark file to jar file

如何从 IBM DSX Scala-Spark Notebook 访问文本文件

[英]How to Access a Text File from IBM DSX Scala-Spark Notebook

scala-spark数组映射

[英]scala-spark Array mapping

更新来自两个Data Frame Scala-Spark的数据

[英]Update data from two Data Frames Scala-Spark

从Spark读取Hive表作为数据集

[英]Reading Hive table from Spark as a Dataset

Scala Spark Sql - 从 Hive 行读取 null 值

[英]Scala Spark Sql - Reading null values from a Hive row

用Scala-Spark中的行平均值填充Nan

[英]Fill Nan with mean of the row in Scala-Spark

在Scala-Spark中进行Maven构建时出错

[英]Error during maven build in Scala-Spark

Scala-Spark：将数据帧转换为RDD [Edge]

[英]Scala-Spark: Convert Dataframe to RDD[Edge]

选择列RDD scala-spark

[英]Selecting column RDD scala-spark

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 将scala-spark文件编译为jar文件如何从 IBM DSX Scala-Spark Notebook 访问文本文件 scala-spark数组映射更新来自两个Data Frame Scala-Spark的数据从Spark读取Hive表作为数据集 Scala Spark Sql - 从 Hive 行读取 null 值用Scala-Spark中的行平均值填充Nan 在Scala-Spark中进行Maven构建时出错 Scala-Spark：将数据帧转换为RDD [Edge] 选择列RDD scala-spark

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM