繁体 English 中英

阿帕奇猪在火花

[英]Apache pig on spark

原文 2014-08-16 05:41:04 2 1 hadoop/ cassandra/ apache-pig/ apache-spark

我正在使用hadoop2.2.0，cassandra2.0.6，pig0.12和spark1.0.1。 我正在使用CassandraStorage处理程序使用Pig从Cassandra读取数据，并进行了分析操作。 我知道spark接受hadoop输入格式（pig）数据，所以我想通过Pig查询将读取的数据传递给spark。 我该怎么做呢？

1 个解决方案

您可以将数据存储在HDFS中，然后从Spark读取数据。 Spark实际上是从HDFS读取的。 如果在Spark中使用名称而不是索引（在Pig中作为别名），则可以创建案例类以提供名称。

Apache PIG，JSON加载程序

[英]Apache PIG, JSON Loader

Apache Pig权限问题

[英]Apache Pig permissions issue

Apache Pig 中的连接错误

[英]Connection Error in Apache Pig

Apache PIG-GROUP BY

[英]Apache PIG - GROUP BY

加入Apache Pig

[英]JOIN in Apache Pig

apache pig count sort

[英]apache pig count sort

等同于Select的Apache Pig *

[英]Apache Pig Equivalent of Select *

使用Apache Pig进行日志分析

[英]Log analysis with Apache Pig

Apache Pig 的工资总额

[英]Sum of Salary in Apache Pig

Apache Pig分位数分组

[英]Apache Pig Quantile Grouping

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Apache PIG，JSON加载程序 Apache Pig权限问题 Apache Pig 中的连接错误 Apache PIG-GROUP BY 加入Apache Pig apache pig count sort 等同于Select的Apache Pig * 使用Apache Pig进行日志分析 Apache Pig 的工资总额 Apache Pig分位数分组

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM