![](/img/trans.png)
[英]NoSuchFieldException while creating a spark session using builder
[英]Issue while creating JavaPairrRDD using spark
我有以下格式的数据
Product1
somelines...
Iteam1
Iteam2
Product1
somelines....
Iteam1
Iteam3
我需要配对
(Product1:Item1,Item2)
(Product1:Item1,Item3)
我尝试使用以下Java代码创建它(已更新,以进一步了解)
public static void main(String[] args) {
SparkConf sparkConf = new SparkConf().setAppName("Analyzer").setMaster("local[2]").set("sparkexecutor","1g");
JavaSparkContext ctx = new JavaSparkContext(sparkConf);
JavaPairRDD<String,String> lines = fetchProductData(ctx);
static JavaPairRDD<String, String> fetchProductData(JavaSparkContext ctx) {
JavaRDD<String> productLines = ctx.textFile("C:\\Service.log", 1);
System.out.println("called" + productLines);
JavaRDD<String[]> productLineMap = productLines.map(new Function<String, String[]>() {
String productname = "";
@Override
public String[] call(String s) throws Exception {
System.out.println("test"+s);
Matcher m = PRODUCTREGEX.matcher(s);
if(m.find()){
productname = m.group(1);
System.out.println("productname"+productname);
}
return s.split("\t");
}
});
JavaPairRDD<String, String> productMapKey = productLineMap.mapToPair(new PairFunction<String[], String, String>() {
@Override
public Tuple2<String, String> call(String[] strings) throws Exception {
String[] dataArray = strings[0].split(",");
String date_s = dataArray[5];
return new Tuple2<String, String>(dataArray[4], "product");
}
});
return productMapKey;
}
}
但是我的代码中的这个语句都没有执行
System.out.println("test"+s);
谁能帮我创造一对。 我正在使用Java
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.