![](/img/trans.png)
[英]Apache Spark MLlib - getting LabeledPoint from data (Java)
[英]Is it possible to create an MLlib RDD<LabeledPoint> from a double[][] in Java?
我正在本地尝试使用MLLib中的“梯度增强”和“随机森林”。
我有一些数据想以二维双精度数组的形式传递给我的学习算法。 第一维指示行,第二列。 我还获得了具有相同长度的双精度数的一维数组中每一行的响应。
当然,有一种方法可以从这些变量创建RDD,以便可以在本地运行算法?
目前我能做的最好的,尽管我希望有更好的方法:
public static JavaRDD<LabeledPoint> makeMeAnRDD(double[][] X, double[] y, JavaSparkContext context)
{
assert(X.length == y.length);
List<LabeledPoint> xList = new LinkedList<LabeledPoint>();
// ivec <=> row number.
for (int ivec = 0; ivec < X.length; ivec++)
{
LabeledPoint x = new LabeledPoint(y[ivec], Vectors.dense(X[ivec]));
}
return context.parallelize(xList);
}
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.