[英]Build a RDD LabeledPoint from a Spark RDD object on scala
我想从RDD
对象构建RDD[LabeledPoint]
,RDD对象如下:
+-------------------+---------+--------------+--------+-------+
| date_time|site_name|posa_continent|year |label |
+-------------------+---------+--------------+--------+-------+
|2014-08-11 07:46:59| 2| 3|2014 |1 |
|2014-08-11 08:22:12| 2| 3|2014 |2 |
|2015-08-11 08:24:33| 2| 3|2015 |1 |
|2016-08-09 18:05:16| 2| 3|2016 |3 |
|2011-08-09 18:08:18| 2| 3|2011 |2 |
|2009-08-09 18:13:12| 2| 3|2009 |1 |
|2014-07-16 09:42:23| 2| 3|2014 |1 |
+-------------------+---------+--------------+--------+-------+
我想构造一个带有label
属性的RDD[LabeledPoint]
,以便应用KNN机器学习算法。 我使用Spark Scala API。
在RDD上尝试map
功能:
rddsObject.map(object => LabeledPoint(object.label, Vectors.dense(object.site_name,object.posa_continent,object.year))
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.