[英]To make a variable or column name an object in Spark
在带有scala的Spark中,是否有任何简单的方法可以自动将变量或列从导入的数据转换为对象,因此我们可以在.map()内部使用column_a.contains("something")
本身?
看来您来自R。Spark是面向行而不是面向列的。 例如,如果要进行contains
,则首先要filter
行,然后对其apply
映射,或者使用一次collect
并同时执行这两项操作,但这很难做到。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.