繁体 English 中英

Scala- Databricks- 线性回归

[英]Scala- Databricks- Linear Regression

原文 2021-07-10 16:18:20 6 1 scala/ linear-regression/ databricks/ categorical-data

有人可以向我解释以下代码行的含义（在 scala-databricks 中）

val categoricalIndexers = categoricalVariables
  .map(i => new StringIndexer().setHandleInvalid("skip").setInputCol(i)
                .setOutputCol(i+"Index"))

1 个解决方案

StringIndexer的目的是将标签的字符串列映射到标签索引的 ML 列（有关更多详细信息和代码，请参阅Apache Spark 的文档（。
您可以使用setHandleInvalid来选择如何使用StringIndexer处理看不见的标签。 如果您选择“跳过”设置，包含未见过标签的行将被跳过（从输出中删除）。
而代码.setInputCol(i)和.setOutputCol(i+"Index")结尾的目的是索引字符串变量并返回索引变量； 索引变量的名称是原始字符串变量的名称+“索引”。 例如，让我们使用字符串变量“City”。 一旦字符串变量被索引，索引变量的名称将是 CityIndex。

您可以使用以下几行索引数据集的所有字符串变量：

var categoricalCols = DataSet.dtypes.filter(_._2 == "StringType").map(_._1) 

var indexOutputCols = categoricalCols.map(_ + "_Index")

// Handle string variables
var stringIndexer = new StringIndexer()
                        .setInputCols(categoricalCols)
                        .setOutputCols(indexOutputCols)
                        .setHandleInvalid("skip")

索引变量具有原始名称+“_indexed”。

Databricks- 将 Python DataFrame 转换为 Scala DataFrame

[英]Databricks- Convert Python DataFrame to Scala DataFrame

Scala- zip with future

[英]Scala- zip with futures

用于Int的Scala-operator重载

[英]Scala- operator overloading for an Int

Intellij Scala-无法找到Scala应用

[英]Intellij Scala- unable to find Scala App

Scala-建立3位成员的元组集合

[英]Scala- Build collection of tuples of 3 members

Scala-从字符串创建地图

[英]Scala- creating a map from string

将列表传递给sc.textFile -scala-

[英]Passing list to sc.textFile -scala-

Scala-使用foreach将文件写入文件

[英]Scala- writing list to file using foreach

Scala中的多态方法-为什么允许这样做？

[英]Polymorphic Methods in Scala- why is this allowed?

查找 scala 程序使用的隐式执行上下文的 scalaways

[英]scala- ways to find implicit execution context in use by a scala program

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Databricks- 将 Python DataFrame 转换为 Scala DataFrame Scala- zip with future 用于Int的Scala-operator重载 Intellij Scala-无法找到Scala应用 Scala-建立3位成员的元组集合 Scala-从字符串创建地图将列表传递给sc.textFile -scala- Scala-使用foreach将文件写入文件 Scala中的多态方法-为什么允许这样做？查找 scala 程序使用的隐式执行上下文的 scalaways

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM