
[英]How to use java.String.format in Scala?
我正在尝试使用字符串的.format方法。 但是如果我在字符串中放置%1,%2等,则会抛出java.util.UnknownFormatConversionException指向令人困惑的Java源代码段: 据我所知, % char是被禁止的。 如果是这样,那么我应该将什么用于参数占 ...
[英]How to use java.String.format in Scala?
我正在尝试使用字符串的.format方法。 但是如果我在字符串中放置%1,%2等,则会抛出java.util.UnknownFormatConversionException指向令人困惑的Java源代码段: 据我所知, % char是被禁止的。 如果是这样,那么我应该将什么用于参数占 ...
[英]How can I change column types in Spark SQL's DataFrame?
假设我正在做类似的事情: 但我真的希望year为Int (可能还转换其他一些列)。 我能想到的最好的是 这有点令人费解。 我来自 R,我习惯于能够写,例如 我可能遗漏了一些东西,因为在 Spark/Scala 中应该有更好的方法来做到这一点...... ...
[英]Spark - load CSV file as DataFrame?
我想在 spark 中读取 CSV 并将其转换为 DataFrame 并使用df.registerTempTable("table_name")将其存储在 HDFS 中 我试过了: 我得到的错误: 在 Apache Spark 中将 CSV 文件加载为 DataFrame 的正确命令是什么? ...
[英]How to show full column content in a Spark Dataframe?
我正在使用 spark-csv 将数据加载到 DataFrame 中。 我想做一个简单的查询并显示内容: col 似乎被截断了: 如何显示列的全部内容? ...
[英]Editor does not contain a main type
刚刚浏览了 Scala 网站上的示例 Scala 代码,但在尝试运行时遇到了令人讨厌的错误。 这是代码: http : //www.scala-lang.org/node/45 。 在 Eclipse 上运行它时,我收到这条消息“编辑器不包含主类型”,阻止它运行。 有什么我需要做的...即将该文 ...
[英]How to convert rdd object to dataframe in spark
如何将 RDD( org.apache.spark.rdd.RDD[org.apache.spark.sql.Row] )转换为数据帧org.apache.spark.sql.DataFrame 。 我使用.rdd将数据帧转换为 rdd 。 处理后我希望它回到数据框中。 我怎样才能做到这一点 ? ...
[英]Write single CSV file using spark-csv
我正在使用https://github.com/databricks/spark-csv ,我正在尝试编写一个 CSV,但不能,它正在创建一个文件夹。 需要一个 Scala 函数,它将采用路径和文件名等参数并写入该 CSV 文件。 ...
[英]Get item in the list in Scala?
在 Scala 中,如何从 List 中的索引i处获取一个元素? 我试过get(i)和[i] - 没有任何效果。 谷歌搜索只返回如何“找到”列表中的元素。 但是我已经知道元素的索引了! 这是无法编译的代码: 查看List api无济于事,因为我的眼睛只是交叉。 ...
[英]How to print the contents of RDD?
我正在尝试将集合的内容打印到 Spark 控制台。 我有一个类型: 我使用命令: 但这是打印的: res1:org.apache.spark.rdd.RDD[Unit] = MappedRDD[4] at map at :19 如何将 RDD 写入控制台或将其保存到磁盘以便查看 ...
[英]Appending an element to the end of a list in Scala
我无法将T<\/code>类型的元素添加到列表List[T]<\/code>中。 我尝试使用myList ::= myElement<\/code>但它似乎创建了一个奇怪的对象并且访问myList.last<\/code>总是返回放入列表中的第一个元素 ...
[英]Extract column values of Dataframe as List in Apache Spark
我想将数据框的字符串列转换为列表。 我可以从Dataframe API 中找到 RDD,所以我尝试先将其转换回 RDD,然后将toArray函数应用于 RDD。 在这种情况下,长度和 SQL 工作得很好。 然而,我从 RDD 得到的结果在每个元素周围都有方括号[A00001] 。 我想知道是否有适当 ...
[英]Running Java gives "Error: could not open `C:\Program Files\Java\jre6\lib\amd64\jvm.cfg'"
经过多年的正常工作,我在尝试启动 JVM 时突然收到此消息: 我尝试卸载,并收到一条消息,说缺少 DLL(未指定) 尝试重新安装,但无济于事。 同时,当尝试启动 Scala 时,我得到: 检查%JAVA_HOME%和%path% - 都可以谁能帮忙? ...
[英]Read entire file in Scala?
在 Scala 中将整个文件读入内存的简单而规范的方法是什么? (理想情况下,可以控制字符编码。) 我能想到的最好的是: 或者我是否应该使用Java 的一种非常糟糕的习语,其中最好的(不使用外部库)似乎是: 通过阅读邮件列表讨论,我不清楚 scala.io.Source 甚至应该是规范的 ...
[英]how to filter out a null value from spark dataframe
我使用以下架构在 spark 中创建了一个数据框: 数据如下所示: 我想过滤掉“friend_id”字段中具有空值的行。 我得到 :res52: Long = 0 这显然是不对的。 获得它的正确方法是什么? 还有一个问题,我想替换friend_id 字段中的值。 我想用 0 和 1 替 ...
[英]How do I break out of a loop in Scala?
我如何打破一个循环? 如何将嵌套的 for 循环转换为尾递归? 来自 FOSDEM 2009 的 Scala Talk http://www.slideshare.net/Odersky/fosdem-2009-1013261第 22 页: 中断并继续 Scala 没有它们。 为什么? ...
[英]Difference between object and class in Scala
我刚刚浏览了 Internet 上的一些 Scala 教程,并注意到在一些示例中,在示例的开头声明了一个对象。 Scala 中的class和object什么区别? ...
[英]How to save DataFrame directly to Hive?
是否可以将DataFrame中的DataFrame直接保存到 Hive? 我尝试将DataFrame转换为Rdd ,然后另存为文本文件,然后加载到 hive 中。 但我想知道是否可以直接将dataframe保存到配置单元 ...
[英]Renaming column names of a DataFrame in Spark Scala
我正在尝试在 Spark-Scala 中转换DataFrame所有标题/列名称。 到目前为止,我想出了以下代码,它只替换了一个列名。 ...
[英]Task not serializable: java.io.NotSerializableException when calling function outside closure only on classes not objects
在闭包外调用函数时出现奇怪的行为: 当函数在一个对象中时,一切正常 当函数在一个类中时 get : 任务不可序列化:java.io.NotSerializableException:测试 问题是我需要在类中而不是对象中的代码。 知道为什么会这样吗? Scala 对象是否序列化(默 ...
[英]How to create an empty DataFrame with a specified schema?
我想在 Scala 中使用指定的模式在DataFrame上创建。 我曾尝试使用 JSON 读取(我的意思是读取空文件),但我认为这不是最佳做法。 ...