簡體   English   中英

如何在不使用RDD的情況下將文本(.txt)文件寫入數據框並在控制台上打印

[英]How do i write a text(.txt) file to a dataframe without using RDDs and print it on a console

我想將.txt文件寫入數據框並在控制台上打印

我嘗試過以與通過數據幀將.csv文件打印到控制台相同的方式進行打印

def txtreader():DataFrame = {

val loadTxt=spark.read
            .format("txt")
  .option("header","true")
  .load("C:\\Users\\1591532\\Spark-Learning-Workspace\\Text Files\\abc.txt")

return loadTxt

我收到一個錯誤“無法找到數據源:txt”。

對於Spark 1.6及更高版本,可以使用csv數據源:

val df = spark.read.csv("file.txt")

對於您的情況,您還可以指定標題選項,分隔符等,例如:

val df = spark.read.option("header", "true").option("delimiter", ";").csv("file.txt")

請找到以下代碼以閱讀文本文件。

scala> spark.read.text("sample.txt")
res34: org.apache.spark.sql.DataFrame = [value: string]

scala> res34.show
+-----+
|value|
+-----+
|  abc|
+-----+

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM