[英]How to convert a csv file to an avro file using PySpark?
我在谷歌雲平台工作,我正在嘗試使用 Pyspark 將 csv 文件轉換為 avro 文件。 我看過很多網站,但我無法實現解決方案。 先感謝您。 :)
您可以使用 spark 將 csv 文件讀入數據集/數據框,並使用 databricks 庫將其編寫為 avro。 就像是:
dataset.write.format("com.databricks.spark.avro").save("你的 output 路徑")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.