![](/img/trans.png)
[英]How to remove quote characters around array when loading a csv in Python?
[英]How to not print out Quote characters when creating a CSV file in Python
我有一個使用Python在Azure Databrick中創建的CSV文件。 這是在獲取數據幀並從中生成CSV文件。 問題是,當數據幀中有一個空值時,輸出為2個雙引號,即“”,
示例輸出
L1Code L1 Desc1 L1 Desc2 L1 Desc3 L2Code
Beverage Beverage "" "" Drink Blends
這是我用來生成文件的代碼,其中df是已經創建的Pandas數據框。
from pyspark.sql import SQLContext
def createCsvFile(data, rootPath, filePath):
data.coalesce(1).write.mode("overwrite").format("com.databricks.spark.csv").option("header", "true").option("delimiter", "\t").option("quoteMode", "NONE").csv(rootPath + filePath + ".tmp")
fileList = dbutils.fs.ls(rootPath + filePath + ".tmp/")
for file in fileList:
if file.name.endswith("csv"):
filename = file.path
dbutils.fs.cp(filename, rootPath + filePath + ".txt")
dbutils.fs.rm(rootPath + filePath + ".tmp", recurse=True)
sqlCtx = SQLContext(sc)
data = sqlCtx.createDataFrame(df)
createCsvFile(data, '/mnt/adlsdata/Raw/Astute/', 'products')
我最終需要使用emptyValue選項來使ti工作
data.coalesce(1).write.mode("overwrite").format("com.databricks.spark.csv").option("header", "true").option("delimiter", "\t").option("quoteMode", "NONE").option("quote", u'\u0000').option("nullValue", "").option("emptyValue", "").csv(rootPath + filePath + ".tmp")
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.