繁体   English   中英

解码 CSV 文件

[英]Decoding CSV file

df=pandas.read_csv("commaSeperated.csv") 将 csv 文件导入 pandas,但查看 pandas.columns 文件格式我得到了这个

在此处输入图像描述

用 pandas.head() 查看文件的头部我得到了这个文件 output

在此处输入图像描述

现在我的问题是,我有什么办法可以 output 一个没有这些字符的正确 CSV 文件

这是它在记事本++ "003 ""|"" ""|"" ""|""7105926 ""|"" ""|"" ""|"" ""|"" ""|"" 中的样子""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|""绿色 ""|"" ""|"" ""|""24-APR-20""|""GH20200071398001DK ""|"" ""|"" ""|"" ""| ""TNMSCA12 ""|"" ""|""

您的初始文件不是正确的 csv 格式。 长话短说,唯一合理的做法是让该恐怖片的制作人修复格式。 如果不可能,可以使用 csv 模块尝试通过每行解码一次并输出第一个也是唯一一个字段来修复它:

import csv

with open("commaSeperated.csv") as fdin, open("fixed.csv", newline="\r\n") as fdout:
    rd = csv.reader(fdin, delimiter='|', quotechar='"')
    for row in rd:
        print(row[0], file=fdout)

完成后,您可以尝试将其加载到 pandas DataFrame 中:

df = pd.read_csv("fixed.csv", sep=r"\|")

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM