繁体   English   中英

如何在Pandas中使用quotechar从DAT文件读取和写入刺字符?

[英]How do I read and write the thorn character from a DAT file using quotechar in Pandas?

请在下面查看我的代码。 该代码可以正常工作,但是输出的DAT文件缺少þ(拉丁文小写字母THORN)字符。

import pandas as pd

inputdat = "C:/Downloads/Python/SAMPLEDATA.dat"
outputdat = "C:/Downloads/Python/Output.dat"

colnames = ["ID", "Company", "Employee", "Salary", 'Years']
df = pd.read_csv(inputdat, names = colnames, header = None, skiprows = 1, encoding='UTF-8', quotechar='\xfe', sep='\x14', engine='python')
filter = ['UID_001', 'UID_002']

df.loc[df.ID.isin(filter), ['Salary', 'Years']] = ""

df.to_csv(outputdat, quotechar='\xfe', sep='\x14', index=False, encoding='UTF-8')

如何确保输出数据中包含刺符号?

样品输入: https : //imgur.com/vUWCRfF

当前输出: https : //imgur.com/sUlsy87

期望的输出: https : //imgur.com/UnX0j43

注意:对于以图像形式发布示例输入和输出,我深表歉意。 否则分隔符和引号字符无法正确显示。

您似乎面临的问题是,由于默认的报价规则是csv.QUOTE_MINIMAL所以没有添加引号(刺字符)。 看起来像你想要csv.QUOTE_ALL

import csv

df.to_csv(outputdat, quotechar='\xfe', sep='\x14', quoting=csv.QUOTE_ALL,
          index=False, encoding='UTF-8')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM