[英]How do I read and write the thorn character from a DAT file using quotechar in Pandas?
请在下面查看我的代码。 该代码可以正常工作,但是输出的DAT文件缺少þ(拉丁文小写字母THORN)字符。
import pandas as pd
inputdat = "C:/Downloads/Python/SAMPLEDATA.dat"
outputdat = "C:/Downloads/Python/Output.dat"
colnames = ["ID", "Company", "Employee", "Salary", 'Years']
df = pd.read_csv(inputdat, names = colnames, header = None, skiprows = 1, encoding='UTF-8', quotechar='\xfe', sep='\x14', engine='python')
filter = ['UID_001', 'UID_002']
df.loc[df.ID.isin(filter), ['Salary', 'Years']] = ""
df.to_csv(outputdat, quotechar='\xfe', sep='\x14', index=False, encoding='UTF-8')
如何确保输出数据中包含刺符号?
样品输入: https : //imgur.com/vUWCRfF
当前输出: https : //imgur.com/sUlsy87
期望的输出: https : //imgur.com/UnX0j43
注意:对于以图像形式发布示例输入和输出,我深表歉意。 否则分隔符和引号字符无法正确显示。
您似乎面临的问题是,由于默认的报价规则是csv.QUOTE_MINIMAL
所以没有添加引号(刺字符)。 看起来像你想要csv.QUOTE_ALL
:
import csv
df.to_csv(outputdat, quotechar='\xfe', sep='\x14', quoting=csv.QUOTE_ALL,
index=False, encoding='UTF-8')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.