![](/img/trans.png)
[英]Pandas drop_duplicates() not working after add a row to DataFrame when read from a csv file
[英]pandas add columns when read from a csv file
我想使用 pandas read_csv
从 CSV 文件中read_csv
。 CSV 文件没有列名。 当我使用 Pandas 读取 CSV 文件时,第一行默认设置为列。 但是当我使用df.columns = ['ID', 'CODE']
,第一行不见了。 我想添加,而不是替换。
df = pd.read_csv(CSV)
df
a 55000G707270
0 b 5l0000D35270
1 c 5l0000D63630
2 d 5l0000G45630
3 e 5l000G191200
4 f 55000G703240
df.columns=['ID','CODE']
df
ID CODE
0 b 5l0000D35270
1 c 5l0000D63630
2 d 5l0000G45630
3 e 5l000G191200
4 f 55000G703240
我认为您需要read_csv
参数names
:
df = pd.read_csv(CSV, names=['ID','CODE'])
名称:类似数组,默认无
要使用的列名称列表。 如果文件不包含标题行,那么您应该明确地传递 header=None。 除非 mangle_dupe_cols=True,这是默认值,否则不允许在此列表中重复。
您可以在读取 csv 文件本身时将列名传递为:
df = pd.read_csv(csv_path, names = ["ID", "CODE"])
在函数调用中使用names
参数自己添加列:
df = pd.read_csv(CSV, names=['ID','CODE'])
您同时需要: header=None
和names=['ID','CODE']
,因为您的 CSV 文件中没有列名/标签/标题:
df = pd.read_csv(CSV, header=None, names=['ID','CODE'])
添加额外索引列的原因是因为 to_csv() 默认写入一个索引,因此您可以在保存 CSV 时禁用索引:
df.to_csv('file.csv', index=False)
或者你可以在阅读时指定一个索引列:
df = pd.read_csv('file.csv', index_col=0)
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.