繁体   English   中英

使用pandas从csv文件中读回元组

[英]Reading back tuples from a csv file with pandas

使用pandas,我已经向csv文件导出了一个数据帧,其单元格包含字符串元组。 生成的文件具有以下结构:

index,colA
1,"('a','b')"
2,"('c','d')"

现在我想用read_csv读回来。 无论我尝试什么,pandas都会将值解释为字符串而不是元组。 例如:

In []: import pandas as pd
       df = pd.read_csv('test',index_col='index',dtype={'colA':tuple})
       df.loc[1,'colA']
Out[]: "('a','b')"

有没有办法告诉大熊猫做正确的事情? 优选地,不对数据帧进行大量后处理:实际表具有5000行和2500列。

将元组存储在列中通常不是一个好主意; 使用Series和DataFrames的许多优点都会丢失。 也就是说,您可以使用converters对字符串进行后处理:

>>> df = pd.read_csv("sillytup.csv", converters={"colA": ast.literal_eval})
>>> df
   index    colA
0      1  (a, b)
1      2  (c, d)

[2 rows x 2 columns]
>>> df.colA.iloc[0]
('a', 'b')
>>> type(df.colA.iloc[0])
<type 'tuple'>

但我可能会在源头改变一切,以避免首先存储元组。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM