使用pandas從csv文件中讀回元組

Question

使用pandas，我已經向csv文件導出了一個數據幀，其單元格包含字符串元組。 生成的文件具有以下結構：

index,colA
1,"('a','b')"
2,"('c','d')"

現在我想用read_csv讀回來。 無論我嘗試什么，pandas都會將值解釋為字符串而不是元組。 例如：

In []: import pandas as pd
       df = pd.read_csv('test',index_col='index',dtype={'colA':tuple})
       df.loc[1,'colA']
Out[]: "('a','b')"

有沒有辦法告訴大熊貓做正確的事情？ 優選地，不對數據幀進行大量后處理：實際表具有5000行和2500列。

Answer 1

將元組存儲在列中通常不是一個好主意; 使用Series和DataFrames的許多優點都會丟失。 也就是說，您可以使用converters對字符串進行后處理：

>>> df = pd.read_csv("sillytup.csv", converters={"colA": ast.literal_eval})
>>> df
   index    colA
0      1  (a, b)
1      2  (c, d)

[2 rows x 2 columns]
>>> df.colA.iloc[0]
('a', 'b')
>>> type(df.colA.iloc[0])
<type 'tuple'>

但我可能會在源頭改變一切，以避免首先存儲元組。

使用pandas從csv文件中讀回元組

問題描述

1 個解決方案

解決方案1
11 已采納 2014-05-14 18:02:29

使用pandas從csv文件中讀回元組

問題描述

1 個解決方案

解決方案1 11 已采納 2014-05-14 18:02:29

解決方案1
11 已采納 2014-05-14 18:02:29