如何在Python Pandas中將dtype從object轉換為int？

Question

我有一個數據文件，當我在df.dtypes上運行df.dtypes時，它表示該類型是一個對象，但要繪制它需要是一個integer ， float ， double float等。數據實際上由三列數字組成，像這樣：

123 12345 0.9484 
123 12345 0.8746 
123 12345 0.4838 
123 12345 0.4837

如何轉換數據以便可以使用pandas進行繪制？

Answer 1

我認為您可以使用帶有參數的read_csv ： sep='\\s+' （任意空格）和engine='python' （因為警告）：

import pandas as pd
import io

temp=u"""Day Time Usage
123 12345 0.9484
123 12345 0.8746
123 12345 0.4838
123 12345 0.4837"""
#after testing replace io.StringIO(temp) to filename
df = pd.read_csv(io.StringIO(temp), sep='\s+', engine='python')

print df
   Day   Time   Usage
0  123  12345  0.9484
1  123  12345  0.8746
2  123  12345  0.4838
3  123  12345  0.4837

print df.dtypes
Day        int64
Time       int64
Usage    float64
dtype: object

print df.index
Int64Index([0, 1, 2, 3], dtype='int64')

Answer 2

`pandas.read_csv`數據類型轉換

這個答案假設你有matplotlib庫，你在iPython中計算，你的文件是csv -ish。

%matplotlib inline
import pandas as pd
from cStringIO import StringIO

fake_csv = '''123 12345 0.9484
123 12345 0.8746
123 12345 0.4838
123 12345 0.4837'''

# Create data frame, fake csv for example only
# normally you would use pd.read_csv('/path/to/file.csv', ...)
df = pd.read_csv(StringIO(fake_csv), sep='\s+', header=None)

print 'DataFrame:\n{}\n\nData Types:\n{}'.format(df, df.dtypes)

df.plot()

DataFrame:
     0      1       2
0  123  12345  0.9484
1  123  12345  0.8746
2  123  12345  0.4838
3  123  12345  0.4837

Data Types:
0      int64
1      int64
2    float64
dtype: object

_{注意：最后一個dtype:object是df.dtypes Series的數據類型，而不是df類型的數據類型。}

如何在Python Pandas中將dtype從object轉換為int？

問題描述

2 個解決方案

解決方案1
0 2016-03-13 18:55:42

解決方案2
0 已采納 2016-03-13 19:01:46

`pandas.read_csv`數據類型轉換

如何在Python Pandas中將dtype從object轉換為int？

問題描述

2 個解決方案

解決方案1 0 2016-03-13 18:55:42

解決方案2 0 已采納 2016-03-13 19:01:46

pandas.read_csv數據類型轉換

解決方案1
0 2016-03-13 18:55:42

解決方案2
0 已采納 2016-03-13 19:01:46

`pandas.read_csv`數據類型轉換