Python Pandas read_csv dtype 無法將“字符串”轉換為“float64”

Question

我有一個標題 = "col1" 和 5 個值的 csv 文件

我打算將其設置為熊貓中的數字 col 所以我寫了

import pandas as pd
data = pd.read_csv(r'\test1.csv', dtype = {'col1': 'float64'})

但錯誤消息 ValueError: 無法將字符串轉換為浮點數：'/N'

上面的代碼在沒有斜線的情況下工作正常，最后一行將變成“Nan”。 但是在不改變我的原始數據值的情況下，有沒有辦法抑制“斜線”並使代碼運行？

Answer 1

嘗試使用 error_bad_lines=False：

data = pd.read_csv(r'\test1.csv', dtype = {'col1': 'float64'}, error_bad_lines=False)

Answer 2

數據 = pd.read_csv(r'\\test1.csv', dtype = {'col1': 'float64'}, na_values=[r'/N'])

根據docs ， na_values 參數是一個類似列表的字符串結構，可以識別為 NaN。

Answer 3

您可以使用converters ，使用errors='coerce'轉換為NaN ：

def convert_float(val):
    return pd.to_numeric(val, errors='coerce')

df = pd.read_csv('test.csv', converters={'col1': convert_float})
print(df)

     col1
0   398.0
1  5432.0
2  5986.0
3  8109.0
4     NaN

Python Pandas read_csv dtype 無法將“字符串”轉換為“float64”

問題描述

3 個解決方案

解決方案1
1 2020-09-26 16:41:20

解決方案2
1 已采納 2020-09-26 16:46:14

解決方案3
0 2020-09-26 16:53:15

Python Pandas read_csv dtype 無法將“字符串”轉換為“float64”

問題描述

3 個解決方案

解決方案1 1 2020-09-26 16:41:20

解決方案2 1 已采納 2020-09-26 16:46:14

解決方案3 0 2020-09-26 16:53:15

解決方案1
1 2020-09-26 16:41:20

解決方案2
1 已采納 2020-09-26 16:46:14

解決方案3
0 2020-09-26 16:53:15