無法使用Pandas從Python 2.7中的.XLSX解析字符串“ N / A”

Question

我有一個很大的Excel電子表格，我試圖將其解析為Python2.7和pandas 0.19.1，以將數據插入MySQL數據庫。 作為其一部分，某些單元格包含字符串“ N / A”。 不幸的是，熊貓似乎無法解析“ N / A”，而是導入了nan。 當在字符串周圍包含單引號或雙引號時，pandas分別將其導入為“ N / A”和“ N / A”，但與我的數據不匹配。

是否可以在不修改現有數據的情況下讀取字符串“ N / A”？

隨后是MWE，包括指向GitHub上的測試數據文件的鏈接：

import pandas as pd
loadData = pd.ExcelFile("testData.xlsx")
testData = loadData.parse("Sheet1")

for row in testData.itertuples(index=True, name='testTuple'):     
    if getattr(row, "Value") == "N/A":
        print(row)

鏈接到測試數據文件： https : //github.com/quacksawbones/testData/blob/master/testData.xlsx

（注意：有關StackOverflow的第一個問題。請讓我知道是否錯過了任何事情或需要更多信息）

Answer 1

根據我對您問題的理解，您想將NaN替換為“ N / A”，如果需要，您可以使用fillna方法，

df=df.fillna('N/A')

如果這不是您的要求，請向我明確解釋您的需求...。

無法使用Pandas從Python 2.7中的.XLSX解析字符串“ N / A”

問題描述

1 個解決方案

解決方案1
1 2017-07-27 06:40:06

無法使用Pandas從Python 2.7中的.XLSX解析字符串“ N / A”

問題描述

1 個解決方案

解決方案1 1 2017-07-27 06:40:06

解決方案1
1 2017-07-27 06:40:06