簡體   English   中英

無法使用Pandas從Python 2.7中的.XLSX解析字符串“ N / A”

[英]Can't parse string “N/A” from .XLSX in Python 2.7 with pandas

我有一個很大的Excel電子表格,我試圖將其解析為Python2.7和pandas 0.19.1,以將數據插入MySQL數據庫。 作為其一部分,某些單元格包含字符串“ N / A”。 不幸的是,熊貓似乎無法解析“ N / A”,而是導入了nan。 當在字符串周圍包含單引號或雙引號時,pandas分別將其導入為“ N / A”和“ N / A”,但與我的數據不匹配。

是否可以在不修改現有數據的情況下讀取字符串“ N / A”?

隨后是MWE,包括指向GitHub上的測試數據文件的鏈接:

import pandas as pd
loadData = pd.ExcelFile("testData.xlsx")
testData = loadData.parse("Sheet1")

for row in testData.itertuples(index=True, name='testTuple'):     
    if getattr(row, "Value") == "N/A":
        print(row)

鏈接到測試數據文件: https : //github.com/quacksawbones/testData/blob/master/testData.xlsx

(注意:有關StackOverflow的第一個問題。請讓我知道是否錯過了任何事情或需要更多信息)

根據我對您問題的理解,您想將NaN替換為“ N / A”,如果需要,您可以使用fillna方法,

df=df.fillna('N/A')

如果這不是您的要求,請向我明確解釋您的需求...。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM