[英]Replace **NULL** values in Pandas dataframe
我在這里拔頭發。 我需要替換pandas dataframe列中的空值。 這些具體是空值,而不是NaN值。
我試過了:
trainData['Embarked'].replace(trainData['Embarked'].isnull, embarkedMost, regex=True)
trainData['Embarked'].replace('', embarkedMost, regex=True)
trainData['Embarked'].replace('', embarkedMost, regex=True, inplace=True)
trainData['Embarked'].str.replace('', embarkedMost, regex=True)
trainData['Embarked'].isnull().replace(np.nan, embarkedMost, regex=True)
trainData['Embarked'].fillna(embarkedMost)
trainData['Embarked'].str.replace(np.Nan, embarkedMost, regex=True)
trainData['Embarked'].str.replace(pd.isnull, embarkedMost, regex=True)
trainData['Embarked'].replace(r'^\s+$', embarkedMost, regex=True, inplace=True)
然后:
trainData.to_csv(os.path.join(os.path.dirname(__file__), 'full.csv'), sep=',')
之后,我將數據集加載到excel中進行檢查,但是這些都沒有改變數據集。
這為我提供了正確的空值索引:
print(np.where(pd.isnull(trainData['Embarked'])))
我想與lambda一起使用apply,但閱讀到它效率極低。
沒關系
解決:
trainData['Embarked'] = trainData['Embarked'].fillna(embarkedMost)
我想我可能已經在其他目錄中打開了一個csv
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.