簡體   English   中英

Pandas - 如何識別系列中的“nan”值

[英]Pandas - How to identify `nan` values in a Series

我目前正在玩 Kaggle 泰坦尼克號數據集 (train.csv)

  1. 我可以很好地加載數據。
  2. 我知道Embarked列中的某些數據具有nan值。 但是當我嘗試使用以下代碼過濾它時,我得到一個空數組
    import pandas as pd
    df = df.read_csv(<file_loc>, header=0)
    df[df.Embarked == 'nan']

我嘗試導入numpy.nan來替換上面的字符串nan 但它不起作用。

我要查找的是所有不是“S”、“C”、“Q”的單元格。

后來也意識到.... nan是使用type(df.Embarked.unique()[-1])的 Float 類型。 有人可以幫助我了解如何識別那些nan細胞嗎?

NaN用於表示缺失值。

  • 要找到它們,請使用.isna()

    檢測缺失值。

  • 要替換它們,請使用.fillna(value)

    填充 NA/NaN 值

col系列中的一些示例:

>>> col
0    1.0
1    NaN
2    2.0
dtype: float64
>>> col[col.isna()]
1   NaN
dtype: float64
>>> col.index[col.isna()]
Int64Index([1], dtype='int64')
>>> col.fillna(-1)
0    1.0
1   -1.0
2    2.0
dtype: float64

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM