Pandas：僅在數據幀的開頭和結尾刪除NaN

Question

我有一個像這樣的pandas DataFrame：

我想在開始和結束時切斷NaN （即僅保留從1950年到1954年的NaN值）。 我已經嘗試過.isnull()和dropna() ，但不知怎的，我找不到合適的解決方案。 有人可以幫忙嗎？

Answer 1

使用內置的first_valid_index和last_valid_index它們專門為此設計並切片你的df：

In [5]:

first_idx = df.first_valid_index()
last_idx = df.last_valid_index()
print(first_idx, last_idx)
df.loc[first_idx:last_idx]
1950 1954
Out[5]:
      sum
1950    5
1951    3
1952  NaN
1953    4
1954    8

Answer 2

這是一種方法。

import pandas as pd

# your data
# ==============================
df

      sum
1948  NaN
1949  NaN
1950    5
1951    3
1952  NaN
1953    4
1954    8
1955  NaN

# processing
# ===============================
idx = df.fillna(method='ffill').dropna().index
res_idx = df.loc[idx].fillna(method='bfill').dropna().index
df.loc[res_idx]

      sum
1950    5
1951    3
1952  NaN
1953    4
1954    8

Answer 3

這是Numpy的一種方法：

import numpy as np

x    = np.logical_not(pd.isnull(df))
mask = np.logical_and(np.cumsum(x)!=0, np.cumsum(x[::-1])[::-1]!=0)

In [313]: df.loc[mask['sum'].tolist()]

Out[313]:
      sum
1950    5
1951    3
1952  NaN
1953    4
1954    8

Pandas：僅在數據幀的開頭和結尾刪除NaN

問題描述

3 個解決方案

解決方案1
23 已采納 2015-07-20 08:12:25

解決方案2
2 2015-07-20 07:06:30

解決方案3
2 2015-07-20 08:20:53

Pandas：僅在數據幀的開頭和結尾刪除NaN

問題描述

3 個解決方案

解決方案1 23 已采納 2015-07-20 08:12:25

解決方案2 2 2015-07-20 07:06:30

解決方案3 2 2015-07-20 08:20:53

解決方案1
23 已采納 2015-07-20 08:12:25

解決方案2
2 2015-07-20 07:06:30

解決方案3
2 2015-07-20 08:20:53