子集 pandas dataframe 使用 function 應用於列/系列

Question

我有一個 pandas dataframe df ，我想根據通過某個 function Name is_valid()

import pandas as pd

data = [['foo', 10], ['baar', 15], ['baz', 14]]
df = pd.DataFrame(data, columns = ['name', 'age'])
df

    name    age
0   foo     10
1   baar    15
2   baz     14

function 檢查輸入字符串的長度是否為 3 並返回 True 或 False：

def is_valid(x):
    assert isinstance(x, str)
    return True if len(x) == 3 else False

我的目標是將df子集，其中 function 返回 True，這將返回 output

    name    age
0   foo     10
2   baz     14

以下語法返回錯誤； 如果 output 滿足條件，則將 function 應用於列（系列）的值並將 dataframe 子集的正確語法是什么= True？

df[is_valid(df['name'])]

Answer 1

嘗試：

df[df['name'].str.len()==3]

或將您的代碼與apply一起使用：

df[df['name'].apply(is_valid)]

Answer 2

使用Series.str.len和Series.eq作為掩碼：

df = df[df['name'].str.len().eq(3)]

或使用Series.apply自定義 function：

df = df[df['name'].apply(is_valid)]
print (df)
  name  age
0  foo   10
2  baz   14

子集 pandas dataframe 使用 function 應用於列/系列

問題描述

2 個解決方案

解決方案1
4 2021-04-06 04:47:42

解決方案2
3 已采納 2021-04-06 04:48:01

子集 pandas dataframe 使用 function 應用於列/系列

問題描述

2 個解決方案

解決方案1 4 2021-04-06 04:47:42

解決方案2 3 已采納 2021-04-06 04:48:01

解決方案1
4 2021-04-06 04:47:42

解決方案2
3 已采納 2021-04-06 04:48:01