如果列的字符串值包含特定模式，如何从 pandas 数据帧中提取整行

Question

我有以下数据框，其中“名称”列的值中有一个模式“///”

data = [['a1','yahoo', 'apple'], ['a2','gma///il', 'mango'], ['a3','amazon', 'papaya'], 
['a4','bi///ng', 'guava']] 
df = pd.DataFrame(data, columns = ['ID', 'Name', 'Info'])

如果列“名称”的值中包含模式“///”，我需要从该数据框中提取整行。 我尝试了以下代码，但得到了一个空的 dataframe。

new_df = df.loc[df['Name'] == '///']

我预期的 output 应该给我这样的数据框：

data_new = [['a2','gma///il', 'mango'],['a4','bi///ng', 'guava']] 
new_df = pd.DataFrame(data, columns = ['ID', 'Name', 'Info'])  
print(new_df)

Answer 1

使用Series.str.contains ：

import pandas as pd

data = [['a1','yahoo', 'apple'], ['a2','gma///il', 'mango'],
        ['a3','amazon', 'papaya'],['a4','bi///ng', 'guava']]

df = pd.DataFrame(data, columns = ['ID', 'Name', 'Info'])

print (df[df["Name"].str.contains("///")])

#
   ID      Name   Info
1  a2  gma///il  mango
3  a4   bi///ng  guava

Answer 2

如果要过滤特定的一列，请使用此解决方案

import numpy as np
immport pandas as pd

data = [['a1','yahoo', 'apple'], ['a2','gma///il', 'mango'], ['a3','amazon', 'papaya'], 
['a4','bi///ng', 'guava']] 
df = pd.DataFrame(data, columns = ['ID', 'Name', 'Info']) 

mask = np.column_stack([df['Name'].str.contains(r"\///", na=False)]) 
df.loc[mask.any(axis=1)]

Output：

   ID      Name   Info
1  a2  gma///il  mango
3  a4   bi///ng  guava

如果您需要对某些模式的所有列进行过滤，请参阅以下解决方案

import numpy as np
mask = np.column_stack([df[col].str.contains(r"\///", na=False) for col in df]) 
df.loc[mask.any(axis=1)]

Output：

   ID      Name   Info
1  a2  gma///il  mango
3  a4   bi///ng  guava

Answer 3

DataFrame有字符串 function contains()为此

 new_df = df[ df['Name'].str.contains('///') ]

如果列的字符串值包含特定模式，如何从 pandas 数据帧中提取整行

问题描述

3 个解决方案

解决方案1
2 已采纳 2019-10-12 06:51:02

解决方案2
0 2019-10-12 07:00:07

解决方案3
0 2019-10-12 07:27:52

如果列的字符串值包含特定模式，如何从 pandas 数据帧中提取整行

问题描述

3 个解决方案

解决方案1 2 已采纳 2019-10-12 06:51:02

解决方案2 0 2019-10-12 07:00:07

解决方案3 0 2019-10-12 07:27:52

解决方案1
2 已采纳 2019-10-12 06:51:02

解决方案2
0 2019-10-12 07:00:07

解决方案3
0 2019-10-12 07:27:52