Python Pandas：有没有办法根据列表中的字符串获取子集dataframe

Question

I am looking to make a subset df based on the string values in a list.我正在寻找基于列表中的字符串值的子集 df 。

A toy model example:以玩具 model 为例：

data = {'month': ['January','February','March','April','May','June','July','August','September','October','November','December'],
        'days_in_month': [31,28,31,30,31,30,31,31,30,31,30,31]
        }

df = pd.DataFrame(data, columns = ['month', 'days_in_month'])

summer_months = ['Dec', 'Jan', 'Feb']

contain_values = df[df['month'].str.contains(summer_months)] 
print (df)

This would fail because of contain_values = df[df['month'].str.contains(summer_months)]这会因为contain_values = df[df['month'].str.contains(summer_months)]

TypeError: unhashable type: 'list'

I know that contain_values = df[df['month'].str.contains('Dec')] works but I would like to return the new dataframe with the summer months in it.我知道contain_values = df[df['month'].str.contains('Dec')]有效，但我想返回带有夏季月份的新dataframe 。 Or even all the none summer months using the ~ function.甚至使用~的所有非夏季月份。

Thanks谢谢

Answer 1

>>> contain_values = df[df['month'].str.contains('|'.join(summer_months))]

>>> contain_values
       month  days_in_month
0    January             31
1   February             28
11  December             31

Answer 2

You can as well using what .str offers you:您也可以使用.str为您提供的内容：

df[df["month"].str[:3].isin(summer_months)]

OUTPUT OUTPUT

       month  days_in_month
0    January             31
1   February             28
11  December             31

You can make it more robust using something like this (in case names in the dataframe are not properly capitalized):您可以使用类似这样的方法使其更健壮（如果 dataframe 中的名称未正确大写）：

df[df["month"].str.capitalize().str[:3]]

Python Pandas：有没有办法根据列表中的字符串获取子集dataframe

问题描述

2 个解决方案

解决方案1
2 2021-12-10 11:11:09

解决方案2
1 2021-12-10 11:29:19

Python Pandas：有没有办法根据列表中的字符串获取子集dataframe

问题描述

2 个解决方案

解决方案1 2 2021-12-10 11:11:09

解决方案2 1 2021-12-10 11:29:19

解决方案1
2 2021-12-10 11:11:09

解决方案2
1 2021-12-10 11:29:19