将函数应用于Pandas中数据框列的每一行

Question

我在数据框中有一个基于文本的列，类似于以下格式：

  Text
0 I am me
1 I am not you
2 I will be him

我正在尝试运行一个字符串函数来删除最后一个空格（包括空格）之后的任何内容。 例如'我就是我'将成为'我是'

码：

df['Text'] = df['Test'].apply(lambda x: x.str.split(' ').str[:-1].str.join(' '))

但是，这会给出错误：

AttributeError：'str'对象没有属性'str'

我不太了解，因为apply函数本身就可以工作，只是在将它应用到数据帧中的特定列时似乎失败了？ （和我一样奇怪和错误......）

Answer 1

当您使用vanilla字符串时，可以直接调用函数。 直接使用pandas列时，请使用str访问器方法。

情况1
正如我的评论中提到的，使用str方法：

df

            Text
0        I am me
1   I am not you
2  I will be him    

df['Text'] = df['Text'].str.split().str[:-1].str.join(' ')

        Text
0       I am
1   I am not
2  I will be

案例2
或者，当在单个列上使用apply时， lambda会收到一个字符串 （不是pd.Series ），因此不涉及.str访问器方法。

Answer 2

我想你想要重写pandas字符串函数有点慢，但支持NaNs值：

df['Text'] = use_data['Test'].str.split().str[:-1].str.join(' ')

到python字符串函数：

df['Text'] = use_data['Test'].apply(lambda x: ' '.join(x.split(' ')[:-1]))

将函数应用于Pandas中数据框列的每一行

问题描述

2 个解决方案

解决方案1
7 已采纳 2017-11-08 09:00:16

解决方案2
1 2017-11-08 08:59:10

将函数应用于Pandas中数据框列的每一行

问题描述

2 个解决方案

解决方案1 7 已采纳 2017-11-08 09:00:16

解决方案2 1 2017-11-08 08:59:10

解决方案1
7 已采纳 2017-11-08 09:00:16

解决方案2
1 2017-11-08 08:59:10