根据括号位置对 Pandas 数据框值使用 str.split

Question

假设我有以下数据框系列 df['Name'] 列：

         Name
       'Jerry'
  'Adam (and family)'
'Paul and Hellen (and family):\n'
'John and Peter (and family):/n'

如何在第一个括号后删除 Name 中的所有内容？

df['Name']= df['Name'].str.split("'(").str[0]

似乎不起作用，我不明白为什么？

我想要的输出是

         Name
       'Jerry'
        'Adam'
    'Paul and Hellen'
    'John and Peter'

所以括号后的所有内容都被删除。

Answer 1

split解决方案 - 是必要的转义(通过\\ ：

df['Name']= df['Name'].str.split("\s+\(").str[0]
print (df)
               Name
0           'Jerry'
1             'Adam
2  'Paul and Hellen
3   'John and Peter

用regex解决并replace ：

df['Name']= df['Name'].str.replace("\s+\(.*$", "")
print (df)
               Name
0           'Jerry'
1             'Adam
2  'Paul and Hellen
3   'John and Peter

\\s+\\(.*$表示从可选的whitespace替换，首先(到字符串$的末尾到"" - 空字符串。

Answer 2

使用正则表达式：

>>> import re
>>> str = 'Adam (and family)'
>>> result = re.sub(r"( \().*$", '', str)
>>> print result
Adam

根据括号位置对 Pandas 数据框值使用 str.split

问题描述

2 个解决方案

解决方案1
2 已采纳 2017-02-13 14:04:22

解决方案2
0 2017-02-13 13:54:57

根据括号位置对 Pandas 数据框值使用 str.split

问题描述

2 个解决方案

解决方案1 2 已采纳 2017-02-13 14:04:22

解决方案2 0 2017-02-13 13:54:57

解决方案1
2 已采纳 2017-02-13 14:04:22

解决方案2
0 2017-02-13 13:54:57