[英]Copying a section of a string from one column and putting it into a new pandas column
我正在清理数据集,需要取下划线 (_) 之间的字符串部分。 A列是我开始的。
A
foo_bar_foo
bar_foo_bar
bar
foo_bar_foo
我需要复制下划线之间的字符并将它们复制到一个新列中。 B 列是预期结果。
A B
foo_bar_foo bar
bar_foo_bar foo
bar null
foo_bar_foo bar
任何建议表示赞赏。
使用str.split
和.str[index]
df['B']=df.A.str.split('_').str[1]
A B
0 foo_bar_foo bar
1 bar_foo_bar foo
2 bar NaN
3 foo_bar_foo bar
使用提取物:
df['B'] = df['A'].str.extract('_(\w+)_')
print(df)
Output
A B
0 foo_bar_foo bar
1 bar_foo_bar foo
2 bar NaN
3 foo_bar_foo bar
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.