[英]Extracting string between 2 characters from Dataframe column
我有一列包含以下条目:Hello [World]。 我正在尝试提取“世界”并用它创建一个新列,并为每一行执行此操作。
不知道该怎么做,我不熟悉正则表达式。
谢谢。
它看起来像这样:
import pandas as pd
df = pd.DataFrame([['hello [world]'],['something [else]']], columns=['words']);
df['words'] = df['words'].str.replace('^.*\[|\]$','')
print(df)
唯一复杂的部分是正则表达式: replace('.*\[|\]$','')
。 这表示要查找单词^
的开头直到.*
[
字符 OR |
的第一个实例。 从字符串$
末尾的]
字符的第一个实例开始,并将其替换为空''
如果您要经常做这种事情,我强烈建议您学习正则表达式。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.