![](/img/trans.png)
[英]How to delete everything after a certain character for whole column in df?
[英]Pandas - 'cut' everything after a certain character in a string column and paste it in the beginning of the column
在pandas dataframe字符串列中,我要抓住某个字符后的所有内容,并将其放在该列的开头,同时剥离该字符。 什么是最有效的方法?
输入数据框:
>>> df = pd.DataFrame({'city':['Bristol, City of', 'Newcastle, City of', 'London']})
>>> df
city
0 Bristol, City of
1 Newcastle, City of
2 London
>>>
我想要的数据帧输出:
city
0 City of Bristol
1 City of Newcastle
2 London
假设每个字符串最多只有两段,则可以拆分,反转和合并:
df.city.str.split(', ').str[::-1].str.join(' ')
0 City of Bristol
1 City of Newcastle
2 London
Name: city, dtype: object
如果有两个以上的逗号,请仅对第一个进行拆分:
df.city.str.split(', ', 1).str[::-1].str.join(' ')
0 City of Bristol
1 City of Newcastle
2 London
Name: city, dtype: object
另一个选择是str.partition
:
u = df.city.str.partition(', ')
u.iloc[:,-1] + ' ' + u.iloc[:,0]
0 City of Bristol
1 City of Newcastle
2 London
dtype: object
这总是只在第一个逗号上分开。
如果需要性能,还可以使用列表推导:
df.assign(city=[' '.join(s.split(', ', 1)[::-1]) for s in df['city']])
city
0 City of Bristol
1 City of Newcastle
2 London
您为什么要关心循环式解决方案? 使用字符串/正则表达式函数时,for循环很快(至少比pandas更快)。 您可以在For循环与熊猫上阅读更多内容-我什么时候应该关心? 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.