![](/img/trans.png)
[英]If cell has 2 words, extract only 1st word and if cell has 3 words, extract 2 first words - PANDAS/REGEX
[英]How to replace dataframe text column with only the 1st occuring word / words before a comma
问题陈述的 dataframe 看起来像
姓名 | 用户标识符 | 搜索文本 |
---|---|---|
乙 | 14 | kj |
小号 | 2 | hsa,isd |
D | 10 | 萨,广告,广告 |
乙 | 99 | PID、PD、DD、EF |
G | 8 | dd |
我希望 dataframe search_text 在逗号前的第一个单词上被剥离和替换。(我不想手动 map 并替换它)。 所以它看起来像。
姓名 | 用户标识符 | 搜索文本 |
---|---|---|
乙 | 14 | kj |
小号 | 2 | 高铁 |
D | 10 | 萨 |
乙 | 99 | PID |
G | 8 | dd |
有什么方便的方法吗?
提取字符串中的第一个字母数字
df['search_text'] = df['search_text'].str.extract('(^\w+)')
Name UID search_text
0 B 14 kj
1 S 2 hsa
2 D 10 sa
3 E 99 pid
4 G 8 dd
df['search_text'] = df['search_text'].str.split(',').str[0]
print(df)
Name UID search_text
0 B 14 kj
1 S 2 hsa
2 D 10 sa
3 E 99 pid
4 G 8 dd
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.