如何分割数字和文字

Question

I have a dataset like this 我有一个像这样的数据集

data = pd.DataFrame({ 'a' : [5, 5, '2 bad']})

I want to convert this to 我想将其转换为

{ 'a.digits' : [5, 5, 2], 'a.text' : [nan, nan, 'bad']}

I can get 'a.digits' as bellow 我可以像下面这样得到“ a.digits”

data['a.digits'] = data['a'].replace('[^0-9]', '', regex = True) 
5    2
2    1
Name: a, dtype: int64

When i do 当我做

data['a'] = data['a'].replace('[^\D]', '', regex = True)

or 要么

data['a'] = data['a'].replace('[^a-zA-Z]', '', regex = True)

i get 我得到

5      2
bad    1
Name: a, dtype: int64

What's wrong? 怎么了？ How to remove digits? 如何删除数字？

Answer 1

Something like this would suffice? 这样的东西就足够了吗？

In [8]: import numpy as np

In [9]: import re

In [10]: data['a.digits'] = data['a'].apply(lambda x: int(re.sub(r'[\D]', '', str(x))))

In [12]: data['a.text'] = data['a'].apply(lambda x: re.sub(r'[\d]', '', str(x)))

In [13]: data.replace('', np.nan, regex=True)
Out[13]: 
       a a.digits a.text
0      5        5    NaN
1      5        5    NaN
2  2 bad        2    bad

Answer 2

假设在2和Bad之间有一个空格，您可以这样做：

data['Text'] = data['a'].str.split(' ').str[1]

如何分割数字和文字

问题描述

2 个解决方案

解决方案1
2 已采纳 2016-08-18 19:35:18

解决方案2
0 2016-08-18 19:36:04

如何分割数字和文字

问题描述

2 个解决方案

解决方案1 2 已采纳 2016-08-18 19:35:18

解决方案2 0 2016-08-18 19:36:04

解决方案1
2 已采纳 2016-08-18 19:35:18

解决方案2
0 2016-08-18 19:36:04