按街道地址分组并将其分为街道名称和编号

Question

我有一个包含以下字段的数据集：

建筑GUID（ abcd-efgh-5678-1234 ， ...等）
街道地址（ 1256 Grant St ， 500 wall st等）
价格（ $5000 ， $10000等）

基于此，我想在Pandas的DataFrame对象中添加两个新列 ：

街道名称（ wall st ）
街道号码（ 500 ）

到目前为止，我已经能够按如下方式获取wall st单词的特定实例：

str_street = 'Wall St'
wall_st  = dataset.loc[dataset['street_address'].str.lower().str.endswith(str_street.lower()), :]
wall_st['street_name'] = ???
wall_st['street_address_number'] = ???

我该怎么做呢？

Answer 1

df = pd.DataFrame({'street address': ['500 wall street', '123 blafoo']})
df['street address'].apply(lambda x: pd.Series(x.split(None, 1)))

将导致：

     0            1
0  500  wall street
1  123       blafoo

然后，您可以将列重命名，并将其pd.concat重命名为原始数据框。

Answer 2

我认为您需要extract ：

df = pd.DataFrame({'street address': ['500 wall street', '123 blafoo']})
print (df)
    street address
0  500 wall street
1       123 blafoo

df1 = df['street address'].str.extract('(?P<number>\d+)(?P<name>.*)', expand=True)
print (df1)
  number          name
0    500   wall street
1    123        blafoo

解决方案与split ：

df[['number','name']] = df['street address'].str.split(n=1, expand=True)
print (df)
    street address number         name
0  500 wall street    500  wall street
1       123 blafoo    123       blafoo

按街道地址分组并将其分为街道名称和编号

问题描述

2 个解决方案

解决方案1
1 2017-03-14 12:33:15

解决方案2
1 已采纳 2017-03-14 12:40:39

按街道地址分组并将其分为街道名称和编号

问题描述

2 个解决方案

解决方案1 1 2017-03-14 12:33:15

解决方案2 1 已采纳 2017-03-14 12:40:39

解决方案1
1 2017-03-14 12:33:15

解决方案2
1 已采纳 2017-03-14 12:40:39