繁体   English   中英

用pandas DataFrame中另一列的值填充一列

[英]Fill one column with value of another column in pandas DataFrame

我的数据框看起来像这样:

ID    ADDRESS                   PRICE    LOCATION
1     NEW YORK, BROOKLYN, 1      500     NEW YORK
2     LONDON, LONDON, 2          400     " "
3     City of MANCHESTER, 3      200     " "
.
.

我想用地址中的值填充“”。 我试过这样的事情:

i = 2008
for addrs, loc in zip(addr[2008:].ADDRSS, addr[2008:].LOCATION):
     if addrs.find('NEW YORK') != -1:
          addr[i].LOCATION = 'NEW YORK'
     if addrs.find('LONDON') != -1:
          addr[i].LOCATION = 'LONDON'
     if addrs.find('PRAGUE') != -1:
          addr[i].LOCATION = 'PRAGUE'
     i = i + 1
.
.
.

位置没有从某行填写,所以这就是为什么有addr[2008:]。 位置不会改变,所以我可以让它们这样写。 此代码返回 KeyError。 我真的不知道,这有什么问题,有人可以帮忙吗?

编辑:

预期输出应该是这样的:

ID    ADDRESS                   PRICE    LOCATION
1     NEW YORK, BROOKLYN, 1      500     NEW YORK
2     LONDON, LONDON, 2          400     LONDON
3     City of MANCHESTER, 3      200     MANCHESTER
.
.

问题在于,在地址栏中,有多种选项如何提及城市,因此仅使用 , 进行简单拆分是行不通的。

你可以这样做:

df.loc[df['LOCATION'].eq(' '), 'LOCATION'] = df['ADDRESS']

据我了解,如果LOCATIONS栏有“”号,ADDRESS栏会填入国家信息。

以下代码对此很有用。

addr['LOCATION'].apply(lambda x: x if x != " " else addr['ADDRESS'].split(sep=',')[0])

我希望这个对你有用。

扩展上面的另一个答案

df.loc[df['LOCATION'].eq(' '), 'LOCATION'] = df.loc[df['LOCATION'].eq(' '), 'ADDRESS'].str.extract('(NEW YORK|LONDON|MANCHESTER)').values

对于更多城市,您当然需要调整正则表达式字符串

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM