用pandas DataFrame中另一列的值填充一列

Question

我的數據框看起來像這樣：

ID    ADDRESS                   PRICE    LOCATION
1     NEW YORK, BROOKLYN, 1      500     NEW YORK
2     LONDON, LONDON, 2          400     " "
3     City of MANCHESTER, 3      200     " "
.
.

我想用地址中的值填充“”。 我試過這樣的事情：

i = 2008
for addrs, loc in zip(addr[2008:].ADDRSS, addr[2008:].LOCATION):
     if addrs.find('NEW YORK') != -1:
          addr[i].LOCATION = 'NEW YORK'
     if addrs.find('LONDON') != -1:
          addr[i].LOCATION = 'LONDON'
     if addrs.find('PRAGUE') != -1:
          addr[i].LOCATION = 'PRAGUE'
     i = i + 1
.
.
.

位置沒有從某行填寫，所以這就是為什么有addr[2008:]。 位置不會改變，所以我可以讓它們這樣寫。 此代碼返回 KeyError。 我真的不知道，這有什么問題，有人可以幫忙嗎？

編輯：

預期輸出應該是這樣的：

ID    ADDRESS                   PRICE    LOCATION
1     NEW YORK, BROOKLYN, 1      500     NEW YORK
2     LONDON, LONDON, 2          400     LONDON
3     City of MANCHESTER, 3      200     MANCHESTER
.
.

問題在於，在地址欄中，有多種選項如何提及城市，因此僅使用 , 進行簡單拆分是行不通的。

Answer 1

你可以這樣做：

df.loc[df['LOCATION'].eq(' '), 'LOCATION'] = df['ADDRESS']

Answer 2

據我了解，如果LOCATIONS欄有“”號，ADDRESS欄會填入國家信息。

以下代碼對此很有用。

addr['LOCATION'].apply(lambda x: x if x != " " else addr['ADDRESS'].split(sep=',')[0])

我希望這個對你有用。

Answer 3

擴展上面的另一個答案

df.loc[df['LOCATION'].eq(' '), 'LOCATION'] = df.loc[df['LOCATION'].eq(' '), 'ADDRESS'].str.extract('(NEW YORK|LONDON|MANCHESTER)').values

對於更多城市，您當然需要調整正則表達式字符串

用pandas DataFrame中另一列的值填充一列

問題描述

3 個解決方案

解決方案1
0 2021-11-01 18:28:12

解決方案2
0 2021-11-01 18:28:12

解決方案3
0 2021-11-02 18:14:26

用pandas DataFrame中另一列的值填充一列

問題描述

3 個解決方案

解決方案1 0 2021-11-01 18:28:12

解決方案2 0 2021-11-01 18:28:12

解決方案3 0 2021-11-02 18:14:26

解決方案1
0 2021-11-01 18:28:12

解決方案2
0 2021-11-01 18:28:12

解決方案3
0 2021-11-02 18:14:26