簡體   English   中英

在帶有類別的 Pandas 數據框中添加新列

[英]add new column in Pandas Data frame with categories

我有以下葡萄酒分類數據:

country, price, colour
USA      10     white
italy    25     red
USA      75     rose
Germany  125    white 

我必須根據以下信息在pandas中添加一個新列:

新列名稱為'Affordability'

如果價格 < 50 則Cheap或如果價格 > 50 但價格 <100 則價格expensive或如果價格 > 100 則very exp

您可以使用numpy.select添加帶有條件的額外列:

import numpy as np 
condlst = [df['price_column'] < 50,
           df['price_column'] < 100,
           df['price_column'] >= 100]
choicelst = ['Cheap',
             'Expensive',
             'Very Expensive',]
df['Affordability'] = np.select(condlist, choicelst)

請注意:

  • 條件的數量應始終與選擇的數量相匹配。
  • 此處提供的條件是自我排除的,將在插入的訂單中進行檢查,因此首先檢查價格是否低於 50,如果不是,將檢查價格是否低於 100,依此類推。 這樣您就可以節省需要執行的檢查次數。

在這里閱讀更多關於np.select的信息。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM