Python 初學者

Question

我有一個作為 excel 文件導入的現有數據集。 在我想要的導入文件中

然后創建一個新列
從現有列分配參數。 例子。 如果在 x 列中，年齡大於 17 且 <23，則在 y 列下分配 z 代；否則，如果在 x 列中，年齡 >24 但小於 <40，則分配給 y 列中的磨機

代碼是

If df[‘age’]>17 and df[‘age’]<23:
    Df[‘generation’]=“genZ”
Élif df[‘age’]>24 and df[‘age’]<40
    Df[‘generation’]=“Millenial”

Answer 1

您應該為此使用pd.cut() 。

data = [18, 19, 17, 27, 25, 24, 39]
columns = ['age']
df = pd.DataFrame(data=data, columns=columns)

df['generation'] = pd.cut(df['age'], [17, 24, 40], labels=['Genz', 'Millenial'])

Output

   age generation
0   18       Genz
1   19       Genz
2   17        NaN
3   27  Millenial
4   25  Millenial
5   24       Genz
6   39  Millenial

Answer 2

我會創建一個自定義 function 並使用map() 。

def generation(age):
   if (age > 17) & (age < 24):
      return "GenZ"
   elif (age > 24) & (age < 40):
      return "Millenial"
   else:
      return "Not classified"

然后我們將它傳遞給我們的 dataframe：

df['generation'] = df['Age'].map(lambda x: generation(x))

Answer 3

通過np.select的選項：

import numpy as np
import pandas as pd

df = pd.DataFrame([17, 18, 19, 23, 24, 25, 39, 40, 41], columns=['age'])

df['generation'] = np.select(
    [(df['age'] > 17) & (df['age'] < 23),
     (df['age'] > 24) & (df['age'] < 40)],
    ['genZ', 'Millenial'],
    default=None)

print(df)

df ：

   age generation
0   17       None
1   18       genZ
2   19       genZ
3   23       None
4   24       None
5   25  Millenial
6   39  Millenial
7   40       None
8   41       None

Python 初學者

問題描述

3 個解決方案

解決方案1
3 2021-05-11 01:04:43

解決方案2
0 已采納 2021-05-11 01:01:20

解決方案3
0 2021-05-11 01:14:24

Python 初學者

問題描述

3 個解決方案

解決方案1 3 2021-05-11 01:04:43

解決方案2 0 已采納 2021-05-11 01:01:20

解決方案3 0 2021-05-11 01:14:24

解決方案1
3 2021-05-11 01:04:43

解決方案2
0 已采納 2021-05-11 01:01:20

解決方案3
0 2021-05-11 01:14:24