繁体   English   中英

Python 中两列的虚拟变量

[英]Dummy variable from two columns in Python

我是 Python 的新手,所以我的问题可能非常基本,抱歉// 我正在努力在 Python 的两列上创建一个虚拟变量。 我有一个列( dead ),它本身就是一个假人,1 对应于死亡,0 - 没有死亡。 第二列是“年龄” ,表示以月为单位的死亡年龄。 我需要的是为 5 岁之前死亡的儿童( 'died'==1 & 'Age' < 60 )创建一个假人,为 1 岁之前死亡的儿童创建一个假人( 'died' == 1 & Age' < 12 )。 我通常在 Stata 工作,这很容易,但在 Python 我很挣扎。 我一直在尝试使用 get_dummies function from pandas: dummy= pd.get_dummies(df['died']) & (df.aad < 60.).astype('int') ' t执行添加,我的猜测是它不能用连续变量'aad'添加指示变量'died'。 是否有一种直接(初学者友好)的方法来组合来自两列的信息以生成新的虚拟变量? 非常感谢!

导入 numpy 作为 np

df['dummy'] = np.where((df['died']==1) & (df['aad']<60), 1, 0)

你可以通过这种方式很容易地做到这一点:

dummy = ((df['died'] == 1) & (df['aad'] < 60)).astype('int')

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM