繁体   English   中英

根据值是否为 null 创建 pandas dataframe 列

[英]Create a pandas dataframe column depending if a value is null or not

我有一个关于学生在 2016 年参加的课程的数据科学相关项目。我有一个专栏,显示学生升级课程的日期。 如果课程尚未升级,则值为 Null。 我想要的是创建一个新的数据框,该数据框仅包含这个由“是”或“否”组成的升级列。 我尝试了以下代码并且它有效,除了我收到以下警告:“SettingWithCopyWarning:试图在 DataFrame 的切片副本上设置值。” 我正在放置一个示例数据集、代码和我得到的 output。 如果有人可以通过解释告诉我更有效的方法,那就太好了。

import pandas as pd

registration = pd.DataFrame({'upgraded':['2016-08-12 19:42:07+00:00', '2016-08-14 11:51:21+00:00',
    '2016-07-22 17:24:59+00:00', None, None, '2016-07-12 10:33:02+00:00']})

upgraded_1 = registration[['upgraded']]
for i in range(len(upgraded_1['upgraded'])):
    if pd.isnull(upgraded_1['upgraded'][i]):
        upgraded_1['upgraded'][i] = "No"
    else:
        upgraded_1['upgraded'][i] = "Yes"

Output:

 upgraded_1
    0   Yes
    1   Yes
    2   Yes
    3   No
    4   No
    5   Yes

您可以使用isna方法和numpy.where来实现这一点(将其视为numpy.if_then_else )。

>>> pd.DataFrame(np.where(registration.isna(), 'No', 'Yes'))
     0
0  Yes
1  Yes
2  Yes
3   No
4   No
5  Yes

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM