繁体   English   中英

Pandas - 创建新列 - 如果另一个列值在列表中(正确方式)

[英]Pandas - Create new column - if another column value is in list (correct way)

我一直在努力制作一个新的专栏来说明周末或不基于“星期几”专栏。 我正在使用基于先前堆栈溢出问题的以下代码。

weekday_classification = {
    'Weekday': ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday'],
    'Weekend': ['Saturday', 'Sunday']
    }
weekday_classification = {day: all_days for all_days, l in weekday_classification.items() for day in l}
df["Weekend"] = df['Day of Week'].map(weekday_classification)
df.head()

虽然上面的代码产生了预期的效果 - 我收到一条警告,其中指出:

ipython-input-21-e273917f31f9:6:SettingWithCopyWarning:试图在 DataFrame 的切片副本上设置值。 尝试改用 .loc[row_indexer,col_indexer] = value

有什么方法可以解决这个问题,我已经阅读了说明如何创建新列的文档,但这似乎仅适用于更简单的列创建。

我仍然只是用 Python 和数据分析将脚趾浸入沙中,我很高兴收到一般反馈。

反转你的字典,就像这样

weekday_classification = {
                            'Monday': 'Weekday',
                            'Tuesday': 'Weekday',
                            'Wednesday': 'Weekday',
                            'Thursday': 'Weekday',
                            'Friday': 'Weekday',
                            'Saturday': 'Weekend',
                            'Sunday': 'Weekend'
                         }

然后构建一个新的weekend_classification基于周末分类字典加入您现有的df

In []: days = pd.DataFrame(data=weekday_classification.values(), index=weekday_classification.keys(), columns=['Weekday/end'])
       days
Out[]:
                Weekday/end
        Monday      Weekday
       Tuesday      Weekday
     Wednesday      Weekday
      Thursday      Weekday
        Friday      Weekday
      Saturday      Weekend
        Sunday      Weekend

In []: df.join(days, on=df['Day of Week'])
Out[]:
        Day of Week     Weekday/end
    0        Monday         Weekday
    1       Tuesday         Weekday
    2     Wednesday         Weekday
    3      Thursday         Weekday
    4        Friday         Weekday
    5      Saturday         Weekend
    6        Sunday         Weekend

因为您的df是另一个 DataFrame 的“子集”。 您可能已经对另一个 DataFrame 的列进行了一些过滤以生成此df ,例如:

df = df_p[df_p['some_col'].isin(some_set)]

Pandas 可以简单地创建对df_p部分的引用来呈现df ,而不是实际创建df 在这种情况下, df就像df_p的一部分,修改df会导致警告,因为这可能会影响df_p 这就是错误消息的描述。 确保在创建dfdf有自己的数据。 对其他 DataFrame 进行过滤,例如:

df = df_p[df_p['some_col'].isin(some_set)].copy()

或使用 copy.deepcopy() 处理复杂的数据。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM