![](/img/trans.png)
[英]Pandas- correct way to create a new column based on the sum of rows of another column (value trying to be set on a copy)?
[英]Pandas - Create new column - if another column value is in list (correct way)
我一直在努力制作一个新的专栏来说明周末或不基于“星期几”专栏。 我正在使用基于先前堆栈溢出问题的以下代码。
weekday_classification = {
'Weekday': ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday'],
'Weekend': ['Saturday', 'Sunday']
}
weekday_classification = {day: all_days for all_days, l in weekday_classification.items() for day in l}
df["Weekend"] = df['Day of Week'].map(weekday_classification)
df.head()
虽然上面的代码产生了预期的效果 - 我收到一条警告,其中指出:
ipython-input-21-e273917f31f9:6:SettingWithCopyWarning:试图在 DataFrame 的切片副本上设置值。 尝试改用 .loc[row_indexer,col_indexer] = value
有什么方法可以解决这个问题,我已经阅读了说明如何创建新列的文档,但这似乎仅适用于更简单的列创建。
我仍然只是用 Python 和数据分析将脚趾浸入沙中,我很高兴收到一般反馈。
反转你的字典,就像这样
weekday_classification = {
'Monday': 'Weekday',
'Tuesday': 'Weekday',
'Wednesday': 'Weekday',
'Thursday': 'Weekday',
'Friday': 'Weekday',
'Saturday': 'Weekend',
'Sunday': 'Weekend'
}
然后构建一个新的weekend_classification
基于周末分类字典加入您现有的df
In []: days = pd.DataFrame(data=weekday_classification.values(), index=weekday_classification.keys(), columns=['Weekday/end'])
days
Out[]:
Weekday/end
Monday Weekday
Tuesday Weekday
Wednesday Weekday
Thursday Weekday
Friday Weekday
Saturday Weekend
Sunday Weekend
In []: df.join(days, on=df['Day of Week'])
Out[]:
Day of Week Weekday/end
0 Monday Weekday
1 Tuesday Weekday
2 Wednesday Weekday
3 Thursday Weekday
4 Friday Weekday
5 Saturday Weekend
6 Sunday Weekend
因为您的df
是另一个 DataFrame 的“子集”。 您可能已经对另一个 DataFrame 的列进行了一些过滤以生成此df
,例如:
df = df_p[df_p['some_col'].isin(some_set)]
Pandas 可以简单地创建对df_p
部分的引用来呈现df
,而不是实际创建df
。 在这种情况下, df
就像df_p
的一部分,修改df
会导致警告,因为这可能会影响df_p
。 这就是错误消息的描述。 确保在创建df
时df
有自己的数据。 对其他 DataFrame 进行过滤,例如:
df = df_p[df_p['some_col'].isin(some_set)].copy()
或使用 copy.deepcopy() 处理复杂的数据。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.