使用索引对 r 中的数据帧执行数学运算

Question

我正在努力对数据框执行基本索引以执行数学运算。 我有一个包含美国所有 50 个州的数据框，其中包含一年中每个月的条目，因此有 600 个观察值。 我希望找到每个州 12 月份的值减去 1 月份的值之间的差值。 我的数据如下所示：

> head(df)
  state year month             value
1    AL 2020    01               2.7
2    AK 2020    01                 5
3    AZ 2020    01               4.8
4    AR 2020    01               3.7
5    CA 2020    01               4.2
7    CO 2020    01               2.7

例如，AL 在 Dec 的值为 4.7，Jan 的值为 2.7，因此我想为该状态返回 2。

我一直在尝试使用 group_by 和 summary 函数来做到这一点，但无法弄清楚它的索引部分来获取与条件相对应的值。 我找不到使用数据框上的索引来执行这些数学运算的资源，我将不胜感激，因为我将使用其他转换。

Answer 1

使用dplyr ：

library(dplyr)
df %>%
  group_by(state) %>%
  summarize(year_change = value[month == "12"] - value[month == "01"])

这假设您的数据如您所描述的那样——每个州每个月都有一个值。 如果您在给定月份的某个州缺少行或多次观察，我不希望此代码起作用。

另一种基于行顺序而不是月份值的方法可能如下所示：

library(dplyr)
df %>%
  ## make sure things are in the right order
  arrange(state, month) %>% 
  group_by(state) %>%
  summarize(year_change = last(value) - first(value))

使用索引对 r 中的数据帧执行数学运算

问题描述

1 个解决方案

解决方案1
1 已采纳 2021-11-08 17:14:07

使用索引对 r 中的数据帧执行数学运算

问题描述

1 个解决方案

解决方案1 1 已采纳 2021-11-08 17:14:07

解决方案1
1 已采纳 2021-11-08 17:14:07