R：創建2列，其中另一列的差異和百分比值

Question

我有一個這樣的數據框

ID <- c(101,101,101,102,102,102,103,103,103)
Pt_A <- c(50,100,150,20,30,40,60,80,90)
df <- data.frame(ID,Pt_A)

+-----+------+
| ID  | Pt_A |
+-----+------+
| 101 |   50 |
| 101 |  100 |
| 101 |  150 |
| 102 |   20 |
| 102 |   30 |
| 102 |   40 |
| 103 |   60 |
| 103 |   80 |
| 103 |   90 |
+-----+------+

我想用從Pt_A列計算的值創建2個新列。

df$Del_Pt_A <- NthRow(Pt_A) - 1stRow(Pt_A) grouped by ID, where n = 1,2,...n
df$Perc_Pt_A <- NthRow(Del_Pt_A) / 1stRow(Pt_A) grouped by ID, where n = 1,2,...n

這是我想要的輸出

+-----+------+---------+-----------+
| ID  | Pt_A | Del_Pt_A | Perc_Pt_A|
+-----+------+---------+-----------+
| 101 |   50 | 0       | 0         |
| 101 |  100 | 50      | 1.0       |
| 101 |  150 | 100     | 2.0       |
| 102 |   20 | 0       | 0         |
| 102 |   30 | 10      | 0.5       |
| 102 |   40 | 20      | 1.0       |
| 103 |   60 | 0       | 0         |
| 103 |   80 | 20      | 0.3       |
| 103 |   90 | 30      | 0.5       |
+-----+------+---------+-----------+

目前，我在MS Excel中獲得了理想的結果，但我想學習在R中做到這一點，以提高工作效率。 我遇到了dplyr，plyr，data.table等軟件包，但是我無法使用它們來解決。 有人可以幫我弄清楚如何解決此問題。

Answer 1

這是data.table的方式：

library(data.table)
setDT(df)[,`:=`(
    del       = Pt_A - Pt_A[1],
    perc      = Pt_A/Pt_A[1]-1
),by=ID]

這使

    ID Pt_A del      perc
1: 101   50   0 0.0000000
2: 101  100  50 1.0000000
3: 101  150 100 2.0000000
4: 102   20   0 0.0000000
5: 102   30  10 0.5000000
6: 102   40  20 1.0000000
7: 103   60   0 0.0000000
8: 103   80  20 0.3333333
9: 103   90  30 0.5000000

Answer 2

這是基數R中的另一個選項：

cbind(df,
      do.call(rbind,by(df,df$ID,
   function(x)
           setNames(data.frame(x$Pt_A-x$Pt_A[1],
                      x$Pt_A/x$Pt_A[1]-1),
                    c('Del_Pt_A','Perc_Pt_A')))))

#        ID Pt_A Del_Pt_A Perc_Pt_A
# 101.1 101   50        0 0.0000000
# 101.2 101  100       50 1.0000000
# 101.3 101  150      100 2.0000000
# 102.1 102   20        0 0.0000000
# 102.2 102   30       10 0.5000000
# 102.3 102   40       20 1.0000000
# 103.1 103   60        0 0.0000000
# 103.2 103   80       20 0.3333333
# 103.3 103   90       30 0.5000000

我在用：

by按組應用功能，結果是一個列表
do.call(rbind, list_by)將列表轉換為data.frame
cbind將結果添加到初始data.frame

R：創建2列，其中另一列的差異和百分比值

問題描述

2 個解決方案

解決方案1
4 已采納 2015-06-18 21:56:08

解決方案2
2 2015-06-18 21:56:18

R：創建2列，其中另一列的差異和百分比值

問題描述

2 個解決方案

解決方案1 4 已采納 2015-06-18 21:56:08

解決方案2 2 2015-06-18 21:56:18

解決方案1
4 已采納 2015-06-18 21:56:08

解決方案2
2 2015-06-18 21:56:18