繁体   English   中英

用R中的现有值替换数据框中的最大值和最小值

[英]Replace max and min values in data frame with existing values in R

我想这是一件容易的事,但是因为我是这个世界的新手,所以对我来说问题更大。

我有这个初始data.frame:

> df
      a    b     c
1 -0.05 0.31  0.62
2  0.78 0.25 -0.01
3  0.68 0.33 -0.04
4 -0.01 0.30  0.56
5  0.55 0.28 -0.03

我想要做的是用其他特定值替换每行的每个最大值和最小值。

因此,我要做的是使用新列创建另一个数据框,以便将其用作“其他特定值”

这是输出:

df_2 <- df

df_2$Rep_MAX <- apply(df_2, 1, max) - 0.1
df_2$Rep_MIN <- apply(df_2, 1, min) + 0.1

print(df_2)
      a    b     c Rep_MAX Rep_MIN
1 -0.05 0.31  0.62    0.52    0.05
2  0.78 0.25 -0.01    0.68    0.09
3  0.68 0.33 -0.04    0.58    0.06
4 -0.01 0.30  0.56    0.46    0.09
5  0.55 0.28 -0.03    0.45    0.07

我想将“ Rep_MAX”设置为每个最大行值,并将“ Rep_MIN”设置为每个最小行值。

这是我想要的输出:

      a    b     c
1  0.05 0.31  0.52
2  0.68 0.25  0.09
3  0.58 0.33  0.06
4  0.09 0.30  0.46
5  0.45 0.28  0.07

有任何想法吗?

我的想法是找出最大值和最小值在每一行中的位置并将其替换:

# Find out the row and column index for maximum and minimum value
max_pos <- matrix(c(1:nrow(df), apply(df, 1, which.max)), ncol=2)
min_pos <- matrix(c(1:nrow(df), apply(df, 1, which.min)), ncol=2)
# Replace them
df[max_pos] <- df[max_pos] - 0.1
df[min_pos] <- df[min_pos] + 0.1
df
     a    b    c
1 0.05 0.31 0.52
2 0.68 0.25 0.09
3 0.58 0.33 0.06
4 0.09 0.30 0.46
5 0.45 0.28 0.07

数据

df <- structure(list(a = c(-0.05, 0.78, 0.68, -0.01, 0.55), b = c(0.31, 
0.25, 0.33, 0.3, 0.28), c = c(0.62, -0.01, -0.04, 0.56, -0.03
)), .Names = c("a", "b", "c"), class = "data.frame", row.names = c("1", 
"2", "3", "4", "5"))

使用apply遍历每一行,并适当替换最大值和最小值,然后将其重新打包为数据框

df <- data.frame(a=c(-0.05,0.78,0.68,-.01,0.55),
                 b=c(0.31,0.25,0.33,0.30,0.28),
                 c=c(0.62,-0.01,-0.04,0.56,-0.03))

df2 <- as.data.frame(t(apply(df,1,function(r) {r[which.min(r)] <- r[which.min(r)]+0.1
                                               r[which.max(r)] <- r[which.max(r)]-0.1
                                               return(r)})))

df2
     a    b    c
1 0.05 0.31 0.52
2 0.68 0.25 0.09
3 0.58 0.33 0.06
4 0.09 0.30 0.46
5 0.45 0.28 0.07

我们可以使用向量化的max.col来找到每一行的最大值的列索引(在第二种情况下,我们乘以-1因此索引将对应于最小值), cbind与行索引cbind以获得matrix行/列索引的索引,可用于提取数据集的值并通过减去或增加0.1进行更新

j1 <- cbind(1:nrow(df), max.col(df, 'first'))
j2 <- cbind(1:nrow(df), max.col(-df, 'first'))
df[j1] <- df[j1]- 0.1
df[j2] <- df[j2] + 0.1
df
#    a    b    c
#1 0.05 0.31 0.52
#2 0.68 0.25 0.09
#3 0.58 0.33 0.06
#4 0.09 0.30 0.46
#5 0.45 0.28 0.07

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM