簡體   English   中英

如何檢索R data.table中按行最大值的列?

[英]How to retrieve column for row-wise maximum value in an R data.table?

我有以下R data.table:

library(data.table)
iris = as.data.table(iris)
> iris
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         3.5          1.4         0.2     setosa
2            4.9         3.0          1.4         0.2     setosa
3            4.7         3.2          1.3         0.2     setosa
4            4.6         3.1          1.5         0.2     setosa
5            5.0         3.6          1.4         0.2     setosa
6            5.4         3.9          1.7         0.4     setosa
7            4.6         3.4          1.4         0.3     setosa
8            5.0         3.4          1.5         0.2     setosa
...

假設我只想為data.table列的子集按行查找逐行最大值: Sepal.LengthSepal.WidthPetal.LengthPetal.Width

我將使用以下代碼:

iris[, maximum_element :=max(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width), by=1:nrow(iris)]

哪個輸出

     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species     maximum_element
  1:          5.1         3.5          1.4         0.2    setosa               5.1
  2:          4.9         3.0          1.4         0.2    setosa               4.9
  3:          4.7         3.2          1.3         0.2    setosa               4.7
  4:          4.6         3.1          1.5         0.2    setosa               4.6
  5:          5.0         3.6          1.4         0.2    setosa               5.0

對於我的問題,我實際上對該值不感興趣,但是該值來自哪一列,即我想要以下輸出:

     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species maximum_column
      1:          5.1         3.5          1.4         0.2    setosa  Sepal.Length
      2:          4.9         3.0          1.4         0.2    setosa  Sepal.Length
      3:          4.7         3.2          1.3         0.2    setosa  Sepal.Length
      4:          4.6         3.1          1.5         0.2    setosa  Sepal.Length
      5:          5.0         3.6          1.4         0.2    setosa  Sepal.Length

(在這種情況下,最大值分別來自Sepal.Length )。

如何“檢索”具有最大值的列名?

這是pmax的選項

iris[, maximum_element := do.call(pmax, .SD), .SDcols = 1:4]

並找到列名,使用max.col.SD指定后.SDcols作為數字列,即列1至4

iris[,maximum_column :=  names(.SD)[max.col(.SD)], .SDcols = 1:4]
head(iris, 4)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species maximum_column
#1:          5.1         3.5          1.4         0.2  setosa   Sepal.Length
#2:          4.9         3.0          1.4         0.2  setosa   Sepal.Length
#3:          4.7         3.2          1.3         0.2  setosa   Sepal.Length
#4:          4.6         3.1          1.5         0.2  setosa   Sepal.Length

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM