如何根據列名的字符向量對 i 中的 data.table 進行子集化（例如查找 NA）

Question

這應該很容易，但谷歌和我都失敗了。 假設我有這些數據：

library(data.table)

mydata <- data.table(a = c(1, NA),
                     b = c(NA, NA),
                     pointer = c(1,2))

我想得到a和b都是NA的行。 當然，我可以手動執行此操作，例如：

mydata[is.na(a) & is.na(b)]

但是這個問題在其他代碼中很深，我想根據列名的字符向量（或列表，或其他靈活的）來執行此操作，例如：

myvector <- c("a","b")

如果我知道向量有多少個元素，我可以再次手動執行此操作：

mydata[is.na(get(myvector[1])) & is.na(get(myvector[2]))]

但我不知道myvector在我的應用程序中有多少元素。 如何在不指定myvector中的條目數的情況下執行此操作？ 本質上，我正在尋找類似with = F但對於i in data.table的東西。 所以我想像這樣使用myvector ：

mydata[is.na(somefunction(myvector))]

我用get()或as.formula()嘗試了各種paste0(myvector, collapse = " & ")組合，但它讓我無處可去。

Answer 1

我們可以用列名向量指定.SDcols ，遍歷.SD的子集），用is.na創建邏輯向量list ，然后用&將list Reduce為單個邏輯向量（檢查帶有&條件的list或列的相應元素），使用它來子集數據行

library(data.table)
mydata[mydata[, Reduce(`&`, lapply(.SD, is.na)), .SDcols = myvector]]

-輸出

#   a  b pointer
#1: NA NA       2

或者使用mget

mydata[mydata[, Reduce(`&`, lapply(mget(myvector), is.na))]]

Answer 2

這是假設myvector是字符向量的另一個解決方案：

library(data.table)
mydata[rowSums(!is.na(mydata[, ..myvector])) == 0]