根據其他數據框中列的值選擇 R 數據框中的列

Question

我有兩個數據框，如下所示。

  #Dataframe 1
    colname value
    col1    0.45
    col2    -0.2
    col3    -0.4
    col4    0.1

#Dataframe 2
col1 col2 col3 col4
1    5    9    5
45   29   43   9
34   33   56   3
2    67   76   1

我想要做的是首先選擇數據框 1 的所有列，其值 > 0.3 或值 < -0.3。 我想要的第二件事是從數據框 2 中選擇與此條件匹配的所有列。 所以應該將 dataframe2 的 col1 和 col3 列選擇到一個新的數據幀中，如下所示。

我想到的解決方案是首先選擇相關列，如下面的代碼所示。

library(sqldf)
features = sqldf('select colname from dataframe1 where value > 0.3 or value < -0.3')

在此之后，在 for 循環中構建一個字符串，如下所示。 並將其粘貼到sqldf查詢中以從sqldf中選擇正確的列。 但是我不知道如何構建這個字符串。 你們知道這個或有其他解決方案嗎？

  stringValue = "col1, col3, col4"
   sprintf("SELECT %s FROM dataframe2", stringValue)

Answer 1

使用您當前的dataframe1只會選擇col1和col3 。

library(sqldf)
features = sqldf('select colname from dataframe1 where value > 0.3 or value < -0.3')
sqldf(sprintf("SELECT %s FROM dataframe2", paste0(features$colname, collapse = ", ")))


#       col1 col3
#    1    1    9
#    2   45   43
#    3   34   56
#    4    2   76

數據

#Dataframe 1
dataframe1 <- read.table(text = 'colname value
    col1    0.45
                         col2    -0.2
                         col3    -0.4
                         col4    0.1', header = T, sep = "")

#Dataframe 2
dataframe2 <- read.table(text = 'col1 col2 col3 col4
1    5    9    5
45   29   43   9
34   33   56   3
2    67   76   1', header = T, sep = "")

Answer 2

這樣做的基本 R 方式：

> mask <- dataframe1$value > 0.3 | dataframe1$value < -0.3
> dataframe2[, mask]

  col1 col3
1    1    9
2   45   43
3   34   56
4    2   76

Answer 3

使用dplyr （不確定它是否相關），您可以執行以下操作：

df2 %>% 
select(one_of(df1 %>% filter(value > 0.3 | value < -0.3) %>% pull(colname) %>% as.character()))

這是通過從df1中選擇與one_of字符串匹配的列名稱來工作的，該列名稱在filter 。

根據其他數據框中列的值選擇 R 數據框中的列

問題描述

3 個解決方案

解決方案1
2 已采納 2020-01-03 16:34:55

解決方案2
1 2020-01-03 18:47:21

解決方案3
0 2020-01-03 16:39:16

根據其他數據框中列的值選擇 R 數據框中的列

問題描述

3 個解決方案

解決方案1 2 已采納 2020-01-03 16:34:55

解決方案2 1 2020-01-03 18:47:21

解決方案3 0 2020-01-03 16:39:16

解決方案1
2 已采納 2020-01-03 16:34:55

解決方案2
1 2020-01-03 18:47:21

解決方案3
0 2020-01-03 16:39:16