R：匹配數據框中的值

Question

我有以下數據幀列表：

a<-data.frame(
  Data0=c("Y","Y","Y","Y","Y","Y","N","N","N","N","N","N"),
  Data1=c(16,18,19,20,21,50,16,18,19,20,21,50),
  Data2=c(2.2291,2.0743,1.9369,1.8148,1.7064,1.6102,2.2291,2.0743,1.9369,1.8148,1.7064,1.6102)
)
b<-data.frame(
  Data0=c(-2 , 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ,10 ,11) ,
  Data1=c(0.8891 ,0.8891,0.9051,1,0.8891,0.8891,0.7907,0.8891,0.9929,0.8891,0.8891,0.8891,0.8891)
)
dfl<-list(a,b)

我想為列表中的每個數據框創建一個函數，該函數針對最后一列中的匹配變量返回最后一列中的數字。

對於a ，如果我發送“ Y”和16，則需要2.2291；對於b ，如果我發送“ 5”，則需要0.7907。 要的問題是，如果我發送小於16的數，無論是“Y”或“N”，我希望它返回值，好像它是16，而無需操縱所述輸入變量。 我設法為b做到了這一點，但是對於a ，我在“ Y”和“ N”之間有一個“分割”，我不知道如何解決這個問題。

至今：

get_value<-function(vector){
  if (length(vector)==1) {
    from<-append(head(unlist(dfl[[2]][1],use.names=FALSE),-1),-9999,0)
    to  <-unlist(dfl[[2]][1],use.names=FALSE)

    match_from<-vector > from
    match_to<-vector <=to

    pos<-which(match_from==match_to)
    return(unlist(dfl[[2]][pos,2]))
  }
  else{
    print("not sure what to do for a")
  }
}
get_value(4)
get_value(-44)

該解決方案需要考慮到有時對於a ，列Data0和Data1已切換位置。

編輯：輸入/輸出表：

INPUT       OUTPUT

c("Y",13) -->   2.2291

c("Y",50) -->   1.6102

c("N",20) -->   1.8148

c("N",50) -->   1.6102

c(-44))   -->     0.8891

Answer 1

好的，我終於想出了一種方法，但是它不是那么優雅，因此將不勝感激。

get_value<-function(vector){
  if (length(vector)==1) {
    from<-append(head(unlist(dfl[[2]][1],use.names=FALSE),-1),-9999,0)
    to  <-unlist(dfl[[2]][1],use.names=FALSE)

    match_from<-vector > from
    match_to<-vector <=  to

    pos<-which(match_from==match_to)
    return(unlist(dfl[[2]][pos,2]))
  }
  else{

    pos_1<-which(unlist(dfl[[1]][1],use.names=FALSE)==vector[1])

    from<-append(head(as.numeric(unlist(dfl[[1]][2],use.names=FALSE))[pos_1],-1),-9999,0)
    to  <-as.numeric(unlist(dfl[[1]][2],use.names=FALSE))[pos_1]

    match_from<-as.numeric(vector[2]) > from
    match_to  <-as.numeric(vector[2]) <=to
    pos<-pos_1[match_from == match_to]
    return(unlist(dfl[[1]][pos,3]))
  }
}

Answer 2

使用tidyverse函數的替代方法如下：

library(tidyverse)
library(magrittr)

get_value<-function(vector){
  if (length(vector)==1) 
  { df <- dfl[[2]]
    k <- df %>%
      arrange(Data0)%>%
      filter(Data0 >= vector) %>%
      select(Data1) %>%
      head(1)
  }
  else
  {df <- dfl[[1]]
  k <- df %>%
    arrange(Data0)%>%
    filter(Data0 == vector[1]) %>%
    filter(Data1 >= vector[2]) %>%
    select(Data2) %>%
    head(1)
  }
  return(k)
}

並測試一些輸出為：

> get_value(c(-44))
   Data1
1 0.8891
> get_value(c('N',16))
   Data2
1 2.2291
> get_value(c('Y',16))
   Data2
1 2.2291
> get_value(c('N',12))
   Data2
1 2.2291
> get_value(c('Y',11))
   Data2
1 2.2291
> get_value(c('Y',18))
   Data2
1 2.0743

R：匹配數據框中的值

問題描述

2 個解決方案

解決方案1
1 2018-04-12 18:53:13

解決方案2
1 已采納 2018-04-13 07:01:52

R：匹配數據框中的值

問題描述

2 個解決方案

解決方案1 1 2018-04-12 18:53:13

解決方案2 1 已采納 2018-04-13 07:01:52

解決方案1
1 2018-04-12 18:53:13

解決方案2
1 已采納 2018-04-13 07:01:52