簡體   English   中英

如何從R中先前功能的輸出創建新功能?

[英]How to create new function from output of previous function in R?

對於R編程和一般編程,我一無所知,但是我有兩段遇到類似問題的代碼(對我來說)。 開始了...

(一種)

我目前有一個返回患者記錄,試驗編號和其他信息的函數。 看起來像這樣:

     ID trial     start   finish     mark     mean    number
903 A34    19     90910 18775077     8236  -0.0197  1.972876
904 A34    19  18782377 23089165     2343   0.0374  2.052525
905 A34    19  23093018 43203507    10267  -0.0162  1.977668
906 A34    19  43203990 43447468       93   0.2138  2.319478
907 A34    19  43447802 43663369      112  -0.0355  1.951387
908 A34    19  43663624 43834506       80  -0.5385  1.376973
909 A34    19  43834848 59097854     8655  -0.0095  1.986873

以下是我為此編寫的代碼。

getRS <- function(CNA, samples = NULL, trial = NULL){ race <- racing.summary(subset(CNA, samplelist = samples, triallist = trial)) race$number <- (2^race$mean)*2 return(race) }

我想知道是否有可能在新函數中使用此輸出來執行簡單的算術運算。 我想從“開始”中減去“完成”以創建“長度”,使用上面的所有方法創建一個新的“均值”,並提取最大的“數字”以創建“最大數字”,同時不顯示“標記”完全沒有

類似於以下的輸出:

ID    trial     max.length          mean    max.number
A34       19       20110489   -0.05260000     2.3194777

與/或

(B)

我有一個替代功能,可以使用已計算的數據創建所有患者的數據框。 我使用以下代碼:

getSum <- function (){
  race_mean <- as.data.frame(df %>% group_by(ID, trial) %>% summarise(mean = mean(mean)))
  race_length <- as.data.frame(df %>% group_by(ID,trial) %>% summarise(max.length = max(end - start)))
  seg_number <- as.data.frame(df %>% group_by(ID,trial) %>% summarise(max.number = max(number)))
  race_m_l_merge <- as.data.frame(merge(x = race_length, y = race_mean))
  race_m_l_n_merge <- as.data.frame(merge(x = race_m_l_merge, y = race_number))
  ordered_summary <- as.data.frame(race_m_l_n_merge[order(race_m_l_n_merge$trial),])
  View(ordered_summary)
}

給出這樣的輸出:

      ID trial    max.length         mean       max.number
1    A22     1      96637812   -1.648909e-01     2.6989533
25   A23     1     101363101   -6.275455e-02     2.2468441
49   A24     1      72598875   -5.878000e-02     2.8204004
73   A25     1     112628591   -3.346917e-01     2.0675182
97   A26     1      55490417    7.621429e-02     2.4512200
121  A28     1     130879821   -4.218571e-02     2.0679481
145  A29     1      72590096   -3.093417e-01     2.3450196
169  A30     1      32642030    4.242500e-02     2.6375528
193  A32     1      34350731   -8.188372e-02     2.1149155
217  A33     1      77537981   -1.305833e-01     2.1125713

這樣,我想創建一個函數來指定要查找的ID和試用版,例如: Function("A22",1)

我希望我的R腳本將來可以隨心所欲地用於將來的工作,因此無論對我的問題A,B還是同時對這兩個問題,任何幫助都將不勝感激! 甚至是有關指向有用網站的鏈接的建議。 :)

如果已經定義了函數getRSgetSum ,則可以在新函數中調用它們。

您只需getSum中包含View(ordered_summary)的行更改為return(ordered_summary)或簡單地ordered_summary ,這樣您就可以返回可以進一步操作的對象。

lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
  data_df <- getRS(CNA = data_lookup)
  summary_df <- getSum(df = data_df)
  subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}

如果您願意,可以以簡潔的方式編寫此函數。

lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
  subset(x = getSum(getRS(data_lookup)), subset = (ID == id_lookup & trial == trial_lookup))
}

或者,如果您不想擁有三個不同的函數,則可以創建一個在其內部定義了getRSgetSum函數。

lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
  data_df <- getRS(CNA = data_lookup)
  summary_df <- getSum(df = data_df)
  subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}

lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
  getRS <- function(CNA, samples = NULL, trial = NULL){
    race <- 
      racing.summary(subset(CNA, samplelist = samples, triallist = trial))
    race$number <- 
      (2 ^ race$mean) * 2

    race
  }

  getSum <- function(df) {
    unordered_summary <- 
      df %>% 
      group_by(ID, trial) %>% 
      summarise(mean = mean(mean),
                max.length = max(end - start),
                max.number = max(number)) %>% 
      data.frame()

    ordered_summary <- 
      data.frame(unordered_summary[order(unordered_summary$trial), ])

    ordered_summary
  }

  data_df <- getRS(CNA = data_lookup)

  summary_df <- getSum(df = data_df)

  subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}

我已編輯的代碼getSum ,因為我沒有看到一個理由罵summarize ,而不是單一的時間的三倍。 當然,您可以使用自己的功能,因為我不知道手頭任務的細節。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM