[英]How to create new function from output of previous function in R?
對於R編程和一般編程,我一無所知,但是我有兩段遇到類似問題的代碼(對我來說)。 開始了...
(一種)
我目前有一個返回患者記錄,試驗編號和其他信息的函數。 看起來像這樣:
ID trial start finish mark mean number
903 A34 19 90910 18775077 8236 -0.0197 1.972876
904 A34 19 18782377 23089165 2343 0.0374 2.052525
905 A34 19 23093018 43203507 10267 -0.0162 1.977668
906 A34 19 43203990 43447468 93 0.2138 2.319478
907 A34 19 43447802 43663369 112 -0.0355 1.951387
908 A34 19 43663624 43834506 80 -0.5385 1.376973
909 A34 19 43834848 59097854 8655 -0.0095 1.986873
以下是我為此編寫的代碼。
getRS <- function(CNA, samples = NULL, trial = NULL){ race <- racing.summary(subset(CNA, samplelist = samples, triallist = trial)) race$number <- (2^race$mean)*2 return(race) }
我想知道是否有可能在新函數中使用此輸出來執行簡單的算術運算。 我想從“開始”中減去“完成”以創建“長度”,使用上面的所有方法創建一個新的“均值”,並提取最大的“數字”以創建“最大數字”,同時不顯示“標記”完全沒有
類似於以下的輸出:
ID trial max.length mean max.number
A34 19 20110489 -0.05260000 2.3194777
與/或
(B)
我有一個替代功能,可以使用已計算的數據創建所有患者的數據框。 我使用以下代碼:
getSum <- function (){
race_mean <- as.data.frame(df %>% group_by(ID, trial) %>% summarise(mean = mean(mean)))
race_length <- as.data.frame(df %>% group_by(ID,trial) %>% summarise(max.length = max(end - start)))
seg_number <- as.data.frame(df %>% group_by(ID,trial) %>% summarise(max.number = max(number)))
race_m_l_merge <- as.data.frame(merge(x = race_length, y = race_mean))
race_m_l_n_merge <- as.data.frame(merge(x = race_m_l_merge, y = race_number))
ordered_summary <- as.data.frame(race_m_l_n_merge[order(race_m_l_n_merge$trial),])
View(ordered_summary)
}
給出這樣的輸出:
ID trial max.length mean max.number
1 A22 1 96637812 -1.648909e-01 2.6989533
25 A23 1 101363101 -6.275455e-02 2.2468441
49 A24 1 72598875 -5.878000e-02 2.8204004
73 A25 1 112628591 -3.346917e-01 2.0675182
97 A26 1 55490417 7.621429e-02 2.4512200
121 A28 1 130879821 -4.218571e-02 2.0679481
145 A29 1 72590096 -3.093417e-01 2.3450196
169 A30 1 32642030 4.242500e-02 2.6375528
193 A32 1 34350731 -8.188372e-02 2.1149155
217 A33 1 77537981 -1.305833e-01 2.1125713
這樣,我想創建一個函數來指定要查找的ID和試用版,例如: Function("A22",1)
。
我希望我的R腳本將來可以隨心所欲地用於將來的工作,因此無論對我的問題A,B還是同時對這兩個問題,任何幫助都將不勝感激! 甚至是有關指向有用網站的鏈接的建議。 :)
如果已經定義了函數getRS
和getSum
,則可以在新函數中調用它們。
您只需getSum
中包含View(ordered_summary)
的行更改為return(ordered_summary)
或簡單地ordered_summary
,這樣您就可以返回可以進一步操作的對象。
lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
data_df <- getRS(CNA = data_lookup)
summary_df <- getSum(df = data_df)
subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}
如果您願意,可以以簡潔的方式編寫此函數。
lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
subset(x = getSum(getRS(data_lookup)), subset = (ID == id_lookup & trial == trial_lookup))
}
或者,如果您不想擁有三個不同的函數,則可以創建一個在其內部定義了getRS
和getSum
函數。
lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
data_df <- getRS(CNA = data_lookup)
summary_df <- getSum(df = data_df)
subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}
lookup_function <- function(data_lookup, id_lookup, trial_lookup) {
getRS <- function(CNA, samples = NULL, trial = NULL){
race <-
racing.summary(subset(CNA, samplelist = samples, triallist = trial))
race$number <-
(2 ^ race$mean) * 2
race
}
getSum <- function(df) {
unordered_summary <-
df %>%
group_by(ID, trial) %>%
summarise(mean = mean(mean),
max.length = max(end - start),
max.number = max(number)) %>%
data.frame()
ordered_summary <-
data.frame(unordered_summary[order(unordered_summary$trial), ])
ordered_summary
}
data_df <- getRS(CNA = data_lookup)
summary_df <- getSum(df = data_df)
subset(x = results_df, subset = (ID == id_lookup & trial == trial_lookup))
}
我已編輯的代碼getSum
,因為我沒有看到一個理由罵summarize
,而不是單一的時間的三倍。 當然,您可以使用自己的功能,因為我不知道手頭任務的細節。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.