簡體   English   中英

考慮對列進行分組並根據R中的其他列選擇行

[英]Consider grouping for a column and selecting rows based on other columns in R

我的數據是dataframe(fpo):

     damIDpoG4 damSirepoG4 damGpoG4 damPhenpoG4 damTBVpoG4 damGBVpoG4
[1,]    450622      430878        4    5.540501   4.260957   3.422568
[2,]    450623      430878        4    3.046358   4.169094   3.528200
[3,]    450625      430878        4    4.515801   4.543196   3.843761
....
[50,]    450626      470878        4    4.798896   4.501067   3.875034
[51,]    450630      470878        4    4.282659   4.388037   3.830042
[52,]    450632      470878        4    3.553223   4.086484   3.571130

我想根據MAX和20% damGBVpoG4為每個類似的damSirepoG4組從damIDpoG4中選擇n個數字(例如12)。 我嘗試的damSirepoG4包含250組相同的數字:

fpo %>% group_by(fpo[,2]) %>% sample_n(12)

但我的答案不正確。 我無法考慮dplyr的最大值或百分比
感謝您的關注

我們需要在group_by傳遞列名(假設'fpo'是data.frame/tbl_df而不是matrix

fpo %>% 
    group_by(damSirepoG4) %>%
    sample_n(12)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM