簡體 English 中英

基於列總和的分位數的子集數據（列）

[英]Subset data (columns) based on quantiles of column sums

原文 2013-01-22 16:14:47 1 2 r/ dataframe/ subset

有什么聰明的方法可以根據列總和的分位數從數據框中選擇列？ 例如，僅從數據列中選擇列總和在第一個分位數中的列。 我可以基於列總和的子集數據，也可以計算列總和的分位數，但是有沒有一種很好的方法可以將這些合並？ 謝謝。

# e.g. subset data - select columns whose column sums are less than 5
mydata <- mydata[,colSums(mydata) < 5]

# e.g create quantiles on colSums
mydata_cs <- colSums(mydata)
quart.mydata_cs <- quantile(mydata_cs,probs=seq(0,1, by=0.25))

2 個解決方案

使用您的mydata_cs ，以下應該可以工作

mydata.firstquart <- mydata[,mydata_cs < quantile(mydata_cs,0.25)]

根據您的第一行代碼，我假設“第一四分位數”是指最低四分位數。 如果您想要最高的四分位數，只需將其更改為

mydata.firstquart <- mydata[,mydata_cs > quantile(mydata_cs,0.75)]

您可能還想使用<=或>=而不是<和> 。

 x <- c(1,2,3,4,5)
 y <- c(4,6,9,2,9)
 df <- data.frame(x,y)
 q <-  quantile(colSums(df),probs=seq(0,1, by=0.25))
 df[,colSums(df) < q[2] ,drop=FALSE]

基於列總和的子集小標題，同時保留字符列

[英]Subset tibble based on column sums, while retaining character columns

為R中的列計算分位數到子集

[英]Computing Quantiles for a column in R to subset

遍歷列並根據每列的分位數過濾掉值

[英]Loop through columns and filter out values based on quantiles for each column

根據列總和從數據框中排除列

[英]Excluding columns from a dataframe based on column sums

基於列名的子集列

[英]subset columns based on column names

子集列基於同一數據框中列名的部分匹配

[英]Subset Columns based on partial matching of column names in the same data frame

使用 .SD 的 data.table 中列子集的累積總和

[英]Cumulativ sums of subset of columns in data.table using .SD

通過根據 R 中的分位數分配值在數據框中生成新列？

[英]Produce new column in data frame by assigning values based on quantiles in R?

基於列屬性的子集數據

[英]Subset Data Based on Column Attributes

如何基於不同列中的值對列進行子集？

[英]How to subset columns based on value in a different column?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 基於列總和的子集小標題，同時保留字符列為R中的列計算分位數到子集遍歷列並根據每列的分位數過濾掉值根據列總和從數據框中排除列基於列名的子集列子集列基於同一數據框中列名的部分匹配使用 .SD 的 data.table 中列子集的累積總和通過根據 R 中的分位數分配值在數據框中生成新列？基於列屬性的子集數據如何基於不同列中的值對列進行子集？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM