簡體   English   中英

刪除數據框中大於95百分位數的數據

[英]remove data greater than 95th percentile in data frame

我有這樣的數據:

DF:

Group   Point
A       6000
B       5000
C       1000
D        100
F        70

在我繪制這個df之前,我只想刪除數據框中超過95百分位數的值。 有誰告訴我該怎么做?

使用quantile功能

> quantile(d$Point, 0.95)
 95% 
5800 

> d[d$Point < quantile(d$Point, 0.95), ]
  Group Point
2     B  5000
3     C  1000
4     D   100
5     F    70

或使用'dplyr'庫:

> quantile(d$Point, 0.95)
 95% 
5800

> df %>% filter(Point < quantile(df$Point, 0.95))
  Group Point
1     B  5000
2     C  1000
3     D   100
4     F    70

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM