簡體   English   中英

基數R中的數據集具有缺失值

[英]Dataset in base R with missing values

基礎R中是否有任何包含缺失值的數據集示例? 我一直在查看每一個,並且到目前為止還使用google搜索。

library(MASS)
data()

編輯:我知道如何在R中的數據集中添加缺失值,我只想知道是否存在任何此類數據集。

airquality是基礎並且有一些NA

> summary(airquality)
     Ozone           Solar.R           Wind             Temp           Month            Day      
 Min.   :  1.00   Min.   :  7.0   Min.   : 1.700   Min.   :56.00   Min.   :5.000   Min.   : 1.0  
 1st Qu.: 18.00   1st Qu.:115.8   1st Qu.: 7.400   1st Qu.:72.00   1st Qu.:6.000   1st Qu.: 8.0  
 Median : 31.50   Median :205.0   Median : 9.700   Median :79.00   Median :7.000   Median :16.0  
 Mean   : 42.13   Mean   :185.9   Mean   : 9.958   Mean   :77.88   Mean   :6.993   Mean   :15.8  
 3rd Qu.: 63.25   3rd Qu.:258.8   3rd Qu.:11.500   3rd Qu.:85.00   3rd Qu.:8.000   3rd Qu.:23.0  
 Max.   :168.00   Max.   :334.0   Max.   :20.700   Max.   :97.00   Max.   :9.000   Max.   :31.0  
 NA's   :37       NA's   :7                                                                      

VIM包中包含一些缺少數據的數據集的好例子。 當我教導缺失值插補時,我使用該包中的睡眠數據集。

我會用NA創建我自己的數值數據集。 這是創建名為df的10x10 data.frame的一種方法,並將80以上的值替換為NA。

df <- data.frame(matrix(data = sample(100,100,replace=TRUE), ncol = 10))
df[df>80] <- NA

獎金,然后您可以使用visdat包檢查NA的視覺效果。

library(visdat)
vis_miss(df)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM