[英]R subset function: why does it include non subsetted data?
我正在使用Datacamp的數據分析和統計推斷。 以下是要加載的與全球宗教和無神論指數相關的代碼,並將美國2012年數據作為子集。
load(url("http://s3.amazonaws.com/assets.datacamp.com/course/dasi/atheism.RData"))
us12 = subset(atheism, atheism$nationality == "United States" & atheism$year =="2012")
我的問題是為什么我打字時會看到其他國家
table(us12)
有沒有一種方法可以僅對過濾后的數據進行子集化?
謝謝。
因為us12
是data.frame
,其中nationality
和response
列是factors
,包括原始data.frame
所有級別。
實際上, table(us12)
返回您的計數,並且您可以看到,與美國不同國籍的所有計數均為零。
如果這對您來說是個問題,則可以使用droplevels
函數,該函數刪除droplevels
中實際上不存在的data.frame
:
> us12dropped=droplevels(us12)
> table(us12dropped)
, , year = 2012
response
nationality atheist non-atheist
United States 50 952
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.