簡體   English   中英

R子集功能:為什么它包含非子集數據?

[英]R subset function: why does it include non subsetted data?

我正在使用Datacamp的數據分析和統計推斷。 以下是要加載的與全球宗教和無神論指數相關的代碼,並將美國2012年數據作為子集。

load(url("http://s3.amazonaws.com/assets.datacamp.com/course/dasi/atheism.RData"))
us12 = subset(atheism, atheism$nationality == "United States" & atheism$year =="2012")

我的問題是為什么我打字時會看到其他國家

table(us12)

有沒有一種方法可以僅對過濾后的數據進行子集化?

謝謝。

因為us12data.frame ,其中nationalityresponse列是factors ,包括原始data.frame所有級別。

實際上, table(us12)返回您的計數,並且您可以看到,與美國不同國籍的所有計數均為零。

如果這對您來說是個問題,則可以使用droplevels函數,該函數刪除droplevels中實際上不存在的data.frame

> us12dropped=droplevels(us12)
> table(us12dropped)
, , year = 2012

               response
nationality     atheist non-atheist
  United States      50         952

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM