[英]error in finalfit::missing_compare: does not find an object
[英]missing_compare error from “finalfit” package
我試圖從“ finalfit”包中獲取此命令“ missing_compare”,以適合我的數據集:
proced<- c(1,NA,0,1,0,1,0)
asa<- c(4,3,4,2,5,1,NA)
albumin<- c(NA, NA, 3.572, NA, NA, NA, 4.262)
death<- c(0,0,1,0,1,1,0)
bmi<- c(26.04, NA, 31.23, 36.93, 28.9, NA, 30.01)
dataframe = data.frame(proced, as, albumin, death, bmi)
(此數據框實際上要大得多)
然后:
dataframe$death = factor(dataframe$death)
dataframe$proced = factor(dataframe$proced)
dataframe$asa = factor(dataframe$asa)
接着:
explanatory = c("proced", "asa",
"bmi", "albumin")
dependent = "death"
dataframe %>%
summary_factorlist(dependent, explanatory,
na_include=TRUE, p=TRUE)
但是我無法使它工作:
dataframe %>%
missing_compare(dependent, explanatory)
當我嘗試對整個數據集執行missing_compare命令時,出現此錯誤:
Error in `[.default`(x, , 2) : subscript out of bounds
In addition: Warning messages:
1: In cor(x, rank(y)) : the standard deviation is zero
2: In cor(x, rank(y)) : the standard deviation is zero
救命!
您的因變量death
沒有缺失值,這是使用missing_compare
函數的關鍵。 查看該函數的文檔以獲取更多信息,
盡管它很少
。
missing_compare
函數將因變量缺失時的解釋變量與因變量不缺失時的解釋變量進行比較。 它應用測試來分析這兩個是否來自相同的分布。
使用您的示例進行說明(請注意,為簡單起見,我減少了DV的數量):
explanatory = c("proced", "bmi")
dependent = "death"
dataframe2 <- dataframe
dataframe2$death[3:4] = NA
dataframe2 %>%
missing_compare(dependent, explanatory)
Missing data analysis: death Not missing Missing p
2 proced 0 2 (66.7) 1 (33.3) 1.000
3 1 2 (66.7) 1 (33.3)
1 bmi Mean (SD) 28.3 (2) 34.1 (4) 0.058
Warning message:
In chisq.test(tab, correct = FALSE) :
Chi-squared approximation may be incorrect
我將2個NA
值添加到因變量death
,然后代碼運行。 因此,例如,該函數將缺少death
的bmi
值與沒有death
的bmi
值進行比較。 p
列指示組之間的差異是否具有統計顯着性(連續變量為Chi-Squared和Kruskal-Wallis)。 我警告不要僅依賴p值來進行這種類型的分析,但這與代碼的工作方式無關。
歡迎使用Stack Overflow!
編輯:偉大的小插圖
如@astrofunkswag所述,此函數的目的是比較特定變量之間的缺失分布。
您最好先可視化丟失的數據,例如
dataframe %>% missing_pairs(dependent, explanatory)
這將幫助您了解所擁有的數據。
大量的小插圖出汗了,人們指責您的文檔稀疏:) http://finalfit.org/articles/missing.html
讓我知道您是否仍然無法正常工作。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.