[英]Logistic Regression Model & Multicolinearity of Categorical Variables in R
[英]How do you test for departure from linear trend across ordered categorical variables with logistic regression using R?
我正在測試有序分類自變量中二進制結果的對數幾率的線性趨勢。 通過將自變量視為連續變量可以直接實現。
我還試圖測試是否偏離線性趨勢。 我了解這是將(a)將自變量分類的模型與(b)將自變量視為連續的模型進行比較。 但是我不確定如何在R中執行此操作。
有人可以幫忙嗎?
我在下面創建了一個可復制的示例。 前7行僅創建一個數據集。 model1
將自變量視為分類變量; model2
為連續的。
model2
提供了有力的證據,線性趨勢比完全沒有趨勢更好地解釋了趨勢,但是在這種情況下,線性趨勢顯然不是很好的解釋。
# create dataset 'a'
n <- 200
ngroups <- 7
a <- data.frame(group = rep(letters[1:ngroups], n), group2 = rep(1: ngroups, n), n = runif(n * ngroups, 0, 1))
y <- data.frame(group = letters[1:ngroups], fac = 1/(1 + exp(-1 * 1:ngroups)))
a <- merge(a, y, by = "group")
a$n2 <- a$n * a$fac
a$ind <- ifelse(a$n2 > quantile(a$n2)[4], 1, 0)
# run models
model1 <- glm(ind ~ group, data = a, family = "quasibinomial")
model2 <- glm(ind ~ group2, data = a, family = "quasibinomial")
回答我自己的問題...
您進行似然比測試以比較兩個模型:
anova(model1, model2, test = "LRT")
這很可能會給出較低的p值,這表明模型是不同的,並且有證據表明非線性趨勢比線性趨勢更適合數據。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.