[英]R logit model variable choice
我有一個數據集,其中每個家庭對五種發電方法中的每一種都有觀察結果(因此每個家庭出現 5 次)。 有一個虛擬變量標記他們使用哪種方法,因此樣本家庭可能看起來像——
hh_id choice choice_dummy
1 Grid 0
1 Diesel 0
1 Ownsolar 1
1 Solargrid 0
1 None 0
我需要在 logit model 中運行一些其他變量(價格、效用、負載、高峰時間),以查看是什么影響了選擇特定選擇的決定。 我知道為此使用 glm() ,但我不確定要為因變量輸入什么。 “Choice”實際上並沒有捕捉到做出的決定,因為“choice_dummy”實際上標記了這個決定,但“choice_dummy”本身並沒有提供任何信息。
我不能僅僅過濾choice_dummy 為1,因為這樣做會丟失所有其他變量的值。 有誰知道我會如何 go 關於運行 logit model 將每個家庭選擇能源的概率與變量“價格”、“可用性”、“負載”和“高峰時間”聯系起來,最好是使用代碼?
回復 OP 的評論 5/22/20:
hh_id<-c("1","1","1","1","1")
choice <- c("Grid","Diesel","Ownsolar","Solargrid","None")
choice_dummy <- c("0","0","1","0","0")
df <- data.frame(hh_id,choice,choice_dummy)
library(reshape2)
df2 <- dcast(df, hh_id ~ choice)
df2$power_choice <- ifelse(df2$Grid==1,"Grid",
ifelse(df2$Diesel==1,"Diesel",
ifelse(df2$Ownsolar==1,"Ownsolar",
ifelse(df2$Solargrid==1,"Solargrid",
ifelse(df2$None==1,"None",NA)))))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.