簡體   English   中英

R logit model 變量選擇

[英]R logit model variable choice

我有一個數據集,其中每個家庭對五種發電方法中的每一種都有觀察結果(因此每個家庭出現 5 次)。 有一個虛擬變量標記他們使用哪種方法,因此樣本家庭可能看起來像——

hh_id  choice     choice_dummy  
1      Grid        0
1      Diesel      0
1      Ownsolar    1
1      Solargrid   0
1      None        0

我需要在 logit model 中運行一些其他變量(價格、效用、負載、高峰時間),以查看是什么影響了選擇特定選擇的決定。 我知道為此使用 glm() ,但我不確定要為因變量輸入什么。 “Choice”實際上並沒有捕捉到做出的決定,因為“choice_dummy”實際上標記了這個決定,但“choice_dummy”本身並沒有提供任何信息。

我不能僅僅過濾choice_dummy 為1,因為這樣做會丟失所有其他變量的值。 有誰知道我會如何 go 關於運行 logit model 將每個家庭選擇能源的概率與變量“價格”、“可用性”、“負載”和“高峰時間”聯系起來,最好是使用代碼?

回復 OP 的評論 5/22/20:

hh_id<-c("1","1","1","1","1")
choice <- c("Grid","Diesel","Ownsolar","Solargrid","None")
choice_dummy <- c("0","0","1","0","0")
df <- data.frame(hh_id,choice,choice_dummy)

library(reshape2)

df2 <- dcast(df, hh_id ~ choice)

df2$power_choice <- ifelse(df2$Grid==1,"Grid",
ifelse(df2$Diesel==1,"Diesel",
ifelse(df2$Ownsolar==1,"Ownsolar",
ifelse(df2$Solargrid==1,"Solargrid",
ifelse(df2$None==1,"None",NA)))))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM