簡體   English   中英

如何衡量回歸中的相互作用(定量*定性)

[英]How to scale interactions in regression (quantitative*qualitative)

假設我在一個模型中有兩個變量,以及它們的相互作用,如下所示:

lmer(response~x1+x2+x1*x2+(1|time), data=db) 

如果 x1 的規模很大(例如城市人口),我可能需要對變量進行縮放/居中。 我知道如果 x1 和 x2 是連續的,我可以縮放(或居中)所有預測變量,並在交互項中使用scale(x1*x2) 但是如果 x2 是分類變量呢? 使用scale(x1)*x2是否正確? 以及如何在兩種情況下(一種是分類的,一種是連續的,兩種是連續的)對其進行縮放?

如果 (1) 您需要在可比較的尺度上使用預測變量,則需要縮放預測變量,例如主成分分析或懲罰方法,如嶺回歸或 LASSO 或 (2) 您將遇到數值問題,就像生存中的指數預測變量值可能發生的那樣分析。 你似乎不屬於這兩種情況。

如果重新縮放連續預測變量,則可以降低回歸系數的大小。 例如,如果您將城市人口表示為數百萬居民的預測變量,則其回歸系數的大小將為使用未縮放人口時的$10^{-6}$ 但只要你始終如一,最終結果將是相同的。

如果您還以參與交互的此類預測變量為中心,請謹慎解釋您的結果,因為這會改變與之交互的預測變量的截距和明顯的“主要影響”。 這些通常是針對所有預測變量都處於 0 或參考水平的情況進行評估的,因此以預測變量為中心可以改變其他系數。 同樣,只要您保持一致,最終結果是相同的。

沒有一種萬能的方法來標准化分類預測變量 由於您沒有使用懲罰,因此無需為此應用程序考慮。

我建議縮放模型中的所有變量或不縮放。 是的,當 x2 是分類變量時,您可以縮放 x1。 因為你有response~x1+x2+x1*x2(Cat =1) + x1*x2(Cat=2) +x1*x2(Cat=3) ,因此每個類別都有一個交互項。 而且,如果您想取消縮放變量,則必須加上均值並乘以標准差,因為您將變量縮放為均值 0 和 sd = 1。希望我能提供幫助:)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM