簡體   English   中英

用R繪制線性模型(lm)時產生的NaN

[英]NaNs produced when plotting a linear model (lm) with R

我正在嘗試創建一個正常的回歸模型和一個邏輯模型來預測真實狀態數據中的欺詐行為。 我使用混合數據集(分類變量和數值變量)進行預處理和重新編碼,以使每個分類變量的每個級別的權重保持平衡(避免僅包含1個注冊表的級別與包含許多級別的級別混合的變量)觀察,等等)。 我添加了一個交互來增加我的lm的R ^ 2。 當我要繪制線性模型時,會收到以下警告:

    Warning messages:
1: In sqrt(crit * p * (1 - hh)/hh) : NaNs produced
2: In sqrt(crit * p * (1 - hh)/hh) : NaNs produced

它似乎與庫克的距離有關-https://bugs.r-project.org/bugzilla3/show_bug.cgi?format=multiple&id =9316- (影響因素,即使我刪除了異常值...)。 知道導致此錯誤的原因是什么,如何繪制線性模型?

我的代碼示例:

lm.a3 <- lm(log(response) ~(.-file_status)*file_status, data=data) 
final.lm3 <- stepAIC(lm.a3,direction="both")
summary(final.lm3) #R^2 = 64%
par(mfrow=c(2,2))
plot(final.lm3)

感謝您的寶貴時間,我感謝您的答復

問題是我在運行stepAIC函數以提高擬合度之前進行了對數轉換。 正如我的某些響應變量等於1一樣,當執行log(response_variable)時,在某些情況下此函數的輸出等於零。 向對數函數的參數添加最小數量可以解決此問題:log(response_variable + 0.0001234)。 感謝@LyzandeR的反饋。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM