簡體   English   中英

R中的多元線性回歸模型

[英]Multiple linear regression model in R

我正在嘗試使用此數據創建多元線性回歸模型:

    bweight   gestwks            hyp sex    

1    2974 38.5200004577637       0 female          
2    3270 NA                     0 male            
3    2620 38.150001525878899     0 female          
4    3751 39.799999237060497     0 male            
5    3200 38.889999389648402     1 male           
6    3673 40.970001220703097     0 female          

為了考慮字符串類型參數“male”和“female”,我將它們轉換為整數 1 和 0,如下所示:

male = 1*(sex == "male")

因此,創建線性模型,其中嬰兒體重是結果變量:

lm2 = lm(bweight ~ gestwks + hyp + male)

但是當我想查看模型的參數時,我得到了這個(這里不包括整個輸出):

Call:
lm(formula = bweight ~ gestwks + 
    hyp + male)

Coefficients:
                              (Intercept)  gestwks26.950000762939499  
                                  864.000                                   -236.000  
gestwks27.329999923706101    gestwks27.9899997711182  
                                    7.363                                    146.469  
gestwks28.040000915527301   gestwks30.5200004577637  
                                  184.469                                    760.469  
gestwks30.649999618530298  gestwks30.709999084472699  
                                  900.000                                   -141.531

我應該只得到一對參數。 我究竟做錯了什么?

在進行任何分析之前,請務必仔細探索您的變量。 注意連續變量的范圍和分布以及分類變量的頻率。 導入數據后執行此操作。

在這種情況下, gestwks變量實際上不是數字。 如果您查看了str(my_data)的輸出,其中my_data是數據框的名稱,那么您就會看到該變量的潛在問題。 您可能需要修改命令以導入數據。 如果它是正確的,那么您需要使用適當的命令將變量轉換為數字變量。 閱讀的幫助頁面警告as.numeric 。*

數據管理是分析的關鍵部分。

仔細查看gestwks以獲取奇怪的值。 如果沒有太多記錄, table可以提供幫助,或者查看第一個和最后幾個排序值。

* as.numeric (levels (f))[f]as.numeric (as.character (f))是推薦的命令。

gestwks 是一個因素,您需要在回歸之前將其轉換為as.numeric

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM