簡體   English   中英

大型數據集的回歸類型,非線性,R

[英]Type of regression for large dataset, nonlinear, skewed in R

我正在研究不同生物群落中的飛蛾生物量,我想找到一個估計生物量的 model。 我測量了 37088 個標本的前翅、腹部和胸部的長度和寬度,並分別稱重(干燥)。

首先,我想對生物量的每個變量進行簡單的線性回歸。 問題是,沒有一個假設得到滿足。 數據不是線性的,生物量(和一些變量)不服從正態分布,存在異方差和大量異常值。 現在我嘗試使用 log、x^2、1/x 和 boxcox 轉換我的數據,但它們都沒有真正幫助。 我還嘗試過 Thiel-Sen 回歸(因為數據太多而無法實現)和 Siegel 回歸(生物質不是向量)。 我可以嘗試其他形式的非參數或基於中值的回歸嗎? 因為我真的沒有想法。

這是生物量的頻率直方圖:頻率直方圖干生物量

所以我真正想做的是構建一個 model,它可以根據我進行的測量准確估計干生物量。 我有一個適用於所有昆蟲的電源 function(Rogers 等人),但這個估計值與我實際稱重的值之間存在顯着差異。 因此,我只想構建一個包含所有重要變量的 model。 我對冪函數不是很熟悉,但也許可以自己構建一個? 任何人都可以推薦一種方法嗎? 提前致謝。

要安裝電源 function,您也許可以從 minpack.lm package 嘗試 nlsLM


library(minpack.lm)
m <- nlsLM( y ~ a*x^b, data=your.data.here )

然后看看它是否表現令人滿意。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM