簡體   English   中英

在 R 中估計 Pareto 類型 2 的參數

[英]Estimating the parameters for a Pareto type 2 in R

我有一個從 0 到 1 的連續變量(百分比數據,包括 0),我想確定它的最佳分布為 model。 我在 R-Studio 上,這里有問題的數據。 請注意,大約 27% 的觀測值是 0,我確實計划像我 go 那樣探索零通貨膨脹。

我檢查了直方圖和 ecdf(見下文)以了解我正在處理的內容。 Fitdistrplus 給了我“beta”,而 gamlss 給了我 Pareto Type 2,我不是很熟悉。

在此處輸入圖像描述 在此處輸入圖像描述

我已經確定了 beta 分布的參數並對其進行了擬合,使用 KS 測試了其他一些分布,但仍然停留在 Pareto Type 2 上。問題是:我在估計位置和比例方面的所有嘗試都失敗了。 據我所知,這是因為數據集中的零。 如果我向整個數據集添加少量(即 0.0001),它會起作用,但老實說,我不確定這是一個好的解決方案,並且會把它與其他任何東西進行比較。 我嘗試了 EnvStats、VGAM、CaDENCE,但都給我錯誤。 因此,我謙虛地來到這里,希望有人可以建議另一種方法來估計該數據集的 Pareto Type 2 參數。

您可以考慮以下方法:

library(DEoptim)

df <- read.csv("percentData.csv")
data <- unlist(df)

log_Lik <- function(data, param)
{
  x <- data
  k <- param[1]
  s <- param[2]
  log_Lik <- sum(log(k/(s + x) * (s / (s + x)) ^ k)) 
  return(-log_Lik)
}

obj_Res <- DEoptim(fn = log_Lik, lower = c(0, 0), upper = c(1000, 1000), data = data, control = list(parallelType = 1))
obj_Res$optim$bestmem

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM