簡體   English   中英

比較兩條曲線的趨勢差異

[英]Comparing two curves for difference in trend

我有一些關於全州吸毒隨時間變化的趨勢的數據。 我想知道隨着時間的推移,靜脈吸毒的性別差異與所有娛樂性吸毒的性別差異是否發生了變化。

我的數據如下。 我想我可能需要使用時間序列分析,但我不確定。 任何幫助將非常感激。

在此處輸入圖片說明

由於問題中的描述與數據不匹配,因為沒有關於性別的信息,我們將從主題中假設我們要確定非法和 iv 的趨勢是否相同。

比較趨勢

請注意, ivillicit的去趨勢值沒有自相關,因此我們將使用普通的線性模型。

iv <- c(0.4, 0.3, 0.4, 0.3, 0.2, 0.2)
illicit <- c(5.5, 5.7, 4.8, 4.7, 6.1, 5.3)
time <- 2011:2016

ar(resid(lm(iv ~ time)))
## Call:
## ar(x = resid(lm(iv ~ time)))
##
## Order selected 0  sigma^2 estimated as  0.0024

ar(resid(lm(illicit ~ time)))
## Call:
## ar(x = resid(lm(illicit ~ time)))
##
## Order selected 0  sigma^2 estimated as  0.287

創建一個長度為 12x3 的數據框long其中包含timevalueindivillicit )列。 然后運行具有兩個斜率和另一個具有一個斜率的線性模型。 兩者都有兩個攔截。 然后使用anova比較它們。 顯然,它們沒有顯着差異,因此我們不能拒絕斜率相同的假設。

wide <- data.frame(iv, illicit)
long <- cbind(time, stack(wide))

fm2 <- lm(values ~ ind/(time + 1) + 0, long)
fm1 <- lm(values ~ ind + time + 0, long)
anova(fm1, fm2)

給予:

Analysis of Variance Table

Model 1: values ~ ind + time + 0
Model 2: values ~ ind/(time + 1) + 0
  Res.Df    RSS Df Sum of Sq      F Pr(>F)
1      9 1.4629                           
2      8 1.4469  1  0.016071 0.0889 0.7732

比較有斜坡的模型和沒有斜坡的模型

實際上,斜率一開始並不重要,我們不能拒絕兩個斜率都為零的假設。 與沒有斜率的兩個截距模型進行比較。

fm0 <- lm(values ~ ind + 0, long)
anova(fm0, fm2)

給予:

Analysis of Variance Table

Model 1: values ~ ind + 0
Model 2: values ~ ind/(time + 1) + 0
  Res.Df    RSS Df Sum of Sq      F Pr(>F)
1     10 1.4750                           
2      8 1.4469  2  0.028143 0.0778 0.9258

或者運行逐步回歸,我們發現它最喜歡的模型是一個有兩個截距且沒有斜率的模型:

step(fm2)

給予:

Start:  AIC=-17.39
values ~ ind/(time + 1) + 0

           Df Sum of Sq    RSS     AIC
- ind:time  2  0.028143 1.4750 -21.155
<none>                  1.4469 -17.386

Step:  AIC=-21.15
values ~ ind - 1

       Df Sum of Sq     RSS     AIC
<none>                1.475 -21.155
- ind   2    172.28 173.750  32.073

Call:
lm(formula = values ~ ind - 1, data = long)

Coefficients:
     indiv  indillicit  
      0.30        5.35  

對數轉換值

如果我們使用 log(values) 那么我們同樣沒有發現自相關(未顯示),但我們確實發現對數轉換值的斜率顯着不同。

fm2log <- lm(log(values) ~ ind/(time + 1) + 0, long)
fm1log <- lm(log(values) ~ ind + time + 0, long)

anova(fm1log, fm2log)

給予:

Analysis of Variance Table

Model 1: log(values) ~ ind + time + 0
Model 2: log(values) ~ ind/(time + 1) + 0
  Res.Df     RSS Df Sum of Sq      F  Pr(>F)  
1      9 0.35898                              
2      8 0.18275  1   0.17622 7.7141 0.02402 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM