簡體   English   中英

推斷我使用方差分析和雙向假設檢驗的Inference()函數; R / RStudio

[英]Inference() Function Insisting That I Use ANOVA Versus Two-Sided Hypothesis Test; R/RStudio

我正在嘗試使用一個名為Inference()的自定義函數,如下面的代碼所示。 沒有該函數的文檔,但這是我在Coursera的DASI類中獲得的。 根據收到的反饋,我正在正確使用該功能。 我正在嘗試在我的類變量和我的wordum變量之間(即,在低類和工人階級的兩種方法之間)進行雙向假設檢驗。 因此,工人階級的平均詞匯量-下層階級的平均詞匯量。 但是,功能/ R / R Studio堅持要求我進行ANOVA測試。 這對我不起作用,因為我試圖拒絕null,並在兩個獨立均值之差之間創建一個置信區間。 我看過函數,但是由於我不是R專家,所以我看不到任何異常。 任何幫助是極大的贊賞。

碼:

load(url("http://bit.ly/dasi_gss_ws_cl"))
source("http://bit.ly/dasi_inference")

summary(gss)
by(gss$wordsum, gss$class, mean)
boxplot(gss$wordsum ~ gss$class)

gss_clean = na.omit(subset(gss, class == "WORKING" | class =="LOWER"))

inference(y = gss_clean$wordsum, x = gss_clean$class, est = "mean", type = "ht", 
          null = 0, alternative = "twosided", method = "theoretical")

返回值:

Response variable: numerical, Explanatory variable: categorical
Error: Use alternative = 'greater' for ANOVA or chi-square test.
In addition: Warning message:
Ignoring null value since it's undefined for ANOVA.

你需要

gss_clean <- droplevels(gss_clean)

然后您的inference()調用起作用了:

Response variable: numerical, Explanatory variable: categorical
Difference between two means
Summary statistics:
n_LOWER = 41, mean_LOWER = 5.0732, sd_LOWER = 2.2404
n_WORKING = 407, mean_WORKING = 5.7494, sd_WORKING = 1.8652
Observed difference between means (LOWER-WORKING) = -0.6762
H0: mu_LOWER - mu_WORKING = 0 
HA: mu_LOWER - mu_WORKING != 0 
Standard error = 0.362 
Test statistic: Z =  -1.868 
p-value =  0.0616 

問題在於,除非刪除未使用的因子水平,否則inference()的內部機制會認為您具有4級分類變量,並且它無法進行t檢驗或等效的2類檢驗:必須執行單向方差分析或類似方法。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM