[英]How to Perform Statistical Two-Sided Test for Independence (on Proportion) in R?
[英]Inference() Function Insisting That I Use ANOVA Versus Two-Sided Hypothesis Test; R/RStudio
我正在嘗試使用一個名為Inference()的自定義函數,如下面的代碼所示。 沒有該函數的文檔,但這是我在Coursera的DASI類中獲得的。 根據收到的反饋,我正在正確使用該功能。 我正在嘗試在我的類變量和我的wordum變量之間(即,在低類和工人階級的兩種方法之間)進行雙向假設檢驗。 因此,工人階級的平均詞匯量-下層階級的平均詞匯量。 但是,功能/ R / R Studio堅持要求我進行ANOVA測試。 這對我不起作用,因為我試圖拒絕null,並在兩個獨立均值之差之間創建一個置信區間。 我看過函數,但是由於我不是R專家,所以我看不到任何異常。 任何幫助是極大的贊賞。
碼:
load(url("http://bit.ly/dasi_gss_ws_cl"))
source("http://bit.ly/dasi_inference")
summary(gss)
by(gss$wordsum, gss$class, mean)
boxplot(gss$wordsum ~ gss$class)
gss_clean = na.omit(subset(gss, class == "WORKING" | class =="LOWER"))
inference(y = gss_clean$wordsum, x = gss_clean$class, est = "mean", type = "ht",
null = 0, alternative = "twosided", method = "theoretical")
返回值:
Response variable: numerical, Explanatory variable: categorical
Error: Use alternative = 'greater' for ANOVA or chi-square test.
In addition: Warning message:
Ignoring null value since it's undefined for ANOVA.
你需要
gss_clean <- droplevels(gss_clean)
然后您的inference()
調用起作用了:
Response variable: numerical, Explanatory variable: categorical
Difference between two means
Summary statistics:
n_LOWER = 41, mean_LOWER = 5.0732, sd_LOWER = 2.2404
n_WORKING = 407, mean_WORKING = 5.7494, sd_WORKING = 1.8652
Observed difference between means (LOWER-WORKING) = -0.6762
H0: mu_LOWER - mu_WORKING = 0
HA: mu_LOWER - mu_WORKING != 0
Standard error = 0.362
Test statistic: Z = -1.868
p-value = 0.0616
問題在於,除非刪除未使用的因子水平,否則inference()
的內部機制會認為您具有4級分類變量,並且它無法進行t檢驗或等效的2類檢驗:必須執行單向方差分析或類似方法。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.