簡體   English   中英

我如何對具有不同數量的個體和嵌套治療的組進行統計分析?

[英]How do I do statisticly analyze groups with different numbers of individuals and nested treatmens?

我目前正在研究我的 MSC 論文,但我擔心我不具備分析這些數據的統計知識水平。 在我的實驗中,有 3 種植物,分別有 31,40 和 82 個個體。 他們每個人都有自己的體重和身高,所以我也需要實施。 總共有 6 個處理,每個處理包含一個侵蝕級別和一個流速(這是設置中水流的速度 stream)。 對於每個侵蝕級別,我使用了 2 種不同的流速。 所以我假設流速被嵌套/阻塞到侵蝕中。 對於每次處理,測量植物莖的角度與站立垂直度的比較。 每個單獨的莖都以完全相同的順序經過每次處理。 無論如何我可以納入統計分析,最好是在 R 中。我試圖對我的數據的外觀進行示意圖概述。 在此處輸入圖像描述

你會是我的 MSC 論文的救星:)

提前致謝,祝您有美好的一天。

我已經嘗試將處理放入一個向量中,但由於控制組的長度都不同,所以它不起作用。

對於erosionflowspeedspecies的多個分類預測變量,這類似於所謂的“重復測量方差分析”。 這是一個線性 model,其中您考慮了對同一個人的重復測量。 問題在於,經典的重復測量方差分析假設每個處理/物種組中的觀察值數量相等,而您沒有。

處理不同數量觀測值的一種方法是線性混合 model。您使用erosionflowspeedspecies作為固定效應預測變量, angle作為結果,並將單個植物視為提供隨機效應。

您為每個觀察設置 1 行數據,並附注angleerosionflowspeedspecies和指示單個植物的ID 最好只有 6 種erosionflowspeed的組合將它們編碼為分類預測變量,而不是數字。 如果要在分析中包含這些變量,請在每行中也包含heightweight 使用一組從 1 到 153 的ID值,而不是在每個物種中從 1 重新編號。 否則軟件會認為ID=1的植物都是同一個體,都是3個物種的一員!

使用lme4中的 lme4 package,您可以從以下內容開始:

myModel <- lmer(angle ~ erosion*flowspeed*species + (1|ID), data = myData)

這允許根據erosionflowspeedspecies組合angle進行不同的關聯。 它通過估計 153 個個體 (ID) 的不同截距( erosion參考水平和flowspeedspecies的估計angle )來考慮重復測量。 您無需擔心“嵌套”等術語。 該軟件將正確解釋ID值在處理/物種組合中的分布。

這將返回大量的固定效應回歸系數:根據我的快速計數,2 個用於erosion ,1 個用於flowspeed ,2 個用於species ,2 個用於erosion:flowspeed相互作用,4 個用於erosion:species相互作用,2 個用於flowspeed:species相互作用, 和 4 用於erosion:flowspeed:species相互作用。 不要花太多時間試圖單獨計算出這些系數。 他們描述 model 的方式使后續使用其他軟件的分析更加清晰。 您還將獲得ID特定截距值之間方差的估計值。

我建議在 R car package中使用Anova() function 來評估erosionflowspeedspecies及其交互集與angle結果的整體關聯。 function 提供的“II 型”默認分析可以正確處理不同數量的觀察結果,而 R 中的標准 anova( anova()aov()函數則不能。

然后,您可以使用emmeans package中的建模后軟件來評估和比較固定效應預測變量組合中的預測angle值。

您必須檢查是否合理滿足線性 model 的假設。 分類預測變量的主要問題是殘差范圍(觀測角度值和預測angle值之間的差異)在預測值范圍內是否相似。 如果不是這種情況,您可能必須考慮對angle值進行一些預轉換。 殘差的合理正態分布是一個優勢,但當您有大量觀測值時就不是那么重要了。

上面沒有在 model 中明確包含heightweight 。它在ID值和相應的隨機截距中隱含地包含它們。 您可以將它們作為顯式預測變量添加到 model 中。如果這樣做,請仔細考慮將它們包含在內的形式。 如果您只是將它們作為線性項包括在內,那么您就隱含地假設angleheightweight中的每一個線性相關且相加地與erosionflowspeedspecies相關的所有其他影響之上。 這合理嗎?

最后,您在討論結果時需要解決研究設計的一個局限性。 由於所有植物都以相同的順序接受相同的處理,因此您不能排除結果存在時間或曝光依賴性的可能性。 也就是說,后期處理組合的結果可能不僅取決於erosionflowspeedspecies ,還取決於經過的時間或之前經歷的處理。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM