[英]How do I do statisticly analyze groups with different numbers of individuals and nested treatmens?
我目前正在研究我的 MSC 論文,但我擔心我不具備分析這些數據的統計知識水平。 在我的實驗中,有 3 種植物,分別有 31,40 和 82 個個體。 他們每個人都有自己的體重和身高,所以我也需要實施。 總共有 6 個處理,每個處理包含一個侵蝕級別和一個流速(這是設置中水流的速度 stream)。 對於每個侵蝕級別,我使用了 2 種不同的流速。 所以我假設流速被嵌套/阻塞到侵蝕中。 對於每次處理,測量植物莖的角度與站立垂直度的比較。 每個單獨的莖都以完全相同的順序經過每次處理。 無論如何我可以納入統計分析,最好是在 R 中。我試圖對我的數據的外觀進行示意圖概述。
你會是我的 MSC 論文的救星:)
提前致謝,祝您有美好的一天。
我已經嘗試將處理放入一個向量中,但由於控制組的長度都不同,所以它不起作用。
對於erosion
、 flowspeed
和species
的多個分類預測變量,這類似於所謂的“重復測量方差分析”。 這是一個線性 model,其中您考慮了對同一個人的重復測量。 問題在於,經典的重復測量方差分析假設每個處理/物種組中的觀察值數量相等,而您沒有。
處理不同數量觀測值的一種方法是線性混合 model。您使用erosion
、 flowspeed
和species
作為固定效應預測變量, angle
作為結果,並將單個植物視為提供隨機效應。
您為每個觀察設置 1 行數據,並附注angle
、 erosion
、 flowspeed
、 species
和指示單個植物的ID
。 最好只有 6 種erosion
與flowspeed
的組合將它們編碼為分類預測變量,而不是數字。 如果要在分析中包含這些變量,請在每行中也包含height
和weight
。 使用一組從 1 到 153 的ID
值,而不是在每個物種中從 1 重新編號。 否則軟件會認為ID=1
的植物都是同一個體,都是3個物種的一員!
使用lme4
中的 lme4 package,您可以從以下內容開始:
myModel <- lmer(angle ~ erosion*flowspeed*species + (1|ID), data = myData)
這允許根據erosion
、 flowspeed
和species
的組合與angle
進行不同的關聯。 它通過估計 153 個個體 (ID) 的不同截距( erosion
參考水平和flowspeed
和species
的估計angle
)來考慮重復測量。 您無需擔心“嵌套”等術語。 該軟件將正確解釋ID
值在處理/物種組合中的分布。
這將返回大量的固定效應回歸系數:根據我的快速計數,2 個用於erosion
,1 個用於flowspeed
,2 個用於species
,2 個用於erosion:flowspeed
相互作用,4 個用於erosion:species
相互作用,2 個用於flowspeed:species
相互作用, 和 4 用於erosion:flowspeed:species
相互作用。 不要花太多時間試圖單獨計算出這些系數。 他們描述 model 的方式使后續使用其他軟件的分析更加清晰。 您還將獲得ID
特定截距值之間方差的估計值。
我建議在 R car
package中使用Anova()
function 來評估erosion
和flowspeed
和species
及其交互集與angle
結果的整體關聯。 function 提供的“II 型”默認分析可以正確處理不同數量的觀察結果,而 R 中的標准 anova( anova()
或aov()
函數則不能。
然后,您可以使用emmeans
package中的建模后軟件來評估和比較固定效應預測變量組合中的預測angle
值。
您必須檢查是否合理滿足線性 model 的假設。 分類預測變量的主要問題是殘差范圍(觀測角度值和預測angle
值之間的差異)在預測值范圍內是否相似。 如果不是這種情況,您可能必須考慮對angle
值進行一些預轉換。 殘差的合理正態分布是一個優勢,但當您有大量觀測值時就不是那么重要了。
上面沒有在 model 中明確包含height
和weight
。它在ID
值和相應的隨機截距中隱含地包含它們。 您可以將它們作為顯式預測變量添加到 model 中。如果這樣做,請仔細考慮將它們包含在內的形式。 如果您只是將它們作為線性項包括在內,那么您就隱含地假設angle
與height
和weight
中的每一個線性相關且相加地與erosion
和flowspeed
和species
相關的所有其他影響之上。 這合理嗎?
最后,您在討論結果時需要解決研究設計的一個局限性。 由於所有植物都以相同的順序接受相同的處理,因此您不能排除結果存在時間或曝光依賴性的可能性。 也就是說,后期處理組合的結果可能不僅取決於erosion
、 flowspeed
和species
,還取決於經過的時間或之前經歷的處理。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.