边际和条件 R^2 值的线性混合效应模型 (nlme/ lme4) 解释

Question

我正在调查细菌多样性，想知道多样性是否取决于 pH 值。 我的数据结构如下：

我有一个包含 17 项不同研究的数据集
每项研究都有多样性和 pH 值（研究之间的值数量不同）

现在我正在寻找一种方法来回答“pH 值对所有研究中的多样性是否有影响”这个问题

这个想法是使用 function lme并将学习设置为随机因素。 查看数据，它们似乎更适合二次项而不是线性回归，因此我尝试使用 pH 的二次项来计算 model：

my_model<- lme( fixed = Bacterial_diversity ~ pH +
I(pH^2),
random = ~ pH |Study,
data= my_data)

output（摘要）是：

> summary(my_model)
Linear mixed-effects model fit by REML
  Data: my_data
       AIC      BIC    logLik
  471.7855 497.7353 -228.8928

Random effects:
 Formula: ~pH | Paper
 Structure: General positive-definite, Log-Cholesky parametrization
            StdDev    Corr  
(Intercept) 4.4808759 (Intr)
pH          0.4783127 -0.88 
Residual    0.4154606       

Fixed effects:  Bacterial_diversity ~ pH + I(pH^2) 
                 Value Std.Error  DF   t-value p-value
(Intercept)  1.6641091 1.8078372 285  0.920497  0.3581
pH           1.1750097 0.4670426 285  2.515851  0.0124
I(pH^2)     -0.1187954 0.0363455 285 -3.268508  0.0012
 Correlation: 
        (Intr) pH    
pH      -0.895       
I(pH^2)  0.763 -0.959

Standardized Within-Group Residuals:
       Min         Q1        Med         Q3        Max 
-4.2091539 -0.4574020  0.1168270  0.6216446  2.0828655 

Number of Observations: 304
Number of Groups: 17

我真的不知道如何解释这些结果。 当我使用tab_model(my_model)时，我最终得到两个 R^2 值。 边际 R^2 (0.025) 和条件 R^2 (0.974)，给定的 p 值为 0.0012（对于 pH 的二次项）和 0.0124（对于 pH）。 是否为整个 model 计算了 R^2 值？ 以及如何解释 R^2 值？ 我可以说我的数据比线性回归更可能拟合二次项吗（由于 pH^2 的 p 值更显着）？

甚至是 model 我使用的是正确的还是我应该使用 nlme 而不是 lme4 （我真的不明白其中的区别。）。

我只想展示不同研究中 pH 值和细菌多样性之间的关系

如果您有任何想法，这将有很大帮助。 如果对数据、代码或其他任何问题有疑问，请随时提出。

Answer 1

摘要和引文

我建议使用performance package 甚至partR2 package，它们使用您提到的边缘和条件 R2 的 Nakagawa R2 值。 我还建议阅读有关该主题的这三篇论文，它们解释了价值观是什么：

配件一个 Model

我在下面提供了这些值和解释的工作示例。 首先，我在下面加载所需的包和 model。 为简单起见，我在此处删除了 NA 值，但在实际场景中应谨慎处理这些值。

#### Libraries ####
library(lmerTest) # for model fitting
library(performance) # for Nakagawa conditional/marginal R2
library(partR2) # for part R2 values
library(tidyverse) # for tidying data

#### Remove NA Values ####
carrots <- carrots %>% 
  drop_na()

#### Fit Model ####
fit <- lmer(Preference 
           ~ sens2 
           + Homesize 
           + (1 | Consumer),
           data=carrots)