繁体   English   中英

如何在 R 中使用交互项和多个非交互变量运行 GLM?

[英]How do I to run GLM with interaction term and multiple non-interaction variables in R?

我有一个数据集,根据非常明确的活动期(例如,第 1 个月的计数非常高,第 2 个月的计数中等,第 3 个月的计数很低),我的因变量的观察结果显示出明显的差异。 我的假设是,环境变量不能解释月份的这些差异,并且环境变量不会影响高活动月份的计数(例如,这些差异有一些重要的生物学驱动,它超越了那个时期的任何环境条件),但是在低计数的几个月内,计数由环境变量解释。 我如何为此编码 GLM model? 会不会是这样:

#activity is categorical variable of high, med, low
GLM <- counts ~ activity + temp + percip + time + activity * temp + percip + time
  1. 您在问题末尾提出的公式具有交互作用,但它还包含冗余术语,由于完美的共线性,这些术语将从 model 中退出。 如果要进行乘法交互,则需要将 model 项相乘。 您可以使用*作为简写来包含主要术语和交互作用术语。 例如, y~x*z等价于y ~ x + z + x:z ,其中x:z等价于向量xz的元素乘法。 如果你不想要主要术语而只想要交互,你可以做y ~ x:z

  2. 如果您有其他不相互作用的变量或其他相互作用的变量,那么您只需将它们输入到 model 公式中,用+分隔。 例如,您可以添加w与: y ~ x*z + w

  3. 例如,如果您使用的是 Poisson model,您可以将所有这些放在一起,如下所示: glm(counts ~ activity*temp + percip, family="poisson", data = foo)) 这将估计截距、主项系数(当 temp = 0 时活动的偏导数和当活动 = 0 时的 temp 偏导数)和交互作用(一个变量的偏导数如何随另一个变量的水平变化。

  4. 听起来您可能不了解您希望拟合的统计 model。 本网站不适用于统计问题,但您可以查看https://stats.stackexchange.com/如果您想对您的特定统计 model 进行反馈。 话虽如此,这里发生了一些严重的统计误解,我将保留以供评论。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM