[英]R tilde operator: What does ~0+a means?
我已经看到如何在公式中使用〜运算符。 例如, y~x
表示:y分布为x。
但是我真的很困惑这个代码中的~0+a
手段:
require(limma)
a = factor(1:3)
model.matrix(~0+a)
为什么只有model.matrix(a)
不起作用? 为什么model.matrix(~a)
的结果与model.matrix(~0+a)
? 最后〜操作符的含义是什么?
~
创建一个公式 - 它将公式的右侧和左侧分开
从?`~`
Tilde用于分离模型公式中的左侧和右侧
引用公式的帮助
通过例如lm和glm函数拟合的模型以紧凑的符号形式指定。 〜运算符是这种模型形成的基础。 形式为y~exode的表达式被解释为响应y由由模型符号指定的线性预测器建模的规范。 这样的模型由一系列由+运算符分隔的术语组成。 术语本身由变量和因子名称组成,由运算符分隔。 这个术语被解释为该术语中出现的所有变量和因素的相互作用。
除了+和:之外,许多其他运算符在模型公式中也很有用。 *运算符表示因子交叉:a * b被解释为a + b + a:b。 ^运算符表示交叉到指定的度数。 例如(a + b + c)^ 2与(a + b + c)*(a + b + c)相同,后者又扩展为包含a,b和c及其第二个的主效应的公式订单交互。 %in%运算符表示其左侧的术语嵌套在右侧的术语中。 例如,a + b%in%a扩展为公式a + a:b。 - 运算符删除指定的项,因此(a + b + c)^ 2 - a:b与a + b + c + b:c + a:c相同。 它还可用于删除截距项:当拟合线性模型时,y~x - 1指定通过原点的直线。 没有截距的模型也可以指定为y~x + 0或y~0 + x。
~a+0
具体问题 a
因素, model.matrix(~a)
将返回一个拦截列,即a1
(你需要n-1
指标才能完全指定n
类) 每个功能的帮助文件都写得很好,详细且易于查找!
model.matrix(a)
工作 model.matrix(a)
不起作用,因为a
是factor
变量,而不是公式或术语对象
来自model.matrix
的帮助
对象一个适当类的对象。 对于默认方法,模型公式或术语对象。
R
正在寻找一个特定的对象类,通过传递一个公式~a
你传递一个类formula
的对象。 model.matrix(terms(~a))
也可以工作,(传递对应于公式的术语对象~a
@BenBolker在评论中有用地指出,这是威尔金森 - 罗杰斯符号的修改版本。
R简介中有一个很好的描述。
在阅读了几本手册之后,我最近对model.matrix(~0+x)
的含义感到困惑,我发现这本书很精彩 。
在数学中, 0+a
等于a
,写一个像0+a
这样的术语非常奇怪。 然而,我们在这里处理线性模型:一个简单的高中方程,如y=ax+b
,它揭示了预测变量(x)和观测值(y)之间的关系。
因此我们可以将~0+x
或同等~x+0
视为形式的等式: y=ax+b
。 通过加0
我们强制b
为零,这意味着我们正在寻找一条通过原点的线(没有截距)。 如果我们指出像~x+1
或只是~x
,那么拟合方程可能包含非零项b
。 同样,我们可以通过公式~x-1
或~-1+x
~x-1
~-1+x
来限制b
,这两者都意味着:没有截距(与我们通过负指数排除R中的行或列的方式相同)。 然而,像~x-2
或~x+3
是没有意义的。
感谢@mnel的有用评论,最后是什么原因使用~
而不是=
? 在标准数学术语/符号体系中, y~x
表示y等于x, y=x
稍微弱一些。 当您拟合线性模型时,您并不是真的说y=x
,而是您可以将y建模为x的线性函数(例如, y = ax+b
)
为了回答部分问题,使用波浪号分隔模型公式中的左侧和右侧。 请参阅?"~"
以获取更多帮助。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.