R中有序因子变量和无序因子变量之间的差异

Question

我一直在尝试在R中找到ordered和无序factor变量之间的区别。特别是在?factor文档中的这一行令我困惑：

Ordered factors differ from factors only in their class, but methods and
the model-fitting functions treat the two classes quite differently.

我最接近找到答案的答案来自这三个问题的答案：

在回答上述第一个问题时， @ joran曾说过“统计差异的详细摘要可能超出了StackOverflow答案的范围。”

我不是在这里寻找一个详细的摘要，但是任何人都可以给出一个小而简单的例子来说明当在方法和模型拟合函数中使用时， ordered和无序factor有何不同？

Answer 1

有序因子默认使用正交多项式对比。 L和Q代表线性和二次项。 无序因素使用“治疗”对比虽然（它们实际上没有对比）。

了解阅读： http ： //r.789695.n4.nabble.com/Models-with-ordered-and-unordered-factors-td4072225.html http://www.stat.berkeley.edu/~s133/factors。 HTML

Answer 2

最容易看出的主要差异是“漂亮印刷”。 在控制台中，有序因子打印得很好，它们确定了ggplots中标签的顺序。

在建模方面 ，在拟合线性模型中为它们生成的对比是不同的。 如果您正在寻找描述材料的一些简单示例，我建议您查看http://www.ats.ucla.edu/stat/r/library/contrast_coding.htm 。 本文中的两点给出了两种方案的例子：1。虚拟编码 - 无序R因子4.正交多项式编码 - 有序R因子。

总而言之，虚拟编码使用简单的水平与拟合模型中的参考水平比较（例如性别，种族等）; 而多项式编码使用趋势分析（对于收入或教育等变量）。

上面链接中的示例位于R中，因此可以很好地说明您的查询。

R中有序因子变量和无序因子变量之间的差异

问题描述

2 个解决方案

解决方案1
3 已采纳 2014-09-30 11:11:45

解决方案2
2 2014-09-30 12:44:00

R中有序因子变量和无序因子变量之间的差异

问题描述

2 个解决方案

解决方案1 3 已采纳 2014-09-30 11:11:45

解决方案2 2 2014-09-30 12:44:00

解决方案1
3 已采纳 2014-09-30 11:11:45

解决方案2
2 2014-09-30 12:44:00