[英]Difference between ordered and unordered factor variables in R
我一直在嘗試在R中找到ordered
和無序factor
變量之間的區別。特別是在?factor
文檔中的這一行令我困惑:
Ordered factors differ from factors only in their class, but methods and
the model-fitting functions treat the two classes quite differently.
我最接近找到答案的答案來自這三個問題的答案:
在回答上述第一個問題時, @ joran曾說過“統計差異的詳細摘要可能超出了StackOverflow答案的范圍。”
我不是在這里尋找一個詳細的摘要,但是任何人都可以給出一個小而簡單的例子來說明當在方法和模型擬合函數中使用時, ordered
和無序factor
有何不同?
有序因子默認使用正交多項式對比。 L和Q代表線性和二次項。 無序因素使用“治療”對比雖然(它們實際上沒有對比)。
了解閱讀: http : //r.789695.n4.nabble.com/Models-with-ordered-and-unordered-factors-td4072225.html http://www.stat.berkeley.edu/~s133/factors。 HTML
最容易看出的主要差異是“漂亮印刷”。 在控制台中,有序因子打印得很好,它們確定了ggplots中標簽的順序。
在建模方面 ,在擬合線性模型中為它們生成的對比是不同的。 如果您正在尋找描述材料的一些簡單示例,我建議您查看http://www.ats.ucla.edu/stat/r/library/contrast_coding.htm 。 本文中的兩點給出了兩種方案的例子:1。虛擬編碼 - 無序R因子4.正交多項式編碼 - 有序R因子。
總而言之,虛擬編碼使用簡單的水平與擬合模型中的參考水平比較(例如性別,種族等); 而多項式編碼使用趨勢分析(對於收入或教育等變量)。
上面鏈接中的示例位於R中,因此可以很好地說明您的查詢。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.