[英]Levels function returning NULL
我希望这是一个简单的修复。 每当我运行 levels(df) 时,我都会给出一个 NULL 输出。 这不是特定于我的数据框,因为它发生在我使用的任何数据集上。 我想我的一个包裹可能有问题。 有没有人遇到过这个问题或知道修复方法? 谢谢
您只能在因子向量上运行levels
,而不能在数据框上运行。
下面的例子
> df <- data.frame(a = factor(c('a','b','c'), levels = c('a','b','c','d','e')),
+ b = factor(c('a','b','c')),
+ c = factor(c('a','a','c')))
> levels(df)
NULL
要查看数据框中每一列的级别,您可以使用lapply
> lapply(df, levels)
$a
[1] "a" "b" "c" "d" "e"
$b
[1] "a" "b" "c"
$c
[1] "a" "c"
如果您想要特定列的级别,您可以指定:
> levels(df[, 2])
[1] "a" "b" "c"
编辑:回答下面关于为什么apply(df, 2, levels)
返回NULL
。
请注意apply()
文档中的以下内容:
在所有情况下,在设置维度之前,结果都被 as.vector 强制转换为基本向量类型之一,因此(例如)因子结果将被强制转换为字符数组。
当您尝试上课并尝试其他一些功能时,您会看到这种行为。
> apply(df, 2, levels)
NULL
> apply(df, 2, class)
a b c
"character" "character" "character"
> apply(df, 2, function(i) levels(i))
NULL
> apply(df, 2, function(i) levels(factor(i)))
$`a`
[1] "a" "b" "c"
$b
[1] "a" "b" "c"
$c
[1] "a" "c"
请注意,即使我们可以强制apply()
将列视为因子,我们也会丢失最初创建时为df
设置的先前排序/级别(请参阅列`a`
)。 这是因为它已被强制转换为字符向量。
初始化数据帧时,在初始化中传递stringsAsFactors = T
例如。 dataFrame <- read.csv(file.choose(), stringsAsFactors=T)
这使得 R 将字符串值视为因子。 希望有帮助
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.