繁体   English   中英

级别函数返回 NULL

[英]Levels function returning NULL

我希望这是一个简单的修复。 每当我运行 levels(df) 时,我都会给出一个 NULL 输出。 这不是特定于我的数据框,因为它发生在我使用的任何数据集上。 我想我的一个包裹可能有问题。 有没有人遇到过这个问题或知道修复方法? 谢谢

您只能在因子向量上运行levels ,而不能在数据框上运行。

下面的例子

> df <- data.frame(a = factor(c('a','b','c'), levels = c('a','b','c','d','e')),
+                  b = factor(c('a','b','c')), 
+                  c = factor(c('a','a','c')))
> levels(df)
NULL

要查看数据框中每一列的级别,您可以使用lapply

> lapply(df, levels)
$a
[1] "a" "b" "c" "d" "e"

$b
[1] "a" "b" "c"

$c
[1] "a" "c"

如果您想要特定列的级别,您可以指定:

> levels(df[, 2])
[1] "a" "b" "c"

编辑:回答下面关于为什么apply(df, 2, levels)返回NULL

请注意apply()文档中的以下内容:

在所有情况下,在设置维度之前,结果都被 as.vector 强制转换为基本向量类型之一,因此(例如)因子结果将被强制转换为字符数组。

当您尝试上课并尝试其他一些功能时,您会看到这种行为。

> apply(df, 2, levels)
NULL
> apply(df, 2, class)
          a           b           c 
"character" "character" "character" 
> apply(df, 2, function(i) levels(i))
NULL
> apply(df, 2, function(i) levels(factor(i)))
$`a`
[1] "a" "b" "c"

$b
[1] "a" "b" "c"

$c
[1] "a" "c"

请注意,即使我们可以强制apply()将列视为因子,我们也会丢失最初创建时为df设置的先前排序/级别(请参阅列`a` )。 这是因为它已被强制转换为字符向量。

初始化数据帧时,在初始化中传递stringsAsFactors = T

例如。 dataFrame <- read.csv(file.choose(), stringsAsFactors=T)

这使得 R 将字符串值视为因子。 希望有帮助

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM