簡體   English   中英

從R中的因子列表創建邏輯或二進制矩陣/數據框架

[英]Create a logical or binary matrix/data.frame from a list of factors in R

我有大約200萬個元素的列表。 該列表由字符串向量組成。 大約有50種不同的字符串,因此可以認為是因素。 字符串向量的長度不同,介於1到50之間(即,字符串的總數)。

我想將列表轉換為邏輯或二進制matrix / data.frame。 目前,我的方法涉及到lapply且非常慢,我想知道是否存在矢量化方法。

require(dplyr); require(tidyr)
#create test data set
set.seed(123)
list1 <- list()
ListLength <-10
elementlength <- sample(1:5, ListLength, replace = TRUE )

for(i in 1:length(elementlength) ){
  list1[[i]] <- sample(letters[1:15], elementlength[i])
}

#Create data frame from list using lapply
lapply(list1, function(n){
  data.frame(type = n, value = TRUE) %>% 
    spread(., key = type, value )
}) %>% bind_rows()

我不知道是否有辦法通過預分配數據幀然后以某種方式填充它。

Type <- unique(unlist(list1, use.names = FALSE))

#Create empty dataframe  
TypeMat <- data.frame(matrix(NA, 
                               ncol = length(Type), 
                               nrow = ListLength)) %>% 
  setNames(Type)

我們可以使用mtabulateqdapTools

library(qdapTools)
mtabulate(list1)!=0
#     a     b     c     d     e     f     g     h     i     j     k     l     m     o
#[1,] FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE
#[2,] FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE  TRUE
#[3,]  TRUE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
#[4,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE  TRUE  TRUE FALSE  TRUE  TRUE
#[5,] FALSE FALSE FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE  TRUE  TRUE
#[6,] FALSE FALSE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
#[7,] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE FALSE FALSE FALSE  TRUE  TRUE
#[8,]  TRUE FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE  TRUE FALSE FALSE
#[9,] FALSE  TRUE FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
#[10,]FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM