簡體   English   中英

條件字符列 ffdf 數據

[英]Conditional Character Column ffdf data

我使用 ffbase 包將一個大數據集(約 600 萬行)導入到 R 中,該包列出了在巴西就讀高中的人數。 原則上,我有 2 列:Id(學生 ID 號)和大學(機構名稱)。

我想創建一個列 - 在我的示例中名為 Group - 將每所大學與其教育組相關聯:

Id           University       Group
000001       Anhanguera       Kroton
000002       Unopar           Kroton
000003       Anhembi          Laureate
000004       FMU              Laureate

PS:我的數據集中沒有關於教育團體的信息,但是,我有我需要的關於每個大學對應哪個團體的信息。 這樣,我需要將此詳細信息附加到我的數據中。

PS2:大學列的類是ff_vector。

我感謝您可能做出的任何貢獻。

如果您有很長的組列表,這可能不是最快的方法,但是,使用dplyr包中的mutate

data <- data.frame("Id" = 000001:000004, "University" = c("Anhanguera", "Unopar", "Anhembi", "FMU"))

data <-  mutate(data, Group = as.factor(
    ifelse(University %in% "Anhanguera", "Kronton", 
        ifelse(University %in% "Unopar", "Kronton",
            ifelse(University %in% "Anhembi", "Laureate",
                ifelse(University %in% "FMU", "Laureate", NA))))))        
data
str(data)

我在這里使用了 University ,但只需將其替換為ff_vector

如果您想保留 Group 作為字符,請刪除as.factor()

我不熟悉ffbase ,但請參閱ffbase2以使用dplyrffbase

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM