[英]Conditional Character Column ffdf data
我使用 ffbase 包將一個大數據集(約 600 萬行)導入到 R 中,該包列出了在巴西就讀高中的人數。 原則上,我有 2 列:Id(學生 ID 號)和大學(機構名稱)。
我想創建一個列 - 在我的示例中名為 Group - 將每所大學與其教育組相關聯:
Id University Group
000001 Anhanguera Kroton
000002 Unopar Kroton
000003 Anhembi Laureate
000004 FMU Laureate
PS:我的數據集中沒有關於教育團體的信息,但是,我有我需要的關於每個大學對應哪個團體的信息。 這樣,我需要將此詳細信息附加到我的數據中。
PS2:大學列的類是ff_vector。
我感謝您可能做出的任何貢獻。
如果您有很長的組列表,這可能不是最快的方法,但是,使用dplyr包中的mutate
:
data <- data.frame("Id" = 000001:000004, "University" = c("Anhanguera", "Unopar", "Anhembi", "FMU"))
data <- mutate(data, Group = as.factor(
ifelse(University %in% "Anhanguera", "Kronton",
ifelse(University %in% "Unopar", "Kronton",
ifelse(University %in% "Anhembi", "Laureate",
ifelse(University %in% "FMU", "Laureate", NA))))))
data
str(data)
我在這里使用了 University ,但只需將其替換為ff_vector
。
如果您想保留 Group 作為字符,請刪除as.factor()
。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.