[英]Creating new columns based on existing columns in R
這是我的數據框的示例。 它來自一項調查,最初的問題是:“你在哪里?標記所有適用的選項。”
Code Option1 Option2 Option3 Option4
101 A C NA NA
102 B D NA NA
103 A B D NA
104 D NA NA NA
105 A B C D
我想轉換此數據,以便每一列都是位置之一,如果您位於 4 個位置中的任何一個,則會得到 0/1:
Code A B C D
101 1 0 1 0
102 0 1 0 1
103 1 1 0 1
104 0 0 0 1
105 1 1 1 1
我嘗試使用 ifelse 語句,但我不斷收到錯誤消息。 有什么建議? 謝謝!
使用tidyverse
library(dplyr)
library(tidyr)
df1 %>%
pivot_longer(cols = -Code, values_drop_na = TRUE) %>%
mutate(n = 1) %>%
select(-name) %>%
pivot_wider(names_from = value, values_from = n, values_fill = list(n = 0)) %>%
select(Code, LETTERS[1:4])
# Code A B C D
#1 101 1 0 1 0
#2 102 0 1 0 1
#3 103 1 1 0 1
#4 104 0 0 0 1
#5 105 1 1 1 1
或者使用mtabulate
library(qdapTools)
cbind(df1[1], +(mtabulate(as.data.frame(t(df1[-1]))) > 0))
或者使用melt/dcast
library(data.table)
dcast(melt(setDT(df1), id.var = 'Code', na.rm = TRUE), Code ~ value, length)
我在使用 gsub 將 True/False 調查響應轉換為二進制 1,0 時完成了此操作:
t <- function(x) gsub("A",1,x)
f <- function(x) gsub("B",0,x)
df[1:4] <- lapply(df[1:4], t)
df[1:4] <- lapply(df[1:4], f)
我確信有更好的方法可以做到這一點,但這對我有用。
你可以試試:
tab <- table(cbind(df[1], unlist(df[-1])))
cbind(Code = row.names(tab), as.data.frame.matrix(tab), row.names = NULL)
Code A B C D
1 101 1 0 1 0
2 102 0 1 0 1
3 103 1 1 0 1
4 104 0 0 0 1
5 105 1 1 1 1
假設 'df1' 是你的表,這種方法需要多行幾行,但很容易理解:
library(tidyverse)
library(reshape2)
df1 %>%
gather(Code) %>%
dcast(Code ~ value, fun.aggregate=length) %>%
select(-'NA')
你的結果是:
Code A B C D
1 101 1 0 1 0
2 102 0 1 0 1
3 103 1 1 0 1
4 104 0 0 0 1
5 105 1 1 1 1
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.