[英]How to recode a three level factor
我的數據集是一個包含各種兒童信息的數據集。 我有一個復雜的因素問題。 我有兩個變量:父母 1 財務和父母 2 財務(采用三個值之一:低、中、高收入)。 我想制作第三個變量,“監護人財務”,因為我的一些科目只有一個父母。 我如何重新編碼以便選擇最高級別的財務,並且,如果孩子來自單親家庭,則將其轉移到新的“監護人”變量中。
p1 n
<int> <int>
1 low 100
2 medium 306
3 high 96
p2 n
<int> <int>
1 low 227
2 medium 230
3 high 243
如果我們想在兩個數據集中獲得最高的 'n',通過 'p' 列在兩列之間進行連接,然后使用pmax
返回 'n' 列之間的max
library(dplyr)
inner_join(df1, df2, by = c("p1" = "p2") %>%
mutate(n = pmax(n.x, n.y) %>%
select(p1, n)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.