[英]Renaming to values in columns using r
我有一個包含不干凈數據的數據框(非常典型)。 所以我試圖將它們重命名為通用值。 因此,所有這一切都像SF
或Bay Area
或San Francisco
應該是San Francisco
。 New York
也是如此。 我怎樣才能做到這一點? 下面是我的數據的樣子
datapasta::dpasta(df)
c("US", "US", "SF", "NYC", "LA", "BOS", "San Francisco", "NYC", "LA", "BOS", "Bay Area", "NYC", "LA", "BOS", "SF", "SFO", "LA", "BOS", "SF", "SF", "SF", "SF", "SF", "New York", "NYC", "NYC", "NYC", "NYC", "Boston", "BOS")
您可以為此使用case_when
:
library(dplyr)
df <- c("US", "US", "SF", "NYC", "LA", "BOS", "San Francisco", "NYC", "LA", "BOS", "Bay Area", "NYC", "LA", "BOS", "SF", "SFO", "LA", "BOS", "SF", "SF", "SF", "SF", "SF", "New York", "NYC", "NYC", "NYC", "NYC", "Boston", "BOS")
df <- case_when(
df %in% c("SF", "Bay Area") ~ "San Francisco",
df %in% c("NYC") ~ "New York",
TRUE ~ df
)
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.