对 dataframe 中的列执行一系列突变

Question

I am trying to replace some text in my dataframe (a few rows given below)我正在尝试替换 dataframe 中的一些文本（下面给出了几行）

> dput(Henry.longer[1:4,])
structure(list(N_l = c(4, 4, 4, 4), UG = c("100", "100", "100", 
"100"), S = c(12, 12, 12, 12), Sample = c(NA, NA, NA, NA), EQ = c("Henry", 
"Henry", "Henry", "Henry"), DF = c(0.798545454545455, 0.798545454545455, 
0.798545454545455, 0.798545454545455), meow = c("Henry.Exterior.single", 
"Multi", "Henry.Exterior.multi", "Henry.Interior.single"), Girder =     c("Henry.Exterior.single", 
"Henry.Interior.multi", "Henry.Exterior.multi", "Interior")), row.names = c(NA, 
-4L), groups = structure(list(UG = "100", S = 12, .rows = list(
1:4)), row.names = c(NA, -1L), class = c("tbl_df", "tbl", 
"data.frame"), .drop = FALSE), class = c("grouped_df", "tbl_df", 
"tbl", "data.frame"))

I try to mutate the dataframe as:我尝试将 dataframe 变异为：

Henry.longer <- Henry.longer %>% 
  mutate(Loading = str_replace(meow, "Henry.Exterior.single", "Single")) %>%
  mutate(Loading = str_replace(meow, "Henry.Exterior.multi", "Multi")) %>%
  mutate(Loading = str_replace(meow, "Henry.Interior.single", "Single")) %>%
  mutate(Loading = str_replace(meow, "Henry.Interior.multi", "Multi")) %>%
  mutate(Girder = str_replace(meow, "Henry.Exterior.multi", "Exterior")) %>%
  mutate(Girder = str_replace(meow, "Henry.Exterior.single", "Exterior")) %>%
  mutate(Girder = str_replace(meow, "Henry.Interior.multi", "Interior")) %>%
  mutate(Girder = str_replace(meow, "Henry.Interior.single", "Interior")) %>%
  select(-meow)

But for some reason the results does not get applied to all the rows and only:但由于某种原因，结果并未应用于所有行，并且仅适用于：

      N_l UG        S Sample EQ       DF Loading               Girder               
1     4 100      12 NA     Henry 0.799 Henry.Exterior.single Henry.Exterior.single
2     4 100      12 NA     Henry 0.799 Multi                 Henry.Interior.multi 
3     4 100      12 NA     Henry 0.799 Henry.Exterior.multi  Henry.Exterior.multi 
4     4 100      12 NA     Henry 0.799 Henry.Interior.single Interior

Answer 1

I think we can use lookup vectors for this, if it's easy or safer to use static string lookups:我认为我们可以为此使用查找向量，如果使用 static 字符串查找更容易或更安全：

tr_vec <- c(Henry.Exterior.single = "Single", Henry.Exterior.multi = "Multi", Henry.Interior.single = "Single", Henry.Interior.multi = "Multi")
tr_vec2 <- c(Henry.Exterior.multi = "Exterior", Henry.Exterior.single = "Exterior", Henry.Interior.multi = "Interior", Henry.Interior.single = "Interior")
Henry.longer %>%
  mutate(
    Loading = coalesce(tr_vec[Loading], Loading),
    Girder = coalesce(tr_vec2[Girder], Girder)
  )
# # A tibble: 4 x 8
# # Groups:   UG, S [1]
#     N_l UG        S Sample EQ       DF Loading Girder  
#   <dbl> <chr> <dbl> <lgl>  <chr> <dbl> <chr>   <chr>   
# 1     4 100      12 NA     Henry 0.799 Single  Exterior
# 2     4 100      12 NA     Henry 0.799 Multi   Interior
# 3     4 100      12 NA     Henry 0.799 Multi   Exterior
# 4     4 100      12 NA     Henry 0.799 Single  Interior

The advantage of RonakShah's regex solution is that it can very easily handle many of the types of substrings you appear to need. RonakShah 的正则表达式解决方案的优势在于它可以非常轻松地处理您似乎需要的许多类型的子字符串。 Regexes do carry a little risk, though, in that they may (unlikely in that answer, but) miss match.但是，正则表达式确实有一点风险，因为它们可能（不太可能在那个答案中，但是）错过匹配。

Answer 2

Instead of using str_replace I guess it would be easier to extract what you want using regex.而不是使用str_replace我想使用正则表达式提取你想要的东西会更容易。

library(dplyr)

Henry.longer %>%
  mutate(Loading = sub('.*\\.', '', meow), 
         Girder = sub('.*\\.(\\w+)\\..*', '\\1', meow))

where在哪里

Loading - removes everything until last dot Loading - 删除所有内容，直到最后一个点

Girder - extracts a word between two dots. Girder - 在两个点之间提取一个单词。

Answer 3

Oh boy, looks like you've got some answers here already but here's a super-simple one that uses stringr::str_extract :哦，男孩，看起来你已经在这里得到了一些答案，但这是一个使用stringr::str_extract的超级简单的答案：

Henry.longer <- Henry.longer %>%
  mutate(Loading = str_extract(meow, "single|multi")) %>%
  mutate(Girder = str_extract(meow, "Interior|Exterior"))

It's worth noting that the demo data has a weird entry for meow in one column, so it didn't run perfectly on my machine:值得注意的是，演示数据在一列中有一个奇怪的meow条目，所以它在我的机器上运行不完美：

对 dataframe 中的列执行一系列突变

问题描述

3 个解决方案

解决方案1
2 已采纳 2021-01-28 03:21:56

解决方案2
1 2021-01-28 03:21:41

解决方案3
1 2021-01-28 03:26:48

对 dataframe 中的列执行一系列突变

问题描述

3 个解决方案

解决方案1 2 已采纳 2021-01-28 03:21:56

解决方案2 1 2021-01-28 03:21:41

解决方案3 1 2021-01-28 03:26:48

解决方案1
2 已采纳 2021-01-28 03:21:56

解决方案2
1 2021-01-28 03:21:41

解决方案3
1 2021-01-28 03:26:48