从R中的另一列创建一列并为其供电

Question

目的是从下面数据的“代码”列中创建两个新列。 一个带有数字，另一个带有代码（因数）。 我怎么做？ 我尝试了ifelse() ，但结果ifelse()了。

structure(list(Potreiro = structure(c(3L, 3L, 3L, 3L, 
3L, 4L, 3L, 4L, 3L, 4L), .Label = c("1A", "6B", "7A", "7B"), class = 
"factor"), Code = structure(c(4L, 1L, 8L, 3L, 2L, 4L, 6L, 5L, 8L, 7L ), 
.Label = c("2", "3", "4", "5", "50%", "70%", "ac", "ad", "av", "cd", "de", 
"Dem"), class = "factor")), .Names = c("Potreiro", "Code"), row.names = 
c(NA, 10L), class = "data.frame")

谢谢！！！

Answer 1

library(dplyr)
library(stringr)

df <- structure(list(Potreiro = structure(c(3L, 3L, 3L, 3L, 3L, 4L, 3L, 4L, 3L, 4L), 
.Label = c("1A", "6B", "7A", "7B"), 
class = "factor"), 
Code = structure(c(4L, 1L, 8L, 3L, 2L, 4L, 6L, 5L, 8L, 7L ), 
.Label = c("2", "3", "4", "5", "50%", "70%", "ac", "ad", "av", "cd", "de", "Dem"), 
class = "factor")), 
.Names = c("Potreiro", "Code"), 
row.names = c(NA, 10L), 
class = "data.frame")



df %>% 
  mutate(
  number = str_extract_all(Code, "\\d+"),
  word = str_extract(Code, "\\D[^%]")
  )

number变量regex寻找数字，并且至少匹配一次\\\\d+ 。 word正则表达式在删除％符号时不查找数字。

结果：

   Potreiro Code number word
1        7A    5      5 <NA>
2        7A    2      2 <NA>
3        7A   ad          ad
4        7A    4      4 <NA>
5        7A    3      3 <NA>
6        7B    5      5 <NA>
7        7A  70%     70 <NA>
8        7B  50%     50 <NA>
9        7A   ad          ad
10       7B   ac          ac

Answer 2

我会这样做：

df <- 
         structure(list(Potreiro = structure(c(3L, 3L, 3L, 3L, 
                                      3L, 4L, 3L, 4L, 3L, 4L), .Label = c("1A", "6B", "7A", "7B"), class = 
                                      "factor"), Code = structure(c(4L, 1L, 8L, 3L, 2L, 4L, 6L, 5L, 8L, 7L ), 
                                                                  .Label = c("2", "3", "4", "5", "50%", "70%", "ac", "ad", "av", "cd", "de", 
                                                                             "Dem"), class = "factor")), .Names = c("Potreiro", "Code"), row.names = 
            c(NA, 10L), class = "data.frame")

arenum <- sapply(df$Code, function (x) grepl('[[:digit:]]', x))
df$codenum <- ifelse(arenum, as.character(df$Code), NaN)
df$codechar <- ifelse(!arenum, as.character(df$Code), NaN)
df

如果您真的不想要什么，除了数字更改arnum：

arenum <- sapply(df$Code, function (x) gsub('[[:digit:]]', '', x) == '')

Answer 3

这是使用extract的选项

library(dplyr)
library(tidyr)
df %>% 
  extract(Code, into = c('number', 'word'), '(\\d*)([a-z]*)', remove = FALSE, convert = TRUE)
#  Potreiro Code number word
#1        7A    5      5     
#2        7A    2      2     
#3        7A   ad     NA   ad
#4        7A    4      4     
#5        7A    3      3     
#6        7B    5      5     
#7        7A  70%     70     
#8        7B  50%     50     
#9        7A   ad     NA   ad
#10       7B   ac     NA   ac

从R中的另一列创建一列并为其供电

问题描述

3 个解决方案

解决方案1
2 已采纳 2018-03-28 10:14:48

解决方案2
1 2018-03-28 09:57:35

解决方案3
0 2018-03-28 10:19:28

从R中的另一列创建一列并为其供电

问题描述

3 个解决方案

解决方案1 2 已采纳 2018-03-28 10:14:48

解决方案2 1 2018-03-28 09:57:35

解决方案3 0 2018-03-28 10:19:28

解决方案1
2 已采纳 2018-03-28 10:14:48

解决方案2
1 2018-03-28 09:57:35

解决方案3
0 2018-03-28 10:19:28