删除数据框中列的特殊字符和数字

Question

我有一个数据框：

dput(Data1)
structure(list(Emp.ID = c(182038L, 191854L), Project.Acquired.Skill = structure(c(2L, 
1L), .Label = c("Architecting (10),Cognos TM1 (4),Support Function (3)", 
"SAS (76),SAS Analytics (76),SAS BI (76),SAS data modeling tool (63),ClearCase (18),SQL (18),SQL Server (18),SQL SERVER 2000 (18),SQL SERVER 2005 (18),Excel (16),Oracle (16),AS400 (10)"
), class = "factor")), .Names = c("Emp.ID", "Project.Acquired.Skill"
), class = "data.frame", row.names = c(NA, -2L))

str(Data1)
'data.frame':   2 obs. of  2 variables:
 $ Emp.ID                : int  182038 191854
 $ Project.Acquired.Skill: Factor w/ 2 levels "Architecting (10),Cognos TM1 (4),Support Function (3)",..: 2 1

我有一列是具有这样的值的因子，例如Architecting (10),Cognos TM1 (4),Support Function (3)并且我需要剥离数字（0-9），WhiteSpace和括号（）以获得Architecting,Cognos TM1,Support Function 。 我正面临问题，因为这被编码为因素。
我的输出应如下所示

Emp ID  Project Acquired Skill
182038  SAS,SAS Analytics,SAS BI,SAS data modeling tool,ClearCase,SQL,SQL Server,SQL SERVER 2000,SQL SERVER 2005,Excel,Oracle,AS400
191854  Architecting,Cognos TM1,Support Function

Answer 1

在gsub使用字符类regexp：

transform(Data1, Project.Acquired.Skill=gsub("\\s[0-9()]+","",Project.Acquired.Skill))
  Emp.ID
1 182038
2 191854
                                                                                             Project.Acquired.Skill
1 SAS,SAS Analytics,SAS BI,SAS data modeling tool,ClearCase,SQL,SQL Server,SQL SERVER,SQL SERVER,Excel,Oracle,AS400
2                                                                          Architecting,Cognos TM1,Support Function

Answer 2

(data1[,2] <- gsub("\\s\\(\\d+\\)", "", data1[,2]))
# [1] "SAS,SAS Analytics,SAS BI,SAS data modeling tool,ClearCase,SQL,SQL Server,SQL SERVER 2000,SQL SERVER 2005,Excel,Oracle,AS400"
# [2] "Architecting,Cognos TM1,Support Function"

Answer 3

library(qdap)
gsub(" ,", ",", strip(Data1[, 2], char.keep=",", lower=F))

## [1] "SAS,SAS Analytics,SAS BI,SAS data modeling tool,ClearCase,SQL,SQL Server,SQL SERVER ,SQL SERVER ,Excel,Oracle,AS"
## [2] "Architecting,Cognos TM,Support Function"

删除数据框中列的特殊字符和数字

问题描述

3 个解决方案

解决方案1
2 已采纳 2014-01-09 14:50:17

解决方案2
2 2014-01-09 14:52:32

解决方案3
1 2014-01-09 14:54:59

删除数据框中列的特殊字符和数字

问题描述

3 个解决方案

解决方案1 2 已采纳 2014-01-09 14:50:17

解决方案2 2 2014-01-09 14:52:32

解决方案3 1 2014-01-09 14:54:59

解决方案1
2 已采纳 2014-01-09 14:50:17

解决方案2
2 2014-01-09 14:52:32

解决方案3
1 2014-01-09 14:54:59