拆分R数据帧中的列

Question

我在R数据框中有一列数据，其值如下：

Blue-#105
Green-#8845
Yellow-#5454
Blue-#999

我想删除最后一个数字部分（从 - ＃开始），以便Blue-#999和Blue-#105在绘图时被认为是相同的。 我怎么能做到这一点？

Answer 1

使用正则表达式：

> DF <- data.frame(col=c("Blue-#105", "Green-#8845", "Blue-#999"))
> DF
          col
1   Blue-#105
2 Green-#8845
3   Blue-#999
> DF$col <- gsub("-\\#.*", "", DF$col)
> DF
    col
1  Blue
2 Green
3  Blue
>

在这里我们说所有的字符串都以-# （其中注释char #需要被转义）开头，然后是正则表达式中的任何 --- .*任何字符（点）重复多次，因为它适合（明星）---将被空字符串替换，换句话说，被删除。

Answer 2

使用sub或gsub函数。 对于您的示例，您可以执行以下操作：

newcolors <- sub("^([^-]*)-.*$", "\\1", oldcolors )

这假设颜色在矢量'oldcolors'中并将结果放入新颜色中。 模式从字符串的开头开始（^）然后匹配0个或更多不是破折号的字符（[^ - ] ），周围的parens表示保存匹配的内容。 然后它匹配一个破折号，后跟另外的字符（。 ）直到字符串（$）的结尾，然后匹配的部分（整个字符串）被替换为parens（颜色）中匹配的任何内容。

拆分R数据帧中的列

问题描述

2 个解决方案

解决方案1
7 已采纳 2010-09-27 15:50:40

解决方案2
3 2010-09-27 15:52:00

拆分R数据帧中的列

问题描述

2 个解决方案

解决方案1 7 已采纳 2010-09-27 15:50:40

解决方案2 3 2010-09-27 15:52:00

解决方案1
7 已采纳 2010-09-27 15:50:40

解决方案2
3 2010-09-27 15:52:00