繁体   English   中英

从 R 中的列中删除字符串

[英]Removing String from the column in R

执行R代码后,我在dataframe列中得到的值是:

  1. 2012 年 7 月 25 日投注

  2. 2015 年 6 月 22 日投注

  3. 2015 年 4 月 9 日

  4. 2016 年 11 月 14 日

    我只想要日期,如何从值中删除“bet”、“be”?

我正在使用以下代码从文本文档中提取上述值:

coalesce((substr((stringr::str_match(text, "ISDA Master Agreementd as of (. ) ")[, 2]),1,16)),(substr((stringr::str_match(text, "ISDA)主协议日期为 (. ) ")[, 2]),1,13)))

如果我滑动合并参数,则第 4 个值会被截断。

我对代码没问题,但是在清理时,我应该如何删除“bet”、“be”?

我离成为正则表达式专家,但这里有一种做你想做的事情的方式:

library(tidyverse, verbose = F)

df <- tibble::tribble(
  ~V1,                ~V2,
   1L, "25 July 2012 bet",
   2L, "22 June 2015 bet",
   3L, "09 April 2015 be",
   4L, "14 November 2016"
  )

df %>% 
  mutate(V2 = str_replace(V2, pattern = "[:space:]be.*", replacement = ""))
#> # A tibble: 4 x 2
#>      V1 V2              
#>   <int> <chr>           
#> 1     1 25 July 2012    
#> 2     2 22 June 2015    
#> 3     3 09 April 2015   
#> 4     4 14 November 2016

reprex 包(v0.3.0) 于 2020 年 2 月 21 日创建

我们可以使用sub删除空格和所有带有"be"

sub("\\s+be.*", "", c("25 July 2012 bet", "09 April 2015 be"))
#[1] "25 July 2012"  "09 April 2015"

如果您使用lubridate您可以删除日期后的多余文本:

library(lubridate)

test_strings <- c("25 July 2012 bet", "09 April 2015 be")

dmy(test_strings)

[1] "2012-07-25" "2015-04-09"

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM