隔离文本中的特定数值

Question

我有大量文本要在各种属性的文本 csv 文件上进行搜索，以查找属性的平方米数值实际上是多少。 例如：

string <- "This is a wonderful 120 sqm flat with a stunning view"

我知道我可以使用以下内容来提取数值：

sqm <- as.numeric(gsub("\\D", "", string))

它应该返回一个“120”的数字向量。 但是，我想知道是否有更复杂的方法来实现这一点，因为文本中可能存在其他不相关的数值？

有什么方法可以搜索“平方米”并返回它前面的数字？ 非常感谢您的任何评论。

Answer 1

我相信这个正则表达式前瞻应该有效：

library(stringr)
##
string <- "This is a wonderful 120 sqm flat with a stunning view"
re <- "((\\d+)(?=\\s?sqm))"
##
R> str_extract(string, perl(re))
[1] "120"

隔离文本中的特定数值

问题描述

1 个解决方案

解决方案1
2 已采纳 2015-04-29 14:10:43

隔离文本中的特定数值

问题描述

1 个解决方案

解决方案1 2 已采纳 2015-04-29 14:10:43

解决方案1
2 已采纳 2015-04-29 14:10:43