隔離文本中的特定數值

Question

我有大量文本要在各種屬性的文本 csv 文件上進行搜索，以查找屬性的平方米數值實際上是多少。 例如：

string <- "This is a wonderful 120 sqm flat with a stunning view"

我知道我可以使用以下內容來提取數值：

sqm <- as.numeric(gsub("\\D", "", string))

它應該返回一個“120”的數字向量。 但是，我想知道是否有更復雜的方法來實現這一點，因為文本中可能存在其他不相關的數值？

有什么方法可以搜索“平方米”並返回它前面的數字？ 非常感謝您的任何評論。

Answer 1

我相信這個正則表達式前瞻應該有效：

library(stringr)
##
string <- "This is a wonderful 120 sqm flat with a stunning view"
re <- "((\\d+)(?=\\s?sqm))"
##
R> str_extract(string, perl(re))
[1] "120"

隔離文本中的特定數值

問題描述

1 個解決方案

解決方案1
2 已采納 2015-04-29 14:10:43

隔離文本中的特定數值

問題描述

1 個解決方案

解決方案1 2 已采納 2015-04-29 14:10:43

解決方案1
2 已采納 2015-04-29 14:10:43