簡體   English   中英

gsub 命令替換以 R 中特定字母開頭的單詞

[英]gsub command to substitute a word starting with a specific letter in R

我的問題是用什么 gsub 命令來代替以特定字母開頭的單詞。 我的主要目標是從給定文本中刪除所有 URL。

例如,我有一條文字: "refer http://www.google.com for further details" 我需要做的是,將文本轉換為"refer for further details" 為此,基本上我需要編寫一個gsub命令,如下所示:

text <- "refer http://www.google.com for further details"

gsub("http", "", text)

但是,這僅從文本中刪除了“http”部分。 我需要刪除以“http”開頭的完整單詞。

我嘗試過的其他一些命令:

gsub('http..', "", text) # -->removes two letters more after 'http' (the number of dots specifies the number of letters'
gsub('^http', "", text)
gsub('/http', "", text)
gsub('\\\http', "", text)

所有這一切都沒有帶來任何豐碩的成果。

在這方面的任何幫助將不勝感激。

這只是半途而廢的答案:

gsub("https?://.*?\\s", "", text)
# [1] "refer for further details"

為什么是“半途而廢”? 它實際上只解決了一組有限的場景——那些 URL 后面總是跟一個空格的場景。 但是,如果它遇到一個 URL 后緊跟一個標點符號,它將不起作用。

檢測 URL 是一項相當常見的任務。 您應該能夠通過搜索“正則表達式識別 URL”之類的內容來找到更詳細的模式。 不過,最有可能的是,您需要對其進行一些修改才能使用 R。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM