簡體   English   中英

用Java解析Hashtags的正則表達式

[英]Regular Expression for Parsing Hashtags in Java

這是我試圖解析的Twitter消息(正如您所看到的,其中一些不是標記,只是URL的一部分):

#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John 
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard 
#fail #design</pre>

這個正則表達式是我到目前為止,但它仍然會獲取一些url標記:

[##]+([A-Za-z0-9-_]+)

這不具諷刺意味,一發帖我就找到了答案。 因此,如果您正在尋找匹配模式來執行此操作,以下似乎可行:

(?:\\ S | \\ A)[##] +([A-ZA-Z0-9 -_] +)

我將對此進行更多測試,以查看是否存在超出此表達式范圍的任何邊緣情況,如果發現任何情況,將報告回來。

我認為這

(\s|\A)#(\w+)

同樣有效,而且更精確一點。 順便說一句,在使用Java正則表達式時,我總是使用regexplanet來測試我的表達式。 比在Java中測試快得多。

--Hardy

@Daniel Dura:[##]這應該是毫無意義的。 方括號[]用於表示字符類。 [##]與[#]相同。 並且[##] +與[#] +相同。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM