[英]Regular Expression for Parsing Hashtags in Java
這是我試圖解析的Twitter消息(正如您所看到的,其中一些不是標記,只是URL的一部分):
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
這個正則表達式是我到目前為止,但它仍然會獲取一些url標記:
[##]+([A-Za-z0-9-_]+)
這不具諷刺意味,一發帖我就找到了答案。 因此,如果您正在尋找匹配模式來執行此操作,以下似乎可行:
(?:\\ S | \\ A)[##] +([A-ZA-Z0-9 -_] +)
我將對此進行更多測試,以查看是否存在超出此表達式范圍的任何邊緣情況,如果發現任何情況,將報告回來。
我認為這
(\s|\A)#(\w+)
同樣有效,而且更精確一點。 順便說一句,在使用Java正則表達式時,我總是使用regexplanet來測試我的表達式。 比在Java中測試快得多。
--Hardy
@Daniel Dura:[##]這應該是毫無意義的。 方括號[]用於表示字符類。 [##]與[#]相同。 並且[##] +與[#] +相同。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.