用Java解析Hashtags的正則表達式

Question

這是我試圖解析的Twitter消息（正如您所看到的，其中一些不是標記，只是URL的一部分）：

#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John 
Nack on &#Adobe: Information about Photoshop&#169; CS3 on Snow Leopard 
#fail #design</pre>

這個正則表達式是我到目前為止，但它仍然會獲取一些url標記：

[##]+([A-Za-z0-9-_]+)

Answer 1

這不具諷刺意味，一發帖我就找到了答案。 因此，如果您正在尋找匹配模式來執行此操作，以下似乎可行：

（？：\\ S | \\ A）[##] +（[A-ZA-Z0-9 -_] +）

我將對此進行更多測試，以查看是否存在超出此表達式范圍的任何邊緣情況，如果發現任何情況，將報告回來。

Answer 2

我認為這

(\s|\A)#(\w+)

同樣有效，而且更精確一點。 順便說一句，在使用Java正則表達式時，我總是使用regexplanet來測試我的表達式。 比在Java中測試快得多。

--Hardy

Answer 3

@Daniel Dura：[##]這應該是毫無意義的。 方括號[]用於表示字符類。 [##]與[＃]相同。 並且[##] +與[＃] +相同。

用Java解析Hashtags的正則表達式

問題描述

3 個解決方案

解決方案1
6 2009-08-27 18:12:45

解決方案2
3 2009-08-28 08:30:02

解決方案3
3 2009-08-28 12:26:02

用Java解析Hashtags的正則表達式

問題描述

3 個解決方案

解決方案1 6 2009-08-27 18:12:45

解決方案2 3 2009-08-28 08:30:02

解決方案3 3 2009-08-28 12:26:02

解決方案1
6 2009-08-27 18:12:45

解決方案2
3 2009-08-28 08:30:02

解決方案3
3 2009-08-28 12:26:02