簡體   English   中英

多模式匹配算法

[英]Multiple Pattern Match Algorithm

我有很多日志,每條記錄都包含一個網址。 我有大約2000多個url模式來過濾日志。 一些模式是具有可捕獲組的常規模式。 我想得到網址和匹配的模式,如果可能的話,我想獲得捕獲的組合。 有沒有一個java lib可以幫助我。 或任何可以解決我的問題的算法。 或者與我的問題有關的其他任何事情。 非常感謝。

看一下java正則表達式庫( 鏈接 )。

您可以通過將原始模式與|連接來構建單個大型模式 它們之間(use ()指定你不只想要1個字符)。

正則表達式可以編譯成一個有效的匹配有限自動機,您可以運行您的數據。 只需確保編譯一次並將其重復用於每條記錄。

它將處理提取組,但您需要以通用方式處理組(因為任何組都可以匹配)。 如果它更容易考慮使用命名組來簡化處理。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM