簡體   English   中英

如何使用java中的正則表達式捕獲字符串中的內容

[英]how to capture content in a string using a regular expression in java

我想解析HTML表單並提取任何嵌入圖像的文件名。

所以字符串看起來像:

{ 

...隨機的HTML內容

    image1.png 

 more random HTML content

    image3.png

...}

從上面我想用Java編寫一個返回給我的函數{image1.png,image3.png}。

我有一個正則表達式,只返回最后一個圖像名稱(image3.png),但它忽略了以前的圖像名稱。 如何使用正則表達式捕獲所有這些?

所有/任何幫助將不勝感激。

https://stackoverflow.com/a/2059614/684934給出了一個很好的提示。 更具體地說,你可能正在尋找類似[a-zA-Z0-9_\\-]+\\.(png|jpg|gif|jpeg|tif)

但請注意,這是正則表達式,僅查找字符序列。 例如,如果您正在查看使用servlet提供動態映像的站點,並且資源URI不會以正常的映像文件擴展名(例如.jsp或.do)結束,那么正則表達式將完全失敗。 它還會從碰巧匹配的任何類型的文本中選取任何“圖像名稱”,這實際上並不代表頁面上的圖像。

要正確完成工作,您需要使用某種DOM並遍歷<img>元素。 (還有<button>元素,可能是image類型......可能有更多可以有圖像的標簽。)

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM