繁体   English   中英

用jsoup删除src一部分正在更改的img

[英]Remove img which a part of the src is changing with jsoup

我想从HTML代码中删除img。 此html代码是由软件生成的。 但是我的img的src取决于html文档的名称。

例如,如果我的html代码的名称为test.html ,则src img为

<img srx="test_one_way.gif">

如果名称为example.html

src img将是

<img srx="example_one_way.gif">

如您所见,只有一部分src正在更改。

_one_way.gif不会改变

所以我的问题是:如何选择(删除)此img?

在我看来,也许可以通过以下方式选择它: "name"+_one_way.gif

我正在像这样解析文档:

Document doc=Jsoup.parse(new FileInputStream(readLine("file name: ")), "ISO-8859-1", "", Parser.xmlParser());

但是我不知道该怎么做。

如果您未为其分配唯一参数,最简单的方法是在jsoup中使用表达式选择img:

Elements elements = doc.select("img[src$=_one_way.gif");
Element firstElement = elements.first();

然后,您可以随时更改elements属性:

firstElement.attr("src", firstElement.attr("src").replaceFirst("^(.*?)(_one_way\\.gif)$", "$1") + "_one_way.gif");

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM