如何使用HTML解析器获取div标签或Java中其他标签的内容

Question

I want to get text in a tag, ie 我想在标签中获取文本，即

<div id="title">    MotoGP  </div>

I want to extract "MotoGP" from here. 我想从这里提取“ MotoGP”。 I'm using org.htmlparser . 我正在使用org.htmlparser 。

I've tried 我试过了

NodeList nodes = parser.extractAllNodesThatMatch(new AndFilter(new TagNameFilter("div"),
     new HasAttributeFilter("id", "title")));

    SimpleNodeIterator nodeIterator = nodes.elements();
    while (nodeIterator.hasMoreNodes()) {

             HeadingTag tag = (HeadingTag)node;
             System.out.println(tag.getStringText());

Answer 1

Looks like something like this: 看起来像这样：

Parser p;

// initialize p somehow
p = createParser(html /* actual html String */,
    charset /* null for default */);

NodeList nl = p.extractAllNodesThatMatch(
    new HasAttributeFilter("id", "title")); // or other id...

// if you want the text of the 1st matching node:
System.out.println(nl.elementAt(0).getText());

See especially: 特别看到：

Parser 解析器
Parser.extractAllNodesThatMatch() Parser.extractAllNodesThatMatch（）
Node.getText() Node.getText（）

如何使用HTML解析器获取div标签或Java中其他标签的内容

问题描述

1 个解决方案

解决方案1
0 2012-05-01 21:49:32

如何使用HTML解析器获取div标签或Java中其他标签的内容

问题描述

1 个解决方案

解决方案1 0 2012-05-01 21:49:32

解决方案1
0 2012-05-01 21:49:32