[英]SAXParser giving unexpected random results
我正在开发适用于Android的RSS feed阅读器,并且为了解析XML文件,我正在使用SAX API。 问题在于,在解析数据时,某些文本在某些随机选择的标签中以随机方式被截断(我的意思是同一标签的不同实例)。 对我来说,我已经添加了一个屏幕截图。
这是我的Handler类:
public class RssParseHandler extends DefaultHandler {
private List<RssItem> rssItems;
private RssItem currentItem;
private boolean parsingTitle;
private boolean parsingLink;
//StringBuilder temp;
public RssParseHandler() {
rssItems = new ArrayList<RssItem>();
//temp = new StringBuilder();
}
public List<RssItem> getItems() {
return rssItems;
}
@Override
public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
if ("item".equals(qName)) {
currentItem = new RssItem();
} else if ("title".equals(qName)) {
parsingTitle = true;
} else if ("link".equals(qName)) {
parsingLink = true;
}
}
@Override
public void endElement(String uri, String localName, String qName) throws SAXException {
if ("item".equals(qName)) {
rssItems.add(currentItem);
currentItem = null;
} else if ("title".equals(qName)) {
//currentItem.setTitle(new String(temp));
//temp = new StringBuilder();
parsingTitle = false;
} else if ("link".equals(qName)) {
//currentItem.setLink(new String(temp));
//temp = new StringBuilder();
parsingLink = false;
}
}
@Override
public void characters(char[] ch, int start, int length) throws SAXException {
if (parsingTitle) {
if (currentItem != null)
{
//temp.append(ch, start, length);
currentItem.setTitle(new String(ch, start, length));
}
} else if (parsingLink) {
if (currentItem != null) {
//temp.append(ch, start, length);
currentElement.setLink(new String(ch, start, length));
parsingLink = false;
}
}
}
}
setTitle(String str)
和setLink(String str)
方法是RSSItem
类的setter方法。
我用谷歌搜索了这个问题,并在某处阅读了使用StringBuilder
。 因此,我尝试使用StringBuilder
。 (使用StringBuilder
时,我已经注释了代码)。 但是后来我开始接收NullPointerException
。
有什么建议可以摆脱这个问题?
从文档
解析器将调用此方法报告字符数据的每个块。 SAX解析器可以在单个块中返回所有连续的字符数据,也可以将其拆分为几个块。 但是,任何单个事件中的所有字符都必须来自同一外部实体,以便定位器提供有用的信息。
因此,很可能您会获得部分数据。 可能的解决方案可能是:
if (currentItem != null) {
//temp.append(ch, start, length);
String tmpLink = currentElement.getLink();
tmpLink += new String(ch, start, length);
currentElement.setLink(tmpLink);
}
当然currentElement.getLink()
应该返回一个空的String
而不是一个null
引用。
您的问题是您假设characters
方法将处理元素内的所有字符,这是不正确的。
您应保存新字符并将其与以前的字符连接(如果有的话)。
使用StringBuilder
对您的事业有好处。 您只需要处理现有的NPE。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.