[英]java get next few words in string
我正在尝试搜索包含HTML的.txt文件。 我需要在文件中搜索特定的HTML标记,然后获取以下接下来的几个字符代码。 我是java的新手,但愿意学习我需要的东西。
例如:说我有代码: <span class="date">Apr 13</span>
,我需要的只是日期(4月13日)。 我该怎么做呢?
非常感谢!
看一下String类文档,然后尝试找到搜索字符串的方法。
使用jsoup,您可以像这样
File input = new File("input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Elements spans = doc.select("span");
for (Element element : spans) {
System.out.println(element.html());
}
尝试这个
Matcher m = Pattern.compile(">(.*?)<").matcher(s);
while(m.find()) {
String s = m.group(1);
}
如果您想要的是基本的东西(我认为这是新手会很好),则可以使用以下方法:
if(s.indexOf("span class=\"date\"")!=0)
s=s.substring(s.indexOf(">")+1,s.lastIndexOf("<"));
但是这个答案是针对您的问题的,而不是广泛的问题
String yourString = "<span class=\"date\">Apr 13</span>"
String date = yourString.split("class=\"date\">")[1].split("</sp")[0];
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.