繁体   English   中英

java获取字符串中的接下来的几个单词

[英]java get next few words in string

我正在尝试搜索包含HTML的.txt文件。 我需要在文件中搜索特定的HTML标记,然后获取以下接下来的几个字符代码。 我是java的新手,但愿意学习我需要的东西。

例如:说我有代码: <span class="date">Apr 13</span> ,我需要的只是日期(4月13日)。 我该怎么做呢?

非常感谢!

看一下String类文档,然后尝试找到搜索字符串的方法。

  • 既然您说的是从HTML文件中获取的,那么您可以看一下Jsoup ,它是HTML解析器,它将使在HTML文档中搜索字符串更加容易。

使用jsoup,您可以像这样

File input = new File("input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");

Elements spans = doc.select("span"); 
for (Element element : spans) {
    System.out.println(element.html());
}

尝试这个

    Matcher m = Pattern.compile(">(.*?)<").matcher(s);
    while(m.find()) {
        String s = m.group(1);
    }

如果您想要的是基本的东西(我认为这是新手会很好),则可以使用以下方法:

if(s.indexOf("span class=\"date\"")!=0)
s=s.substring(s.indexOf(">")+1,s.lastIndexOf("<"));

但是这个答案是针对您的问题的,而不是广泛的问题

String yourString = "<span class=\"date\">Apr 13</span>"
String date = yourString.split("class=\"date\">")[1].split("</sp")[0];

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM