繁体   English   中英

如何从文件中选择文本

[英]how to choose text from a file

我有一个文本文件,如:

“ GET /opacial/index.php?op=results&catalog=1&view=1&language=el&numhits=10&query= \\ xce \\ x95 \\ xce \\ xbb \\ xce \\ xbb \\ xce \\ xac \\ xce \\ xb4 \\ xce \\ xb1%20% 20 \\ xce \\ x95 \\ xce \\ xb8 \\ xce \\ xbd \\ xce \\ xb9 \\ xce \\ xba \\ xce \\ xad \\ xcf \\ x82%20 \\ xcf \\ x83 \\ xcf \\ x87 \\ xce \\ xad \\ xcf \\ x83 \\ xce \\ xb5 \\ xce \\ xb9 \\ xcf \\ x82%20
-%20 \\ xce \\ x99 \\ xcf \\ x83 \\ xcf \\ x84 \\ xce \\ xbf \\ xcf \\ x81 \\ xce \\ xaf \\ xce \\ xb1 &search_field = 11&page = 1

我想在单词“ query”之后和“&search”之前剪切所有字符。 (上方为粗体)。 我正在尝试使用模式来削减数据,但是出了点问题。.您能给我上面示例代码的示例吗?

编辑:另一个问题,除了上面的那个是匹配器仅用于charSequences,并且我有一个文件,不能将其强制转换为charSequence ...:\\

像这样的东西:

   String yourNewText=yourOldText.split("query")[1].split("&search")[0];

要查看如何将文件读取为String ,可以在这里查看 (有不同的可能性)

".*query\\=(.*)\\&search_field.*"

这个正则表达式应该可以让您捕获要删除的内容。 然后String.replace应该可以解决问题。

编辑-评论回应。 以下代码...

    String s = "GET /opacial/index.php?op=results&catalog=1&view=1&language=el&numhits=10&query=\\xce\\x95\\xce\\xbb\\xce\\xbb\\xce\\xac\\xce\\xb4\\xce\\xb1%20--%20\\xce\\x95\\xce\\xb8\\xce\\xbd\\xce\\xb9\\xce\\xba\\xce\\xad\\xcf\\x82%20\\xcf\\x83\\xcf\\x87\\xce\\xad\\xcf\\x83\\xce\\xb5\\xce\\xb9\\xcf\\x82%20 --%20\\xce\\x99\\xcf\\x83\\xcf\\x84\\xce\\xbf\\xcf\\x81\\xce\\xaf\\xce\\xb1&search_field=11&page=1";
    Pattern p = Pattern.compile(".*query\\=(.*)\\&search_field.*");
    Matcher m = p.matcher(s);
    if (m.matches()){
        String betweenQueryAndSearch = m.group(1);
        System.out.println(betweenQueryAndSearch);
    }

产生以下输出。

\xce\x95\xce\xbb\xce\xbb\xce\xac\xce\xb4\xce\xb1%20--%20\xce\x95\xce\xb8\xce\xbd\xce\xb9\xce\xba\xce\xad\xcf\x82%20\xcf\x83\xcf\x87\xce\xad\xcf\x83\xce\xb5\xce\xb9\xcf\x82%20 --%20\xce\x99\xcf\x83\xcf\x84\xce\xbf\xcf\x81\xce\xaf\xce\xb1

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM