[英]Removing non-printable and/or unicode chararacters from large XML-file
我有一个方法来接收包含XML数据的File对象。 文件可以超过50 MB。 是否有一种方便的方法可以从中删除控制字符和/或不可打印的字符。
对于较小的文件,我将文件内容读取为String并使用replaceAll(“ \\ p {Cntrl}”,“”)。
1)。 使用notepad ++或ms单词并使用查找/替换2)使用bufferedStream编写Java程序以查找并替换stringtokens
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.