繁体   English   中英

使用正则表达式删除Java中的转义unicode字符串

[英]Remove escaped unicode string in java with regex

我有下面的字符串

"them coming \nLove it \ud83d\ude00"

我要删除此字符"\?\?" 所以会的

"them coming \nLove it "

如何在Java中实现呢? 我已经尝试过使用下面的代码,但无法正常工作

payload.toString().replaceAll("\\\\u\\b{4}.", "")

谢谢 :)

我认为\\\\\\\\u\\\\b{4}. 将不起作用,因为正则表达式将\?视为符号......,而不是文字字符串。 因此,要匹配这种不需要的(出于任何原因)unicode字符,最好排除您接受(不想替换)的字符,因此,对于所有ASCII字符,请与其他所有字符(要替换的字符)匹配。 尝试:

[^\x00-\x7F]+

\\x00-\\x7F包含Unicode Basic Latin块

String str = "them coming \nLove it \ud83d\ude00";
System.out.println(str.replaceAll("[^\\x00-\\x7F]+", ""));

结果将是:

他们来了
爱它

但是,如果使用国家字符,其他任何非ASCII符号(ś,±,♉,☹等),您都会遇到问题。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM