[英]What does it line mean in bash?
spkgender=$(perl -ane ' s/.*gender\\:\\W*(.).*/lc($1)/ei && print; ' <$rdm)
它是正则表达式,它从“性别:男性”中提取M
,但不适用于unicode。
如何使其与unicode一起使用?
它不适用于“性别:Мужской”-看起来\\W
“吃掉了”所有unicode符号。
使用/u
regex修饰符。 资料来源: https : //perldoc.perl.org/perlre.html
spkgender=$(perl -ane ' s/.*gender\:\W*(.).*/lc($1)/uei && print; ' <$rdm)
或者,使用官方的POSIX字符类。 代替\\W
使用[[:blank:]]
。 据我所知,它支持Unicode。
另外,请确保总体上正确使用Unicode。 参考: https : //perldoc.perl.org/perlunicode.html
当字符串来自标记为Unicode的外部来源时
-C命令行选项可以指定程序的某些输入是Unicode,并且此值可以由您的Perl代码读取,请参阅perlvar中的$ {^ UNICODE}。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.