[英]C# Regex.Split is working differently than JavaScript
我正在尝试将这个长JS正则表达式转换为C#。
下面的JS代码给出了从["","常","","に","","最新","、","最高"...]
开始的数组中的29个项目
var keywords = /(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g;
var source = '常に最新、最高のモバイル。Androidを開発した同じチームから。';
var result = source.split(keywords);
但是下面的C#代码给出了 string[]
的非拆分单项 。
var keywords = @"/(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)/g";
var source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
var result = Regex.Split(source, keywords);
Stack Overflow中的许多问题仅涵盖相对简单的表达式,因此我无法找到错误。
我错过了什么?
你的RegEx是错误的,你不应该以'/'
或'/g'
开头和结尾你在构造函数中指定一个字符串,而不是JavaScript Regex(带有'/ /'语法。)。 这是一个Javascript语法。
实际上,当您使用这样的字符串构造函数时,同样适用于JavaScript:
var regex = new RegExp('//');
//这将匹配2个斜杠
这是一个C#示例代码
string keywords = @"(\ |[a-zA-Z0-9]+\.[a-z]{2,}|[一-龠々〆ヵヶゝ]+|[ぁ-んゝ]+|[ァ-ヴー]+|[a-zA-Z0-9]+|[a-zA-Z0-9]+)";
string source = @"常に最新、最高のモバイル。Androidを開発した同じチームから。";
string [] res = Regex.Split(source, keywords);
string single = "";
foreach ( string str in res )
single += "'" + str + "',";
Console.WriteLine("{0}", single);
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.