繁体   English   中英

C#split string但保留分隔符

[英]C# split string but keep separators

已经存在类似的问题,但所有问题都使用regexen。 我正在使用的代码(剥离分隔符):

string[] sentences = s.Split(new string[] { ". ", "? ", "! ", "... " }, StringSplitOptions.None);

我想在句子分词上分割一段文字并保留句子终结符。 我想避免使用regexen来提高性能。 可能吗?

我不相信有一个现有的功能可以做到这一点。 但是,您可以使用以下扩展方法。

public static IEnumerable<string> SplitAndKeepSeparators(this string source, string[] separators) {
  var builder = new Text.StringBuilder();
  foreach (var cur in source) {
    builder.Append(cur);
    if (separators.Contains(cur)) {
      yield return builder.ToString();
      builder.Length = 0;
    }
  }
  if (builder.Length > 0) {
    yield return builder.ToString();
  }
}

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM