繁体   English   中英

清理并从文本文件中提取数据

[英]Cleaning up and extracting data from text files

我需要使用C#从非定界文本文件中提取数据。 基本上,我需要删除所有不需要的字符,然后标记行尾并添加换行符。 将数据分成几行后,我需要依次遍历每行并使用正则表达式提取值。 我一直在使用Perl进行此操作,但现在需要使用C#进行此操作。 原始文件在整个文件中包含许多换行符,而不像您期望的那样在行尾突出。 我将能够使用Regex对象提取值,但是我无法将文件转换为每条记录都具有一行的格式。

您提供的信息很少,但是。 此代码将创建行列表。

请注意,ReadLine将采用一系列字符,后跟换行符(“ \\ n”),回车符(“ \\ r”)或回车符后立即换行符(“ \\ r \\ n”)。
我不确定这是否是您期望的行为。

    string fileName = "Text.txt";
    List<string> lines = new List<string>();
    using (StreamReader r = new StreamReader(fileName))
    {
        string line;
        while ((line = r.ReadLine()) != null)
        {
            lines.Add(line);
        }
    }

    foreach (string s in lines)
    {
        Console.WriteLine(s);
       //can do your Regex here
    }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM