繁体   English   中英

如何解析带有C#的CSV数据和逗号?

[英]How can I parse data in a CSV with C# with commas in the data?

我正在尝试使用数据中的逗号来解析CSV文件。 所有字段都没有引号,但是如果其中包含逗号,则有些美元金额会包含引号。 因此,例如文件看起来像这样:

0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Comapny,,312.3
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Company,,"1,420.97"

因此,您可以看到1,420.97中有一个逗号,但是它周围确实有引号。 有没有办法可靠地读取此文件?

这是我的代码:

var path = @"glid.csv";

TextFieldParser parser = new TextFieldParser(path);

parser.HasFieldsEnclosedInQuotes = true;
parser.SetDelimiters(",");

while (!parser.EndOfData)
{
    parser.ReadLine();
    fields = parser.ReadFields();

    //do something
}

parser.Close();

CSV是一种反叛的鸟,没有人可以驯服 ,因此永远不要尝试使用自己的规则来解析它。

我强烈建议使用OleDbDataAdapter而不是Microsoft.VisualBasic.FileIO.TextFieldParser来填充数据集,这样可以节省大量时间和麻烦。

    string fileName = @"glid.csv";
    DataSet ds = new DataSet("csvData");
    string dir = Path.GetDirectoryName(fileName);
    string connstr = String.Format("Provider = Microsoft.Jet.OleDb.4.0; Data Source={0}; Extended Properties = \"Text;HDR=YES;FMT=Delimited\"",dir);

    using (System.Data.OleDb.OleDbConnection conn = new System.Data.OleDb.OleDbConnection())
    {
        conn.Open();
        OleDbDataAdapter adapter = new OleDbDataAdapter("SELECT * FROM " + Path.GetFileName(fileName), conn);
        adapter.Fill(ds);
    }

    var p = ds; //<-- here is your data;

您确定要同时使用

parser.ReadLine();

fields = parser.ReadFields();

根据文档https://msdn.microsoft.com/zh-cn/library/microsoft.visualbasic.fileio.textfieldparser(v=vs.110).aspx,这将跳过一行,一遍又一遍地处理下一行,直到文件末尾。

您可能还希望检查您的编码类型,TextFieldParser构造函数接受一个编码类型: https : //msdn.microsoft.com/zh-cn/library/ms128085(v=vs.110).aspx

尝试以下编码: https : //msdn.microsoft.com/zh-cn/library/system.text.encoding(v=vs.110).aspx

老实说 ,我建议使用这个nuget包 它在读取和写入csv方面非常有帮助,甚至允许您直接映射到从记录创建对象模型的类。 它会为您处理所有转义和复杂的工作。 简而言之,它是可行的。

这真的是好东西,而且非常容易使用!

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM