[英]How can I parse data in a CSV with C# with commas in the data?
我正在尝试使用数据中的逗号来解析CSV文件。 所有字段都没有引号,但是如果其中包含逗号,则有些美元金额会包含引号。 因此,例如文件看起来像这样:
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Comapny,,312.3
0000-0C,Sales-Data Entry,10/31/2016,000000,VJ,Company,,"1,420.97"
因此,您可以看到1,420.97中有一个逗号,但是它周围确实有引号。 有没有办法可靠地读取此文件?
这是我的代码:
var path = @"glid.csv";
TextFieldParser parser = new TextFieldParser(path);
parser.HasFieldsEnclosedInQuotes = true;
parser.SetDelimiters(",");
while (!parser.EndOfData)
{
parser.ReadLine();
fields = parser.ReadFields();
//do something
}
parser.Close();
CSV是一种反叛的鸟,没有人可以驯服 ,因此永远不要尝试使用自己的规则来解析它。
我强烈建议使用OleDbDataAdapter
而不是Microsoft.VisualBasic.FileIO.TextFieldParser
来填充数据集,这样可以节省大量时间和麻烦。
string fileName = @"glid.csv";
DataSet ds = new DataSet("csvData");
string dir = Path.GetDirectoryName(fileName);
string connstr = String.Format("Provider = Microsoft.Jet.OleDb.4.0; Data Source={0}; Extended Properties = \"Text;HDR=YES;FMT=Delimited\"",dir);
using (System.Data.OleDb.OleDbConnection conn = new System.Data.OleDb.OleDbConnection())
{
conn.Open();
OleDbDataAdapter adapter = new OleDbDataAdapter("SELECT * FROM " + Path.GetFileName(fileName), conn);
adapter.Fill(ds);
}
var p = ds; //<-- here is your data;
您确定要同时使用
parser.ReadLine();
和
fields = parser.ReadFields();
根据文档https://msdn.microsoft.com/zh-cn/library/microsoft.visualbasic.fileio.textfieldparser(v=vs.110).aspx,这将跳过一行,一遍又一遍地处理下一行,直到文件末尾。
您可能还希望检查您的编码类型,TextFieldParser构造函数接受一个编码类型: https : //msdn.microsoft.com/zh-cn/library/ms128085(v=vs.110).aspx
尝试以下编码: https : //msdn.microsoft.com/zh-cn/library/system.text.encoding(v=vs.110).aspx
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.