繁体   English   中英

如何使用没有DEFAULT_QUOTE_CHARACTER的openCSV CSVReader?

[英]How to have openCSV CSVReader without a DEFAULT_QUOTE_CHARACTER?

我正在使用CSVReader从制表符分隔的文本文件中读取,该文件具有名为“ user_comments”的字段。 在此列中,我们可以找到用户输入的各种自由格式文本。

这是我声明解析器的代码...

import au.com.bytecode.opencsv.CSVReader;

CSVReader csv = new CSVReader(new FileReader(opt.f),'\t' as char, '~' as char, '\0' as char);

构造函数的第三个参数是“ DEFAULT_QUOTE_CHARACTER”。 默认值为...

 public static final char DEFAULT_QUOTE_CHARACTER = '\"';

我将其设置为“〜”,因为“ user_comments”列中的值带有双引号(不应将其视为实际引号,而应仅将其作为列中的数据读取)。

问题在于该列还具有“〜”和“ |”。

那么我可以创建没有默认引号字符的CSVReader实例吗? 如果不能,那么您可以建议一个我可以使用的字符,这种字符非常罕见,并且很可能在此“ user_comments”列中找不到?

从头到尾检查Unicode的BMP平面( http://unicode.org/roadmaps/bmp/ )。 您一定会找到一个“不太可能在您的数据中使用”的数据。 然后使用\\ u ....在pgm源代码中对其进行编码。

或更妙的是,使用甚至不表示Unicode字符的代码点,例如\\ ud7c7。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM