[英]OpenCSV CsvToBean: First column not read for UTF-8 Without BOM
使用OpenCSV解析没有 BOM的UTF-8文档会导致第一列无法读取。 输入相同的文档内容,但使用 BOM表以UTF-8 进行编码,则可以正常工作。
我将字符集专门设置为UTF-8
fileInputStream = new FileInputStream(file);
inputStreamReader = new InputStreamReader(fileInputStream, StandardCharsets.UTF_8);
reader = new BufferedReader(inputStreamReader);
HeaderColumnNameMappingStrategy<Bean> ms = new HeaderColumnNameMappingStrategy<Bean>();
ms.setType(Bean.class);
CsvToBean<Bean> csvToBean = new CsvToBeanBuilder<Bean>(reader).withType(Bean.class).withMappingStrategy(ms)
.withSeparator(';').build();
csvToBean.parse();
我创建了一个示例项目,可以在其中复制该问题: https : //github.com/dajoropo/csv2beanSample
运行单元测试,您可以看到没有BOM的UTF-8文件如何失败以及带有BOM的UTF-8文件如何正常工作。
错误出现在第二个断言中,因为第一列未读。 结果:
[Bean [a = null ,b = second,c = third]]
有什么提示吗?
如果我在您的项目中打开Bean
类并搜索“ B”,那么我可以找到一个条目。 如果我搜索“ A”,那么我不能:)这意味着您将带有BOM表头的A复制/粘贴到Bean
类。 BOM表头不可见,但仍会考虑在内。
如果我修复“ A”,则另一个测试开始失败,但是我认为您可以使用BOMInputStream
对其进行BOMInputStream
。
检查此问题并回答字节顺序标记会破坏Java中的文件读取
这是已知问题。 您可以使用Apache Commons IO的BOMInputStream
来解决它。
刚试过
<dependency>
<groupId>commons-io</groupId>
<artifactId>commons-io</artifactId>
<version>2.6</version>
</dependency>
和
inputStreamReader = new InputStreamReader(new BOMInputStream(fileInputStream), StandardCharsets.UTF_8);
和修复
@CsvBindByName(column = "A")
private String a;
从“ A”中排除前缀会使两个测试均通过
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.