OpenCSV CsvToBean：不带BOM的UTF-8无法读取第一列

Question

使用OpenCSV解析没有 BOM的UTF-8文档会导致第一列无法读取。 输入相同的文档内容，但使用 BOM表以UTF-8 进行编码，则可以正常工作。

我将字符集专门设置为UTF-8

    fileInputStream = new FileInputStream(file);
    inputStreamReader = new InputStreamReader(fileInputStream, StandardCharsets.UTF_8);
    reader = new BufferedReader(inputStreamReader);
    HeaderColumnNameMappingStrategy<Bean> ms = new HeaderColumnNameMappingStrategy<Bean>();
    ms.setType(Bean.class);
    CsvToBean<Bean> csvToBean = new CsvToBeanBuilder<Bean>(reader).withType(Bean.class).withMappingStrategy(ms)
            .withSeparator(';').build();
    csvToBean.parse();

我创建了一个示例项目，可以在其中复制该问题： https : //github.com/dajoropo/csv2beanSample

运行单元测试，您可以看到没有BOM的UTF-8文件如何失败以及带有BOM的UTF-8文件如何正常工作。

错误出现在第二个断言中，因为第一列未读。 结果：

[Bean [a = null ，b = second，c = third]]

有什么提示吗？

Answer 1

如果我在您的项目中打开Bean类并搜索“ B”，那么我可以找到一个条目。 如果我搜索“ A”，那么我不能:)这意味着您将带有BOM表头的A复制/粘贴到Bean类。 BOM表头不可见，但仍会考虑在内。

如果我修复“ A”，则另一个测试开始失败，但是我认为您可以使用BOMInputStream对其进行BOMInputStream 。

检查此问题并回答字节顺序标记会破坏Java中的文件读取

这是已知问题。 您可以使用Apache Commons IO的BOMInputStream来解决它。

刚试过

    <dependency>
        <groupId>commons-io</groupId>
        <artifactId>commons-io</artifactId>
        <version>2.6</version>
    </dependency>

和

        inputStreamReader = new InputStreamReader(new BOMInputStream(fileInputStream), StandardCharsets.UTF_8);

和修复

@CsvBindByName(column = "A")
private String a;

从“ A”中排除前缀会使两个测试均通过

OpenCSV CsvToBean：不带BOM的UTF-8无法读取第一列

问题描述

1 个解决方案

解决方案1
1 已采纳 2019-05-20 13:32:01

OpenCSV CsvToBean：不带BOM的UTF-8无法读取第一列

问题描述

1 个解决方案

解决方案1 1 已采纳 2019-05-20 13:32:01

解决方案1
1 已采纳 2019-05-20 13:32:01