[英]Java CSV Reader, reading remaining data
我有CSV数据,如下所示:
1,mm/dd/yy,"abc,def,"pqr",xyz"
我想将其解析为3个字符串。
1
MM / DD / YY
所有剩余的数据,在这种情况下为“ abc,def,” pqr“,xyz”
我尝试了几个库,openCSV,javacsv等。它们似乎都可以解析并标记最后一列。 我想要的是将第二列之后的数据作为单个令牌保留。
有任何想法吗 ?
您应该更新输入数据以用单引号将第三列括起来,如下所示:1,mm / dd / yy,'abc,def,“ pqr”,xyz'
否则,您将永远无法正确解析csv数据。
使用更新后的数据,您可以调用功能强大的开源库uniVocity-parsers以仅几行即可正确读取数据:
public static void main(String[] args) throws FileNotFoundException {
// 1st, config the CSV reader
CsvParserSettings settings = new CsvParserSettings();
settings.getFormat().setLineSeparator("\n");
settings.getFormat().setQuote('\''); // set the quote to single quote '
settings.getFormat().setQuoteEscape('\\'); // escape the double quote "
// 2nd, creates a CSV parser with the configs
CsvParser parser = new CsvParser(settings);
// 3rd, parses all rows from the CSV file into a 2-dimensional array
List<String[]> resolvedData = parser.parseAll(new StringReader("1,mm/dd/yy,'abc,def,\"pqr\",xyz'"));
for (String[] row : resolvedData) {
StringBuilder strBuilder = new StringBuilder();
for (String col : row) {
strBuilder.append(col).append("\t");
}
System.out.println(strBuilder);
}
}
您将获得如下输出:
1毫米/日/年abc,def,“ pqr”,xyz
int firstCommaIndex = s.indexOf(',');
int secondCommaIndex = s.indexOf(',', firstCommaIndex + 1);
String firstPart = s.substring(0, firstCommaIndex);
String secondPart = s.substring(firstCommaIndex + 1, secondCommaIndex);
String lastPart = s.substring(secondCommaIndex + 1);
尝试SuperCSV 。 它具有quoteChar配置选项,似乎可以表达对引用文本的处理。
您可以在https://github.com/CyborTronik/fluent-ssv上使用自定义LineParser
它也可以将CSV数据转换为bean,但是对于日期类型,您将需要提供ValueConverter的自定义实现,否则您可以将其存储为字符串然后进行操作。
因此代码如下所示:
new SsvStreamBuilder<MyBean>()
.forEntity(MyBean.class)
.withLineParser(new MyLineParser())
.withValueConverter(new MyDateConverter())
.stream("~/some/csv/file");
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.