从慢速流读取时，BufferedReader.readLine（）是否可能不读取整行？

Question

我的一个系统遇到一个奇怪的错误，我不知所措。 在我们的系统中，后端生成一个大的TSV输出文件，然后我们使用以下代码在HTTP上提供该文件：

    BufferedInputStream input = new BufferedInputStream(p.getInputStream(), (int)FileUtils.BYTES_PER_MEGABYTE * 16);
    OutputStream output = resp.getOutputStream();
    byte[] buffer = new byte[(int) (FileUtils.BYTES_PER_KILOBYTE * 8)];
    do
    {
        int read = input.read(buffer);
        if (read <= 0) break;
        output.write(buffer);           
    } while (true);
    input.close();
    output.close();

然后在客户端，有一个使用HTTP响应的TSV解析器，但是在非常大的输入上，我们开始看到奇怪的工件，其中解析器将报告一行错误的项目数，并且错误消息会打印将要解析的行，该行将是随机数据块，即不是整个数据行

我最初的想法是生成的TSV格式错误，但是我已经通过直接从后端系统复制文件，然后通过三个独立编写的开放源代码TSV解析器（包括客户端代码正在使用的解析器）运行该文件，将其排除在外），当它们在本地文件上运行时，所有文件都能够很好地解析文件。

供参考，我们使用的TSV解析器的代码在这里

这使我想到了两种可能性：

我显示的用于通过HTTP复制文件的代码在某些方面存在缺陷-在这种情况下，我希望有人指出我犯了什么愚蠢但不明显的错误！
不能保证使用解析器正在使用的BufferedReader.readLine()能读取整行吗？ 如果是这种情况，我将不会完全感到惊讶，因为我在.Net缓慢的网络流中被奇怪的读取行为所困扰，所以想知道类似的问题是否可以在Java中解决？

还是我忽略了其他解释？

Answer 1

在发布这个问题时，我突然发现了错误所在（通常是！）。

我发布的用于复制文件的代码的以下部分不正确：

int read = input.read(buffer);
if (read <= 0) break;
output.write(buffer);

而是应如下所示：

int read = input.read(buffer);
if (read <= 0) break;
output.write(buffer, 0, read);

问题是，即使我们从输入中读取的内容少于缓冲区的大小，我也总是将整个缓冲区写入输出流。 这意味着在文件末尾，我们将打印数据的最后一块以及缓冲区其余部分中剩下的所有内容，因此将剩下随机的数据块！

从慢速流读取时，BufferedReader.readLine（）是否可能不读取整行？

问题描述

1 个解决方案

解决方案1
1 已采纳 2012-07-03 20:56:36

从慢速流读取时，BufferedReader.readLine（）是否可能不读取整行？

问题描述

1 个解决方案

解决方案1 1 已采纳 2012-07-03 20:56:36

解决方案1
1 已采纳 2012-07-03 20:56:36