Node.js流和数据消失

Question

我一直在使用Readable和Transforming流，但无法解决线条消失的谜团。

考虑一个文本文件，其中的行包含从1到20000的连续数字：

$ seq 1 20000 > file.txt

我创建了一个Readable流和LineStream （称为署名从库： npm install byline ;我使用的是版本4.1.1）：

var file = (require('fs')).createReadStream('file.txt');
var lines = new (require('byline').LineStream)();

考虑以下代码：

setTimeout(function() {
  lines.on('readable', function() {
    var line;
    while (null !== (line = lines.read())) {
      console.log(line);
    } 
  });
}, 1500);

setTimeout(function() {
  file.on('readable', function() {
    var chunk;
    while (null !== (chunk = file.read())) {
      lines.write(chunk);
    }
  }); 
}, 1000);

请注意，它首先将侦听器附加到file Readable流的'readable'事件，该事件将写入lines流，仅半秒钟后，它将侦听器附加到该lines流的'readable'事件，该事件仅打印线到控制台。

如果运行此代码，它将仅打印16384（2 ^ 14）行并停止。 它不会完成文件。 但是，如果我将1500ms超时更改为500ms －有效地交换了侦听器的连接顺序，它将很高兴地打印出整个文件。

我尝试过使用highWaterMark，指定了要从文件流中读取的字节数，并将侦听器附加到行流的其他事件，但都是徒劳的。

有什么可以解释这种行为？

谢谢！

Answer 1

我认为这种行为可以用两件事来解释：

您如何使用流。
byline工作原理。

您要做的是手动管道。 它的问题是它不尊重highWaterMark并强制整个缓冲区。

所有这些都会导致byline表现不良。 看到这个： https : //github.com/jahewson/node-byline/blob/master/lib/byline.js#L110-L112 。 这意味着当缓冲区长度> highWaterMark时，它将停止推线。 但这没有任何意义！ 它不会阻止内存使用量的增长（行仍存储在特殊的行缓冲区中），但是流不知道这些行，如果流以溢出状态结束，它们将永远丢失。

你可以做什么：

使用pipe
修改highWaterMark ： lines._readableState.highWaterMark = Infinity;
停止使用byline

Node.js流和数据消失

问题描述

1 个解决方案

解决方案1
2 已采纳 2014-07-27 10:02:49

Node.js流和数据消失

问题描述

1 个解决方案

解决方案1 2 已采纳 2014-07-27 10:02:49

解决方案1
2 已采纳 2014-07-27 10:02:49