繁体   English   中英

C++ 中的动态缓冲区类型?

[英]A dynamic buffer type in C++?

我不是一个 C++ 新手,但我过去很少认真对待它,所以我对它的设施的了解相当粗略。

我正在用 C++ 编写一个快速的概念验证程序,我需要一个动态大小的二进制数据缓冲区。 也就是说,我将从网络套接字接收数据,但我不知道会有多少(尽管不会超过几 MB)。 我可以自己编写这样的缓冲区,但是如果标准库可能已经有了一些东西,为什么还要麻烦呢? 我使用的是 VS2008,所以一些 Microsoft 特定的扩展对我来说很好。 我只需要四个操作:

  • 创建缓冲区
  • 将数据写入缓冲区(二进制垃圾,不以零结尾)
  • 以字符数组的形式获取写入的数据(连同其长度)
  • 释放缓冲区

我需要的类/函数集的名称是什么?

补充:几票投给了std::vector 一切都很好,但我不想逐字节推送几 MB 数据。 套接字将以几 KB 大块的形式向我提供数据,因此我想一次将它们全部写入。 此外,最后我需要将数据作为简单的 char* 获取,因为我需要将整个 blob 传递给一些未修改的 Win32 API 函数。

你想要一个std::vector

std::vector<char> myData;

vector会自动为你分配和释放它的内存。 使用push_back添加新数据(如果需要, vector将为您调整大小),并使用索引运算符[]来检索数据。

如果在任何时候您都可以猜到需要多少内存,我建议调用reserve以便后续的push_back不必重新分配那么多。

如果你想读入一块内存并将其附加到你的缓冲区,最简单的可能是这样的:

std::vector<char> myData;
for (;;) {
    const int BufferSize = 1024;
    char rawBuffer[BufferSize];

    const unsigned bytesRead = get_network_data(rawBuffer, sizeof(rawBuffer));
    if (bytesRead <= 0) {
        break;
    }

    myData.insert(myData.end(), rawBuffer, rawBuffer + bytesRead);
}

myData现在拥有所有读取数据,逐块读取。 但是,我们复制了两次。

我们改为尝试这样的事情:

std::vector<char> myData;
for (;;) {
    const int BufferSize = 1024;

    const size_t oldSize = myData.size();
    myData.resize(myData.size() + BufferSize);        

    const unsigned bytesRead = get_network_data(&myData[oldSize], BufferSize);
    myData.resize(oldSize + bytesRead);

    if (bytesRead == 0) {
        break;
    }
}

它直接读入缓冲区,代价是偶尔会过度分配。

这可以通过例如将每次调整大小的向量大小加倍以摊销调整大小而变得更智能,因为第一个解决方案是隐式的。 当然,如果您对最终缓冲区的可能大小有先验知识,则可以预先reserve()一个更大的缓冲区,以最小化调整大小。

两者都留给读者作为练习。 :)

最后,如果您需要将数据视为原始数组:

some_c_function(myData.data(), myData.size());

std::vector保证是连续的。

std::vector<unsigned char> buffer;

每个 push_back 都会在最后添加新字符(如果需要重新分配)。 如果您大致知道您期望多少数据,您可以调用reserve 来最小化分配的数量。

buffer.reserve(1000000);

如果你有这样的事情:

unsigned char buffer[1000];
std::vector<unsigned char> vec(buffer, buffer + 1000);

std::string将为此工作:

  • 它支持嵌入的空值。
  • 您可以通过使用指针和长度对其调用append()来向其附加多字节数据块。
  • 您可以通过对其调用data()来获取其内容作为字符数组,并通过对其调用size()length()来获取当前长度。
  • 释放缓冲区由析构函数自动处理,但您也可以对其调用clear()以擦除其内容而不破坏它。

对 std::vector 再投一票。 最少的代码,跳过额外的副本 GMan 的代码做:

std::vector<char> buffer;
static const size_t MaxBytesPerRecv = 1024;
size_t bytesRead;
do
{
    const size_t oldSize = buffer.size();

    buffer.resize(oldSize + MaxBytesPerRecv);
    bytesRead = receive(&buffer[oldSize], MaxBytesPerRecv); // pseudo, as is the case with winsock recv() functions, they get a buffer and maximum bytes to write to the buffer

    myData.resize(oldSize + bytesRead); // shrink the vector, this is practically no-op - it only modifies the internal size, no data is moved/freed
} while (bytesRead > 0);

至于调用 WinAPI 函数 - 使用 &buffer[0](是的,它有点笨拙,但就是这样)传递给 char* 参数,buffer.size() 作为长度。

最后一点,您可以使用 std::string 而不是 std::vector,应该没有任何区别(除非您可以编写 buffer.data() 而不是 &buffer[0] 如果您的缓冲区是字符串)

我会看看 Boost basic_streambuf ,它是为这种目的而设计的。 如果您不能(或不想)使用 Boost,我会考虑std::basic_streambuf ,它非常相似,但要使用更多的工作。 无论哪种方式,您基本上都从该基类派生并重载underflow()以将数据从套接字读取到缓冲区中。 您通常会将std::istream附加到缓冲区,因此其他代码从中读取的方式与用户从键盘(或其他任何方式)输入的方式大致相同。

不是来自 STL 但可能有用的替代方案 - Boost.Circular 缓冲区

使用std::vector ,一个不断增长的数组,保证存储是连续的(你的第三点)。

关于您的评论“我没有看到 append()”,最后插入是一回事。

vec.insert(vec.end,

如果您确实使用 std::vector,那么您只是在使用它来为您管理原始内存。 您可以只malloc您认为需要的最大缓冲区,并跟踪到目前为止读取的写入偏移量/总字节数(它们是相同的)。 如果你到达终点......无论是realloc或选择的方式失败。

我知道,它不是很 C++y,但这是一个简单的问题,其他建议似乎是引入不必要副本的重量级方法。

这里的重点是,您想将缓冲区用于什么目的。 如果要保留带有指针的结构,则必须将缓冲区固定在首先分配的内存地址处。 为了避免这种情况,您必须使用相对指针和修复列表来在最终分配后更新指针。 这将值得一堂课。 (没有找到这样的东西)。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM