std :: vector如何支持未知大小的自定义对象的连续内存

Question

我正在为正确的思维模式和对std::vector理解而苦苦挣扎。

我以为我知道

当创建类型T的向量，然后为该向量保留N个元素时，编译器基本上会找到并保留一个连续的内存块，即N * sizeof(T)个字节。 例如，

// Initialize a vector of int
std::vector<int> intvec;

// Reserve contigious block of 4 4-byte chunks of memory
intvec.reserve(4);  // [ | | | ]

// Filling in the memory chunks has obvious behavior:
intvec.push_back(1);  // [1| | | ]
intvec.push_back(2);  // [1|2| | ]

然后，我们可以在随机访问时间内访问任何元素，因为如果我们要求向量的第k个元素，我们只需从向量开始处的内存地址开始，然后“跳转” k * sizeof(T)字节即可获得到第k个元素。

自定义对象

我的思维模型针对大小未知/不同的自定义对象进行了分解。 例如，

class Foo {

public:
    Foo() = default;
    Foo(std::vector<int> vec): _vec{vec} {}

private:
    std::vector<int> _vec;
};

int main() {

    // Initialize a vector Foo
    std::vector<Foo> foovec;

    // Reserve contigious block of 4 ?-byte chunks of memory
    foovec.reserve(4);  // [ | | | ]

    // How does memory allocation work since object sizes are unkown?
    foovec.emplace_back(std::vector<int> {1,2});        // [{1,2}| | | ]
    foovec.emplace_back(std::vector<int> {1,2,3,4,5});  // [{1,2}|{1,2,3,4,5}| | ]

    return 0;
}

由于我们不知道Foo每个实例的大小，因此foovec.reserve()如何分配内存？ 此外，您如何获得随机访问时间，而我们不知道要“跳”多远才能到达第k个元素？

Answer 1

您的尺寸概念有缺陷。 一个std::vector<type>具有一个已知的编译时要占用的空间大小。 它还具有可以使用的运行时大小（在运行时分配，并且向量保存指向它的指针）。 您可以像这样布置图片

+--------+
|        |
| Vector |
|        |
|        |
+--------+
     |
     |
     v
+-------------------------------------------------+
|         |         |         |         |         |
| Element | Element | Element | Element | Element |
|         |         |         |         |         |
+-------------------------------------------------+

因此，当您拥有包含向量的事物的向量时，每个Element将成为向量，然后指向其他地方的自身存储

+--------+
|        |
| Vector |
|        |
|        |
+----+---+
     |
     |
     v
+----+----+---------+---------+
| Object  | Object  | Object  |
|  with   |  with   |  with   |
| Vector  | Vector  | Vector  |
+----+----+----+----+----+----+
     |         |         |   +---------+---------+---------+---------+---------+
     |         |         |   |         |         |         |         |         |
     |         |         +-->+ Element | Element | Element | Element | Element |
     |         |             |         |         |         |         |         |
     |         |             +-------------------------------------------------+
     |         |    +-------------------------------------------------+
     |         |    |         |         |         |         |         |
     |         +--->+ Element | Element | Element | Element | Element |
     |              |         |         |         |         |         |
     |              +-------------------------------------------------+
     |    +-------------------------------------------------+
     |    |         |         |         |         |         |
     +--->+ Element | Element | Element | Element | Element |
          |         |         |         |         |         |
          +---------+---------+---------+---------+---------+

这样，所有向量都彼此相邻，但是向量具有的元素可以在内存中的其他任何位置。 因此，您不想将std:vector<std::vector<int>>用于矩阵。 所有子向量都将存储到任何地方，因此行之间没有局部性。

请注意，这适用于所有可识别分配器的容器，因为它们不会将元素直接存储在容器中。 对于std::array ，情况并非如此，因为像原始数组一样，元素是容器的一部分。 如果您有std::array<int, 20> ，则至少为sizeof(int) * 20个字节。

Answer 2

的大小

class Foo {

public:
    Foo() = default;
    Foo(std::vector<int> vec): _vec{vec} {}

private:
    std::vector<int> _vec;
};

内部常量std :: vector是已知且恒定的，它会在堆中进行分配，因此foovec.reserve(4);没问题foovec.reserve(4);

否则std :: vector怎么会在堆栈中？ ;-)

Answer 3

Foo类的大小在编译时是已知的， std::vector类具有恒定的大小，因为它持有的元素是在堆上分配的。

std::vector<int> empty{};
std::vector<int> full{};
full.resize(1000000);
assert(sizeof(empty) == sizeof(full));

尽管持有不同数量的元素， std::vector<int>两个实例， empty和full都将始终具有相同的大小。

如果您想要一个无法调整大小的数组，并且必须在编译时知道其大小，请使用std::array 。

Answer 4

创建T类型的向量并为该向量保留N个元素时，编译器基本上会找到并保留一个连续的内存块

编译器不执行此类操作。 它在运行时生成代码以请求向量的分配器进行存储。 默认情况下，它是std::allocator ，它委派给operator new ，该operator new将从运行时系统中获取未初始化的存储。

我的心理模型针对大小未知/变化的自定义对象分解

用户定义类型实际上可以具有未知大小的唯一方法是不完整-并且您不能将向量声明为不完整类型。

在你的代码中的任何点的种类齐全，其大小也是固定的，你可以声明存储该类型像往常一样的向量。

您的Foo已完成，并且其大小在编译时已固定。 您可以使用sizeof(Foo)和sizeof(foovec[0])等进行检查。

向量拥有可变数量的存储空间，但不包含在对象中。 它只是存储一个指针以及保留和使用的大小（或等效值）。 例如，以下实例：

class toyvec {
  int *begin_;
  int *end_;
  size_t capacity_;
public:
  // push_back, begin, end, and all other methods
};

始终具有固定的大小sizeof(toyvec) = 2 * sizeof(int*) + sizeof(size_t) + maybe_some_padding 。 分配一个巨大的内存块，并将设置begin ，对指针本身的大小没有影响。

tl; dr C ++没有动态调整大小的对象。 对象的大小由类定义永久固定。 C ++ 确实拥有一些对象，这些对象拥有并且可能会调整动态存储的大小，但这不是对象本身的一部分。

std :: vector如何支持未知大小的自定义对象的连续内存

问题描述

我以为我知道

自定义对象

4 个解决方案

解决方案1
11 已采纳 2019-04-02 15:47:41

解决方案2
8 2019-04-02 15:37:31

解决方案3
3 2019-04-02 15:40:35

解决方案4
2 2019-04-02 15:40:25

std :: vector如何支持未知大小的自定义对象的连续内存

问题描述

我以为我知道

自定义对象

4 个解决方案

解决方案1 11 已采纳 2019-04-02 15:47:41

解决方案2 8 2019-04-02 15:37:31

解决方案3 3 2019-04-02 15:40:35

解决方案4 2 2019-04-02 15:40:25

解决方案1
11 已采纳 2019-04-02 15:47:41

解决方案2
8 2019-04-02 15:37:31

解决方案3
3 2019-04-02 15:40:35

解决方案4
2 2019-04-02 15:40:25