![](/img/trans.png)
[英]Does std::vector<Simd_wrapper> have contiguous data in memory?
[英]How does std::vector support contiguous memory for custom objects of unknown size
我正在为正确的思维模式和对std::vector
理解而苦苦挣扎。
当创建类型T的向量,然后为该向量保留N个元素时,编译器基本上会找到并保留一个连续的内存块,即N * sizeof(T)
个字节。 例如,
// Initialize a vector of int
std::vector<int> intvec;
// Reserve contigious block of 4 4-byte chunks of memory
intvec.reserve(4); // [ | | | ]
// Filling in the memory chunks has obvious behavior:
intvec.push_back(1); // [1| | | ]
intvec.push_back(2); // [1|2| | ]
然后,我们可以在随机访问时间内访问任何元素,因为如果我们要求向量的第k个元素,我们只需从向量开始处的内存地址开始,然后“跳转” k * sizeof(T)
字节即可获得到第k个元素。
我的思维模型针对大小未知/不同的自定义对象进行了分解。 例如,
class Foo {
public:
Foo() = default;
Foo(std::vector<int> vec): _vec{vec} {}
private:
std::vector<int> _vec;
};
int main() {
// Initialize a vector Foo
std::vector<Foo> foovec;
// Reserve contigious block of 4 ?-byte chunks of memory
foovec.reserve(4); // [ | | | ]
// How does memory allocation work since object sizes are unkown?
foovec.emplace_back(std::vector<int> {1,2}); // [{1,2}| | | ]
foovec.emplace_back(std::vector<int> {1,2,3,4,5}); // [{1,2}|{1,2,3,4,5}| | ]
return 0;
}
由于我们不知道Foo每个实例的大小,因此foovec.reserve()
如何分配内存? 此外,您如何获得随机访问时间,而我们不知道要“跳”多远才能到达第k个元素?
您的尺寸概念有缺陷。 一个std::vector<type>
具有一个已知的编译时要占用的空间大小。 它还具有可以使用的运行时大小(在运行时分配,并且向量保存指向它的指针)。 您可以像这样布置图片
+--------+
| |
| Vector |
| |
| |
+--------+
|
|
v
+-------------------------------------------------+
| | | | | |
| Element | Element | Element | Element | Element |
| | | | | |
+-------------------------------------------------+
因此,当您拥有包含向量的事物的向量时,每个Element
将成为向量,然后指向其他地方的自身存储
+--------+
| |
| Vector |
| |
| |
+----+---+
|
|
v
+----+----+---------+---------+
| Object | Object | Object |
| with | with | with |
| Vector | Vector | Vector |
+----+----+----+----+----+----+
| | | +---------+---------+---------+---------+---------+
| | | | | | | | |
| | +-->+ Element | Element | Element | Element | Element |
| | | | | | | |
| | +-------------------------------------------------+
| | +-------------------------------------------------+
| | | | | | | |
| +--->+ Element | Element | Element | Element | Element |
| | | | | | |
| +-------------------------------------------------+
| +-------------------------------------------------+
| | | | | | |
+--->+ Element | Element | Element | Element | Element |
| | | | | |
+---------+---------+---------+---------+---------+
这样,所有向量都彼此相邻,但是向量具有的元素可以在内存中的其他任何位置。 因此,您不想将std:vector<std::vector<int>>
用于矩阵。 所有子向量都将存储到任何地方,因此行之间没有局部性。
请注意,这适用于所有可识别分配器的容器,因为它们不会将元素直接存储在容器中。 对于std::array
,情况并非如此,因为像原始数组一样,元素是容器的一部分。 如果您有std::array<int, 20>
,则至少为sizeof(int) * 20
个字节。
的大小
class Foo {
public:
Foo() = default;
Foo(std::vector<int> vec): _vec{vec} {}
private:
std::vector<int> _vec;
};
内部常量std :: vector是已知且恒定的,它会在堆中进行分配,因此foovec.reserve(4);
没问题foovec.reserve(4);
否则std :: vector怎么会在堆栈中? ;-)
Foo
类的大小在编译时是已知的, std::vector
类具有恒定的大小,因为它持有的元素是在堆上分配的。
std::vector<int> empty{};
std::vector<int> full{};
full.resize(1000000);
assert(sizeof(empty) == sizeof(full));
尽管持有不同数量的元素, std::vector<int>
两个实例, empty
和full
都将始终具有相同的大小。
如果您想要一个无法调整大小的数组,并且必须在编译时知道其大小,请使用std::array
。
创建T类型的向量并为该向量保留N个元素时,编译器基本上会找到并保留一个连续的内存块
编译器不执行此类操作。 它在运行时生成代码以请求向量的分配器进行存储。 默认情况下,它是std::allocator
,它委派给operator new
,该operator new
将从运行时系统中获取未初始化的存储。
我的心理模型针对大小未知/变化的自定义对象分解
用户定义类型实际上可以具有未知大小的唯一方法是不完整-并且您不能将向量声明为不完整类型。
在你的代码中的任何点的种类齐全 ,其大小也是固定的,你可以声明存储该类型像往常一样的向量。
您的Foo
已完成,并且其大小在编译时已固定。 您可以使用sizeof(Foo)
和sizeof(foovec[0])
等进行检查。
向量拥有可变数量的存储空间,但不包含在对象中。 它只是存储一个指针以及保留和使用的大小(或等效值)。 例如,以下实例:
class toyvec {
int *begin_;
int *end_;
size_t capacity_;
public:
// push_back, begin, end, and all other methods
};
始终具有固定的大小sizeof(toyvec) = 2 * sizeof(int*) + sizeof(size_t) + maybe_some_padding
。 分配一个巨大的内存块,并将设置begin
,对指针本身的大小没有影响。
tl; dr C ++没有动态调整大小的对象。 对象的大小由类定义永久固定。 C ++ 确实拥有一些对象,这些对象拥有并且可能会调整动态存储的大小,但这不是对象本身的一部分。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.