[英]Repeat contents of a std::vector
假设我有一个简单类型的向量(可能很大),例如
std::vector<int> v{1,2,3};
重复 n 次的最佳方法是什么?
例如 3 次会得到结果{1,2,3,1,2,3,1,2,3}
当然,这是一个经常出现的问题(数字库通常内置了这样的函数)。 我天真的解决方案:
template<typename T>
std::vector<T> repeat(const std::vector<T> &input, unsigned int times) {
std::vector<T> result;
auto input_size = input.size();
result.reserve(input_size * times);
for (std::size_t rep = 0; rep < times; ++rep) {
for (std::size_t i = 0; i < input_size; ++i) {
result.push_back(input[i % input_size]);
}
}
return result;
}
这当然可以做得更快吗? 也许用 std::copy ? 但是,在这种情况下,我不确定如何在避免零初始化的同时告诉向量其新大小。 显然这不容易完成(参见,例如, 1 )。 我也尝试用迭代器来做,但它似乎并没有更快。
我会立即调整向量的大小以避免任何中间重新分配。 然后,您可以使用std::copy
和一些算术将input
向量复制到result
使用特定偏移量到该预先分配的向量中。
template<typename T>
std::vector<T> repeat(const std::vector<T> &input, unsigned int times) {
std::vector<T> result(input.size() * times);
for (std::size_t rep = 0; rep < times; ++rep) {
std::copy(input.begin(), input.end(), std::next(result.begin(), rep * input.size()));
}
return result;
}
使用 range-v3 你可以写:
#include <range/v3/all.hpp>
namespace rv = ranges::views;
template<typename T>
auto repeat(const std::vector<T> &input, unsigned int times)
{
return rv::repeat_n(input, times)
| rv::join
| ranges::to<std::vector<T>>;
}
这是一个演示。
我怀疑这将有足够好的性能满足您的需求。
这最初是对问题的编辑。 用户 cigien 建议将其发布为答案。 这包含一些不完整的(即尚未探索实施解决方案的所有可能性)分析结果。
我制作了一些分析代码(我绝不是分析专家)将我的版本与 Cory Kramer 的答案中的版本进行比较。 答案中的代码似乎比我的快 4.5 倍(在quick-bench.com 上使用 GCCv10.1、C++17、O3 优化进行测试)。 Remy Lebeau 保存迭代器临时文件的建议似乎没有任何区别。
在问自己之前,我错过了重复的问题: 1和2 。 这些中的一些答案提出了更多略有不同的解决方案,我尚未对其进行分析。
range-v3 库(cigien 的回答)虽然看起来很方便,但不是我可以使用的选项,我也没有对其进行概要分析。
分析代码:
// This code is intended to be used at quick-bench.com.
// Needs profiling library AND ADDITIONAL INCLUDES to compile,
// see https://github.com/google/benchmark
#include<vector>
template<typename T>
std::vector<T> repeat_1(const std::vector<T> &input, unsigned int times) {
std::vector<T> result;
auto input_size = input.size();
result.reserve(input_size * times);
for (std::size_t rep = 0; rep < times; ++rep) {
for (std::size_t i = 0; i < input_size; ++i) {
result.push_back(input[i % input_size]);
}
}
return result;
}
template<typename T>
std::vector<T> repeat_2(const std::vector<T> &input, unsigned int times) {
std::vector<T> result(input.size() * times);
for (std::size_t rep = 0; rep < times; ++rep) {
std::copy(input.begin(), input.end(),
std::next(result.begin(), rep * input.size()));
}
return result;
}
template<typename T>
std::vector<T> repeat_3(const std::vector<T> &input, unsigned int times) {
std::vector<T> result(input.size() * times);
auto iter = result.begin();
for (std::size_t rep = 0; rep < times; ++rep, iter += input.size()) {
std::copy(input.begin(), input.end(), iter);
}
return result;
}
static void version_1(benchmark::State &state) {
std::vector<int> vec = {12, 4, 4, 5, 16, 6, 6, 17, 77, 8, 54};
for (int i = 0; i < 100'000; ++i) {
vec.push_back(i % 10'000);
}
for (auto _ : state) {
auto repeated = repeat_1(vec, 1000);
// Make sure the variable is not optimized away by compiler
benchmark::DoNotOptimize(repeated);
}
}
BENCHMARK(version_1);
static void version_2(benchmark::State &state) {
std::vector<int> vec = {12, 4, 4, 5, 16, 6, 6, 17, 77, 8, 54};
for (int i = 0; i < 100'000; ++i) {
vec.push_back(i % 10'000);
}
for (auto _ : state) {
auto repeated = repeat_2(vec, 1000);
// Make sure the variable is not optimized away by compiler
benchmark::DoNotOptimize(repeated);
}
}
BENCHMARK(version_2);
static void version_3(benchmark::State &state) {
std::vector<int> vec = {12, 4, 4, 5, 16, 6, 6, 17, 77, 8, 54};
for (int i = 0; i < 100'000; ++i) {
vec.push_back(i % 10'000);
}
for (auto _ : state) {
auto repeated = repeat_3(vec, 1000);
// Make sure the variable is not optimized away by compiler
benchmark::DoNotOptimize(repeated);
}
}
BENCHMARK(version_3);
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.