[英]How to get 16 or 32 bit iterator from 8 bit iterator in C++?
我写了代码,使用这个库http://utfcpp.sourceforge.net ,它转换 utf16to8:
ifstream sourceFile("/home/myuser/utf16.txt", std::ifstream::binary);
vector<unsigned char> res;
std::vector<uint16_t> my_buffer;
my_buffer.resize(fileSize/2);
sourceFile.read((char*) my_buffer.data(), fileSize);
utf8::utf16to8(my_buffer.begin(),
my_buffer.end(),
back_inserter(res));
outFile.write((char*)&res[0], res.size());
我的问题:如果我想转换 utf32to8,我必须编写所有这些代码,但向量中的类型不同:
vector<unsigned char> res;
std::vector<uint32_t> my_buffer;
my_buffer.resize(fileSize/4);
sourceFile.read((char*) my_buffer.data(), fileSize);
utf8::utf32to8(my_buffer.begin(),
my_buffer.end(),
back_inserter(res));
outFile.write((char*)&res[0], res.size());
我使用 std::vector 和 std::vector 因为 lib uf8-cpp 需要 32 位和 16 位迭代器。 有没有办法从 std::vector 获取这个迭代器,例如:
std::vector<char> myvector;
std::vector<uint16_t>::iterator u16bit_iterator = myvector.begin(); //this doesn't work now
让我们澄清手头的问题。
你有:
std::vector<uint32_t> in;
std::vector<uint8_t> out;
您希望将in
(UTF-32 格式的数据)转换为out
(UTF-8 格式的数据); in
由 32 位整数填充,因为这是utf8::utf32to8
所要求的(加上它有意义),而out
由 8 位整数(即字节)填充,这也有意义。
现在:
我想重构我的代码并只使用一个向量而不是两个不同类型的向量。
撇开这是一个弱要求(现在的类型有什么问题?)这可以通过从默认迭代器切换到指针来实现。 迭代器std::vector<T>::iterator
用于迭代std::vector<T>
周期。 你对T
的不同选择都是整数并不重要; 它们是不同的类型。 但是指针可以用作迭代器(特别是当您使用像向量包含的连续数据块时),并且将任意内存重新解释为字节(仅限)是合法的。
作为奖励,从文件中读取会更容易,因为您返回到只读取字节(这在某种程度上更有意义)。
std::vector<uint8_t> in;
std::vector<uint8_t> out;
in.resize(fileSize);
sourceFile.read((char*)&in[0], fileSize);
// Make sure you have a whole number of 32-bit
// blocks, before we interpret them as bytes
assert((in.size() % 4) == 0);
utf8::utf32to8(
(uint32_t*)&in.front(),
(uint32_t*)&in.back(),
std::back_inserter(out)
);
outFile.write((char*)&out.front(), out.size());
我希望我已经正确解释了您的要求。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.