繁体   English   中英

C ++保存并加载巨大的向量<bool>

[英]C++ save and load huge vector<bool>

我有一个巨大的vector<vector<bool>> (512x 44,000,000位)。 创建它需要花费4-5个小时来进行计算,显然我想保存结果,以免我再次重复该过程。 当我再次运行该程序时,我要做的就是加载相同的向量(没有其他应用程序将使用此文件)。

我相信文本文件对于这么大的尺寸是不可能的。 有没有简单(快速又脏)的方法来做到这一点? 我不使用Boost,这只是我的科学应用程序的一小部分,因此必须快速。 我还考虑过将其在线反转并存储在Postgres DB中(44000000条记录和512位数据),因此DB可以轻松处理它。 我看到这样的答案需要8bits> 1byte然后保存,但是由于我有限的新手C ++经验,它们听起来太复杂了。 有任何想法吗?

您可以 8位保存为一个字节:

unsigned char saver(bool bits[])
{
   unsigned char output=0;
   for(int i=0;i<8;i++)
   {

           output=output|(bits[i]<<i); //probably faster than if(){output|=(1<<i);}
           //example: for the starting array 00000000
           //first iteration sets:           00000001 only if bits[0] is true
           //second sets:                    0000001x only if bits[1] is true
           //third sets:                     000001xx only third is true
           //fifth:                          00000xxx if fifth is false
           // x is the value before

   }
   return output;
}

您可以从单个字节加载 8位:

void loader(unsigned char var, bool * bits)
{

   for(int i=0;i<8;i++)
   {

       bits[i] = var & (1 << i);
       // for example you loaded var as "200" which is 11001000 in binary
       // 11001000 --> zeroth iteration gets false
       // first gets false
       // second false
       // third gets true 
       //...
   }

}

1<<0 is 1  -----> 00000001
1<<1 is 2  -----> 00000010
1<<2 is 4  -----> 00000100
1<<3 is 8  -----> 00001000
1<<4 is 16  ----> 00010000
1<<5 is 32  ----> 00100000
1<<6 is 64  ----> 01000000
1<<7 is 128  ---> 10000000

编辑:使用gpgpu,在cpu上花费4-5个小时的令人尴尬的并行算法可以缩短为在gpu上的0.04-0.05个小时(甚至在使用多个gpu的情况下甚至不到一分钟)。例如,上方的“ saver / loader”功能令人尴尬平行。

我看到这样的答案需要8bits> 1byte然后保存,但是由于我有限的新手C ++经验,它们听起来太复杂了。 有任何想法吗?

如果您要经常读取文件,那么这是学习按位操作的好时机。 每布尔使用一位将是大小的1/8。 这样可以节省大量内存和I / O。

因此,将其保存为每bool一位,然后将其分成大块和/或使用映射的内存(例如mmap )读取。 您可以将其放在一个可用的接口后面,因此您只需执行一次即可,并在需要读取值时抽象化序列化的格式。

如前所述,vec是bool向量的向量,我们将8 x 8子向量中的所有位打包成字节,然后将这些字节推入向量中。

 std::vector<unsigned char> buf;
 int cmp = 0;
 unsigned char output=0;
   FILE* of = fopen("out.bin")
  for_each ( auto& subvec in vec)
  {
       for_each ( auto b in subvec)
       {
            output=output | ((b ? 1 : 0) << cmp);
             cmp++;
            if(cmp==8)
             {
                 buf.push_back(output);
                 cmp = 0;
                 output = 0;
              }
          }
            fwrite(&buf[0], 1, buf.size(), of);
            buf.clear();
       }

         fclose(of);

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM