如何最小化将数据从(大)分区表复制到另一个分区表的 RAM 要求?

对于 table1 和 table2 这两个大表,table1 中有数千个分区和 1.5 亿行,mysql/mariadb 执行此查询效率低下。

insert into table2 select * from table1

事实上,在两个表上都使用了 8192 个分区,在查询结束之前 RAM 已经耗尽。 当它分配了 6.1 GB 的 RAM 时,我不得不终止它,因为这个特定的盒子只有 8 GB 的 RAM。 如何以较低的 RAM 占用空间执行此任务?

通过强制 mysql/mariadb 一次处理来自一个分区的数据,可以在任何时候使用少于 500 MB 的 RAM 完成任务。


insert into table2 select * from table1 partition (p<X>)

其中 X 应该是与分区相对应的完整整数集,在我的例子中是从 0 到 8191。这可以通过存储过程来实现,如下所示:

drop procedure if exists my_partitioning_data_copy_procedure;

delimiter #
create procedure my_partitioning_data_copy_procedure()

declare v_max int unsigned default 8191;
declare v_counter int unsigned default 0;

  start transaction;
  while v_counter < v_max do
    SET @expression = concat("insert into table2 select * from table1 partition (p", v_counter, ");");
    prepare myquery from @expression;
    execute myquery;
    set v_counter=v_counter+1;
  end while;
end #

delimiter ;

call my_partitioning_data_copy_procedure();


