繁体   English   中英

marklogic数据从一个目录林复制到多个目录林

[英]marklogic data copy from one forest to multiple forest

我需要将Marklogic数据库内容(5000万个xml文档)从一台数据库主机复制到另一台数据库主机。 我们可以通过执行备份/还原来做到这一点。 但是我需要将两个森林(每个2500万)中的可用数据复制到20个森林(每个250万)中,并平均分配它们。 可以使用xqsync或任何其他实用程序完成此操作吗?

我本周正在进行相同的迁移。 从单个主机上的两个林到群集和六个林的14M文档。 我们已经完成了几次迁移迁移的试运行,并使用备份/还原,然后重命名目录林,然后将新目录林添加到集群中。 然后,我们使用CORB进行重新平衡。 进行一些微调以优化线程数,我们不得不调整linux TCP超时,以确保CORB进程在重新平衡过程中不会失败。 我认为我们最终基于当前正在运行的ML的较旧版本使用了CORB。

如果您很幸运能够在ML7下运行,那么这一切将变得更加容易,同时森林存储需求也大大减少。

如wst所示,默认情况下,对于新数据库,Marklogic 7将自动为您执行此操作。 对于从早期版本升级的数据库,需要从管理界面手动启用重新平衡。 您可以在底部附近的“数据库配置”选项卡上找到该设置。

之后,您只需根据需要向数据库中添加新的林,并且在整个集群中稍有延迟(基于诸如reindexer之类的限制级别)之后,就会自动触发重新分配。 您可以在管理界面的“数据库状态”页面中进行重新平衡。 尽管可能要花一点时间,但它的设计目的是在后台以低干扰运行。

反之亦然。 转到“数据库”下的“森林”页面,然后选择要删除的森林旁边的“已退休”。 这将自动触发重新平衡远离该森林的文档。 完成后,您只需将其与数据库分离。

尽管响应时间可能相对较慢,因为在此期间也需要刷新缓存,但是所有数据在此期间都是完全可搜索和可访问的。

HTH

使用ML6或更早版本时,我将使用后退和还原来移动森林,然后使用https://github.com/mblakele/task-rebalancer进行重新平衡。 之后,您可能需要强制合并以摆脱原始林中已删除的片段。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM