繁体 English 中英

如何处理大型数据列表

[英]how to handle large lists of data

原文 2009-11-04 00:39:45 1 5 java/ algorithm/ collections/ list/ large-data-volumes

我们有一个应用程序，其中，说的一部分，它需要超过内存限制的数据量巨大阅读时间的20％。 虽然我们可以增加内存限制，但我们不愿意这样做，因为它需要在大多数情况下都没有必要时进行高分配。

当我们达到这样的峰值负载时，我们正在考虑使用自定义的java.util.List实现来假脱机到磁盘，但在较轻的情况下将保留在内存中。

数据一次加载到集合中，随后迭代并处理，然后丢弃。 它不需要在集合中进行排序。

有没有人对这种方法有利弊？

是否有一个开源产品提供这样的List impl？

谢谢！

更新：

不是厚颜无耻，而是“巨大”，我的意思是超出我们愿意分配的内存量，而不会干扰同一硬件上的其他进程。 你需要什么其他细节？
该应用程序本质上是一个批处理器，它从多个数据库表中加载数据并在其上执行广泛的业务逻辑。 列表中的所有数据都是必需的，因为聚合操作是完成逻辑的一部分。
我刚刚看到这篇文章提供了一个非常好的选择： STXXL相当于Java

5 个解决方案

你真的需要使用List吗？ 编写Iterator的实现（可能有助于扩展AbstractIterator ），而不是逐步执行数据。 然后，您可以使用该迭代器来使用这些有用的实用程序。 这些都不会导致大量数据急切地加载到内存中 - 相反，只有在迭代器处于高级状态时才会从源中读取记录。

如果您正在处理大量数据，则可能需要考虑使用数据库。

将其备份到数据库并对项目进行延迟加载。

ORM框架可能是有序的。 这取决于您的使用情况。 这可能是相当直接的，或者是你最糟糕的噩梦很难从你所描述的内容中分辨出来。

我很乐观，我认为使用ORM框架（如Hibernate）可以在大约3-5天内解决您的问题

在将数据读入集合时是否正在进行排序/处理？ 从哪里读取？

如果它已经从磁盘读取，是否可以直接从磁盘批量处理它，而不是完全将其读入列表然后迭代？ 数据如何相互依赖？

我还想问为什么你需要加载内存中的所有数据来处理它。 通常，您应该能够在加载时进行处理，然后使用结果。 这将使实际数据保持在内存中。

如何处理大量数据？

[英]How to handle large amounts of data?

如何用Java处理大数据？

[英]How to Handle Large Data in Java?

如何在HttpServlet中处理大数据处理？

[英]How to handle large data processing in HttpServlet?

如何处理大量浮点数据？

[英]how to handle large amount of float data?

android中如何处理加载大量数据

[英]How to handle loading large amounts of data in android

如何处理大数？

[英]How to handle large numbers?

处理Java中的大数据结构

[英]Handle large data structure in Java

如何在Java中处理Prolog列表

[英]How to handle prolog lists in java

如何处理不同类型的列表

[英]How to handle Lists with different types

比较大型列表并提取丢失的数据

[英]Compare large lists and extract missing data

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 如何处理大量数据？如何用Java处理大数据？如何在HttpServlet中处理大数据处理？如何处理大量浮点数据？ android中如何处理加载大量数据如何处理大数？处理Java中的大数据结构如何在Java中处理Prolog列表如何处理不同类型的列表比较大型列表并提取丢失的数据

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM