簡體 English 中英

如何從卡桑德拉的巨大表中讀取所有行？

[英]how to read all row from very huge table in cassandra?

原文 2016-02-10 09:43:41 9 1 java/ cassandra-2.0/ datastax-java-driver

我有一個Cassandra群集，在同一數據中心中有兩個節點，replicate_factor = 2。 我需要每天讀取一次表並更新Cassandra中的相應行，這在約1.5億個表中並不斷增加。

有沒有更好的方法可以做到這一點？
有什么方法可以將並行塊中的所有行和每個塊過程中的某個線程划分嗎？
Cassandra版本：2.2.1
Java版本：openjdk 1.7

1 個解決方案

您應該看看Spark。 使用Spark Cassandra Connector可以從多個Spark節點讀取Cassandra的數據，這些數據可以另外部署在Cassandra節點上或單獨的集群中。 通過運行Spark作業，可以並行讀取，處理和寫回數據，該作業也可以安排為每天執行。

隨着數據大小的不斷增長，研究Spark Streaming可能也很有意義，它使您可以僅基於傳入的新數據來不斷處理和更新數據。這將防止一遍又一遍地重新處理相同的數據，但這當然取決於您的用例。

如何從巨大的表中讀取所有行？

[英]How to read all rows from huge table?

用Spring從Cassandra表中獲取行

[英]Fetching row from Cassandra table with Spring

如何使用java非常快速地將記錄插入到cassandra表中

[英]how to use java to very quickly insert records into cassandra table

如何從Spark cassandra連接器讀取指標（寫入表作者的時間）

[英]How to Read metrics from Spark cassandra connector(Table Writer's time taken to write)

如何從Cassandra增加Dataflow讀取並行性

[英]How to increase Dataflow read parallelism from Cassandra

如何使用Apache Flink從Cassandra讀取？

[英]How to read from Cassandra using Apache Flink?

從大表中檢索所有記錄時如何避免OOM（Out of memory）錯誤？

[英]How to avoid OOM (Out of memory) error when retrieving all records from huge table?

Cassandra：獲取Cassandra中索引表的讀取計數嗎？

[英]Cassandra : Getting read count for Index table in cassandra?

如何在沒有停機的情況下在Cassandra進行大量更新？

[英]How to do huge updates in Cassandra without downtime?

Cassandra：如何從群集中獲取所有主機？

[英]Cassandra: how to get all hosts from cluster?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何從巨大的表中讀取所有行？用Spring從Cassandra表中獲取行如何使用java非常快速地將記錄插入到cassandra表中如何從Spark cassandra連接器讀取指標（寫入表作者的時間）如何從Cassandra增加Dataflow讀取並行性如何使用Apache Flink從Cassandra讀取？從大表中檢索所有記錄時如何避免OOM（Out of memory）錯誤？ Cassandra：獲取Cassandra中索引表的讀取計數嗎？如何在沒有停機的情況下在Cassandra進行大量更新？ Cassandra：如何從群集中獲取所有主機？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM