繁体 English 中英

HBase扫描操作缓存

[英]HBase scan operation caching

原文 2015-02-11 14:32:48 8 2 java/ hadoop/ hbase

HBase扫描机制中setCaching和setBatch有什么区别？ 在扫描大数据量时我必须使用什么才能获得最佳性能？

2 个解决方案

除非您拥有包含许多列（或非常大的列）的超宽表，否则您应该完全忘记setBatch（）并专注于setCaching（）：

setCaching（int caching）

设置将传递给扫描程序的缓存行数。 如果未设置，将应用配置设置HConstants.HBASE_CLIENT_SCANNER_CACHING。 较高的缓存值将使扫描程序更快，但会占用更多内存。

setBatch（int batch）

设置每次调用next（）时要返回的最大值数

setBatch是关于每次调用/迭代时应返回的行的值的数量。 这是一篇很好的帖子： http ： //blog.jdwyah.com/2013/08/hbase-scan-batch-vs-cache.html

指定在返回扫描结果之前将填充的扫描程序缓存，将setCaching设置为要在返回结果之前缓存的行数。 默认情况下，使用表上的缓存设置。 目标是平衡IO和网络负载。

public Scan setCaching（int caching）

如果表的行具有非常宽的行（具有大量列的行），要限制列数，请使用setBatch（int batch）并将其设置为要在一个批处理中返回的列数。 大量列不是推荐的设计模式。

public scan setBatch（int batch）

这是很好的链接http://www.cloudera.com/documentation/enterprise/5-5-x/topics/admin_hbase_scanning.html

HBase：如何在单个扫描操作中指定多个前缀过滤器

[英]HBase: How to specify multiple prefix filters in a single scan operation

mapreduce，hbase和扫描

[英]mapreduce, hbase and scan

Hbase扫描超时

[英]Hbase scan timeout

Hbase反向扫描

[英]Hbase reverse scan

Hbase扫描返回已删除的行

[英]Hbase scan is returning deleted rows

HBase多线程扫描真的很慢

[英]HBase Multithreaded Scan is really slow

没有其ID的HBase扫描值

[英]HBase scan values without their id

hbase如何使用包含'\\ 1'的密钥进行扫描

[英]hbase how to scan with the key contains '\1'

HBase OutOfOrderScannerNextException关于在扫描时使用过滤器

[英]HBase OutOfOrderScannerNextException on using filter on scan

如何扫描hbase中的数值范围

[英]How to scan a numeric range in hbase

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 HBase：如何在单个扫描操作中指定多个前缀过滤器 mapreduce，hbase和扫描 Hbase扫描超时 Hbase反向扫描 Hbase扫描返回已删除的行 HBase多线程扫描真的很慢没有其ID的HBase扫描值 hbase如何使用包含'\\ 1'的密钥进行扫描 HBase OutOfOrderScannerNextException关于在扫描时使用过滤器如何扫描hbase中的数值范围

相关标签

HBase扫描操作缓存

问题描述

2 个解决方案

解决方案1
3 2015-02-11 15:16:36

解决方案2
0 2016-07-21 13:29:22

HBase扫描操作缓存

问题描述

2 个解决方案

解决方案1 3 2015-02-11 15:16:36

解决方案2 0 2016-07-21 13:29:22

解决方案1
3 2015-02-11 15:16:36

解决方案2
0 2016-07-21 13:29:22