簡體 English 中英

如何控制每個區域服務器用於讀取 HBase 表的映射器數量

[英]how to control the number of mappers per region server for reading a HBase table

原文 2016-09-22 17:57:28 1 1 java/ hadoop/ apache-spark/ mapreduce/ hbase

我有一個 HBase 表（通過 Apache Phoenix 編寫），需要讀取和寫入純文本文件。 當前的瓶頸是因為我們有 32 個鹽桶用於該 HBase(Phoenix) 表，它只打開 32 個映射器來讀取。 當數據增長超過 1000 億時，它變得非常耗時。 有人可以指出我如何控制每個區域服務器用於讀取 HBase 表的映射器數量嗎？ 我也看過在下面的 URL 中解釋的程序，“ https://gist.github.com/bbeaudreault/9788499 ”，但我沒有完整解釋的驅動程序。 有人可以幫忙嗎？

1 個解決方案

在我看來，表的區域數 = framework 打開的映射器數。

所以減少區域的數量，這反過來又會減少映射器的數量。

如何才能做到這一點：

1) 在為 ex 0-9 創建時預先拆分 hbase 表。

2) 通過生成 0-9.* 之間的行前綴來加載這些區域中的所有數據

以下是進行拆分的各種方法：

另外，看看 apache-hbase-region-splitting-and-merging

此外，設置映射器的數量並不能保證它會打開那么多，它是由輸入拆分驅動的

您可以使用setNumMapTasks或conf.set('mapred.map.tasks','numberofmappersyouwanttoset')更改映射器的數量（但這是對配置的建議）。

關於您提供的鏈接，我不知道它是如何工作的，您可以與作者聯系。

如何在HBase中控制並發映射器

[英]how to control concurrent mappers in HBase

Hbase 表不一致[Region 未部署在任何區域服務器上]

[英]Inconsistency in Hbase table[Region not deployed on any region server]

每個HBase表的Reducer

[英]a Reducer per HBase table

每行具有大量版本的HBase表的性能成本？

[英]Performance cost of HBase table with a high number of versions per row?

當使用HBase作為MapReduce的源時，我可以擴展TableInputFormatBase來為每個區域創建多個拆分和多個映射器嗎？

[英]When using HBase as a source for MapReduce, can I extend TableInputFormatBase to create multiple splits and multiple mappers for each region?

HBase：/ hbase / meta-region-server節點不存在

[英]HBase: /hbase/meta-region-server node does not exist

HBase Java客戶端無法訪問遠程HBase區域服務器

[英]HBase Java client can't reach to remote HBase region server

HBase區域服務器無法與主服務器連接

[英]HBase region server cannot connect with master

組合器在HBase掃描mapreduce中為每個區域創建mapoutput文件

[英]Combiner creating mapoutput file per region in HBase scan mapreduce

使用Hadoop，如何更改給定作業的映射器數量？

[英]With Hadoop, how to change the number of mappers for a given job?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 如何在HBase中控制並發映射器 Hbase 表不一致[Region 未部署在任何區域服務器上] 每個HBase表的Reducer 每行具有大量版本的HBase表的性能成本？當使用HBase作為MapReduce的源時，我可以擴展TableInputFormatBase來為每個區域創建多個拆分和多個映射器嗎？ HBase：/ hbase / meta-region-server節點不存在 HBase Java客戶端無法訪問遠程HBase區域服務器 HBase區域服務器無法與主服務器連接組合器在HBase掃描mapreduce中為每個區域創建mapoutput文件使用Hadoop，如何更改給定作業的映射器數量？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM