[英]Should I start Hadoop cluster before launching Pig in MapReduce mode?
[英]For a single CDH (Hadoop) cluster installation, which host should I use?
我從一台Windows 7計算機開始,並設置了一個which I run using VirtualBox
的Ubuntu Linux虛擬機。 The Cloudera Manager Free Edition version 4
已經執行,我一直在關注localhost:7180
上的提示。
當提示要求我“為CDH群集安裝指定主機”時,我現在卡住了。 我可以單獨在linux虛擬機中安裝所有Hadoop組件並運行它們嗎?
請幫助指出我應該指定哪個主機的正確方向。
您可以指定機器的主機名。 它只會在您的機器上安裝所有內容。
是的,你可以單獨在linux虛擬機中運行cdh。 您可以使用“獨立”或“偽分布”模式執行此操作。 恕我直言,最有效的方法是使用“偽分布式”模式。
在這種情況下,有多個java虛擬機(JVM)在運行,因此它們模擬為具有多個節點的集群(每個線程被模擬為集群節點)。
Cloudera已經記錄了如何部署為“偽分布式”:
https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_qs_cdh5_pseudo.html
注意:部署cdh的3種方式:
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.