Cloudera Desktop をUbuntu 8.0.4(hardy) 32bit に入れてみたよ。
噂のCloudera Desktop を、インストールしてみた。
インストールマニュアル通りにやれば、まぁ、大体出来る感じ。
/etc/apt/sources.lst.d/cloudera.listを新規作成
deb http://archive.cloudera.com/debian hardy-testing contrib deb-src http://archive.cloudera.com/debian hardy-testing contrib
hardy-testingって所は、自分の環境に合ってる奴を大体選ぶ感じで。
この辺見たり、 lsb_release -c ってすれば、何を書けば良いか何となく分る筈。
updateする前に、なんちゃらキーを入れないと、aptに怒られるので、
clouderaさん所からキーをダウンロードして、ローカルにインストール。
wget http://archive.cloudera.com/debian/archive.key sudo apt-key add ./archive.key sudo aptitude update
これで、Hadoopが何か色々入りそうな雰囲気になる。
aptitude search hadoop
とかすると、ニヤニヤ出来るんだぜ?
で、本題。
sudo aptitude install hadoop-0.20 sudo aptitude install hadoop-0.20-conf-pseudo-desktop
後で、遊ぶので、pigとhiveも入れておく。
sudo aptitude install hadoop-pig sudo aptitude install hadoop-hive
次に、クラスタを起動しる。
sudo /etc/init.d/hadoop-0.20-namenode start sudo /etc/init.d/hadoop-0.20-datanode start sudo /etc/init.d/hadoop-0.20-secondarynamenode start sudo /etc/init.d/hadoop-0.20-jobtracker start sudo /etc/init.d/hadoop-0.20-tasktracker start
ジョブトラッカーがちゃんと動いているか、ブラウザで確認しる。
ネームノードも動いてるか、ブラウザで確認しる。
ついでに、円周率等を計算するジョブをボロっと投げてみる。
hadoop-0.20 jar /usr/lib/hadoop-0.20/hadoop*examples*jar pi 2 10000
最後に、Cloudera Desktop を起動しる。
sudo /etc/init.d/cloudera-desktop start
Cloudera Desktop にブラウザでアクセスしる。