Hadoop」カテゴリーアーカイブ

Cloudera Impala (Beta) File format & Compression codec

前回に続いて、Cloudera Impalaに触れていきます。 今回は軽く、Impalaが対応するデータの保存形式と圧縮形式についてまとめておきます。 ある程度は検証手順も記載しますが、基本は最後のまとめだけ見てもらえれ … 続きを読む

How to install Cloudera Impala (Beta) on Debian

Hiveより数倍、数十倍速いとの触れ込みに触発され、Cloudera Impalaに挑戦してみました。『Debianには入らないよ』と明記されているだけあって、一度は挫折記事を書き始めたりしつつ、忍耐と閃きで乗り切ったイ … 続きを読む

CDH4 HDFSシンボリックリンクの現状

事の発端は、CDH4.1のリリースがされたのでテスト環境のCDH4.0をアップグレードしてみよう、というものでした。 過去記事:How to upgrade from CDH4.0 to CDH4.1 for Debia … 続きを読む

How to upgrade from CDH4.0 to CDH4.1 for Debian

CDH4.1のリリースがされたのでCDH4.0をアップグレードしてみました。 次の記事に書きますが、アップグレードとは別のところが原因で手間取ってしまったものの、CDH4.1へのアップグレードそのものは何も問題なくできた … 続きを読む

CDH4 Hive 0.8.1 でCLOSE_WAITが溜まる問題

CDH4もだいぶ安定稼働して死火山だわ~ って思ってたら、地味にマグマを蓄えていました。 解決してませんけど、斬新なCDH4ユーザのために記録しておきます。