カテゴリー別アーカイブ: BigData

Hadoop SecondaryNameNodeのメモリ不足エラー

検索 少々可愛がり方が足りなかったのか、SecondaryNameNodeでメモリ不足が発生して、機能が停止してしまいました。 その際の調査や修復の記録になります。

Cloudera Impala (Beta) File format & Compression codec

検索 前回に続いて、Cloudera Impalaに触れていきます。 今回は軽く、Impalaが対応するデータの保存形式と圧縮形式についてまとめておきます。 ある程度は検証手順も記載しますが、基本は最後のまとめだけ見ても … 続きを読む

How to install Cloudera Impala (Beta) on Debian

検索 Hiveより数倍、数十倍速いとの触れ込みに触発され、Cloudera Impalaに挑戦してみました。『Debianには入らないよ』と明記されているだけあって、一度は挫折記事を書き始めたりしつつ、忍耐と閃きで乗り切 … 続きを読む

CDH4 HDFSシンボリックリンクの現状

検索 事の発端は、CDH4.1のリリースがされたのでテスト環境のCDH4.0をアップグレードしてみよう、というものでした。 過去記事:How to upgrade from CDH4.0 to CDH4.1 for De … 続きを読む

How to upgrade from CDH4.0 to CDH4.1 for Debian

検索 CDH4.1のリリースがされたのでCDH4.0をアップグレードしてみました。 次の記事に書きますが、アップグレードとは別のところが原因で手間取ってしまったものの、CDH4.1へのアップグレードそのものは何も問題なく … 続きを読む