Hadoop SecondaryNameNodeのメモリ不足エラー

少々可愛がり方が足りなかったのか、SecondaryNameNodeでメモリ不足が発生して、機能が停止してしまいました。

その際の調査や修復の記録になります。

続きを読む

Cloudera Impala (Beta) File format & Compression codec

前回に続いて、Cloudera Impalaに触れていきます。
今回は軽く、Impalaが対応するデータの保存形式と圧縮形式についてまとめておきます。

ある程度は検証手順も記載しますが、基本は最後のまとめだけ見てもらえればOKです。

続きを読む

How to install Cloudera Impala (Beta) on Debian

Hiveより数倍、数十倍速いとの触れ込みに触発され、Cloudera Impalaに挑戦してみました。『Debianには入らないよ』と明記されているだけあって、一度は挫折記事を書き始めたりしつつ、忍耐と閃きで乗り切ったインストール記録になります。

とても良いネタなのでCDH3ユーザは早くコッチにおいでと手招きしておきたいと思います。

続きを読む

原因調査用Linuxコマンド

サーバの動作に異常が発生した際に原因を探るためのLinuxコマンドで、自分用のメモです。
全てmanとかググったら出てくるので説明は適当です。思いついたら後で追記していくかもです。

対象はDebian Squeezeになります。
全てパッケージインストールできるもので、パッケージ名は [in packagename] としてあります。

続きを読む

Percona XtraBackupの機能紹介 (2) テーブル単位で抽出

XtraBackupシリーズで今回はテーブル単位のデータ抽出&リストアです。

通常は全データベースを対象としますが、テスト用とかで部分的に本番データが欲しい時などに利用できます。用意されている2種類の方法を紹介します。

続きを読む