カテゴリー別アーカイブ: BigData

Fluentd+WebHDFSのAPPENDエラーをlog4jで除外

検索 前回に続いてFluendからWebHDFSに書き込んだ時の話ですが、今回はどちらかというと log4j の話になります。 log4j についてずっとド素人なままHadoopを使ってきたのですが、さすがに放っておけな … 続きを読む

Fluentd+WebHDFSの書き込み問題

検索 以前に晒したFluentdからWebHDFSに対してログを流し込むフローの部分を、 少しキツ目の環境にブっこんで運用したら色々問題点がでてきたので記しておきます。 どちらかというとFluentdというよりはHDFS … 続きを読む

YARN+Capacity Schedulerの管理画面

検索 まだ続いてみるYARN+Capacity Scheduler。 プロパティの説明だけではわかりづらいので、 簡単な説明をつけた管理画面のキャプチャを貼ります。

YARN+Capacity Schedulerのリソース調整

検索 前記事で説明したYARNでのメモリ設定と並列度は、Capacity Schedulerとして特に上限を定めずに、総リソースに対してフルに動作しようとする状態における説明でした。 今回は、それに対してさらにCapac … 続きを読む

YARN+Capacity Schedulerのメモリと並列処理

検索 YARN+Capacity Schedulerにおけるメモリ計算方法とMapReduceの並列処理数について、ここまで調べたことを記しておきます。 MRv1とは全く違う考え方なので、適当にせずきっちり理解しておいた … 続きを読む