草薙 昭彦 @nagix 現行HBaseの色々な課題(コンパクションやリージョン分割・マージなどを意識する必要があり運用管理が難しい、障害復旧に時間がかかる、等)は、HDFSのダメさ具合とHadoopの分散システムの中にHBaseの分散システムを構築するという複雑さが主な要因になっている 2012-12-20 14:03:51 草薙 昭彦 @nagix HDFSはWrite Onceのファイルシステム。分かりやすく例えるとCD-Rのようなもの。ファイルのわずかな部分を書き換えるために全てのデータを読み込んでメモリ上で一部分を更新し、全てのデータを書き込む必要がある。ファイルシステムといいつつプリミティブな機能しか備えていない 2012-12-20 14:18:15 草薙 昭彦 @nagix MapRが行った改良はこのHDFSをMapR-FSに置き換えて同時アクセス・ランダムR/W可能な先進