[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

cdhに関するmuddydixonのブックマーク (8)

  • CDH4で YARN から MRv1 にスイッチ - たごもりすメモ

    CDH4.2 + YARN + Hive でしばらく動かしてたんだけど、なんか一部のクエリが失敗しまくる。おかしいなーと思ったらこれにひっかかってた。 https://issues.cloudera.org/browse/DISTRO-461 なんだかなー。 いい回避策がないかあれこれやってみたんだけどどうにもうまくないので、しょうがないから MRv1 に変えよう、ということにした。 ところで YARN と MRv1 は設定をスイッチして再起動すればまあいけるんじゃね? ということは聞いてたが実際のところはどうなのよ、ということをここにまとめる次第。結論から言うとできた。 おおざっぱにまとめると以下のようにした。 現状の設定ファイルセットを丸ごとコピーして MRv1 用に一部のみ書き換え 切り替えは alternatives で読み込むパスを変更することで行う 変更するファイルは mapr

    CDH4で YARN から MRv1 にスイッチ - たごもりすメモ
  • CDH4でHiveServerを使う際の注意点 - たごもりすメモ

    CDHでHadoopを使っている良い子のみんな、hiveserverまわりで罠があるので気をつけましょう! という話。ふたつあるので順番に。 hive-server 再起動時にログがtruncateされる hiveserverがなんかおかしかったりすると、原因究明はやるとしてとりあえず再起動、という運用をしてしまう気持ちはよくわかります。が、やってしまうとその日の分のログが消える(!)ので注意が必要だ。 原因は /etc/init.d/hive-server *1の hive_start() 中の以下の部分。 log_success_msg "Starting $desc (${NAME}): " $SU -c "cd $HIVE_HOME ; $exec_env nohup \ $EXE_FILE --service $service_name $PORT \ > $LOG_FILE 2

    CDH4でHiveServerを使う際の注意点 - たごもりすメモ
    muddydixon
    muddydixon 2013/03/05
    前半のログのところ超大事
  • Cloudera | ハイブリッドデータカンパニー

    データを信頼し、AI を信頼する 信頼できるデータ、信頼できるモデル、信頼できる AI を実現するために、これほど多くのクラウドのさまざまなデータタイプを管理でき、オープンデータのイノベーションと大規模展開に対応できるプラットフォームは他にありません。

    Cloudera | ハイブリッドデータカンパニー
  • CDH4 Configurations with YARN, Capacity Scheduler and Hive | 外道父の匠

    CDH4 Configurations with YARN, Capacity Scheduler and Hive 前回の続きで、私がCDH4で利用している外道式設定ファイルの紹介です。 非常に手間暇かけて作成したものなので墓の下まで持って行きたいところですが、某所からの圧力と社会のために、恥ずかしながら放出したいと思います。 はじめに 言うまでもなく、参考・利用においては自己責任でお願いします ホスト名・ファイルパスは適当に変換してください descriptionの日語は私のメモですので怪しかったらググってください 英文のみの場合はまだ未検証だったり説明するまでもないものになっています 2ヶ月以上これで運用していますが、まだまだ変わると思うので更新日付を書いておきます ファイルはUTF-8です Hadoop設定 CDH3からCDH4への設定変更リスト core 公式 core-def

    CDH4 Configurations with YARN, Capacity Scheduler and Hive | 外道父の匠
    muddydixon
    muddydixon 2012/09/03
    すごい資料が出てきた!!!
  • How to upgrade from CDH3 to CDH4 for Debian | 外道父の匠

    イベント2つを経て、何から書くか迷うところですが、先に @tagomoris との約束を果たすためにCDH3からCDH4への具体的なアップグレード手順を紹介します。 この約束を果たすと、@ryu_kobayashi が Huahin Framework をCDH4対応してくれるというパーフェクトフローになっておりますが、JobTrackerがResourceManagerになってるので大変そうですね! はじめに 公式 CDH4 Installation Upgrading from CDH3 to CDH4 Deprecated Properties 過去記事 Upgrade CDH3 to CDH4 注意点その1 Upgrade CDH3 to CDH4 注意点その2 OSについて Debian Squeeze です。LennyにはCDH4は存在しませんし、無理矢理もほぼ不可能です。 C

    How to upgrade from CDH3 to CDH4 for Debian | 外道父の匠
  • Clouderaトレーニングコース受講者向けCDH4説明会でとったメモを公開しよう - #garagekidztweetz

    ツイートSource: cloudera.com via garage-kid on Pinterest Clouderaトレーニングコース受講者向けCDH4説明会にお呼ばれしたので、行って参りました。 今日はそのときわたしがとったメモを公開しようと思います。 〜Clouderaトレーニングコース受講者様向けCDH4説明会 概要〜 ▼ 日時:2012年7月6日(金) ▼ 会場:ベルサール八重洲 3階ルーム4 (http://www.bellesalle.co.jp/bs_yaesu/access.html) ▼ タイトル: 進化するHadoop:CDH4とCloudera Enterprise4.0のご紹介 Cloudera のトレーニングを受けた人に対するインセンティブのようなものとして開催された催しでした。 雨の中にも関わらず、50名近い参加者があったことは正直にすごいな、とわたしは思

  • CDH4+YARN+Hiveでハマってる - たごもりすメモ

    検証用として新規にセットアップしたCDH4クラスタ、YARN使用で設定してみたんだけど以下のような状態。完全分散モード。 CDH4はtarballを展開する形でインストール HADOOP_MAPRED_HOMEは hadoop/share/hadoop/mapreduce を指定 YARNで hadoop-mapreduce-example.jar は走る ResourceManagerと同ホストから以下のコマンドを実行したら成功する hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-0.23.1-cdh4.0.0b2.jar pi 4 1000 HiveでMapReduceを介さない処理は成功する 具体的にはSHOW TABLESやCREATE TABLEおよびLOADなど Hive

    CDH4+YARN+Hiveでハマってる - たごもりすメモ
  • CDH4にいったん挫折した - たごもりすメモ

    CDH3で使ってる設定ファイル群を基的にそのまま(ノードリストなどだけ書き換え)でCDH4の検証クラスタを作ろうとしてみた。 ら、以下のような事情でいろいろ面倒くさかったのでいったん挫折したのが日あったこと。 使う環境変数がいろいろ変わってる YARN_HOGE とか HDFS_HOGE みたいなのを使うようになっている 基的には HADOOP_CONF_DIR などから組み立てるようになっている ただしその処理は libexec/hadoop-config.sh で行われる $HADOOP_CONF_DIR/hadoop-config.sh を自分で用意して使っている場合は libexec/hadoop-config.sh が読まれないので新しい変数の組み立てができない このため各種の環境変数がセットされずいろいろコケる たいへん困った。設定ファイル群をイチから作り直す覚悟が必要な

    CDH4にいったん挫折した - たごもりすメモ
    muddydixon
    muddydixon 2012/05/17
    tagomorisさんの情報半端ないなぁ・・・
  • 1