[B! hadoop] chigurihaguriのブックマーク

More Web Proxy on the site http://driver.im/

chigurihaguri id:chigurihaguri

hadoopに関するchigurihaguriのブックマーク (7)

Hadoopのマージソートについて | 角部屋
Hadoopのソースコードを読んでいて気になったことについて書いてみる一般に,Hadoopの処理はMap処理,シャッフル,Reduce処理の3つに分類されるこのうち，Map処理とReduce処理はユーザプログラムによって制御できるもののシャッフルについてはHadoopが独自に処理するためユーザはその内容を知ることができないこのシャッフル処理はMapタスクの結果をReduceタスクに集めるものだ確かにユーザがいちいちこのMapタスクのこのパーミッションの中間データ（Mapタスクの出力結果）をこのReduceタスクに集める、といったことをわざわざ実装する必要がないことは魅力的だしかしこのシャッフル処理がくせ者であるシャッフルには中間データをReduceタスクへ転送することに加えマージ・ソートの処理が含まれている（"・"で区切っているのは一般的なソートアルゴリズムであるマージソートと
chigurihaguri 2015/03/05
hadoop

ソート

sort

詳細

アーキテクチャ
リンク
Hadoop輪読会第6章
Apr 14, 2010Download as PPT, PDF8 likes2,063 views
chigurihaguri 2015/03/05
hadoop

shuffle

ノード間

通信
リンク
Hadoop徹底入門を読んだ - boscoworks.log
初心者なんで、とりあえずパフォーマンスチューニングとかはなしで、概論的なとこだけ。入門書としてはこれが一番と勧められたので読んだのだけど、とっかかりとしてはなかなか分かりやすかったと思う。まぁ実際に手を動かさないと何とも分かんないところあるけどね・・・。第1章 Hadoop ってなんだろう? Hadoop とは大規模なデータを処理するための並列分散処理基盤テラバイト・ペタバイトクラスのデータに対して、同じ処理を複数のサーバで同時に処理できる Hadoop の概要ログ解析、レコメンデーションエンジン、検索エンジンなどで用いられるケースが多い大規模データ対象のバッチ処理向き Hadoop が提供する機能概要ハードディスク・ハードウェアを複数並べて同時に利用できる仕組み分散処理で共通して使う機能 Hadoop の適用領域 RD
chigurihaguri 2015/02/24
hadoop

まとめ
リンク
あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R
あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid
chigurihaguri 2010/10/22
hadoop

apache

オープンソース

お役立ち

プログラミング

OSS

まとめ
リンク
Big Data in Real-Time at Twitter
Apr 18, 2010Download as KEY, PDF841 likes139,790 views The document summarizes how Twitter handles and analyzes large amounts of real-time data, including tweets, timelines, social graphs, and search indices. It describes Twitter's original implementations using relational databases and the probl ems they encountered due to scale. It then discusses their current solutions, which involve partitionin
chigurihaguri 2010/04/20
twitter

memcached

database

あとで読む

hadoop

QCon

slideshare
リンク
あしたのオープンソース研究所 - CouchDB Eucalyptus Hadoop Factor Endian-Firewall GStreamer ]project-open[ SeleniumHQ jQuery Cassandra ZooKeeper HBase Scala Lift Moses Neo4j Gephi Mahout MyFaces S4 James Ruby on Rails OpenLayers MongoDB Mapnik Flume UIMA Solr Friendica R
あしたのオープンソース研究所では、これから注目されるであろう海外のオープンソースソフトウェアを発見し、サイトを日本語訳することで、みなさまにいち早くご紹介いたします。 2012/08/06 reactive-web の翻訳コンテンツをアップしました。 2012/07/24 「あしたの研について」と「運営会社」のページを更新しました。 2012/07/05 Red5 の翻訳コンテンツ (第2弾) をアップしました。 2012/06/06 Red5 の翻訳コンテンツをアップしました。 2012/06/04 Red5 の座談会資料を SlideShare に掲載しました。 2012/05/07 Friendica の翻訳コンテンツをアップしました。 2012/04/04 Apache UIMA の翻訳コンテンツをアップしました。 2012/03/07 Friendica の座談会資料を Slid
chigurihaguri 2010/03/22
apache

hadoop

opensource

OSS
リンク
Hadoop関連技術メモ | tonbyブログ
Hadoopユーザー会 http://hugjp.org/ Liberty On Hbase 20091113 Hadoop/HBase 開発：Liberty インデクサプロジェクトの例Hadoopユーザー会 http://hugjp.org/ Liberty On Hbase 20091113 Hadoop/HBase 開発：Liberty インデクサプロジェクトの例 http://www.slideshare.net/ykomiyam/liberty-on-hbase-20091113 Hadoop、hBaseで構築する大規模分散データ処理システム http://codezine.jp/article/detail/2448 Hadoopのインストールとサンプルプログラムの実行 http://codezine.jp/article/detail/2485 複数マシンへHa
chigurihaguri 2010/03/19
hadoop

開発

入門

RDB

xml

SQL
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx