Apache Spark™ is a multi-language engine for executing data engineering, data science, and machine learning on single-node machines or clusters.
先日MapR勉強会に参加した、というか主催者だったので、一応まとめ。 細かい内容とかは以下にまとめてくださった方々がいらっしゃるので感謝でございます。 @znj6さん MapR(GreenPlumHD)の中身説明会参加 http://zenjiro.wordpress.com/2012/01/19/inside-mapr-briefing/ @johtaniさん 2012.01.20 Friday MapR中身説明会に参加しました。 http://johtani.jugem.jp/?eid=57 t_otodaさん [Hadoop][MapR]MapR(GreenPlumHD)の中身説明会に参加してきました。 http://tech.hatenablog.com/entry/2012/01/19/234644 moguzoさん 「MapR(GreenPlumHD)の中身説明会」に参加してき
さて今回から新しいテーマです。 分散計算フレームワークであるHadoopを導入から実践までを連載します。よろしくお願いします。 Googleの技術から生まれたHadoop わたしたちは日常、ごく当たり前にGoogleのサービスを使っています。 あそこの店の情報を知りたい、有名人xxさんってどんな人?、あの大事件を振り返って調べたい、などなど。生活に密着した情報だったり、過去を振り返って社会現象を調べたり、あるいは芸能人のゴシップネタを検索したりと、知りたいことは人それぞれで目的も全く違いますが、Googleの検索を利用すれば一発で目的の情報(あるいは近い情報)にたどり着くことができます。 世界中の何億というWebページについて文言によってインデックス化してなければとうていできない芸当です。そしてウェブページは新たに作られ、または消えてしまうものでもあります。ものすごく膨大なテキストデータの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く