Hadoop Summit 2010 - application track Data Applications and Infrastructure at LinkedIn Jay Kreps, LinkedInRead less
3. Today’s speaker - Jeff Hammerbacher • hammer@cloudera.com • Studied Mathematics at Harvard • Worked as a Quant on Wall Street • Conceived, built, and led Data team at Facebook • Nearly 30 amazing engineers and data scientists • Several open source projects and research papers • Founder of Cloudera • Chief Scientist • Also, check out the book “Beautiful Data” Copyright 2010 Cloudera Inc. All rig
大規模分散処理のフレームワークとしてグーグルが開発したMapReduce処理や、そのオープンソース実装であるHadoopが急成長し、ビジネスの分野での商業利用が立ち上がり始めていることは、Publickeyでも何度か記事で紹介してきました。 Hadoopを表計算のように使える「InfoSphere BigInsights」、IBMが発表 グーグルによるMapReduceサービス「BigQuery」が登場。SQLライクな命令で大規模データ操作 Hadoopは企業のための新たな情報分析プラットフォームとなる、とCloudera グーグルがBigQueryの開始を発表し、IBMも大規模処理のエンジンとしてHadoopを採用、AmazonクラウドでもHadoop処理を行う「Amazon Elastic MapReduce」サービスを提供していることから分かるように、Hadoopはクラウドでの大規模
大谷さん:HadoopとNoSQLとRDBMS Hadoopの現状:もうすぐ普及期 NoSQLの現状:まだ枯れてない RDBMSの現状:市場がシュリンクしてきた Hadoopの特性:巨大データのバッチ処理に強い NoSQLの特性(Cassandraより):スケーラビリティ NoSQLとCAP:Cassandraは多様性、HBaseは一貫性重視 RDBMSの特性:優れたデータ一貫性(ACID)とクエリー言語をもつ CQRSパターン:更新系と参照系は明確に分けましょう 一貫性保護をアプリ開発者に任せるのは不可能:コンシステンシーレベルをアプリからもらうのは必須 アーキテクチャ図:HadoopでViewの構築を行う ポイント:一貫性はRDBMS、速度重視はNoSQLに。力技はHadoopで。 課題1:RDBMSからHadoop:ネイティブに持ってくる HadoopからNoSQQL:HDFSからダ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く