[B! R_Language] gologo13のブックマーク

線形単回帰をmap reduce風に分散処理して計算する - データサイエンティスト上がりのDX参謀・起業家

巷では何かと分散処理が流行っています。特にHadoop＋Mahoutで大規模データに対して機械学習や統計モデルを高速分散処理することで、データマイニングがより盛んになるのではないかと期待がされています。分散処理するためには、最後に足し合わせることができればいいわけで、考えてみるとそんなに難しいことじゃないんですよね。試しにRを使って、線形単回帰を分散処理っぽく計算します。大規模データで試しているじゃないですし、パフォーマンスを比較しているわけではありませんのであしからず、、結局、分散処理はデータを分割それぞれのデータでパラメータ計算計算結果を足すの3つをやっているだけだと、私は理解しています。ですので、その3つの手順をRで100サンプル発生させて書いてみます。まずは全体データで回帰係数を計算。 set.seed(1) x <- rnorm(100) set.seed(

gologo13 2011/07/12

リンク

R で識別器を作ってみるのに必要な散布図の書き方・正規化の方法(iris データセットを例に) - 木曜不足

PRML ４章とかを読んで、ちょっと試しに識別器を実装してみたい！　というとき、初心者的にはデータセットをどこから持ってくるか、そのデータセットをどう使うか、実行結果をどうやってグラフなどに出力するか、といったあたりが悩み。 R はそのへんとてもよくできていて、すごくラクチン。まず結構な数の著名なデータセットがあらかじめ入っている。その一つである iris dataset を例に「識別器を試作するための準備」について説明していこう。 iris dataset は、３品種(setosa, versicolor, verginica)のユリの花それぞれ50本について、花の萼(がく)の長さと幅、花弁の長さと幅を測ったもの。 iris はデータがきれいに分かれているので、どんな識別器に食わせてもそこそこ良い結果が出る。初心者が達成感を得るのに最適(笑)。 R での iris データセットの利用は

gologo13 2011/06/10

R_Language

リンク

Tsukuba.R#7 Vol.10, Tsukuba.R#7 Vol.10 gihyojp on USTREAM. Conference

Not rated yet. You must be logged in to rate this video.

gologo13 2011/06/02

R_Language

リンク

R で高速な (ユークリッド) 距離行列計算 | Atsushi TATSUMA Web Page

はじめに皆さんは R 好きですか？好きですよね。勉強会もたくさんありますもんね。僕は嫌いです。遅いので。でも、書き方の工夫でなんとかなることもあります。僕が研究室でやってることは、表向き検索ということになってるのですが、やってることは、次元削減とかクラスタリングとか、そのあたりです。データがなす空間を、解析するという点では、検索も機械学習も一緒ですね。この、データが空間上でどういった感じになってるのか、の手がかりとなるモノに、全データ点同士の距離があります。これを行列で表したものが、距離行列です。距離には、だいたい、まずは、ユークリッド距離を試します。 R で距離行列を求める場合 dist 関数を使いますが、ユークリッド距離だけに絞れば、自作した関数の方が速くなります。 2点間のユークリッド距離いま、二次元のデータが、二点あるとします。ちなみに、データ点

gologo13 2011/05/29

R_Language

リンク

R packages for machine learning and statistical learning - 手習い録

R package ElemStatLearn では, 統計学習の教科書 Elements of Statistical Learning に対する R package を紹介しましたが, これを紹介しているページ CRAN Task View: Machine Learning & Statistical Learning にある, 機械学習, 統計学習のための他の R パッケージを以下のような項目にしました. 人工神経回路網 (neural networks) nnet: 単一隠れ層の人工神経回路網決定木, 回帰木 rpart: CART のような木構造を作るのにお勧め. (base R に付属) mvpart: rpart を多変量の出力に対応した版. tree Weka + RWeka インターフェイス. Weka には, C4.5 の Java による実装 J4.8 などがあ

gologo13 2011/04/06

R_Language

リンク

EmacsでのR開発環境をRstudio、Eclipseライクにするe2wm-R.el - sheephead

EmacsでのR開発環境をRstudio、Eclipseライクにするe2wm-R.el 2011.03.15 Emacs e2wm, Emacs このところ、R界隈では新しく公開されたRstudioというIDEの話が飛びかっておりました。 RStudio これが、かなり完成度が高いです。補完機能はもちろんのこと、パッケージマネージャ、オブジェクトマネージャーなど洒落た機能まで持っています。しかもサーバ版まで。githubのコミットログを見てみると12月頃から開発が始められているようなので、3ヶ月ほどで完成したことになります。いやーすごいです。 Rstudioに始まったことではなく、R関連のエディタ、IDEはすでに成熟した分野となりつつあります。gedit、notepad+などの主要なエディタにはすでにR用の拡張がありますし、当然あのEclipseにもR用の拡張があります。 R を Ecli

gologo13 2011/03/18

リンク

はてなブログ | 無料ブログを作成しよう

はじめての海外旅行！3週間行って帰ってきた全体の感想編！はじめに 5/19-6/6 の約3週間でポーランド・イギリス・ドイツを訪れる海外旅行に行きました。このブログは、この期間を通して何を感じたとかそういいう内容のブログです。それぞれの地域で何をしたかとかのブログは半分くらい書けていないんですが、写真を見返しなが…

gologo13 2011/02/13

リンク

Osaka.R #4で「TwitterのデータをRであれこれ」を発表してきました - あらびき日記

この記事は abicky.net の Osaka.R #4で「TwitterのデータをRであれこれ」を発表してきましたに移行しました

gologo13 2010/12/05

R_Language

リンク

Rの文字出力に便利な関数を作ってみた - あらびき日記

この記事は abicky.net の Rの文字出力に便利な関数を作ってみたに移行しました

gologo13 2010/12/05

R_Language

リンク

Tsukuba.R#8が開催されました - yasuhisa's blog

Tsukuba.R#8 - Tsukuba.R - Seesaa Wiki（ウィキ）今回はつくばの回(奇数回が東京、偶数回がつくば)だったのですが、筑波大ではなく産総研にてやらせてもらったそうです。@toddler2009さん、ありがとうございました。発表者のスライドでWebに上がっているものは以下の通り(抜けがあったら教えてください)。 Tsukuba.R#8で発表しました - ぬいぐるみライフ(仮) Tsukuba.R #8 - Mad Dryfarm Wolves TsukubaR#8主催 & 「俺のUseR!解説が45分でわかるわけがない」を発表してきた - 糞ネット弁慶その頃id:syou6162は何をやっていたかと言えば京都でハチロクの集まりがあっていたので参加しにいっていました。LT的な発表が何件かあって、id:satzzさんが「ハチロク世代とは何だったのか」という発表

gologo13 2010/09/20

R_Language

リンク

http://devcheatsheet.com/tag/r/

For full functionality of this site it is necessary to enable JavaScript. Here are the instructions how to enable JavaScript in your web browser.

gologo13 2010/08/28

リンク

Microsoft Office ホームページ

Your current User-Agent string appears to be from an automated process, if this is incorrect, please click this link: United States English Microsoft Homepage

gologo13 2010/08/28

商用のR言語．大規模データも扱える

R_Language

リンク

EmacsでRのコード補完を快適にしてくれるauto-complete-acr.elがオムニ補完に対応しました。 - sheephead

HOMEEmacsEmacsでRのコード補完を快適にしてくれるauto-complete-acr.elがオムニ補完に対応しました。 EmacsでRのコード補完を快適にしてくれるauto-complete-acr.elがオムニ補完に対応しました。 2010.08.27 【統計】R Emacs auto-complete, Emacs, ESS, KeySnail, Python 案の定、auto-complete.elのR用拡張でした。ざーっと見た感じ、オムニ補完ができそうだし、古いバージョンのRでも補完ができるようになっていたりと、とても高機能っぽいです。ちなみにオムニ補完とは、もともとVimの補完方法につけられている名称で(多分)、VSのインテリセンスのようなものだと思うとわかりやすいかもしれません。これを使うと例えば、JavaやPythonのメソッドをさくっと補完していくことがで

gologo13 2010/08/27

リンク

10分で分かるRパッケージの作り方

[DL輪読会]BERT: Pre-training of Deep Bidirectional Transf ormers for Language Und...

gologo13 2010/08/04

R_Language

リンク

A free book on probability and statistics with R

Revolutions Milestones in AI, Machine Learning, Data Science, and visualization with R and Python since 2008 G Jay Kerns has published a 400+ page introductory text on Probability and Statistics. All of the examples and illustrations are done using R (as Jay puts it, "The people at the party are Probability and Statistics; the handshake is R") so if you want to brush up on your probability and lea

gologo13 2010/07/31

R_Language

リンク

第1回 Rは統計解析のブッシュナイフだ - 実践！ Rで学ぶ統計解析の基礎 - ＠IT

今ほど統計解析が必要とされる時代はありません。オープンソースの統計処理言語・環境の「R」を使って実践的な統計解析のテクニックとリテラシーを習得しましょう！読者にとってRは、世に溢れるデータの密林を切り開くための“ブッシュナイフ”となることでしょう（編集部）統計解析の必要性とリテラシー 21世紀になって、経営学者の故ピーター・ドラッカー氏が言うところの知識労働者は、ますます統計解析を必要する局面が増えてきました。この状況は、20世紀後半から21世紀に起きた計算機能力の増大とインターネットの発展を基礎に、3つの大きな潮流が現れたことがキッカケとなっているように思います。その3つの潮流とは、オープンソース、オープンデータ、そしてオープンアイデアです。後ろの2つは今筆者が名付けました。オープンソースは、皆さんがご存知のように、Linux、Apache、Perl、Python、RubyなどのO

gologo13 2010/07/23

R_Language

リンク

seekR - 統計分析ソフトウェア R のための検索エンジン

統計分析ソフトウェア R のための検索エンジンです。R 言語に関する内容に特化した検索結果を表示します。

gologo13 2010/07/15

R_Language

リンク

ディリクレ分布の可視化 - nokunoの日記

PRML復習レーンで、id:a_bickyさんのディリクレ分布の可視化スクリプトをデモさせていただきました。ディリクレ分布まとめ - a_bickyの日記 IBISMLでの牧野先生の講演を参考に、単語1と単語2と単語3があって、その多項分布の事前分布をベイジアンアップデートしていって、最終的に3:2:2の比率の多項分布に収束するというデモで説明をしてみました。 library(MCMCpack) library(fields) # Dirichlet distribution over three variables dirichlet3d function(n = 25, alpha = rep(1, 3)){ gx1 gx2 seq(0, 1, len = n) # grid d outer(gx1, gx2, dirichlet3d.each, alpha) d ifelse(d !

gologo13 2010/07/04

R_Language

リンク

R言語による統計学

R言語による統計学 * はじめに * 基本的統計量 ** 分散 *** 共分散 *** 共分散行列 *** 相関係数 *** 分散共分散行列 ** 標準偏差 ** 標準誤差 * 分散分析の原理 ** 一元配置分散分析 ** 二元配置分散分析 * χ2乗検定 * 重回帰分析 ** 標準偏回帰係数 ** 3次元散布図 * 因子分析 ** 骨密度データの例 * 共分散構造分析 ** 下部消化器癌の例1 ** 下部消化器癌の例2 ** Kleinの例 ** パス図 * 多重ロジスティック解析 * クローンバッハα係数 * 入出力 ** ファイル出力 * はじめに > で始まる行はRへのコマンド入力を表します。一方、%で始まる行は、ターミナルからの入力を意味します。Rからの出力は特に区別していませんが、文脈から明らかでしょう。なお、私の実行環境は、 Debian GNU/Linux woody

gologo13 2010/05/27

リンク

「Tsukuba.R#7」活動報告 | gihyo.jp

5月9日(日)に、Rの勉強会「Tsukuba.R#7」が開催されました。 Tsukuba.Rは、奇数回を都内、偶数回をつくばで行うのが慣例となっており、第7回の今回は東京大学理学部での開催となりました。今回は初の試みとして、スピーカー12人全員が各10分のLT形式で発表するという「LT祭り」を行いました。Ustreamの録画とともに、各セッションの内容を簡単にご紹介します。 1.wakutekaさん「Beautiful woRld」最初は今回の主催者の一人であるwakutekaによるBeautiful woRldです。Rに興味を持ったばかりの方やR初心者の方に向けて、Rの簡単な説明からその利用法、そしてRに関する様々なウェブリソースの紹介やその活用法について話しました。初心者には取っ付きづらいこと、Rという単語そのものが検索しづらいこと、まだまだ利用者が多くないことなどを克服するため、

gologo13 2010/05/19

R_Language

リンク

はてなブックマーク

タグ

関連タグで絞り込む (15)

R_Languageに関するgologo13のブックマーク (45)

お知らせ

今週のはてなブックマーク数ランキング（2025年7月第2週）

今週のはてなブックマーク数ランキング（2025年7月第1週）

月間はてなブックマーク数ランキング（2025年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス