こんにちは、awakiaです。今回のアドベントカレンダー、結構、機械学習ガチなメンツが揃ったみたいなので、俺も対抗してやる!!とも思ったのですが、研究を離れて2年が経とうとしているので、真っ向勝負とか今更無理なことに気づきました...w なので、開発者の皆も知っておくと便利なデータサイエンスの話をすることにします。 ABテストと検定の必要性 Webサービスを運営していると、見た目の問題だけでも結構悩みます。ボタンの色や文言などの小さなところから、トップページに盛り込む内容をどうするかまで、いろいろです。 今回、「ABテスト」と呼ぶものは、画面に占める大きさ等にかかわらず、パターンAとパターンBを作って、そのどちらがいいかを判断するための実験と定義することにします。 なお、ABテストの呼び名には結構流派があるので別の名前で聞いたことがあるかもしれません。例えば、Googleのマット・カッツ先
. ...... 統計的学習理論チュートリアル: 基礎から応用まで † 鈴木 大慈 † 東京大学 情報理工学研究科 数理情報学専攻 IBIS 2012@筑波大学東京キャンパス文京校舎 2012 年 11 月 7 日 1 / 60 構成 ...1 はじめに: 理論の役割 ...2 統計的学習理論と経験過程 ...3 一様バウンド 基本的な不等式 Rademacher 複雑さと Dudley 積分 局所 Rademacher 複雑さ ...4 最適性 許容性 minimax 最適性 ...5 ベイズの学習理論 2 / 60 構成 ...1 はじめに: 理論の役割 ...2 統計的学習理論と経験過程 ...3 一様バウンド 基本的な不等式 Rademacher 複雑さと Dudley 積分 局所 Rademacher 複雑さ ...4 最適性 許容性 minimax 最適性 ...5 ベイズの
私のブックマーク: 確率密度比に基づく機械学習 (Machine Learning based on Density Ratio) 東京工業大学 大学院情報理工学研究科 計算工学専攻 山田 誠 (Makoto Yamada) URL: http://sugiyama-www.cs.titech.ac.jp/~yamada はじめに パターン認識、ドメイン適応、外れ値検出、変化点検出、次元削減、因果推論等の様々な機械学習の問題が確率密度比(確率密度関数の比)の問題として定式化できることから、近年、確率密度比に基づいた機械学習の研究が機械学習およびデータマイニングの分野において大変注目されている。本ブックマークでは確率密度比の研究開発のための有用なリソースを紹介する。 解説記事等 密度比に基づく機械学習の新たなアプローチ 統計数理, vol.58, no.2, pp.141-15
サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。
การวิเคราะห์ตลาดเป็นกระบวนการสำคัญสำหรับธุรกิจ เริ่มตั้งแต่ทำความเข้าใจเป้าหมายลูกค้า วิเคราะห์คู่แข่ง/ข้อมูล การประเมินและตั้งคำถาม นำไปสู่การดำเนินการในท้ายที่สุด
Data Scientist: a unicorn? Finding a good engineer is hard. Finding a good data scientist doubly so. A couple of months ago, Josh Wills, Director of Data Science at Cloudera, gave a talk dubbed “The Life of a Data Scientist”. In the talk, he defined data scientist as: Data Scientist (n.): Person who is better at statistics than any software engineer and better at software engineering than any stat
TOPICS 発行年月日 2012年08月 PRINT LENGTH 196 ISBN 978-4-87311-572-6 原書 Think Stats FORMAT PDF 本書は「プログラミングのスキルを統計の理解に役立てよう」というコンセプトで書かれたものです。数学的な観点から語られることが多い統計について、計算処理の観点から説明。実際にPythonのコードを示し、実データを分析しながら統計の基礎を解説しています。日本語版では豊富な数学関数ライブラリを提供するPythonの科学技術計算用モジュールNumPyとSciPyに関する解説を付録として追加。NumPy/SciPyが持つ統計関数の解説のほか、本書に登場した問題をNumPy/SciPyを使って解く方法を紹介します。Pythonで書かれたサンプルコードを使って実際に手を動かしながら統計が学べる、プログラマのための統計入門の決定版です
3. 今回のもくじ イントロ -『相関と因果』再訪 基礎編 - 因果概念の変遷: 心の習慣 から 反事実 へ - 因果と確率論を繋ぐ:Pearlのdo演算子 実務編 - 重回帰とは因果構造分解酵素である - バックドア基準による変数選択 考察 - 因果推論の不可能性, モデル選択の3視点 4. 相関と因果は一致しない 86 女 性 84 の 平 82 均 寿 80 命 78 (歳) 30 34 38 NHKの放送受信契約数(百万) http://www.stat.go.jp/data/nihon/02.htm 元データ→ http://pid.nhk.or.jp/jushinryo/know/pdf/toukei2010.pdf 5. 相関と因果は一致しない 86 p < 0.00000002 女 2 性 84 R = 0.99 の 平 82 均 寿 80 命 78 (歳) 30 34 3
拓也「ごめん、ちょっと遅れちゃったよ。課長が話し好きでさ。」 麻衣「いいのよ、私も今、一杯目のカクテル頼んだとこ。」 ウエイター「飲み物は何になさいますか?」 拓也「あ、僕はウォッカのロックで。」 麻衣「今週もお疲れ様!」 拓也「麻衣の方こそ、お疲れ様。今週はどうだった?何か変わったことあった?」 麻衣「いろいろあったけど、いつも通りだよ。インドに出した注文 また納期遅れたけど、そんなのしょっちゅうだし。」 拓也「僕の方もぼちぼちかな。クライアントの希望する仕様が少し 変更になって残業が少し増えそうだけど、よくあることだし。」 麻衣「・・・ねえ、拓也。」 拓也「なに?」 麻衣「こうして週末にバーで会うの、もう何回目かしら?」 拓也「そうだな、もう30回くらいにはなるかな。」 麻衣「私が拓也と会うときは、すごくテンション高い時もあるし、機嫌が悪い事もある。 だから言い合いになっちゃたりするこ
目次 1. 『コンプガチャの数理 -コンプに必要な期待回数の計算方法について-』 2. 『「数学的ゲームデザイン」というアプローチ』 3. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その1-』 4. 『コンプガチャの数理 -ガイドラインに基づいたゲームデザイン その2-』 目的 コンプガチャのコンプに必要な回数を求める問題は「The Coupon Collector's Problem」と呼ばれる数学モデルの枠組みに沿った美しい問題である事を述べ,いくつかの有用な結果を示す。 ※ あくまで個人研究のつもりで書いたので,色々不備があるかもしれません。その際は一言頂けると助かります。 定義 コンプガチャ問題を Coupon Collector's Problem に準じた形で書くと以下の様になる: 「全部で n 種類のアイテムがあって,1つのガチャの中にアイテムが1つ入って
Librato Has Leveled Up. Introducing SolarWinds® AppOptics™. AppOptics combines all the great features of Librato with new, additional functionality including host maps, distributed transaction tracing, 150+ cloud-ready integrations, and affordable pricing. Start AppOptics Free Trial Custom Metrics A fully customizable metrics platform. Quickly collect custom infrastructure, application, and busine
googleさんやマイクロソフトさんは「次の10年で熱い職業は統計学」と言っているようです。またIBMは分析ができる人材を4,000人増やすと言っています(同記事)。しかし分析をするときの基礎的な学問は統計学ですが、いざ統計学を勉強しようとしてもどこから取りかかればいいか分からなかくて困るという話をよく聞きます。それに機械学習系の本は最近増えてきましたが、統計学自体が基礎から学べる本はまだあまり見かけないです。 そこで今回は、統計学を初めて勉強するときに知っておいた方が良い10ポイントを紹介したいと思います。 1. 同じ手法なのに違う呼び名が付いている 別の人が違う分野で提案した手法が、実は全く同じだったということがあります。良く聞くのは、数量化理論や分散分析についてです。 数量化理論 数量化I類 = ダミー変数による線形回帰 数量化II類 = ダミー変数による判別分析 数量化III類 =
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く