すぐ忘れるのでメモ。ナイーブベイズの学習アルゴリズムの導出とか、そもそもナイーブベイズが定番過ぎて意外とやったことなかった気もするので、復習がてらやってみた。 ちょっと修正 2013/07/30 ナイーブベイズについて整理 学習アルゴリズムの導出 Naive bayes (ナイーブベイズ) スパムフィルタで使われたことで有名な確率モデルで、シンプルだけどそこそこ実用的なのが良い所。Naive bayesという名前は、特徴ベクトル間に条件付き独立性を仮定してることにある(実際は相関あることが多いけど、まぁ簡単のためって感じ)。具体的に例を挙げて言うと、例えば文書分類タスクの場合、各単語は独立に生起するという仮定を置くことに相当する。 まずはモデルを書き下す。入力データを$\mathbf{x}$(D次元)、ラベルを$y$(離散値)とすると、ナイーブベイズでは以下のように同時確率をモデル化する。