Hacker Newsあたりに流れてておもしろそうだったので、Pythonで書いてみました。 元の記事は以下です。 Simple recommendation system written in Ruby Jaccard(ジャッカード)指数は サンプル群間の類似度を比較するためのものとのこと 。 A集合とB集合で、AとBの両方に出現ものを分子、AとBのどちらかに出現するものを分母として算出します。 Pythonを使うと set.intersection と set.union で表現できます。 日本語の単語抽出には mecab を使いました。 # coding: utf-8 import re import MeCab class Book(object): def __init__(self, title): self.title = title # original #self.wor