前回書いたように「クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)」で手に入れたlivedoor clipのデータ(2008年12月版)をドメインごとに分類するとd.hatena.ne.jpが一番多かった。そこでid別にカウントしてみた。どう利用するかは分からないけど需要があるようなので。 データ全体では2546のidが含まれていた。以下はクリップ数40以上の499。 クリップ数 id 4328 id:amachang 2685 id:naoya 1749 id:essa 1639 id:umedamochio 1625 id:fromdusktildawn 1589 id:tokuhirom 1439 id:sirouto2 1437 id:secondlife 1342 id:brazil 1326 id:favre21 1261 i