2005年もIT業界では数々のニュースがありました。昨日は1年間で最も読まれたCNET Japanの記事トップ15をご紹介しましたが(関連記事)、本日はCNET Japanの記事の中で最も重要な2005年の記事をご紹介します。 とはいえ、記者が勝手に「これが重要だ」といっても説得力に欠けるかもしれません。そこでCNET Japanが誇る技術部隊が総力を挙げて、2005年に掲載した記事の文章の中から重要と思われる単語を抽出し、その単語が多く含まれる記事を重要と判断することにしました。 具体的には、TF IDFと呼ばれるアルゴリズムを利用しました。まず、2005年にCNET Japanに掲載された記事の文章をすべてMeCabという形態素解析ツールを使って単語ごとに分け、最も多く登場する単語をランキングにしました。同時に、Yahoo! 検索Webサービスを使って、Yahoo! 検索における各単語