[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

2010年2月5日のブックマーク (4件)

  • 「ヒットの泉」マート族 | 日経MJ | 日経テレコン21

    SuiJackDo
    SuiJackDo 2010/02/05
    光文社の月刊女性誌「マート」の読者コミュニティがヒット商品の火付け役に。
  • 【Seesaaブログ】Twitterのつぶやきの自動おまとめ投稿ができるようになりました

    平素は、Seesaaブログをご利用いただきありがとうございます。 Twitterのつぶやき(TL)の自動おまとめ投稿をリリースいたしました。 前日のつぶやきが、自動でブログの記事として投稿されます。 Twitterのタイムゾーンの設定により投稿される時間が異なります。 タイムゾーンを日に設定している場合は、0時過ぎに投稿されます。 投稿されるのは、認証されたTwitterのつぶやきになります。 自分からの@reply(メンション)を表示する、しない、昇順降順の設定、投稿の際の記事タイトルの設定が可能となります。 ■設定方法 ブログ設定でTwitterの認証を行うと項目に「自動おまとめ投稿」の項目が追加されます。 すでに認証を行ってる場合は、表示がされています。 自動投稿を「する」に変更、自分からの@reply(メンション)を表示「する」「しない」を選択してください。 タイトルについては、

    【Seesaaブログ】Twitterのつぶやきの自動おまとめ投稿ができるようになりました
    SuiJackDo
    SuiJackDo 2010/02/05
    お、こんな機能が追加されてたんだ。
  • tf*idf 法による特徴的単語の抜き出し - World Wide Walker

    tf*idf 法による特徴的単語の抜き出し Posted by yoosee on Web at 2005-02-25 23:42 JST1 Tf Idf Ranking特徴的単語の抜き出し方法。nterm := あるドキュメント内のある単語の出現回数 maxn := ドキュメント内で最も出現頻度が高かった単語の出現回数 tf = 0.5 + 0.5 * nterm / maxn idf = log2(ドキュメントの数/対象単語が含まれるドキュメントの数) + 1 log の底は任意に変えることで idf の重み付けを変更出来る と言う数字で評価する。つまり「あるドキュメント内での出現頻度が高い(tf)」単語のうち「他のドキュメントにはあまり出現し無いもの(idf)」を「そのドキュメントに特徴的な単語」として扱うという考え方らしい。 とりあえず kakasi -w で単純な単語分割したもの

    SuiJackDo
    SuiJackDo 2010/02/05
    「あるドキュメント内での出現頻度が高い(tf)」単語のうち「他のドキュメントにはあまり出現し無いもの(idf)」を「そのドキュメントに特徴的な単語」として扱うという考え方
  • MeCabでMTの自動タグ付けなんかを。 | Junnama Online

    随分ご無沙汰してしまったのですが、年も引き続きよろしくお願いします。 さて今年の最初は実用性があるかどうかはまったく別にして(且つ環境を選ぶものですけど)、サンプル的な感じで一つ。 きっかけは(ちょっと時間が経ってしまいましたが)、以下のエントリーから。 こんぶだしmeeting9杯目:あったらいいな、未来のこんなMovable Type!|linker journal|linker 文内の文章を言語解析してくれて、関連するエントリーを勝手に出してほしい MeCab/MeCab.pmをインストール MTのタグをMeCabの辞書に書き出して登録 プラグインによってエントリーの保存時に形態素解析してタグを抽出して自動的にセットする というものです。タグを辞書に登録するのだから素直にDB見に行ってやればいいってのとそういうのもどっかで公開されてるんですが、あくまでもサンプルとして作りました。

    MeCabでMTの自動タグ付けなんかを。 | Junnama Online
    SuiJackDo
    SuiJackDo 2010/02/05
    形態素解析で使用された単語でエントリー間の近似性調べて関連記事自動抽出とかすると、なんか別の意味で面白いフィードバックがありそうだ。