平素は、Seesaaブログをご利用いただきありがとうございます。 Twitterのつぶやき(TL)の自動おまとめ投稿をリリースいたしました。 前日のつぶやきが、自動でブログの記事として投稿されます。 Twitterのタイムゾーンの設定により投稿される時間が異なります。 タイムゾーンを日本に設定している場合は、0時過ぎに投稿されます。 投稿されるのは、認証されたTwitterのつぶやきになります。 自分からの@reply(メンション)を表示する、しない、昇順降順の設定、投稿の際の記事タイトルの設定が可能となります。 ■設定方法 ブログ設定でTwitterの認証を行うと項目に「自動おまとめ投稿」の項目が追加されます。 すでに認証を行ってる場合は、表示がされています。 自動投稿を「する」に変更、自分からの@reply(メンション)を表示「する」「しない」を選択してください。 タイトルについては、
tf*idf 法による特徴的単語の抜き出し Posted by yoosee on Web at 2005-02-25 23:42 JST1 Tf Idf Ranking特徴的単語の抜き出し方法。nterm := あるドキュメント内のある単語の出現回数 maxn := ドキュメント内で最も出現頻度が高かった単語の出現回数 tf = 0.5 + 0.5 * nterm / maxn idf = log2(ドキュメントの数/対象単語が含まれるドキュメントの数) + 1 log の底は任意に変えることで idf の重み付けを変更出来る と言う数字で評価する。つまり「あるドキュメント内での出現頻度が高い(tf)」単語のうち「他のドキュメントにはあまり出現し無いもの(idf)」を「そのドキュメントに特徴的な単語」として扱うという考え方らしい。 とりあえず kakasi -w で単純な単語分割したもの
随分ご無沙汰してしまったのですが、本年も引き続きよろしくお願いします。 さて今年の最初は実用性があるかどうかはまったく別にして(且つ環境を選ぶものですけど)、サンプル的な感じで一つ。 きっかけは(ちょっと時間が経ってしまいましたが)、以下のエントリーから。 こんぶだしmeeting9杯目:あったらいいな、未来のこんなMovable Type!|linker journal|linker 本文内の文章を言語解析してくれて、関連するエントリーを勝手に出してほしい MeCab/MeCab.pmをインストール MTのタグをMeCabの辞書に書き出して登録 プラグインによってエントリーの保存時に形態素解析してタグを抽出して自動的にセットする というものです。タグを辞書に登録するのだから素直にDB見に行ってやればいいってのとそういうのもどっかで公開されてるんですが、あくまでもサンプルとして作りました。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く