[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

*workと研究に関するir_taktのブックマーク (4)

  • クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    クローリングしてる暇があるなら…論文かいたら? | EDGE Datasets(研究用データセット)
    ir_takt
    ir_takt 2011/09/07
    ブクマデータ集めようと参考文献から飛んだらMOEGAZOUで吹いた。はてブやめてこっち使うか。
  • 最近のはてブで流行している7つのタグ : 404 Blog Not Found

    2006年03月18日00:00 カテゴリLogosLightweight Languages 最近のはてブで流行している7つのタグ ↓にインスパイヤされますた。 ある編集者の気になるノート : 最近の出版界で流行している7つのキーワードで、「最強のタイトル」をつくってみた。 なかでも、多用されている7つのキーワードを抽出。 それらを組み合わせれば「最強のタイトル」ができるのではないか、と思ったのが、この記事を書いたキッカケです。 とはいっても、まず残念なことに、はてブにはブックマーカーごとのタグ数集計はあっても(厳密にはタグクラウドだけど)、全体のタグ数集計を直接知る方法がないということ。しゃあないので以下のscriptでホッテントリ分だけでも集計してみる。 #/usr/bin/env perl -Tw use strict; use HTML::LinkExtor; my %entry

    最近のはてブで流行している7つのタグ : 404 Blog Not Found
  • 私のブックマーク「Web構造マイニングとWeb視覚化」

    1.はじめに Webデータにおけるパターン発見をデータマイニング技術を用いて行なうこと をWebマイニングと呼ぶ。Webマイニングは、自然言語処理や機械学習、データ マイニングなどの人工知能の分野にとどまらず、情報検索やデータベースなど 幅広い分野と関連する複合的な研究分野である。 注目するWebデータの種類によって、Webマイニングは以下の3つに分類される。 1) Webページのコンテンツに注目し、自然言語処理やデータベースのアプローチを用いて、 テキストマイニングによる情報抽出や半構造データにおける検索のモデル化などを 目指すWeb内容マイニング 2) Webページ間を結ぶハイパーリンクによって構成されるグラフ構造に注目し、 関連ページの発見や重要ページのランキング、グラフ構造のモデル化などを 目指すWeb構造マイニング 3) Webページの閲覧によって生じる(サーバー側やクライアント

  • SBMデータを用いたwebコンテンツ推薦: SBM-miyata080723.pdf

    SBMデータを用いたwebコンテンツ推薦 東京工業大学 宮田 高道 / 佐々木 祥 佐々木 SBM研究会 宮田 高道/佐々木 祥 0 Agenda Aパート:SBMと研究(宮田) SBM研究の着眼点と目的 SBMデータを用いた推薦 Bパート:Anti-Folksonomyアプローチにもとづ くSBMデータからのWeb推薦(佐々木) SBM研究会 宮田 高道/佐々木 祥 1 SBMと研究 SBM SBMとは何か? URLに対してタグやコメントをつけられるもの 日の「はてなブックマーク」では… コメントを受け付けないブログにもコメント可能 コメント欄での議論など,コミュニケーションツールの側面 一方,多くのSBM関係の研究では タグとコンテンツ,ユーザの関係に着目 コメントを分析/利用する研究は少ない なぜタグが重視されるのか? SBM研究会 宮田 高道/佐々木 祥

  • 1