[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

blogに関するUDONCHANのブックマーク (7)

  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

  • はてな記法一覧 - はてなダイアリーのヘルプ

    このページでは、はてなブログで使用することができるはてな記法の一覧を紹介しています。 入力支援記法 自動リンク はてな内自動リンク 入力支援機能 関連 入力支援記法 記法名 書式 機能 大見出し記法 *~~ 日記に大見出し(h3)をつけます 中見出し記法 **~~ 日記に中見出し(h4)をつけます 小見出し記法 ***~~ 日記に小見出し(h5)をつけます リスト記法 -~~ --~~ +~~ ++~~ リスト(li)を簡単に記述します 定義リスト記法 :~~:~~ 定義リスト(dt)を簡単に記述します 表組み記法 | ~~ | ~~ | |*~~ | ~~ | 表組み(table)を簡単に記述します 引用記法 >> ~~ << 引用ブロック(blockquote)を簡単に記述します pre記法 >| ~~ |< 整形したテキストをそのまま表示します(pre) スーパーpre記法 >||

    はてな記法一覧 - はてなダイアリーのヘルプ
  • ブログの文体で書き手の性別を自動判別、リクルート子会社が広告配信に応用

    リクルート子会社のブログウォッチャー(東京・港区)は、2008年2月をメドに、「プロファイルパスポート」システムを稼働させる。ブログやSNS(ソーシャル・ネットワーキング・サービス)といったCGM(消費者発信型メディア)に書き込まれた文章を基に、インターネット利用者の行動を解析し広告配信などに活用するものだ。 独自の日語解析技術で、CGMの文章から書き手の属性や行動パターンを解析。これを、プロファイルパスポートに対応したゲーム占い、アンケートサイトなどから得た情報と組み合わせて、CGMの書き手に合った広告を配信する。 例えば、「自分のブログに『高級レストランAがおいしかった』と書き込んでいて、かつ、相性占いで恋人の誕生日を入力し、かつ、情報配信を許諾している」人に対象を絞って、「競合の高級レストランBの記念日特別メニュー」の案内を配信できる。誕生日などの個別登録された定型情報だけではな

    ブログの文体で書き手の性別を自動判別、リクルート子会社が広告配信に応用
  • 新公式:儲かるWebサービス≒はてブされにくいサービス - VENTURE VIEW

    人気記事 1 OpenAI、新たなAIモデル「o3」発表--AGIへ前進、軽量版は1月末公開 2024年12月21日 2 ドコモ、dポイント(通常)の有効期限を変更 2024年12月19日 3 使用済み乾電池を肥料に、パナソニックが新技術 2024年12月20日 4 電話で「ChatGPT」との会話が可能に--さっそく試してみた 2024年12月19日 5 ソフトバンク、シャープ堺工場跡地約1000億円で取得を決議--受電容量250MW超のAIDCへ 2024年12月20日 6 mixi2話題沸騰--「ここ最近、特にひどくなったX」を代替する国産SNSになり得るか(石川温) 2024年12月17日 7 PayPay、東京都の10%還元キャンペーンを3日前倒しで終了--12月24日午後11時59分まで 2024年12月20日 8 ここまで会議を効率化できるとは… 話者をも識別「自動議事録作成

    新公式:儲かるWebサービス≒はてブされにくいサービス - VENTURE VIEW
  • ウィキペディアのラルクの項にハイドの身長は156cm、と書くと数時間以内に消される|笑える一言

    Wikipedia という、自由に編集できるネット百科事典での攻防の様子。 ライブ感覚でお楽しみ下さい。 348 名前:番組の途中ですが名無しです[] 投稿日:2006/01/10(火) 19:47:09 ID:+sdhsVLk0 ウィキペディアのラルクの項にハイドの身長は156cm、と書くと数時間以内に消される http://ja.wikipedia.org/wiki/%E3%83%A9%E3%83%AB%E3%82%AF 祭りはこの一言から始まった。 490 名前:番組の途中ですが名無しです[] 投稿日:2006/01/11(水) 10:27:43 ID:S/s9kOx70 >>404 ヤター\(^o^)/ もう消されたよ! 492 名前:番組の途中ですが名無しです[sage] 投稿日:2006/01/11(水) 10:40:46 D:Okqhw+TX0 >>490 書き直してあるー

  • アルファなんて必要ない--無個性なブログサービス「sa.yona.la」

    ハートレイルズは7月18日、徹底的に個性を排したブログサービス「sa.yona.la」を提供開始した。利用するにはOpenIDが必要だ。 sa.yona.la は、さまざまな制約をユーザーに課すことで、自由な発言やコミュニケーションを促そうとしている。制約とは具体的には下記のようなものだ。 ブログのアカウント名を指定できない ブログのタイトルを指定できない ブログのデザインをカスタマイズできない エントリーの内容以外でユーザーを差別化する方法がない。ブログタイトルはユーザーアカウントと同一になるが、そのアカウント名すら自分で指定できない。こうした仕組みによって、ブログに個性を求められることからユーザーを解放するのだという。 今後はモバイル端末向けの機能も拡充していくという。 sa.yona.laトップページにはすべてのユーザーのブログエントリーが更新順に並ぶ。投稿者のアカウント名をクリック

    アルファなんて必要ない--無個性なブログサービス「sa.yona.la」
  • Feature Column from the AMS: Pagerank

    Imagine a library containing 25 billion documents but with no centralized organization and no librarians. In addition, anyone may add a document at any time without telling anyone. You may feel sure that one of the documents contained in the collection has a piece of information that is vitally important to you, and, being impatient like most of us, you'd like to find it in a matter of seconds. Ho

    Feature Column from the AMS: Pagerank
  • 1