[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

researchとNLPに関するchezouのブックマーク (8)

  • Statistical Semantic入門 ~分布仮説からword2vecまで~

    1. The document discusses various statistical and neural network-based models for representing words and modeling semantics, including LSI, PLSI, LDA, word2vec, and neural network language models. 2. These models represent words based on their distributional properties and contexts using techniques like matrix factorization, probabilistic modeling, and neural networks to learn vector representatio

    Statistical Semantic入門 ~分布仮説からword2vecまで~
  • http://www.logos.t.u-tokyo.ac.jp/~tau/papers/pubs.html

    chezou
    chezou 2012/08/29
    分散クローラ。河原研が格解析用に使用していた
  • Language Resources and Evaluation | Home

    chezou
    chezou 2012/08/22
    言語資源に関連する雑誌
  • 適当な仕事をしている注釈者を発見せよ! - kisa12012の日記

    NIPS2011の論文を紹介していくコーナー. 今回対象とする論文は,Ranking annotators for crowdsourced labeling tasks. 概要 論文は,標のラベル付を複数人にしてもらう時に,標をきちんと見ず,適当な注釈を行なっている人を見付け出すためのスコアリングを提案しています. Mechanical Turk等のクラウドソーシングで今後必要になりそうなテーマですね. 論文では,このような適当な注釈者をスパマーと呼び,スパマーを効率的に見つけ出すためのランキング手法を提案しています. 手法 2クラスの場合と多クラスの場合について議論していますが,今回は2クラスの場合を簡単に紹介します. スパマーはコイン投げと同じようにラベルを選んでいるため,P(注釈者のラベル|真のラベル)が0.5になります.[α,β] 一方で,仕事が出来る注釈者は上の確率が1

    適当な仕事をしている注釈者を発見せよ! - kisa12012の日記
  • JST戦略的創造研究推進事業「さきがけ」に研究課題が採択されました - Não Aqui!

    昨日プレスリリースの通り,JST戦略的創造研究推進事業「さきがけ」の研究領域「情報環境と人」に,自分が申請していた研究課題が採択されました.研究課題名は「知識の自動獲得・構造化に基づく情報の論理構造とリスクの分析」です.研究の概要は次の通りです. ウェブやソーシャルメディアなどの新しい情報環境により、情報の流通が加速する一方、偏った情報やデマなどの拡散による社会の混乱や不安が増大しています。研究では、ネット上で言及されている物・事態に関する知識を計算機がロバストに獲得・活用する言語処理技術を基盤として、流通している情報の背後にある論理構造を解析し、その整合性を分析することで、安全・危険に関する多角的な判断材料を人や社会に提供します。 研究総括の石田亨先生の総評にもありますが,この研究は東日大震災を強く意識したものになっています.世の中の状況に左右されず,研究者は自身の研究に邁進すべきと

  • 「かわいい検索」の実験がはじまった! - balab | 小川克彦研究室

    11年06月29日 ポータルサイト goo では gooラボ でさまざまな実験をやっていますが、このたびgooと小川研究室で「かわいい検索」の実証実験を始めました。 「かわいい検索」のサイト名は http://kawaii-search.jp/ です。 「かわいい検索」とは、ブログ記事内で使われている絵文字や行間などの"見た目"をもとに、「ゆるかわ」「キュート」「きれい」「おもしろ」「まじめ」という5種類のタイプで、ブログ検索できるサービスです。それぞれの特徴は以下の通りです。 ・ ゆるかわ検索 (ひらがなが多くふんわりした見た目、ナチュラルなファッション) ・ キュート検索 (絵文字が多くにぎやかな見た目、ポップなファッション) ・ きれい検索  (シンプルで大人っぽい見た目、清楚なファッション) ・ おもしろ検索 (カラフルで目を引く見た目、個性的なファッション) ・ まじめ検索  (

    chezou
    chezou 2011/06/30
    「かわいい検索」の簡単な説明
  • 単語感情極性対応表

    単語感情極性対応表 日語および英語の単語とその感情極性の対応表を、 研究目的の利用に限り公開します。 感情極性とは、その語が一般的に良い印象を持つか(positive) 悪い印象を持つか(negative)を表した二値属性です。 例えば、「良い」、「美しい」などはpositiveな極性、 「悪い」、「汚い」などはnegativeな極性を持ちます。 感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。 もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。 リソースとして、日語は「岩波国語辞書(岩波書店)」を、 英語はWordNet-1.7.1を使わせていただきました。 こちらからダウンロードしてください→[日語] [英語] フォーマットは、各行が一単語に対応し、 見出し語:読み:品

  • 言語処理学会第17回年次大会(NLP2011)ワークショップ 「自然言語処理における企業と大学と学生の関係」

    ワークショップは終了いたしました。ご協力いただいた皆様、どうもありがとうございました。 twitterのまとめ。 twitterのハッシュタグは #gengo2011ws です。 自然言語処理に関係した企業と大学と学生の関係が変化しています。 自然言語処理に関する大学での研究内容と企業での応用が非常に近くなって来ています。 企業がデータを大学等に提供し、その研究成果が社会に還元される仕組みができつつあります。 多くの学生は大学での研究活動の後に企業に入り、研究所や事業部での活躍が期待されています。 企業はより優秀な頭脳を集めるために、これまでの枠に捕われない採用姿勢をとる傾向が強まっています。 インターン制度により学生が企業の中身を事前に知ることができるようになっていますが、範囲は限定されています。 ワークショップでは、企業、大学、学生の3者の間での相互理解を目的に、それぞれの 立場や

    chezou
    chezou 2011/01/28
    自然言語処理の研究者が寄稿されている。興味深いものが多そう。後で読む
  • 1