[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

TechとNLPに関するttpoohのブックマーク (4)

  • 国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan

    経済産業省は7月、国内の総合電機メーカーや大学など38団体とともに、国産の検索エンジンを開発する「情報大航海プロジェクト・コンソーシアム」を設立する。企業や大学がこれまで研究してきた検索技術やノウハウを持ち寄り、成果物はオープンソースとして広く公開する考えだ。 検索エンジンの分野では現在、GoogleYahoo!Microsoftといった米国の大手企業が火花を散らしている。この分野で国が音頭を取って研究開発を進める狙いは何なのか。経済産業省 商務情報政策局 情報政策ユニット 情報経済企画調査官で、今回のプロジェクトを推進した立役者である八尋俊英氏に聞いた。 --情報大航海プロジェクト・コンソーシアムを結成した狙いはどこにあるのでしょう。 まず前提として、現在は情報がとにかく山のように沢山あり、その中から必要なものだけをうまく抽出して知識化する技術が求められているということがあります。こ

    国産検索エンジンはなぜ必要なのか?--経産省担当者に聞く - CNET Japan
    ttpooh
    ttpooh 2006/07/08
    医療での画像検索とかは普通に有意義っぽい。他は成果を見守るか。
  • 現代版「バベルの塔」も完成間近?--新種の同時翻訳技術が登場

    人は数年のうちに、スペイン語にフランス語、英語までをも話せるようになるかもしれない。それもすべて同時に、だ。 カーネギーメロン大学(CMU)および独カルルスルーエ大学でコンピュータサイエンスの教授を務めるAlex Waibelは、米国時間27日にCMUのピッツバーグキャンパスにおいて、複数のソフトウェア/ハードウェアのデモンストレーションを行う予定だ。ここで利用されている技術は、異なる言語を話す人々の相互理解をはるかに容易にするものだという。 非公式に「Lecture Translation」と呼ばれているものは、会話をある言語からほかの言語へ、即座にかつ制約なしに翻訳できる。今日の一般的な翻訳技術は、ある種のトピックや限られたボキャブラリしか対象としておらず、アプリケーションの利用にはある程度の訓練も必要だ。 まだ名称も決まっていないそのほかの試作品では、指向性のスピーカーを用いて、特定

    現代版「バベルの塔」も完成間近?--新種の同時翻訳技術が登場
    ttpooh
    ttpooh 2005/10/29
    発声しなくても筋電位でわかる、ってのは面白い。embedded読唇術。
  • 日本語入力プログラムについて考える

    コンピュータ上で日語を使って作業するうえで欠かせない道具の一つが、日本語入力プログラム(インプットメソッド、IME)註1です。WindowsにはMS-IMEが、MacOSにはことえりといったソフトがあらかじめ付属していますが、これらのソフトが登場する前からより効率的な日本語入力を求めて、さまざまなソフトが開発されて来ました。 現在は、インプットメソッドを比較検討のうえ購入したり、議論がなされたりする機会が減っているようですが、日語を入力することが否が応でも多い私たちは、書家が筆を選ぶように、職人が道具を選ぶように、もっと自分の手になじむ道具(=ソフト)に注目し、吟味してもいいのではないでしょうか。 このページは、fj.sys.mac、fj.comp.input-methodの高野さんの記事<3D5B8A62.6903839E@ty2.fitweb.or.jp>をきっかけに作成しました。

    ttpooh
    ttpooh 2005/07/07
    日本語IMEの歴史・技術など。
  • 10GBのテキストを1秒で検索できる検索エンジン「QuickSolution 4.1」

    東京ビッグサイトで7月1日まで開催中の「第14回ソフトウェア開発環境展」で、住友電工情報システムが類似情報検索エンジン「QuickSolution 4.1」をデモンストレーションしている。 QuickSolutionでは、入力された文章をN文字の文字列として区切る「N-gram方式」で検索キーワードやフレーズを区切り、文字列と検索対象のファイルとの類似度を計算することで自然文検索を実現した。検索結果には統計処理などを元に独自のアルゴリズムを適用する。例えば、PCニュース関連のデータベースを検索する場合は、「パソコン」「インターネット」という関連キーワードが頻出するため、これらのキーワードが決め手にならないように重要度が下がるという。 7月15日から提供する最新版では、1台のPCで1TB・1億件以上のテキストを検索できるようになったほか、10GB・1,000万件のテキストであれば0.1秒で検

    ttpooh
    ttpooh 2005/06/30
    新語とかがバシバシ出てくるドメインだとやっぱn-gramがいいよなぁ。どう活かすか考えてみる。
  • 1