Google日本法人は12月3日、同社初の日本語入力システム「Google日本語入力(ベータ)」を公開した。Webサイトから無料でダウンロードできる。 Webから自動で辞書を生成、新語や専門用語、芸能人の名前なども網羅した。Web上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成、高い変換精度を実現したという。冒頭の数文字を入力すると候補語を提示するサジェスト機能も搭載している。Windows XP/Vista/7(それぞれ32ビット版)とMacに対応する。
現在の音声認識は背景雑音にものすごく弱い。人間が気にしないような小さなBGMでも音声認識にとっては致命的である。本日の日記も雑音の話である。 先日、自動音声認識というのは、特徴抽出部とデコーダ(音響モデル・言語モデル)からなっているのだということを書いた。では、このどちらが強く雑音の影響を受けるのか。両者は直列につながっているので、答えはもちろん「両方」なのだが、雑音対策をする上でどちらを直すべきなのかということに関する個人的な見解を書きたい。 バグをとるときには大抵途中の出力を見ていろいろと確かめてみるものだが、自動音声認識の中間出力を「聞いて」確かめることは可能だろうか。そう思って特徴抽出部で抽出した特徴量を強引に聞ける形式に逆変換してみた。音響信号から特徴量への変換は可逆ではないので、強引な逆変換をせざるを得なかったのだが、とにかく聞けるかたちにはなっていると思う。また、音声らしく復
2009年11月5日、「音音研」という集まりに行ってきた。音声と音楽のこぢんまりとした研究会である。そのことについては西本先生が詳しく書いている。あまり知られていないことであるが、この研究会の様子はネット中継されていた。ネットの向こう側にいる人に話しかけるのが楽しかった。 さて、内容についてであるが、雑音に関する知覚の話がメインだった。この話はどこまでここに書いても大丈夫なのかが分からないので書かない。その代わりに、私が雑音に対して何を今考えているのかを書こうと思う。 私は、雑音の混入した音声から雑音をとり除くことに関する研究で博士号をとった。このテーマにとりかかったのが、修士の二年くらいのときなのであるが、博士の一年の頃に、このテーマはそれほど重要ではないような気がしてきていた。そのときは、やむを得ずそのままそのテーマで研究を続けて、卒業までに三報の論文を載せたが、あまり楽しいものではな
Google IME がリリースされたそうで、Twitter でも #googleime というハッシュタグで祭りになっているようである。リリース文を見ると @taku910 さんと @komatsuh さんが主に関わっているようである。 以前Google サジェストのローマ字検索機能 = Google IME でも書いたことがあるのだが、これが出る予兆はいろいろあって、 2007年秋に Google 日本語 N グラムが出る(もっと言えば2007年3月に言語処理学会で「N グラムデータを出すならどういう形がいいか、どういう用途で使うか」という特別セッションがあった)ときから想像できたことであり、taku さんや komatsuh さんくらいのエンジニアであればエンジンを作るのには数日もかからないであろう。 Social IME 開発者の nokuno さんもGoogle IMEという可能
さっき家に帰ってきて、溜まっていた洗濯をやり、漸く一息ついたところ。 寝る前に更新。 今日は、朝9時からのスペイン語の試験が終わった後は、一日中TA(ティーチングアシスタント)のお仕事。 来週にファイナルレポートの締め切り3本と、試験1本抱えているが、TAは給料もらってるレッキとした仕事。 やらないわけには行かない。 ちなみにスペ語の試験は散々だった(汗)。 授業が過去形に入った頃から、完全に落ちこぼれ気味。 理由は簡単で、動詞によって色々違う、過去形の活用をちゃんと暗記してないから。 要は、真面目に勉強してないことが問題だってこと・・・。 TAの仕事方は、スペ語が終わったあと先生に会って、来学期の授業の内容を議論した以外は、ほとんど雑用。 授業でリーディング教材として指定する大量の論文のPDFを、ひとつずつオンラインから探し出してきて、授業用サイトにリンクを張る、と言う作業。 まあ、TA
昨日、日経BP主催のAndroidに関するセミナーで講演+パネルディスカッションをしたのだが、パネルディスカッションを一緒にさせていただいた、日本通信の福田尚久氏との話(特に、楽屋に戻ってからの非公開の話)が興味深かった。 福田氏は、スティーブ・ジョブズがAppleに戻り、Microsoftからの資金調達、iPodのリリース、アップル直営店の展開、という今のAppleの成功の基盤となる「奇跡の復活」を遂げた時期にジョブズの側近として活躍した人。 彼に言わせると、今のAppleのビジネス戦略は、倒産寸前だった97年当時に作った「30年ロードマップ」に書かれた通りのシナリオを描いているという。 もちろん、具体的な内容は企業秘密でもあるので直接聞き出すことはできなかったが、ここ12年の間にアップルが出して来たもの(iPod, iTunes, iPhone, Apple TV, Safari, O
Microsoft Learn. Spark possibility. Build skills that open doors. See all you can do with documentation, hands-on training, and certifications to help you get the most from Microsoft products. Learn by doing Gain the skills you can apply to everyday situations through hands-on training personalized to your needs, at your own pace or with our global network of learning partners. Take training Find
「ひとがご→人がゴミのようだ」 桁違いの語彙力、Googleが日本語入力ソフト(無料)発表…ATOKどうなる? 1 名前:☆ばぐた☆ ◆JSGFLSFOXQ @☆ばぐ太☆φ ★ :2009/12/03(木) 15:07:34 ID:???0 グーグル日本法人は3日、日本語入力ソフト(ベータ版)の提供を始めた。ネット上から自動的に単語を収集して辞書をつくり、新しい言葉や専門用語、著名人の名前なども収録されているという。ソフトをダウンロードして使う。同社の検索で、入力間違いを類推して指摘する「もしかして機能」の担当技術者らが開発。単語を入力すると、同社の検索エンジンで単語を入力した時に表示される候補と似た変換候補がリスト表示され、必要な言葉を選ぶ。 http://mainichi.jp/select/biz/news/20091203mog00020019000c.html 「ぱんつじゃ」まで
GoogleがMac用とWindows用の日本語入力を公開した. 思いどおりの日本語入力 - Google 日本語入力(Google日本Blog) 以下はインプットメソッドの感想. 入力レスポンスは快適.素晴らしい. H氏によると「貴社の記者は汽車で帰社した」が変換できるので凄いと言っていたが,「貴社の記者は車で帰社した」は「貴社の記者は車で記者した」になってしまう(笑)ので,文法解析よりも膨大な使用履歴の解析に助けられているのか?ちなみに,MS-IMEやことえりは意外にも一発変換する. このインプットメソッドの登場で期待したことは,「異なるOS(Mac OS XとWindows)のマシン間で同じユーザ辞書を(できれば学習結果も)共有する」ことだが,現在はサポートされていない.私はMac OS Xでは「ことえり」を使っているのだが,その一番の理由はユーザ辞書の共有機能があることだ.この機能
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く