Google Chromeのベータ版にのっているWeb Speech APIをつかってみたよ。最近はブラウザでなんでもできるけどここまでやるとはね。 Web Speech APIでできること Web Speech API Specificationによると、音声認識と音声合成が簡単に扱えるAPIのようす。Chrome 25のベータ版では、音声認識のみ実装しているようです。 認識精度がけっこういいのだ まずはGoogleのデモアプリで遊んでみる。はっきりとしゃべる分には、けっこう正確に認識してくれる感覚。例によって宇多丸と歌丸を使い分けるぞ! この音声認識も、Siriよろしくどっかのサーバで解析して結果を返してもらっている様子。ネットワークを切った状態で認識ボタンを押すと、マイクを起動しにいった直後に切ってしまい、音すら拾ってくれません。また、ローカルでもきちんとWebサーバを立てて、HTT
uSpeech library The uSpeech library provides an interface for voice recognition using the Arduino. It currently produces phonemes, often the library will produce junk phonemes. Please bear with it for the time being. A noise removal function is underway. Minimum Requirements The library is quite intensive on the processor. Each sample collection takes about 3.2 milliseconds so pay close attention
【ET 2008】人間の感情を認識するマイコンが登場、家電など向けエプソンが開発(2008/11/20) セイコーエプソンは、人の音声から喜怒哀楽などの感情を認識するアルゴリズムを搭載したマイコンを開発し、組み込み機器開発技術の展示会「Embedded Technology 2008(ET 2008)」(2008年11月18日~20日にパシフィコ横浜で開催)に参考出展した。音声の周波数成分と韻律(リズム)を解析して、発話者の感情をリアルタイムに認識する機能を備える。具体的には、「喜び」「怒り」「悲しみ」「平常」「興奮」の5つの感情成分について、それぞれの強さを50段階で検知可能だ。家電機器をはじめとした組み込み機器の音声入力型ユーザー・インターフェースに向ける。 32ビットのプロセッサ・コア「C33」のほか、マイクロホンからのアナログ音声入力をデジタル化するA-D変換器などを集積したマ