今月は更新めんどいなと思っていたのですが、下の動画見ていたらテンション上がってきたので頑張ります。 すごいですよね。ある意味これもインターフェースの一つだと思いますが、ある程度用途が決まっているものであれば、現在のAIでも結構面白いことができると思います。期待ですね。 ちなみに、Juliusが使われているのはスルーして、動画を見る限りOpen JTalkが予想以上に結構いい感じなので気になってます。僕もOpen JTalk突っ込みたいんですが、どう使うんだという話なので悩み中です。 JuliusLibとは 今日はJuliusLibをやります。 Julius自体の説明は前回したのでそれを見て頂くとして、JuliusLibは、前回コンパイルしたJuliusのコアの部分だけをライブラリ化したものです。 通常Juliusを使ってプログラミングすると、システムコールの関数を利用してコマンドを実行、と
目次 まえがき1. 概要動作環境音声認識システムの実行に必要なものパッケージの構成処理フロー2. インストールバイナリパッケージソースからコンパイルするコンパイル時オプションlibsent オプションlibjuliusオプションjuliusオプションコンパイル手順の詳細LinuxWindows - cygwinWindows - mingwWindows - Microsoft Visual C++3. 音声データ入力基本フォーマットビット数チャンネル数サンプリングレートファイル入力サポートするファイル形式録音デバイスからの直接入力録音デバイスの条件OSごとの詳細入力遅延の調整ネットワーク・ソケット経由の入力ネットワーク経由esd標準入力DATLINK/NetAudio特徴量ファイル入力プラグインによる入力拡張について4. フロントエンド処理・特徴量抽出フロントエンド処理直流成分除去スペク
iPhoneで音声認識を行うサンプルアプリケーションを作成しました。 音声認識エンジンにはJulius(http://julius.sourceforge.jp/)を利用させて頂いてます。 アプリケーションのソースコードは以下のURLで公開されていますので、興味のある開発者の方はご覧ください。 https://github.com/FLCLjp/iPhone-julius Juliusではマイクなどのオーディオデバイスからの入力もサポートしていますが、CoreAudioを利用したコードをiOS用に変換するのに手間がかかりそうだったのでこのリリースでは省略しています。そのため、リアルタイムでの解析ではなく、録音した音声ファイルを解析するアプリになっています。 気になる音声認識精度ですが、私が試した限りではあまり良くありません。ただ、iPhone以外の環境で録音された高品質な音声データーを読み
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く