JP2009187349A - 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム - Google Patents
文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム Download PDFInfo
- Publication number
- JP2009187349A JP2009187349A JP2008027471A JP2008027471A JP2009187349A JP 2009187349 A JP2009187349 A JP 2009187349A JP 2008027471 A JP2008027471 A JP 2008027471A JP 2008027471 A JP2008027471 A JP 2008027471A JP 2009187349 A JP2009187349 A JP 2009187349A
- Authority
- JP
- Japan
- Prior art keywords
- correction
- sentence
- text
- reader
- terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】音声認識処理によって多量に出力される文字情報を、短時間で、よりわかりやすい情報に修正して提供する。
【解決手段】音声認識処理によって得られる音声の文章化表現データである文字列情報が入力されるデータ処理装置が、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する表記レベル補正手段と、前記表記レベル補正手段によって生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる補正文章表示手段と、オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付ける修正指示受け付け手段と、各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた修正指示による修正を、修正個所を特定可能に反映させる画面更新手段とを備える。
【選択図】図1
【解決手段】音声認識処理によって得られる音声の文章化表現データである文字列情報が入力されるデータ処理装置が、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する表記レベル補正手段と、前記表記レベル補正手段によって生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる補正文章表示手段と、オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付ける修正指示受け付け手段と、各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた修正指示による修正を、修正個所を特定可能に反映させる画面更新手段とを備える。
【選択図】図1
Description
本発明は、音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章の修正を読み手が理解しやすい文章にして提示するための文章修正支援システム、文章修正支援方法、および文章修正支援用プログラムに関する。
会議で交わされる音声や、ラジオやテレビ等の媒体から発せられる音声による情報を文字列で提供する音声認識の実施方法として、例えば、マイクロフォン等を介して入力される音声情報を解析して、その結果をエディタ画面等に出力する方法がある。これにより、音声による情報の獲得が困難な聴覚障害者や高齢者、日本語習得途上の外国人に対し、より正確な情報を提供することができる。
ところで、コンピュータの音声データ処理において、音声によるコミュニケーションが短時間に多くの言葉が発せられることや周りの雑音等の障壁が、音声の識別を困難にしている。
このように、様々な原因によって誤認識が生じた文字列を正しい文字列に修正するための技術の一例として、例えば、特許文献1には、オペレータを介在させて修正を行う文字データ修正装置が記載されている。特許文献1に記載されている文字データ修正装置では、番組内容の音声を音声認識によりテキストデータに変換した文字列に対して、不一致箇所選択手段が、オペレータの操作により音声との不一致箇所の選択を行う。そして、選択された不一致箇所の内容に対応した修正を行った修正テキストデータを入力して、元のテキストデータに加えることにより修正付加テキストデータを生成、出力する。
また、例えば、特許文献2には、単語間の意味関係に基づく制約情報を参照して音声認識結果の誤りを修正する音声認識方法が記載されている。特許文献2に記載されている音声認識方法では、単語間の意味関係とその度合いを示す関連度とを記憶しておき、その関連度に基づいて、最も確からしい単語列を選択する。
しかし、特許文献1に記載されているような、単純にオペレータを介在させて修正を行う方法では、オペレータが、託される文字列を全て追って不一致箇所を選択しなければならず、長時間文字を追う場合には、そのために生じる文章のゆれが顕著となる。ここで、”ゆれ”とは、同音異義語等、発音としては正しいものの、表記文章としては不適切な表現が含まれる状態をいう。結果、その情報の要点等を把握しずらくなり、リアルタイムでの正しい読解が妨げられてしまう。これでは、例えば、聴覚障害者が音声コミュニケーションの場に参加するために用いようとしても、用をなさない。
また、特許文献2に記載されているような、コンピュータ解析により自動で修正を行う方法では、正確度として低い結果が出る恐れがある。また、コンピュータ解析のみで、話される音声情報を全て解析し、常に正確に出力しようとすれば、解析に要する時間も長くなり、やはりリアルタイムでの正しい読解の妨げとなってしまう。
そこで、本発明は、音声認識処理によって多量に出力される文字情報を、短時間で、よりわかりやすい情報に修正して提供することを目的とする。
本発明による文章修正支援システムは、音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援システムであって、音声の文章化表現データである文字列情報が入力されるデータ処理装置と、読み手が使用する1台以上の読み手用端末と、オペレータが使用する1台以上のオペレータ用端末とを備え、前記データ処理装置は、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する表記レベル補正手段と、前記表記レベル補正手段によって生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる補正文章表示手段と、オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付ける修正指示受け付け手段と、各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた修正指示による修正を、修正個所を特定可能に反映させる画面更新手段とを備えたことを特徴とする。
また、本発明による文章修正支援方法は、音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援方法であって、音声の文章化表現データである文字列情報が入力されるデータ処理装置が、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成し、生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させ、オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付け、各読み手用端末および各オペレータ用端末の画面に、オペレータ用端末から受け付けた修正指示による修正を、修正個所を特定可能に反映させることを特徴とする。
また、本発明による文章修正支援用プログラムは、音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援用プログラムであって、音声の文章化表現データである文字列情報が入力されるデータ処理装置に適用される文章修正支援用プログラムにおいて、コンピュータに、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する処理、生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる処理、オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付ける処理、および各読み手用端末および各オペレータ用端末の画面に、オペレータ用端末から受け付けた修正指示による修正を、修正個所を特定可能に反映させる処理を実行させることを特徴とする。
本発明によれば、音声認識処理によって多量に出力される文字情報を、短時間で、よりわかりやすい情報に修正して提供することができる。
以下、本発明の実施形態を図面を参照して説明する。図1は、本発明による文章修正支援システムの構成例を示すブロック図である。図1に示す文章修正支援システムは、音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章に修正して提示するための文章修正支援システムであって、音声の文章化表現データである文字列情報が入力されるデータ処理装置1と、読み手が使用する1台以上の読み手用端末2−1と、オペレータが使用する1台以上のオペレータ用端末2−2とを備える。
また、データ処理装置1は、表記レベル補正手段11と、補正文章表示手段12と、修正指示受け付け手段13と、画面更新手段14とを含む。
表記レベル補正手段11は、入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する。表記レベル補正手段11は、例えば、文字列情報で示される文章に含まれる各単語について、予め登録されている単語辞書との照合を行い、単語辞書に登録されていない場合に、当該単語に表記レベルでの誤りの可能性があるとして、当該単語をひらがなに変換することによって補正文章を生成してもよい。また、表記レベル補正手段11は、例えば、文字列情報で示される文章に含まれる各単語について、予め登録されている単語辞書との照合を行い、単語辞書におなじ読みをもつ異なる表記の単語が登録されている場合に、当該単語に表記レベルでの誤りの可能性があるとして、当該単語をひらがなに変換することによって補正文書を生成してもよい。
補正文章表示手段12は、表記レベル補正手段11によって生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる。
修正指示受け付け手段13は、オペレータ用端末2−2から、オペレータ操作による表示中の文章に対する修正指示を受け付ける。
画面更新手段14は、各読み手用端末2−1および各オペレータ用端末2−2の画面に、修正指示受け付け手段13が受け付けた修正指示による修正を、修正個所を特定可能に反映させる。
また、図2は、本発明による文章修正支援システムの他の構成例を示すブロック図である。図2に示すように、データ処理装置1は、さらに、文章加工手段15と、加工文書表示手段16と、モード設定手段17とを含んでいてもよい。
文章加工手段15は、表記レベル補正手段11によって生成された補正文章を予め定められた表示モードに応じて加工した加工文章を生成する。
加工文書表示手段16は、表示中の補正文章と対応づけて、各読み手が使用している読み手用端末2−1の画面に、該読み手に対し設定されている表示モードに即した加工文章を表示させるとともに、オペレータ用端末2−2の画面に、少なくとも読み手用端末に表示させた表示モードに即した加工文章を表示させる。
なお、本例の場合には、修正指示受け付け手段13は、オペレータ用端末から、オペレータの操作による前記加工文章に対する修正指示を受け付ける。また、画面更新手段14は、各読み手用端末および各オペレータ用端末の画面に、修正指示受け付け手段13が受け付けた加工文章に対する修正指示による修正を、修正箇所を特定可能に反映させる。
モード設定手段17は、読み手用端末2−1から、読み手の操作による表示モードの切り替え指示を受け付ける。モード設定手段17は、例えば、表示モードとして、発声内容とほぼ同一の内容を提示する詳細モードと、発声内容から冗長さを排除した字幕モードと、発声内容の要点を箇条書きで提示する簡易モードとを用意し、読み手のレベルに応じた切り替えを可能としてもよい。
また、加工文章表示手段16は、モード設定手段17が表示モードの切り替え指示を受け付けた場合には、少なくとも要求元の読み手用端末に、該読み手に対し設定されている表示モードに即した加工文章を表示させてもよい。
以下、より具体的な実施形態について説明する。図3は、より具体的な文章修正支援システムの構成例を示すブロック図である。図3に示す文章修正支援システム1000は、音声認識装置100と、データ処理装置200と、1つ以上の文字入出力装置300とを備える。
音声認識装置100は、既存の技術によるものであり、音声を入力するマイクロフォン装置やアナログ信号である音声をディジタル信号に変換するアナログデジタルコンバータ装置、音声認識処理を実現するソフトウェア(より具体的には、該ソフトウェアに従って動作するCPU等のプロセッサ)によって実現される。
なお、本実施形態における音声認識装置100は、データ処理装置200に対し、少なくとも入力される音声を文字列に変換して出力する。なお、音声認識装置100が出力する音声認識結果には、入力音声で表現された言葉を示す文字列だけでなく、その文字列における語句の区切り等の文法情報を含んでいてもよい。
データ処理装置200は、音声認識装置100から入力される音声認識結果の文字列を必要に応じて修正しつつ、各文字入出力装置300に出力するための制御を行う。データ処理装置200は、認識結果補正手段210と、モード設定手段220と、文章加工手段230と、文章編集手段240と、画面制御手段250とを含む。
認識結果補正手段210は、音声認識装置100によって得られた文字列情報に対し、誤変換等の表記レベルでの誤りを補正する。なお、認識結果補正手段210は、上述の表記レベル補正手段11の機能を実現する処理手段である。
モード設定手段220は、読み手毎に、文章の表示モードを設定する。本実施形態では、文章の表示モードとして、詳細モード,字幕(要約)モード,簡易モードを用意する。詳細モードは、入力音声で表現された文章をそのままの形式で表示するモードである。字幕モードは、入力音声で表現された文章を字幕のように要約した形式で表示するモードである。簡易モードは、入力音声で表現された文章において情報獲得のポイントとなるキーワードを列挙する形式で表示するモードである。モード設定手段220は、例えば、読み手からの要求に応じて、該読み手における文章の表示モードを設定する。なお、モード設定手段220は、上述のモード設定手段17の機能を実現する処理手段である。
文章加工手段230は、各モードに即した文章の加工を行う。なお、文章加工手段230は、上述のモード設定手段17の機能を実現する処理手段である。
文章編集手段240は、文章加工手段230が加工した文章に対し、オペレータからの修正操作に応じて編集を実施する。なお、文章編集手段240は、上述の修正指示受け付け手段の機能を実現する処理手段である。
画面制御手段250は、所定のタイミングで、音声認識結果の文字列から生成される文章を、各文字入出力装置300に表示させるための処理を行う。なお、画面制御手段250が行う処理には、各文字入出力装置300に、文章編集手段240によって編集(修正)された部分の更新を行わせるための処理を含む。本実施形態では、画面制御手段250は、認識結果補正手段210による補正が完了した時点で各文字入出力装置300に文章を表示させ、その後、読み手毎に文章の表示モードが設定された際や文章編集手段240によって文章の編集が行われた際に、その旨およびその箇所がわかるように再表示させる。なお、画面制御手段250は、上述の補正文章表示手段12、画面更新手段14、および加工文章表示手段16の機能を実現する処理手段である。
文字入出力装置300は、データ処理装置200で補正、加工、編集された文章を表示したり、その文章に対する操作を入力するための入出力装置である。文字入出力装置300は、例えば、ディスプレイ装置等の出力装置と、マウスやキーボード等の入力装置とを備えたネットワーク通信機能を有するパーソナルコンピュータ(PC)によって実現される。実施形態では、2台のPCを配置する例を用いて説明する。ここでは、2台のうちの1台でオペレータが文字編集支援を行い、残りの1台で、音声による情報の獲得が困難な利用者(読み手)が修正文章の閲覧を行うものとする。なお、オペレータ用に2台以上配置したり、読み手用に2台以上配置することも可能である。また、文字入出力装置300を実現するPCのCPUの一つが、データ処理装置200を実現するといった構成も可能である。
次に、本実施形態の動作について説明する。図4は、文章修正支援システム1000の動作例を示すフローチャートである。なお、図4に示す例では、データ処理装置200が、一連の文字列情報(例えば、人間が人前で話をするときに、次に一息つくまでの長さ程度に区切った文章についての文字列情報)を単位に、ステップS10〜S70の処理を繰り返し行うループ構造となっている。なお、ステップS60,S70については、ループ構造から離れ、オペレータからの操作に応じたタイミングで処理するようにしてもよい。
なお、図示省略しているが、まず音声認識装置100に、人間が発声発語した音声が入力される。音声認識装置100は、音声認識処理によって入力された音声を、該音声の文章化表現データである文字列情報に変換して、データ処理装置200に出力する。なお、文字列情報には、音声を文章表記した際の文字列の情報だけでなく、読みや語句の区切りの情報等が含まれるものとする。
データ処理装置200では、認識結果補正手段210が、音声認識装置100から出力される文字列情報を入力情報として、該文字列情報で示される音声認識装置100の認識結果である文章を補正する(ステップS10)。なお、認識結果補正手段210が補正した文章を示す文字列情報は、加工文章表示のための元データとして文章加工手段230に入力される。
認識結果補正手段210は、文字列情報で示される文章に対し、誤変換等の表記レベルでの誤りを補正する。なお、表記レベルでの誤りとは、同音異義語のような日本語(単語)としては存在する言葉であるが、表記された文章としては誤りであるものをいう。
本実施例では、認識結果補正手段210は、単語辞書を有し、その単語辞書と照合することによって、表記レベルでの誤りを補正する。なお、本実施例では、単語辞書で照合できる範囲での補正を行うのみとし、前後の文脈から判断するような補正は行わない。そのような補正は、文章加工手段230で既存の発明を活用したり、オペレータによる修正指示によって補う。
一連の文字列情報に対し、認識結果補正手段210による補正が完了すると、画面制御手段250は、認識結果補正手段210によって得られた補正後の文章を第1次文章として、各文字入出力装置300の画面に表示させる(ステップS20)。例えば、予め各文字入出力装置300を当該データ処理装置200にアクセスさせておき、画面制御手段250は、その際ダウンロードさせた端末用アプリケーションソフトウェアに対して、補正後の文章の文字列情報を含む画面更新要求メッセージを送信することによって、各文字入出力装置300の画面に補正後の文章を表示させてもよい。また、例えば、周期的に自動更新を行う処理を組み込んだWebページの画面情報を予め用意しておき、各文字入出力装置300に、そのWebページにアクセスさせておくことによって、各文字入出力装置300からの自動更新要求に応じて補正後の文章をそのWebページに反映(掲載)させることによって、表示させてもよい。
ここでは、その後のモード設定手段220や文章編集手段240の処理が、読み手やオペレータの介在(操作)を必要とすることにより、情報獲得の面で、数十秒程度のタイムロスを生じる可能性が高いことを考慮して、少しでも早く状況(話されている内容の要点)の把握を可能にさせるために、読み手やオペレータからの操作を待たずに、第一次文章として表示させている。図5は、文字入出力装置300に表示させる画面の一例を示す説明図である。画面制御手段250は、例えば、図5に示すように、第一次文章を画面の上段に表示させ、その後加工された文章や編集された文章を第二次文章として画面の下段に表示させるなど、リアルタイム性を損なわずに、かつ正しい情報の把握がしやすい構成で表示させる。
次に、モード設定手段220は、読み手からの要請に応じて、読み手毎に文章表示モードを設定する(ステップS30)。本例では、文章表示モードとして、大まかな情報を提供するレベルの「簡易モード」と、字幕と同様のレベルの「字幕モード」と、認識結果をより洗練化した「詳細モード」を用意し、その三種類から選択可能な構成とする。モード設定手段220は、文字入出力装置300において読み手が指定した文章表示モードをイベントとして受け取り、当該データ処理装置200で管理(保持)している読み手別文章表示モードを設定したり、その設定を変更したりする。そして、設定されたモードに応じた加工文章を出力するための処理を行う。例えば、文章加工手段230に、ある文字入出力装置300がモードの設定または変更をした旨を通知したりする。
なお、オペレータ用端末として使用される文字入出力装置300に対しては、モードを複数設定可能としてもよい。例えば、1台のオペレータ用端末で文章の編集を行う場合には、各モードに応じた加工文章をその1台のオペレータ用端末に全て表示させる。なお、詳細モードのみをオペレータにチェックさせ、その詳細モードに対する修正を、他のモードに反映させるといった方法も可能である。
次に、文章加工手段230が、モード設定手段220によって設定された各読み手のモードに合わせ、文章(ここでは、認識結果補正手段210によって補正された文章)を加工する(ステップS40)。「簡易モード」の場合には、例えば、特開2005−107793号公報に開示されているキーワード抽出方法を適用して、情報獲得のポイントとなりうるキーワードを列挙する形式で表記される文字列情報を生成してもよい。また、「字幕モード」の場合には、例えば、特開2007−233823号公報に開示されている自動要約装置を適用して、字幕のように要約された形式で表記される文字列情報を生成してもよい。また、「詳細モード」の場合には、例えば、特開平11−171058号公報に開示されている文章処理装置を適用して、認識結果をさらに正しい日本語として読める程度に洗練化した形式で表記される文字列情報を生成してもよい。
なお、モード設定手段220からの通知を待たずに、各モードに応じた加工文章を生成する処理を先行して行い、モード設定手段220からの通知がされた際に、画面制御手段250に対してその読み手に対して設定されたモードに応じた加工文章を出力するようにしてもよい。また、例えば、予めモードの初期値を設定しておき、読み手からの切り替え要請(イベント)がくるまでは、現在設定されているモードで処理を進めるようにしてもよい。なお、読み手から切り替え要請があった場合には、ステップS30以降の処理を再度行うようにすればよい。
一連の文字列情報に対し、文章加工手段230によって、ある読み手が設定したモードに応じた文章の加工が完了すると、画面制御手段250は、文章加工手段230によって得られたその読み手の文章表示モードに応じた加工後の文章を第2次文章として、該読み手が使用している文字入出力装置300の画面に表示させる(ステップS50)。なお、第2次文章の画面表示に係る処理は、ステップS20と同様でよい。例えば、画面制御手段250は、対象とした文字入出力装置300にインストールされている端末用アプリケーションソフトウェアに対して、加工後の文章の文字列情報を含む画面更新要求メッセージを送信することによって、該文字入出力装置300の画面に加工後の文章を追加表示させてもよい。また、例えば、対象とした文字入出力装置300からのWebページの画面情報に従って行われる自動更新要求に応じて加工後の文章をそのWebページに反映(掲載)させることによって、追加表示させてもよい。なお、第2次文章を表示する際には、既に表示中の第1次文章と対応づけて表示させることが好ましい。
次に、文章編集手段240が、オペレータ用端末として使用されている文字入出力装置300からの文章の修正指示を受け付け、その指示に従い、文章を編集する(ステップS60)。文章編集手段240は、例えば、オペレータ操作に応じて入力される、表示文章に対する範囲の設定を示す情報を受け付けると、その設定範囲の情報を記憶するとともに、その設定範囲内の文字列に対する修正文字列の入力を行わせるようにしてもよい。そして、入力された設定範囲内の修正文字列の情報を受け取ればよい。文章編集手段240は、例えば、オペレータ用端末で表示させる画面情報に、表示文章に対して範囲の設定操作を受け付けて修正文字列を入力させる機能を組み込んでおき、画面操作に応じて必要な情報が当該データ処理装置200に送信されるようにし、それを受信してもよい。なお、オペレータ用端末に対するステップS20およびステップS50の画面制御処理を文章編集手段240が行うようにしてもよい。
また、文章編集手段240は、修正が確定した時点で、画面制御手段250に対して、修正による文章の編集部分の画面更新を指示する。
画面制御手段250は、オペレータからの修正指示により文章編集手段240によって編集された箇所がわかるように、各文字入出力装置300の画面表示を更新させる(ステップS70)。画面制御手段250は、例えば、編集箇所に関する情報(例えば、修正後の内容、修正範囲の始点位置、長さ、該当文章の送信カウンタ等)を含む画面更新要求メッセージを送信することによって、各文字入出力装置300の画面に編集後の文章を、その箇所がわかるように表示させてもよい。なお、送信カウンタは、一連の文章として処理される単位での文章を識別するための情報であって、例えば、ステップS20による文字列情報の送信が行われる度に、該文字列情報を識別するために割り当てられる番号である。各文字入出力装置300は、データ処理装置200から送信された送信カウンタを元に、更新をかける対象の加工文章を追跡し、その上で、送信された始点位置と長さで示される範囲の文字列をオペレータによる修正内容に上書きすればよい。その際、他の文字列と区別した表現(他の文字列と異なる色等)を用いる。
また、例えば、画面制御手段250は、各文字入出力装置300で表示しているWebページの画面情報に従ってなされる自動更新要求に応じて、そのWebページに、最新の編集後の文章を編集箇所を強調しつつ反映(掲載)させることによって、画面表示を更新させてもよい。
以下、具体的な例を用いて本実施形態の動作を説明する。図6は、文章修正支援システム1000の実施イメージの一例を示す説明図である。なお、図6に示す例では、音声認識装置100およびデータ処理装置200としてマイクロフォンに接続されるサーバを用いる。また、読み手用の文字入出力装置300(読み手用端末)として、そのサーバとLAN等のネットワークを介して接続されるPCを用いる。また、オペレータ用の文字入出力装置300(オペレータ用端末)として、そのサーバとネットワークを介して接続されるPCを用いる。本例では、音声認識装置100は、サーバが有する既存の音声ワープロ機能(音声を文字列に変換する機能)をもつソフトウェア(より具体的には、そのソフトウェアに従って動作するCPU)によって実現されている。また、データ処理装置200は、サーバが有する文章修正機能(データ処理装置200の各処理手段の機能)をもつソフトウェアによって実現されている。なお、文章修正機能をもつソフトウェアは、音声ワープロ機能をもつソフトウェアのプラグイン・ソフトウェアとして実装されているものとする。
また、文字入出力装置300を実現する各PCは、TCP/IP等の通信プロトコルに基づいた通信が可能とする。また、サーバと通信を行って画面表示を更新したり、修正指示を通知したりするクライアントソフトウェアがインストールされていてもよい。なお、特別なクライアントソフトウェアを用意せずに、ブラウザ等の既存のソフトウェアを利用することも可能である。
サーバでは、スピーカから出力される音声の情報がマイクロフォンを介して入力され、音声認識装置100を実現する音声ワープロ機能をもつソフトウェアが、音声認識処理を行うことにより文字列情報に変換する。変換された文字列情報は、逐次、データ処理装置200を実現する文章修正機能をもつソフトウェアに入力される。
文字列情報が入力されると、文章修正機能をもつソフトウェアによって実現される認識結果補正手段210が、補正処理を行う。ここでは、「すでにつうちぶんなどでごれんらくのとおり、ろくがつよっかげつようびごぜんじゅうじごふんから、にせんななねんどほんしゃびるぼうさいくんれんをじっしいたします。」と発声されたことに対し、「素手に通知文などでご連絡のとうり、6月4日月曜日午前10時5分から、2007年度御社ビル防災訓練を実施いたします。」という文章を示す文字列情報が音声認識結果として出力された場合を例に説明する。
図7は、認識結果補正手段210の補正処理の一例を示すフローチャートである。認識結果補正手段210は、上記音声認識装置100から出力された文字列情報に含まれる語句一つひとつについて、図7に示すフローチャートに沿って一連の処理を行うことにより、補正後の文章である第1次文章(より具体的には第1次文章を示す文字列情報)を生成する。ここでは、上記音声認識装置100から出力された文字列情報に含まれる語句一つひとつについて、単語辞書との照合を行い文書として日本語が正しく使用されているかどうかを判別し、日本語として誤りである語句、または誤りであることが判別できない語句を、一旦ひらがなに変換することによって、第1次文章を生成する。
図8は、単語辞書のフォーマットの一例を示す説明図である。単語辞書には、各単語について、その読みと表記文字列とが対応づけられて登録されている。図8に示す例では、各単語の情報をword[][][]という形式で登録している。なお、word[][][]の最初の配列添字は、先頭文字(読み)を特定するための番号が割り当てられている。例えば、「あ」から始まる単語は、word[11][][]として登録される。また、「い」から始まる単語は、word[12][][]として登録される。また、「お」から始まる単語は、word[15][][]として登録される。また、「か」から始まる単語は、word[21][][]として登録される。また、「さ」から始まる単語は、word[31][][]として登録される。すなわち、図8に示す例では、最初の配列添字の番号の十の位が、50音順における子音の順番に対応し、一の位が、母音の順番に対応している。なお、子音と母音とを分けずに、50音順の各音に順番に番号を割り振って配列添字の番号としてもよい。
また、次の配列添字は、所定の文字(読み)から始まる単語について、その最初の表記文字を特定するための番号が割り当てられている。例えば、word[11][1][]には、最初の表記文字が「愛」である単語が登録される。また、word[11][2][]には、最初の表記文字が「藍」である単語が登録される。なお、最初の表記文字別に配列添字を用いず、よみの50音順で並べて登録するようにしてもよい。
また、単語辞書には、誤用句として、発声される単語と表記される単語とで読みが異なるような単語について、発声単語のよみと表記文字列とを対応づけて登録するようにしてもよい。図8に示す例では、誤用句登録単語として、発声単語のよみ「とうり」と表記文字列「とおり」とを対応づけて登録する例が示されている。
また、単語辞書には、各単語のかかりや受けといった組み合わせ確率の高い単語や表現の情報を含んでいてもよい。
まず、認識結果補正手段210は、図7に示すように、音声認識装置100によって出力された文章(文字列情報)を入力情報とするため、入力バッファにて情報をフェッチする(ステップS101)。フェッチ時に、当該文章をいくつかの単語に分解し、分解した単語ごとに以下の走査を行っていく。すなわち、認識結果補正手段210は、分解した単語の個数分、ステップS103〜S108の走査処理をループする(ステップS102)。以下、現在走査を行っている単語を単語Xという。
ループ内の走査処理として、認識結果補正手段210は、まず、単語Xの先頭文字が何であるかを識別する(ステップS103)。次に、識別された文字を元に、単語辞書との照合を行う(ステップS104)。例えば、「素手」という単語Xが走査されている場合には、ステップS103で先頭文字が「す」であると識別され、その「す」を元に単語辞書での照合を行えばよい。図8に示す例では、先頭文字「す」の登録単語である照合先として、word[33][][]の部分についてのみ走査をかければよい。
先頭文字が一致する単語が登録されている場合(ステップS105のYes)、その先頭文字で始まる登録単語を順番に走査して次の処理を行う(ステップS106)。ここでは、認識結果補正手段210は、照合対象である単語Xと照合先となった登録単語とが一致するか否かを確認し(ステップS107)、一致しない場合には照合先を次の登録単語へ移行してステップS107に戻ることで同様の処理を繰り返す(ステップS108)。
一方、照合対象である単語Xと照合先となった登録単語とが一致する場合には、単語辞書にその登録単語の同音異義語が存在するか否かを判定する(ステップS109)。同音異義語が存在する場合、単語Xは日本語として曖昧性を含んでいるとみなし、単語Xをひらがな表記に変換する(ステップS110)。一方、同音異義語が存在しない場合には、そのまま登録単語での表記とする(ステップS111)。
認識結果補正手段210は、例えば、照合先となった配列群(ここでは、word[33][][])の中に、単語Xと同一な単語が登録されている配列が存在するか否かを判別し、存在していた場合、それに加えて同じ読み方をする別の配列が存在するか否かを判別すればよい。図8に示す例では、単語Xが「素手」である場合に、word[33][1][0]として登録されている「素手」が単語Xと一致したと判別され、さらに、word[33][2][0]として登録されている「既」が単語Xの同音異義語であると判別される。このような場合には、認識結果の「素手」をひらがなの「すで」に入れ替える処理を行う。
また、ステップS104において、単語Xの先頭文字による照合で一致しなかった場合には(ステップS105のNo)、そもそも正確な日本語ではないとみなし、単語Xが漢字表現であれば文章をよみにくくする原因となることを考慮し、ここでは、ひらがなでの表記に変換する(ステップS112)。なお、正確な日本語であっても、難しい漢字である場合には単語辞書には登録しないようにし、ひらがなでの表記に変換させるという方法も可能である。
また、ステップS106〜ステップS108の走査処理を繰り返す中で、照合先となった配列群(単語Xと先頭文字が一致する単語群)に、単語Xと一致するものが存在しないまま走査処理を終えた場合についても、単語Xが正確な日本語ではないとみなし、ひらがなでの表記に変換する(ステップS112)。
単語Xについて、上記一連の処理が終了すると、照合対象(単語X)を次の分解された単語に移し、ステップS103に戻ることで同様の処理を繰り返す(ステップS113)。
なお、ここでは、音声認識装置100による音声認識結果である文章が漢字かな混じりの形式で表現されていることを基本としつつ、内部情報として、ひらがなのみの文章の情報を併せ持つことを前提としている。よってステップS110およびS112の処理において、当該漢字が、ひらがなのみの文章のどの部分に対応するかをパターン照合によって抽出することにより変換すればよい。なお、音声認識結果がひらがなの形式で表現されている場合には、ステップS107において、登録単語の読みとの照合を行うようにすればよい。
また、「とうり」のような慣用句については、「とうり」は正しくは「とおり」と表記することを単語辞書に事前に登録しておき、照合するようにすればよい。
本例では、本来「既に」、「とおり」、「防災」と表記される部分が、それぞれ「素手に」、「とうり」、「亡妻」と認識されており、日本語として意味が通りづらくなっている。認識結果補正手段210は、「素手に」という語句について、単語辞書によって「素手に」と「既に」の2通りに変換できることを確認して、その双方とも文脈を確認しない限り日本語として誤りであるか否かを判別することができない性質のものと認識し、ここでは、一旦「すでに」というひらがなに変換する。
また、「とうり」という語句は、一般的な語句として単語辞書に登録されていない語句として確認し、かつ単語辞書において「とおり」の表記誤りと認識することにより、ここでは、「とおり」に変換する。
また、「亡妻」については、次に続く語句が「訓練」であることを認識した上で、単語辞書との照合により、「防災」に変換される。最終的には、認識結果補正手段210によって「既に通知文などでご連絡のとおり、6月4日月曜日午前10時5分から、2007年度御社ビル防災訓練を実施いたします。」という文章に補正されることになる。なお、この段階では、「本社」を「御社」と認識されている点については補正されないでいる。
認識結果補正手段210による補正が完了すると、画面制御手段250が各文字入出力装置300に、補正後の文章を第1次文章として表示させる。なお、図9に示すように、音声認識装置100による音声認識結果を得た時点で、音声認識結果(第0次文章)をそのまま表示させ、補正後の文章を詳細モード(デフォルトモード)として即時表示させることも可能である。そのような場合には、文章加工手段230の詳細モードに対する加工処理は省略される。
なお、表示画面において、画面の上部、下部とも文章が長くなって表示領域からあふれた場合には、上へスクロールし、新しい文章が下の方から表示させることでより見やすくする。
ここで、読み手が、画面中央部に設けてあるモード一覧から「簡易モード」または「字幕モード」を選択したとする。その読み手が使用している読み手用端末としての文字入出力装置300が、読み手からの画面操作に応じて、モード変更イベントをサーバ(データ処理装置200)に通知する。データ処理装置200では、モード設定手段220が、そのモード変更イベント通知によって、モードの設定が行われ、変更後のモードに即した文章がその文字入出力装置300に表示されることになる。
文章加工手段230は、モード設定手段220によるモードの設定を受けて、設定されたモードの状態を認知し、そのモードに応じて加工された文章を出力すればよい。
なお、図10は、字幕モードが設定された状態での文字入出力装置300における画面表示の例を示す説明図である。また、図11は、簡易モードが設定された状態での文字入出力装置300における画面表示の一例を示す説明図である。
文章編集手段240は、文章加工手段230による加工文書の出力をトリガに動作を開始する。本例では、事前にLAN接続等によって読み手用端末とオペレータ用端末とサーバとが通信可能な状態になっているため、読み手用端末の画面に加工文章が出力されるたびに、オペレータ用端末にも同一の文章による加工文章が表示されるものとする。また、一連の処理が行われる文章を単位に送信し、送信が行われる度に送信カウンタを1つずつ増やしている構成とする。
文章編集手段240または画面制御手段250は、オペレータ用端末に対して、画面下部に表示される加工文章部分が編集可能に表示させる。以降、文章編集手段240は、図12に示す処理フローに沿って編集処理を行う。
図12は、文章編集手段240による編集処理の一例を示すフローチャートである。ここでは、オペレータが、オペレータ用端末の画面に表示される加工文章を見て、修正すべき箇所があると判断した場合に、当該部分をマウス等で範囲設定を行う。オペレータ用端末では、オペレータからの画面操作に応じて、範囲設定通知イベントをサーバ(データ処理装置200)に通知する。例えば、範囲設定された領域の先頭位置(文字単位)と、長さ、当該加工文章の送信カウンタを含む範囲設定通知イベントをデータ処理装置200に送信する。図13は、オペレータ用端末における範囲設定操作にかかる画面イメージの例を示す説明図である。
データ処理装置200では、文章編集手段240が、その範囲設定通知イベントを受け取る(ステップS201)。文章編集手段240は、範囲設定を受け付けた応答を、そのオペレータ用端末に返信し、その範囲内での正しい文章を入力させるための画面表示を該オペレータ用端末に行わせる(ステップS202)。
そして、オペレータ用端末では、オペレータからの設定範囲に対する正しい文章の入力を受け付け、受け付けた修正文章をサーバに送信する。図14は、オペレータ用端末における修正文章入力操作にかかる画面イメージの例を示す説明図である。
図14に示す例では、オペレータが、入力した文章に誤りがないことを確認し、キーボード上のEnterキーを押下することにより、範囲指定箇所の修正文章がデータ処理装置200に送信される。ここでは、「御社」と表記されている箇所を「本社」に修正する指示を行っている。
データ処理装置200の文章編集手段240は、範囲指定箇所の修正文章を受信すると(ステップS203)、その修正文章を加工文章に反映させることにより、文章を編集する(ステップS204)。なお、文章編集手段240は、修正個所が他のモードでも表示されている文字を含んでいる場合には、他のモードにおける該当個所もあわせて編集する。そして、画面制御手段250に、編集後の文章に対応した画面更新をさせる(ステップS205)。
画面制御手段250は、例えば、文章編集手段240によって編集された修正個所に関する内容、当該範囲の始点位置、長さ、文章の送信カウンタを元に、更新をかける対象の加工文章を追跡し、その上で、各文字入出力装置300に送信した文字単位の始点位置、長さ情報に該当する部分をシークする。ここでは、シールした位置から、オペレータによる修正内容を元と異なる色(例えば、赤色)で上書きする。
オペレータによる編集操作は、読み手用端末の画面上では一切見えない状態で行わせる。そうすることによって、読み手は現在表示されている文章をよむことのみに集中できる環境が形成される。そして、オペレータによる編集操作が確定した時点で、修正すべき部分を色分けした形式で更新表示させる。なお、図14に示す例では、反転表示させる例を示しているが、この修正後の画面イメージは、画面制御手段250の画面更新処理により読み手用端末に対しても適用される。
また、読み手用端末の画面において、更新をかけた箇所がスクロールされて見えなくなっている場合には、修正文章の表示欄の右側に「※」マークを表示させるなど、更新された文章がある旨を読み手に知らせるようにしてもよい。
なお、本例において、オペレータは、音声認識装置100に入力される元の音声を聴ける環境にいて、かつ音声のみでほぼ意味、背景、状況を理解可能な人を配置する。
また、例えば、簡易/字幕(要約)/詳細のそれぞれのモードに応じてオペレータを配置し、各モードでの編集作業を行わせてもよい。例えば、図15に示すように、字幕モードを担当するオペレータでは、字幕としての文章の表現についても確認をするなどの実施方法が考えられる。図15に示す例では、「実施いたします」となっている語尾の「いたします」を「します」に修正する指示を行っている。
以上のように、本実施形態によれば、音声認識が行われる際、マイクロフォンに音源以外の雑音が入りやすい環境等により、誤変換をおこないやすい場合であっても、その「ゆれ」を可能な限り文章編集支援等の処理を経て、より確度の高い文章として出力することができる。本発明では、支援のためのオペレータを介した必要最小限のヒューマンインタフェースのあり方も一つの構成として提案している。人手による支援を含むことにより、明らかに誤りとわかる文章の識別がしやすい構成となっているとともに、リアルタイム性を損なわないよう提示するための表示制御を行っている。結果、音声でしか情報を得られない環境であっても、すばやい状況判断がしやすくなり、特に、聴覚障害者にとっても自主的なコミュニケーションがとりやすい土壌が形成される。
例えば、音声でしか情報を得られない環境では、聴覚障害者にとっては、例えば今、どこで何が起こっているのか、今、誰が、何がおかしくて笑っているのか、また、今、誰が何に対して何の意見を述べているのかというようなことすらも把握できず、いちいち周りの人に状況を筆談等で説明してもらうようにアクションを起こさなければならないが、本発明を利用すれば、リアルタイム性を損なわずに、状況判断に必要な情報を得ることができる。
なお、コンピュータ処理だけで、精度よく誤りか否かを判断しようとすると、ある程度の長さの文章が必要になったり、処理時間がかかったりといった問題が生じるが、本実施形態では、あいまいなものについては一旦ひらがなに変換し、その上でオペレータによる修正指示を受け付けるようになっているため、より短いスパンで、認識性を低下させる可能性のある変換結果を排除した文章を出力することができる。
また、音声認識処理によって多量に出力される文字列情報から、曖昧さや冗長さ等を排除し、よりわかりやすい形で情報を提供することができる。発声された文章に対し、どのレベルで表示させるかを当事者の判断で設定することができるので、当事者の要請、スキル等に応じて、映画字幕のレベルに落とし込むか、またはもっと簡便に、箇条書きレベルまで落とし込むか等を決定できるため、当事者がストレスをためることなく、音声しか流れない環境であっても、ごく自然な形で情報を獲得する環境を形成することができる。
本発明は、音声認識結果として出力される文字列情報で示される文章に限らず、リアルタイムで更新される文章を対象にするシステムであれば、好適に適用可能である。
1 データ処理装置
11 表記レベル補正手段
12 補正文章表示手段
13 修正指示受け付け手段
14 画面更新手段
15 文章加工手段
16 加工文章表示手段
17 モード設定手段
100 音声認識装置
200 データ処理装置
210 認識結果補正手段
220 モード設定手段
230 文章加工手段
240 文章編集手段
250 画面制御手段
300 文字入出力装置
11 表記レベル補正手段
12 補正文章表示手段
13 修正指示受け付け手段
14 画面更新手段
15 文章加工手段
16 加工文章表示手段
17 モード設定手段
100 音声認識装置
200 データ処理装置
210 認識結果補正手段
220 モード設定手段
230 文章加工手段
240 文章編集手段
250 画面制御手段
300 文字入出力装置
Claims (10)
- 音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援システムであって、
音声の文章化表現データである文字列情報が入力されるデータ処理装置と、読み手が使用する1台以上の読み手用端末と、オペレータが使用する1台以上のオペレータ用端末とを備え、
前記データ処理装置は、
入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する表記レベル補正手段と、
前記表記レベル補正手段によって生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる補正文章表示手段と、
オペレータ用端末から、オペレータの操作による表示中の文章に対する修正指示を受け付ける修正指示受け付け手段と、
各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた修正指示による修正を、修正個所を特定可能に反映させる画面更新手段とを備えた
ことを特徴とする文章修正支援システム。 - 補正文章を予め定められた表示モードに応じて加工した加工文章を生成する文章加工手段と、
表示中の補正文章と対応づけて、各読み手が使用している読み手用端末の画面に、該読み手に対し設定されている表示モードに即した加工文章を表示させるとともに、オペレータ用端末の画面に、少なくとも読み手用端末に表示させた表示モードに即した加工文章を表示させる加工文章表示手段とを備え、
修正指示受け付け手段は、オペレータ用端末から、オペレータの操作による前記加工文章に対する修正指示を受け付け、
画面更新手段は、各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた前記加工文章に対する修正指示による修正を、修正箇所を特定可能に反映させる
請求項1に記載の文章修正支援システム。 - 表記レベル補正手段は、文字列情報で示される文章に含まれる各単語について、予め登録されている単語辞書との照合を行い、単語辞書に登録されていない場合に、当該単語に表記レベルでの誤りの可能性があるとして、当該単語をひらがなに変換することによって補正文章を生成する
請求項1または請求項2に記載の文章修正支援システム。 - 表記レベル補正手段は、文字列情報で示される文章に含まれる各単語について、予め登録されている単語辞書との照合を行い、単語辞書におなじ読みをもつ異なる表記の単語が登録されている場合に、当該単語に表記レベルでの誤りの可能性があるとして、当該単語をひらがなに変換することによって補正文書を生成する
請求項1から請求項3のうちのいずれか1項に記載の文章修正支援システム。 - 読み手用端末から、読み手の操作による表示モードの切り替え指示を受け付けるモード設定手段を備え、
加工文章表示手段は、前記モード設定手段が表示モードの切り替え指示を受け付けると、少なくとも要求元の読み手用端末に、該読み手に対し設定されている表示モードに即した加工文章を表示させる
請求項2から請求項4のうちのいずれか1項に記載の文章修正支援システム。 - 表示モードとして、発声内容とほぼ同一の内容を提示する詳細モードと、発声内容から冗長さを排除した字幕モードと、発声内容の要点を箇条書きで提示する簡易モードとを備える
請求項2から請求項5のうちのいずれか1項に記載の文章修正支援システム。 - 音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援方法であって、
音声の文章化表現データである文字列情報が入力されるデータ処理装置が、
入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成し、
生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させ、
オペレータ用端末から、オペレータ操作による表示中の文章に対する修正指示を受け付け、
各読み手用端末および各オペレータ用端末の画面に、オペレータ用端末から受け付けた修正指示による修正を、修正個所を特定可能に反映させる
ことを特徴とする文章修正支援方法。 - 補正文章を予め定められた表示モードに応じて加工した加工文章を生成し、
表示中の補正文章と対応づけて、各読み手が使用している読み手用端末の画面に、該読み手に対し設定されている表示モードに即した加工文章を表示させるとともに、オペレータ用端末の画面に、少なくとも読み手用端末に表示させた表示モードに即した加工文章を表示させ、
オペレータ用端末から、オペレータの操作による前記加工文章に対する修正指示を受け付け、
各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた前記加工文章に対する修正指示による修正を、修正箇所を特定可能に反映させる
請求項7に記載の文章修正支援方法。 - 音声認識処理によって得られる音声の文章化表現データである文字列情報で示される文章を、読み手が理解しやすい文章にして提示するための文章修正支援用プログラムであって、
音声の文章化表現データである文字列情報が入力されるデータ処理装置に適用される文章修正支援用プログラムにおいて、
コンピュータに、
入力される文字列情報で示される文章に対し、表記レベルでの誤りの可能性のある単語を補正した補正文章を生成する処理、
生成された補正文章を、各読み手用端末および各オペレータ用端末の画面に表示させる処理、
オペレータ用端末から、オペレータ操作による表示中の文章に対する修正指示を受け付ける処理、および
各読み手用端末および各オペレータ用端末の画面に、オペレータ用端末から受け付けた修正指示による修正を、修正個所を特定可能に反映させる処理
を実行させるための文章修正支援用プログラム。 - コンピュータに、
補正文章を予め定められた表示モードに応じて加工した第2次文章を生成する処理、
表示中の補正文章と対応づけて、各読み手が使用している読み手用端末の画面に、該読み手に対し設定されている表示モードに即した加工文章を表示させるとともに、オペレータ用端末の画面に、少なくとも読み手用端末に表示させた表示モードに即した加工文章を表示させる処理、
オペレータ用端末から、オペレータの操作による前記加工文章に対する修正指示を受け付ける処理、および
各読み手用端末および各オペレータ用端末の画面に、前記修正指示受け付け手段が受け付けた前記加工文章に対する修正指示による修正を、修正箇所を特定可能に反映させる処理を実行させる
請求項9に記載の文章修正支援用プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008027471A JP2009187349A (ja) | 2008-02-07 | 2008-02-07 | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008027471A JP2009187349A (ja) | 2008-02-07 | 2008-02-07 | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009187349A true JP2009187349A (ja) | 2009-08-20 |
Family
ID=41070513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008027471A Pending JP2009187349A (ja) | 2008-02-07 | 2008-02-07 | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009187349A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011064829A1 (ja) * | 2009-11-30 | 2011-06-03 | 株式会社 東芝 | 情報処理装置 |
JP2012013915A (ja) * | 2010-06-30 | 2012-01-19 | Humminglish Academy Llc | 学習用教材および教材情報出力装置 |
JP2017161850A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 会議支援装置、会議支援方法、及び会議支援プログラム |
WO2018020759A1 (ja) * | 2016-07-26 | 2018-02-01 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
US10276150B2 (en) | 2016-09-12 | 2019-04-30 | Kabushiki Kaisha Toshiba | Correction system, method of correction, and computer program product |
CN109740142A (zh) * | 2018-04-20 | 2019-05-10 | 北京字节跳动网络技术有限公司 | 一种字符串纠错方法及装置 |
CN110517689A (zh) * | 2019-08-28 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置及存储介质 |
US10609455B2 (en) | 2017-03-21 | 2020-03-31 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing method, and computer program product |
JP2021092713A (ja) * | 2019-12-12 | 2021-06-17 | 三菱電機インフォメーションシステムズ株式会社 | 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム |
US11176943B2 (en) | 2017-09-21 | 2021-11-16 | Kabushiki Kaisha Toshiba | Voice recognition device, voice recognition method, and computer program product |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03260721A (ja) * | 1990-03-09 | 1991-11-20 | Matsushita Electric Ind Co Ltd | データ表示装置 |
JP2000010970A (ja) * | 1998-06-23 | 2000-01-14 | Just Syst Corp | 表記文字列変換装置および表記文字列変換方法 |
JP2003281101A (ja) * | 2002-03-19 | 2003-10-03 | Ricoh Co Ltd | 電子会議システム |
-
2008
- 2008-02-07 JP JP2008027471A patent/JP2009187349A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03260721A (ja) * | 1990-03-09 | 1991-11-20 | Matsushita Electric Ind Co Ltd | データ表示装置 |
JP2000010970A (ja) * | 1998-06-23 | 2000-01-14 | Just Syst Corp | 表記文字列変換装置および表記文字列変換方法 |
JP2003281101A (ja) * | 2002-03-19 | 2003-10-03 | Ricoh Co Ltd | 電子会議システム |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5535238B2 (ja) * | 2009-11-30 | 2014-07-02 | 株式会社東芝 | 情報処理装置 |
WO2011064829A1 (ja) * | 2009-11-30 | 2011-06-03 | 株式会社 東芝 | 情報処理装置 |
JP2012013915A (ja) * | 2010-06-30 | 2012-01-19 | Humminglish Academy Llc | 学習用教材および教材情報出力装置 |
JP2017161850A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 会議支援装置、会議支援方法、及び会議支援プログラム |
US10102859B2 (en) | 2016-03-11 | 2018-10-16 | Kabushiki Kaisha Toshiba | Conference support apparatus, conference support method, and computer program product |
JP7107219B2 (ja) | 2016-07-26 | 2022-07-27 | ソニーグループ株式会社 | 情報処理装置、および情報処理方法 |
WO2018020759A1 (ja) * | 2016-07-26 | 2018-02-01 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
JPWO2018020759A1 (ja) * | 2016-07-26 | 2019-05-09 | ソニー株式会社 | 情報処理装置、および情報処理方法 |
US10276150B2 (en) | 2016-09-12 | 2019-04-30 | Kabushiki Kaisha Toshiba | Correction system, method of correction, and computer program product |
US10609455B2 (en) | 2017-03-21 | 2020-03-31 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing method, and computer program product |
US11176943B2 (en) | 2017-09-21 | 2021-11-16 | Kabushiki Kaisha Toshiba | Voice recognition device, voice recognition method, and computer program product |
CN109740142A (zh) * | 2018-04-20 | 2019-05-10 | 北京字节跳动网络技术有限公司 | 一种字符串纠错方法及装置 |
CN110517689A (zh) * | 2019-08-28 | 2019-11-29 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置及存储介质 |
CN110517689B (zh) * | 2019-08-28 | 2023-11-24 | 腾讯科技(深圳)有限公司 | 一种语音数据处理方法、装置及存储介质 |
JP2021092713A (ja) * | 2019-12-12 | 2021-06-17 | 三菱電機インフォメーションシステムズ株式会社 | 修正候補特定装置、修正候補特定方法及び修正候補特定プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009187349A (ja) | 文章修正支援システム、文章修正支援方法、および文章修正支援用プログラム | |
KR101066741B1 (ko) | 컴퓨터 시스템과 동적으로 상호작용하기 위한 컴퓨터 구현 방법, 시스템, 및 컴퓨터 판독가능 기록 매체 | |
KR101042119B1 (ko) | 음성 이해 시스템, 및 컴퓨터 판독가능 기록 매체 | |
US6587822B2 (en) | Web-based platform for interactive voice response (IVR) | |
US8504350B2 (en) | User-interactive automatic translation device and method for mobile device | |
JP4089148B2 (ja) | 通訳サービス方法および通訳サービス装置 | |
US20040111272A1 (en) | Multimodal speech-to-speech language translation and display | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US20060136220A1 (en) | Controlling user interfaces with voice commands from multiple languages | |
US20060149551A1 (en) | Mobile dictation correction user interface | |
JP2011154099A (ja) | 音声認識装置で利用される音声認識用辞書、音声認識用言語モデルの学習方法 | |
US20200320976A1 (en) | Information processing apparatus, information processing method, and program | |
JP2004259238A (ja) | 自然言語解析における感情理解システム | |
US20060129398A1 (en) | Method and system for obtaining personal aliases through voice recognition | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
JPH10124293A (ja) | 音声指令可能なコンピュータとそれ用の媒体 | |
JP5300576B2 (ja) | 検索装置、検索方法、および検索プログラム | |
JP4808763B2 (ja) | 音声情報収集装置、その方法およびそのプログラム | |
KR100684160B1 (ko) | 개체명 인식을 이용한 대화 분석 장치 및 방법 | |
JP2010197709A (ja) | 音声認識応答方法、音声認識応答システム、及びそのプログラム | |
JP2000090087A (ja) | 通訳装置及び通訳装置の機能を発揮させるプログラムを記録した記録媒体 | |
JP3973496B2 (ja) | グループウェアにおけるユーザの対話支援装置 | |
JP2002279353A (ja) | 文字認識装置、その方法、および記録媒体 | |
JP2009086597A (ja) | テキスト音声変換サービスシステム及び方法 | |
JP2000047684A (ja) | 音声認識方法および音声サービス装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120119 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120207 |