JP2007108518A

JP2007108518A - 音声録音再生装置

Info

Publication number: JP2007108518A
Application number: JP2005300578A
Authority: JP
Inventors: Seiichiro Miki; 成一郎三木; Katsushi Tazaki; 克司田崎
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2005-10-14
Filing date: 2005-10-14
Publication date: 2007-04-26

Abstract

【課題】複数人の会話を録音した場合に、会話者の区別を自動で行い、特定者の会話内容のみを簡単な操作で自動再生可能とする。
【解決手段】複数のマイクロホン３，４からの入力音声を音声メモリ１９に録音（記録）する制御を行うとともに、音声メモリ１９に録音された録音データを再生する制御を行うコントローラ１を備えており、コントローラ１は、マイクロホン３，４から入力される音声の音量を計測する音量計測手段と、音量の計測結果に基づいて発話者を特定する発話者特定手段とを備えており、発話者特定手段により特定された発話者の切り替わったことを検出した場合に、録音データにマークを付与することで、再生時にはそのマークを利用して、選択された発話者の録音データを抽出再生する。
【選択図】図１

Description

本発明は、音声録音再生装置に係り、特に、複数人の会話を録音して、特定者の会話内容のみを再生することのできる音声録音再生装置に関する。

従来のボイスレコーダ等の音声録音再生装置は、録音した複数人の会話の中から、特定者の会話内容のみを再生することができるようになっており、そのための手法が種々提案されている（例えば、特許文献１〜３等参照）。

特許文献１に記載の音声通話録音方法は、公衆網に接続される音声通信システムにおける音声の通話録音方法に関するもので、音声の通話録音中に必要な部分にキー入力やマウス入力をすることで、録音データにデータ検出用のマークを挿入するものであり、このマークによってデータの検索を効率よく行えるようにしたものである。

また、特許文献２に記載のデジタル音声記録再生装置は、アンケート形式の質問と回答内容を記録する場合に、質問する内容を録音しておき、質問内容を再生するインデックスマークがあれば質問を再生し、その回答内容を録音した後に回答終了のインデックスマークを付与する操作を行うことで、音声の対話形式での録音・再生を効率的に行えるようになっている。

また、特許文献３に記載の音声録音再生装置は、複数人がそれぞれのマイクを用いて会話する際、各マイクを使用する際にスイッチを操作することで使用時間を管理し、発言時間をディスプレイに表示し、指示された箇所の発言内容を再生するものである。
特開平９−９８２１２号公報特開平９−２５９５９５号公報特開２００３−１２２３９７号公報

しかしながら、上記各文献の技術はいずれも、会話の録音時にインデックスマークを挿入する操作を行うことで特定者の会話を検索したり、各マイクの録音時間を管理することで特定者の会話を再生することができるものであり、インデックスを挿入したり、マイクのスイッチをオン・オフしたりする操作が必要であった。

本発明はかかる問題点を解決すべく創案されたもので、その目的は、複数人の会話を録音した場合に、会話者の区別を自動で行い、特定者の会話内容のみを自動再生することのできる音声録音再生装置を提供することにある。

上記課題を解決するため、本発明の音声録音再生装置は、複数のマイクロホンからの入力音声を録音する録音手段と、前記録音手段で録音された録音データを再生する再生手段とを有する音声録音再生装置において、前記録音手段から入力される音声の音量を計測する音量計測手段と、前記音量計測手段による音量の計測結果に基づいて発話者を特定する発話者特定手段と、前記発話者特定手段により特定された発話者の切り替わったことを検出する発話者切替検出手段とを備え、前記発話者切替検出手段で発話者の切り替わりを検出した場合に録音データにマークを付与することを特徴とする。

すなわち、本発明の音声録音再生装置では、音量計測手段による音量の計測結果に基づいて発話者を特定する発話者特定手段を備えており、この発話者特定手段により特定された発話者の切り替わったことを発話者切替検出手段で検出したときに、録音データの録音位置に自動的にマークを付与するようになっている。ここで、マークは、例えば録音開始からの録音時間を例えばマーカー用メモリ等に登録する。これにより、このマークを利用することで、録音データの再生時には、特定者の会話内容のみを自動再生することができる。

具体的には、前記発話者特定手段により特定された発話者の情報を録音データに付与する発話者情報付与手段と、発話者を選択する発話者選択手段とを更に備え、前記発話者情報付与手段により付与された発話者の情報の中で、前記発話者選択手段により選択された発話者の情報を検索し、検索された録音データを再生する構成とすることができる。また、前記発話者特定手段により特定された発話者の情報を録音データに付与する発話者情報付与手段と、発話者を選択する発話者選択手段とを更に備え、前記発話者情報付与手段により付与された発話者の情報の中で、前記発話者選択手段により選択された発話者の情報を検索し、検索された録音データをスキップして再生する構成とすることができる。

また、本発明の音声録音再生装置では、再生する時間を計測するタイマーをさらに備えており、前記発話者選択手段にて選択された発話者の録音データを再生する場合に、録音データのマークの位置から、タイマーによって計測される特定時間（例えば、５秒等）だけ再生するように構成してもよい。これにより、各発話者の会話内容の頭の部分だけが順次再生されるので、聴きたい内容のところをいち早く検索することができる。

ここで、前記発話者特定手段は、複数のマイクロホンから入力される音声の音量の比率により発話者を特定する構成とすることができる。複数のマイクロホンと複数の発話者との位置関係により、マイクロホンから入力される各発話者の音声の音量は異なるので、その差（比率）に基づいて発話者を特定することが可能である。

また、前記録音手段は、前記発話者特定手段により特定された発話者以外の入力音声を低く抑えて録音するように構成してもよい。発話者以外の入力音声には、通常ノイズが多く含まれることから、このノイズを低減することで、発話者の入力音声をより鮮明に録音することができ、再生したときにも非常に聞き取り易い音声再生が可能となる。

また、本発明の音声録音再生装置は、電話機による会話の音声を録音する録音手段と、前記録音手段で録音された録音データを再生する再生手段とを有する音声録音再生装置において、電話機の電話回線から発話される相手側の音声の音量及び当該電話機の発話者の音声の音量を計測する音量計測手段と、前記音量計測手段による音量の計測結果に基づいて、録音データの会話者が発話者側か相手側かを特定する会話者特定手段と、前記会話者特定手段により会話者が切り替わったことを検出する会話者切替検出手段とを備え、
前記会話者切替検出手段で会話者の切り替わりを検出した場合に、録音データにマークを付与することを特徴とする。

すなわち、本発明の音声録音再生装置では、音量計測手段による音量の計測結果に基づいて、録音データの会話者が発話者側か相手側かを特定する会話者特定手段を備えており、この会話者特定手段により特定された会話者の切り替わったことを会話者切替検出手段で検出したときに、録音データの録音位置に自動的にマークを付与するようになっている。ここで、マークは、例えば録音開始からの録音時間を例えばマーカー用メモリ等に登録する。これにより、このマークを利用することで、録音データの再生時には、特定者の会話内容のみを自動再生することができる。

具体的には、前記会話者特定手段により特定された会話者の情報を録音データに付与する会話者情報付与手段と、会話者を選択する会話者選択手段とを更に備え、前記会話者情報付与手段により付与された会話者の情報の中で、前記会話者選択手段により選択された会話者の情報を検索し、検索された録音データを再生する構成とすることができる。また、前記会話者特定手段により特定された会話者の情報を録音データに付与する会話者情報付与手段と、会話者を選択する会話者選択手段とを更に備え、前記会話者情報付与手段により付与された会話者の情報の中で、前記会話者選択手段により選択された会話者の情報を検索し、検索された録音データをスキップして再生する構成とすることができる。

また、本発明の音声録音再生装置では、再生する時間を計測するタイマーをさらに備えており、前記会話者選択手段にて選択された会話者の録音データを再生する場合に、録音データのマークの位置から、タイマーによって計測される特定時間（例えば、５秒等）だけ再生するように構成してもよい。これにより、各会話者の会話内容の頭の部分だけが順次再生されるので、聴きたい内容のところをいち早く検索することができる。

ここで、前記会話者特定手段は、電話回線から発話される相手側の音声の音量と当該電話機の発話者の音声の音量との比率により会話者を特定する構成とすることができる。例えば、電話回線から発話される相手側の音声を受話器から送出しているとき、この受話音声が送話器側に回り込む音量は少なく、当該電話機の発話者の音声を送話器を経由して電話回線に送出するとき、この送話音声が受話器側に回り込む音量は少ない。従って、この音量を比較することで、会話者を特定することが可能である。

また、前記録音手段は、前記会話者特定手段により特定された会話者以外の入力音声を低く抑えて録音するように構成してもよい。会話者以外の入力音声には、通常ノイズが多く含まれることから、このノイズを低減することで、会話者の入力音声をより鮮明に記録することができ、再生したときにも非常に聞き取り易い音声再生が可能となる。

本発明の音声録音再生装置によれば、音量計測手段による音量の計測結果に基づいて発話者または会話者を特定する特定手段を備えており、この特定手段により特定された発話者または会話者の切り替わったことを切替検出手段で検出したときに、録音データの録音位置に自動的にマークを付与するように構成したので、このマークを利用することで、録音データの再生時には、発話者または会話者の会話内容のみを自動再生することができる。すなわち、再生時には、選択手段にて選択された発話者または会話者の録音データを再生したり、選択手段にて選択された発話者または会話者の録音データをスキップして再生することができるので、発話者または会話者だけの会話内容のみを連続再生することができる。また、選択手段にて選択された発話者または会話者の録音データを再生する場合に、録音データのマークの位置からタイマーによって計測される特定時間だけ再生するように構成すれば、各発話者または会話者の会話内容の頭の部分だけが順次再生されるので、聴きたい内容のところをいち早く検索することができる。

以下、本発明の実施の形態について、図面を参照して説明する。

−実施形態１−
図１及び図２は、本実施形態１の音声録音再生装置であるボイスレコーダの電気的構成の一例を示すブロック図、図３は外観図である。

図３に示すように、本実施形態１の音声録音再生装置は、左側マイクロホン３と右側マイクロホン４の２つのマイクロホンを備えており、この例では両マイクロホン３，４が装置筐体１００の正面に向かって約４５度の角度を保って配置されている。ただし、この配置方向及び配置角度に限定されるものではない。また、装置筐体１００の正面には、スピーカ２２と各種操作を行う操作パネル２とが配置されている。操作パネル２には、録音キー２ａ、再生キー２ｂ、停止キー２ｃ、巻戻キー２ｄ、早送キー２ｅ、音声ボリューム（回転スイッチ）２ｆ等の従来周知の機能キー等が設けられている他に、再生時に特定者の会話内容のみを再生する場合に使用される特定者選択キー２ｇが設けられている。特定者選択キー２ｇは、本実施形態１では発話者を３名として想定しているので、Ｒキー（発話者Ａ）、Ｃキー（発話者Ｂ）、Ｌキー（発話者Ｃ）の３つのキーを備えている。

図１において、左側マイクロホン３の入力音声信号は、マイクアンプ５を介してノイズカット用のバンドパスフィルタ７に入力され、さらに整流ダイオード９を介して積分回路１１に入力され、Ａ／Ｄコンバータ１３を介してコントローラ１に入力されている。同様に、右側マイクロホン４の入力音声信号は、マイクアンプ６を介してノイズカット用のバンドパスフィルタ８に入力され、さらに整流ダイオード１０を介して積分回路１２に入力され、Ａ／Ｄコンバータ１４を介してコントローラ１に入力されている。

また、一方のマイクアンプ５の出力は、ゲインコントロールアンプ（ＧＣＡ）１５を介して加算アンプ１７の一方の端子に入力され、他方のマイクアンプ６の出力は、ゲインコントロールアンプ（ＧＣＡ）１６を介して加算アンプ１７の他方の端子に入力されており、加算アンプ１７の出力は、Ａ／Ｄコンバータ１８を介して音声メモリ１９に入力されている。さらに、音声メモリ１９の出力は、Ｄ／Ａコンバータ２０及びスピーカアンプ２１を介してスピーカ２２に接続されている。

コントローラ１は、操作パネル２からの入力に従って装置全体をコントロールするものであり、図２に示すように、ＣＰＵ１ａ、動作プログラムを格納したＲＯＭ１ｂ、動作時にはワークエリアとして働くＲＡＭ（ワークメモリ）１ｃ、パラレルＩ／Ｏ１ｄ、アドレスカウンタ１ｅ、タイマー１ｆ、後述する発話者判断基準テーブル１ｇ等を備えている。ただし、発話者判断基準テーブル１ｇは、コントローラ１に格納しておく必要はなく、外部メモリ（例えばフラッシュメモリやＥＥＰＲＯＭ等）に格納しておいてもよい。また、コントローラ１には、後述するマーカ用メモリ２３が接続されている。コントローラ１は、操作パネル２からの入力に従い、音声メモリ１９にアドレス信号を出力して、録音動作や再生動作を制御する。また、コントローラ１は、ＧＣＡ１５，１６の増幅率を制御する。

ここで、ワークメモリ１ｃは、入力音声の録音(記録)時や、録音データの再生時にＲＯＭ1ａ内の所望のプログラムをインストールし、各種状態を管理して録音動作や再生動作を実行するエリアである。具体的には、現在録音中であることを示す録音中フラグの状態、現在再生中であることを示す再生中フラグの状態、現在の発話者を特定して再生中であることを示すＬ／Ｃ／Ｒ再生中フラグの状態などを管理しているとともに、音声メモリ１９に記録されているデータ量（録音時間）の管理、後述するマーカ用メモリ２３に録音されているＩＤ数（登録マーカ数）の管理、現在再生中のマーカ部位（再生マーカ）の管理、録音中及び再生中の発話者の管理、マーカが切り替わったときの時間（マーカ切替位置）の管理などを、ＣＰＵ１ａからの制御によって行っている。

アドレスカウンタ１ｅは、録音中及び再生中は自動的にインクリメントしている。また、Ａ／Ｄコンバータ１８で変換した音声メモリ１９のアドレスを指定する。なお、本実施形態１では、１０ｍｓｅｃで割り込みをかけているため、上記のアドレス値を１０ｍｓｅｃ当たりのサンプリング数で割った値が録音時間または再生時間となる。

タイマー１ｆは、録音時及び再生時に１０ｍｓｅｃの割り込みをかける。また、本実施形態１では、後述するが特定時間（例えば、５秒等）の計測も合わせて行う場合がある。従って、図２ではタイマー１ｆは１個であるが、１０ｍｓｅｃの計測と５秒の計測とを同時に行う必要があるため、実際には２個のタイマーが用意されている。

図４は、発話者判断基準テーブル１ｇに格納されている発話者判断基準の具体的な構成例を示している。また、図５は、この発話者判断基準の基本となる３名の発話者の配置位置を示しており、右マイクロホン４に対面して右発話者Ａ、左マイクロホン３に対面して左発話者Ｃ、その中間位置（すなわち、装置筐体１００の正面位置）に中発話者Ｂがいる場合を想定している。

上記想定に基づき、発話者判断基準は、各マイクロホン３，４から入力される各発話者の音声の音量の比率Ｐに基づいて３つに区分されている。すなわち、下式（１）、
Ｐ＝Ｌ音量÷（Ｌ音量＋Ｒ音量）・・・（１）
（ただし、Ｌ音量：Ａ／Ｄコンバータ１３の値、Ｒ音量：Ａ／Ｄコンバータ１４の値）
の演算結果に基づき、比率ＰをＰ１（０〜０．３３）、Ｐ２（０．３３〜０．６７）、Ｐ３（０．６７〜１）、の3つに区分している。そして、比率ＰがＰ１の区分内にある場合には右発話者Ａ、比率ＰがＰ２の区分内にある場合には中発話者Ｂ、比率ＰがＰ３の区分内にある場合には左発話者Ｃと判断する。

また、この発話者判断基準テーブル１ｇには、各ＧＣＡ１５，１６の増幅率も各区分に対応して設定されている。具体的には、比率ＰがＰ１の区分内にある場合にはＧＣＡ１５の増幅率を０．２倍、ＧＣＡ１６の増幅率を１．０倍とし、比率ＰがＰ２の区分内にある場合にはＧＣＡ１５，１６共に増幅率を１．０倍とし、比率ＰがＰ３の区分内にある場合にはＧＣＡ１５の増幅率を１．０倍、ＧＣＡ１６の増幅率を０．２倍としている。ただし、増幅率を抑えるときの倍率については、０．２倍に限定されるものではなく、例えば０．１倍〜０．５倍程度の範囲内で任意に設定すればよい。

従って、コントローラ１は、この発話者判断基準テーブル１ｇに格納されている発話者判断基準に基づき、発話者が左発話者Ｃであると判断した場合には、左側マイクロホン３に対応するＧＣＡ１５の増幅率を１とし、右側マイクロホン４に対応するＧＣＡ１６の増幅率を０．２として、右側マイクロホン４からの入力を抑えるように制御する。また、発話者が右発話者Ａであると判断した場合には、右側マイクロホン４に対応するＧＣＡ１６の増幅率を１とし、左側マイクロホン３に対応するＧＣＡ１５の増幅率を０．２として、左側マイクロホン３からの入力を抑えるように制御する。さらに、発話者が中発話者Ｂであると判断した場合には、両マイクロホン３，４に対応する両ＧＣＡ１５，１６の増幅率を共に１とする。

図６は、マーカ用メモリ２３に登録される登録内容の一例を示している。

このマーカ用メモリ２３は、登録マーカ数（０からの連続番号）、発話者の録音時間（録音開始からの時間）、当該発話者を識別する識別コード（具体的には、操作パネル２の特定者選択キー２ｇに設けられている各Ｒ，Ｃ，Ｌキーに対応した識別コード）の各項目からなっている。ここで、図６に登録されている内容は、例えば図７に示す各発話者Ａ〜Ｃの発話内容に対応した内容となっている。具体的には、録音を開始して最初（０：００）に右発話者Ａが発話（「こんにちは」）した結果、マーカ用メモリ２３には、登録マーカ数「０」が登録され、その登録マーカ数「０」の位置に、録音時間「００：００．００」と、識別コード「Ｒ（＝右発話者Ａ）」とが登録されている。そして、次に「０：０９」の時点で今度は中発話者Ｂが発話（「はじめまして」）を開始した結果、マーカ用メモリ２３には、それまでの登録マーカ数にプラス１した登録マーカ数「１」が新たに登録され、その登録マーカ数「１」の位置に、録音時間「００：０９．２４」と、識別コード「Ｃ（＝中発話者Ｂ）」とが登録されている。以下同様にして、順次登録されている。

次に、上記構成の音声録音再生装置において、各マイクロホン３，４からの入力音声を録音する場合の処理について説明する。

操作パネル２の録音キー２ａが押されると、入力音声は次のような流れで録音される。

すなわち、左側マイクロホン３と右側マイクロホン４からの音声信号は、各マイクアンプ５，６で増幅される。そして、増幅された信号の音量を検出できるようにするために、まずノイズカット用のバンドパスフィルタ７，８で高域及び低域の周波数をカットして音声信号を中心とした信号にした後、次の整流ダイオード９，１０で交流信号を脈流信号に整流し、次の積分回路１１，１２でその信号を積分し、音量の信号に変換する。そして、次のＡ／Ｄコンバータ１３，１４で音量を示すデジタル信号に変換してコントローラ１に入力する。

コントローラ１は各Ａ／Ｄコンバータ１３，１４からの信号に対して上記（１）式を計算する。そして、この計算値を元に、図４に示す発話者判断基準テーブル１ｇの内容に従って、現在の発話者が右発話者であるのか、中発話者であるのか、左発話者であるのかを判断する。コントローラ１はその判断に従い、各マイクアンプ５，６に接続された各ＧＣＡ１５，１６の増幅率を、発話者判断基準テーブル１ｇに設定されている増幅率の値に設定する。これは、発話者の音声が少ない方の信号にはノイズが多いため、ノイズを減らすための処理である。ただし、実際の処理では、増幅率が急激に切り替わるのを防ぐため一定時間その状態が続くことを条件とする等の処理があるが、ここでは説明を省略する。

このようにして増幅率がコントロールされた左右のＧＣＡ１５，１６の出力は、加算アンプ１７で合成され、その出力はＡ／Ｄコンバータ１８でデジタル変換され、時系列に音声メモリ１９に記録される。音声メモリ１９のデータは、Ａ／Ｄコンバータ１８より入力され、アドレスはコントローラ１より入力される。音声メモリ１９に記録されるデータは、通常はデータ圧縮等するが、本発明と直接関係ないので、ここでは記述しない。また、コントローラ１は、発音者が切り替わったというタイミング（音声メモリ１９の記録位置に相当）を、マーカ用メモリ２３に順次登録する。

一方、再生する場合は次のような制御を実施する。すなわち、操作パネル２の再生キー２ｂが押されると次のような流れで再生される。

コントローラ1は音声メモリ１９の再生するアドレスを指定して時系列にデータを読み出す。その出力は、Ｄ／Ａコンバータ２０に入力されてアナログ信号に変換され、変換された信号はスピーカアンプ２１で増幅され、スピーカ２２で音声として再生される。

次に上記の録音処理と再生処理を、図８ないし図１５に示すフローチャートを参照してより具体的に説明する。

＜初期化処理＞
まず、図８を参照して初期化処理を説明する。

初期化処理では、全フラグをクリアし、マーカ用メモリ２３及び音声メモリ１９を０にする（ステップＳ１）。次に、アドレスカウンタ１ｅを０にリセットした後（ステップＳ２）、１０ｍｓｅｃの割り込み動作を開始する（ステップＳ３）。

＜１０ｍｓｅｃの割り込み動作時の処理（録音から再生までの全体の処理）＞
次に、図９を参照して、１０ｍｓｅｃの割り込み動作時の処理について説明する。

割り込みが発生すると、まず、各キーのオン、オフ状態、及びＬ，Ｒ，Ｃ各キーの長押し状態を確認する（ステップＳ１０１〜ステップＳ１１１）。そして、録音キー２ａが押されている場合には、録音フラグをオンにして（ステップＳ１１２）、ステップＳ１２３以降の処理に移る。また、再生キー２ｂが押されている場合には、再生フラグをオンにして（ステップＳ１１３）、ステップＳ１２３以降の処理に移る。また、停止キー２ｃが押されている場合には、全フラグをクリアするとともに、アドレスカウンタ１ｅを０にして（ステップＳ１１４）、ステップＳ１２３以降の処理に移る。また、巻戻キー２ｄが押されている場合には、通常の巻き戻し処理を行って（ステップＳ１１５）、ステップＳ１２３以降の処理に移る。また、早送キー２ｅが押されている場合には、通常の早送り処理を行って（ステップＳ１１６）、ステップＳ１２３以降の処理に移る。また、Ｌキーが押されている場合には、再生フラグをオンにするとともに、左再生中フラグをオンにして（ステップＳ１１７）、ステップＳ１２３以降の処理に移る。また、Ｒキーが押されている場合には、再生フラグをオンにするとともに、右再生中フラグをオンにして（ステップＳ１１８）、ステップＳ１２３以降の処理に移る。また、Ｃキーが押されている場合には、再生フラグをオンにするとともに、中再生中フラグをオンにして（ステップＳ１１９）、ステップＳ１２３以降の処理に移る。また、Ｌキーが長押しされた場合には、再生フラグをオンにするとともに、左再生中フラグをオンにし、かつ、スキップフラグをオンにして（ステップＳ１２０）、ステップＳ１２３以降の処理に移る。また、Ｒキーが長押しされた場合には、再生フラグをオンにするとともに、右再生中フラグをオンにし、かつ、スキップフラグをオンにして（ステップＳ１２１）、ステップＳ１２３以降の処理に移る。また、Ｃキーが長押しされた場合には、再生フラグをオンにするとともに、中再生中フラグをオンにし、かつ、スキップフラグをオンにして（ステップＳ１２２）、ステップＳ１２３以降の処理に移る。なお、Ｌ，Ｒ，Ｃ各キーが長押しされた場合の処理については、後ほど詳述する。

ステップＳ１２３〜ステップＳ１２８では、ステップＳ１１２〜ステップＳ１２２で設定されたフラグのオン、オフ状態を確認する。その結果、録音フラグがオンされている場合には、録音処理を実行する（ステップＳ１２９）。また、再生フラグがオンされている場合には、再生処理を実行する（ステップＳ１３０）。また、左再生中フラグがオンされている場合には、左再生処理を実行する（ステップＳ１３１）。また、右再生中フラグがオンされている場合には、右再生処理を実行する（ステップＳ１３２）。また、中再生中フラグがオンされている場合には、中再生処理を実行する（ステップＳ１３３）。また、スキップフラグがオンされている場合には、スキップ再生処理を実行する（ステップＳ１３４）。

次に、上記ステップＳ１２９〜１３４の処理について、具体的に説明する。すなわち、以下に説明する各処理は、１０ｍｓｅｃの割り込み時に実行される。

＜録音処理＞
図１０を参照して、録音処理を説明する。

録音処理では、録音開始から自動的にインクリメントされているアドレスカウンタ１ｅのカウント値を時間に変換して、録音時間（録音開始からの時間）を求める（ステップＳ２０１）。次に、各マイクロホン３，４から入力される各発話者の音声の音量の比率Ｐと発話者判断基準テーブル１ｇに格納されている発話者判断基準とに基づき、現在の発話者が左発話者Ｃであるのか（ステップＳ２０２）、右発話者Ａであるのか（ステップＳ２０５）、中発話者Ｂであるのか（ステップＳ２０８）を判断する。

ここで、現在の発話者が左発話者Ｃである場合（ステップＳ２０２でＹｅｓと判断された場合）には、次に、その左発話者Ｃが前回割り込み時の発話者と同じ発話者であるかどうかを判断し（ステップＳ２０３）、同じ発話者である場合（ステップＳ２０３でＹｅｓと判断された場合）には、ステップＳ２１０に進み、発話者判断基準テーブル１ｇに格納されているＧＣＡの増幅率に従い、各ＧＣＡ１５，１６の増幅率を設定する。ただし、前回と同じである場合には、そのままの増幅率を継続することになる。

一方、前回の発話者と現在の左発話者Ｃとが異なる場合、つまり、前回の発話者が左発話者Ｃ以外の発話者である場合（ステップＳ２０３でＮｏと判断された場合）には、マーカ用メモリ２３に、登録マーカ数をプラス１して登録するとともに、このプラス１した登録マーカ数の位置に、発話者の切り換わりの位置を示す現在までの録音時間と、現在の発話者である左発話者Ｃの識別コード「Ｌ」とを登録する（ステップＳ２０４）。具体的には、例えば図６に示す例で言うと、それまでの登録マーカ数が「１」であり、その登録マーカ数「１」に対応する発話者が中発話者Ｂ（識別コード「Ｃ」）であった場合には、上記の判断処理により、登録マーカ数をプラス１して「２」とし、この登録マーカ数「２」の位置に、発話者の切り換わりの位置を示す現在までの録音時間である「００：１４：３５（すなわち、１４．３５秒）」を登録し、識別コードとして左発話者Ｃであることを示す「Ｌ」を登録する。ステップＳ２０４の処理終了後は、ステップＳ２１０へ進む。

また、現在の発話者が右発話者Ａである場合（ステップＳ２０５でＹｅｓと判断された場合）には、次に、その右発話者Ａが前回割り込み時の発話者と同じ発話者であるかどうかを判断し（ステップＳ２０６）、同じ発話者である場合（ステップＳ２０６でＹｅｓと判断された場合）には、ステップＳ２１０に進み、発話者判断基準テーブル１ｇに格納されているＧＣＡの増幅率に従い、各ＧＣＡ１５，１６の増幅率を設定する。ただし、前回と同じである場合には、そのままの増幅率を継続することになる。

一方、前回の発話者と現在の右発話者Ａとが異なる場合、つまり、前回の発話者が右発話者Ａ以外の発話者である場合（ステップＳ２０６でＮｏと判断された場合）には、マーカ用メモリ２３に、登録マーカ数をプラス１して登録するとともに、このプラス１した登録マーカ数の位置に、発話者の切り換わりの位置を示す現在までの録音時間と、現在の発話者である右発話者Ａの識別コード「Ｒ」とを登録する（ステップＳ２０７）。ステップＳ２０７の処理終了後は、ステップＳ２１０へ進む。

また、現在の発話者が左発話者Ｃでも右発話者Ａでもない場合、つまり現在の発話者が中発話者Ｂであると判断された場合（ステップＳ２０５でＮｏと判断された場合）には、次に、その中発話者Ｂが前回割り込み時の発話者と同じ発話者であるかどうかを判断し（ステップＳ２０８）、同じ発話者である場合（ステップＳ２０８でＹｅｓと判断された場合）には、ステップＳ２１０に進み、発話者判断基準テーブル１ｇに格納されているＧＣＡの増幅率に従い、各ＧＣＡ１５，１６の増幅率を設定する。ただし、前回と同じである場合には、そのままの増幅率を継続することになる。

一方、前回の発話者と現在の中発話者Ｂとが異なる場合、つまり、前回の発話者が中発話者Ｂ以外の発話者である場合（ステップＳ２０８でＮｏと判断された場合）には、マーカ用メモリ２３に、登録マーカ数をプラス１して登録するとともに、このプラス１した登録マーカ数の位置に、発話者の切り換わりの位置を示す現在までの録音時間と、現在の発話者である中発話者Ｂの識別コード「Ｃ」とを登録する（ステップＳ２０９）。ステップＳ２０９の処理終了後は、ステップＳ２１０へ進む。

このようにして録音処理を終了した後は、再び図９に示す全体処理に戻る。

＜再生処理＞
図１１を参照して、再生処理を説明する。

再生処理を開始すると、再生開始から自動的にインクリメントされているアドレスカウンタ１ｅのカウント値を時間に変換して、再生開始からの時間を求め（ステップＳ２２１）、その再生時間と録音時間とを比較する（ステップＳ２２２）。つまり、録音データの最後まで再生されたかを判断する。その結果、録音データが最後まで再生されている場合（ステップＳ２２２でＮｏと判断された場合）には、再生処理を終了し、ワークメモリ１ｃの全フラグをクリアし、アドレスカウンタ１ｅのカウント値を０にリセットして（ステップＳ２２３）、再生処理を終了した後は、再び図９に示す全体処理に戻る。

一方、再生時間が録音時間より短い場合（ステップＳ２２２でＹｅｓと判断された場合）には、再生マーカ数をプラス１した再生マーカ数とマーカ用メモリ２３に登録されている登録マーカ数とを比較する（ステップＳ２２４）。その結果、プラス１した再生マーカ数が登録マーカ数と同じかそれよりも少ない場合（ステップＳ２２４でＮｏと判断された場合）には、未再生の録音データがあるため、そのまま再生処理を継続した状態で、再び図９に示す全体処理に戻る。

一方、プラス１した再生マーカ数が登録マーカ数より少ない場合（ステップＳ２２４でＹｅｓと判断された場合）には、再生中のマーカの更新処理を行うため、プラス１した再生マーカ数の録音時間と、現在の再生時間とを比較する（ステップＳ２２５）。その結果、録音時間と再生時間とが異なる場合（つまり、再生時間が登録されている録音時間に達していない場合）には、そのまま再生処理を継続した状態で、再び図９に示す全体処理に戻る。一方、再生時間が登録されている録音時間に達している場合には、現在の再生マーカ数にプラス１して（すなわち、マーカの位置を更新して）新たな再生マーカ数とし（ステップＳ２２６）、その新たな再生マーカ数に該当する発話者を、マーカ用メモリ２３の一致する登録マーカ数の発話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ２２７）。このステップＳ２２７での録音時間の保存処理は、後述するスキップ処理のときに特定時間（例えば、５秒等）を計測するのに必要となる。このようにして再生処理を終了した後は、再び図９に示す全体処理に戻る。

＜早送り処理＞
図１２を参照して、早送り処理を説明する。ここで言う早送り処理とは、発話者を進める方向に切り換える処理のことであり、再生速度自体を上げる処理のことではない。

まず、再生中かどうかを確認し（ステップＳ２３１）、再生中であれば、現在の再生マーカ数にプラス１してマーカの位置を更新し、この更新した再生マーカ数とマーカ用メモリ２３に登録されている登録マーカ数とを比較する（ステップＳ２３２）。その結果、再生マーカ数が登録マーカ数と同じかそれよりも少ない場合（ステップＳ２３２でＹｅｓと判断された場合）には、現在の再生マーカ数にプラス１してマーカの位置を更新し（ステップＳ２３３）、この更新した再生マーカ数に該当する発話者を、マーカ用メモリ２３の一致する登録マーカ数の発話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ２３４）。次に、この録音時間をアドレスカウンタ１ｅの値に変換して、アドレスカウンタ１ｅのカウント値を更新し（ステップＳ２３５）、例えば早送りしたことを知らせる早送り音（例えば、「ピッ」という電子音）を発生して（ステップＳ２３６）、再び図９に示す全体処理に戻る。一方、ステップＳ２３１の判断において再生中でないと判断された場合と、ステップＳ２３２において、現在の再生マーカ数にプラス１したマーカ数が登録マーカ数より大きい場合（ステップＳ２３２でＮｏと判断された場合）には、何もしないで再び図９に示す全体処理に戻る。

＜巻き戻し処理＞
図１３を参照して、巻き戻し処理を説明する。ここで言う巻き戻し処理とは、発話者を戻す方向に切り換える処理のことであり、巻き戻し速度自体を上げる処理のことではない。

まず、再生中かどうかを確認し（ステップＳ２４１）、再生中であれば、現在の再生マーカ数が１以上かどうかを判断し（ステップＳ２４２）、１以上の場合（ステップＳ２４２でＹｅｓと判断された場合）には、現在の再生マーカ数からマイナス１してマーカの位置を更新し（ステップＳ２４３）、その新たな再生マーカ数に該当する発話者を、マーカ用メモリ２３の一致する登録マーカ数の発話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ２４４）。次に、この録音時間をアドレスカウンタ１ｅの値に変換して、アドレスカウンタ１ｅのカウント値を更新し（ステップＳ２４５）、例えば巻き戻ししたことを知らせる巻き戻し音（例えば、「ピッ」という電子音）を発生して（ステップＳ２４６）、再び図９に示す全体処理に戻る。一方、ステップＳ２４１の判断において再生中でないと判断された場合と、ステップＳ２４２において、再生マーカ数が１未満であり、再生中のデータは先頭のデータで、そのデータより巻き戻すデータは存在しない場合（ステップＳ２４２でＮｏと判断された場合）には、何もしないで再び図９に示す全体処理に戻る。

＜左再生処理＞
図１４を参照して、左再生処理を説明する。ここで、左再生処理とは、左発話者Ｃの発話内容のみを再生していく処理のことである。

まず、再生中かどうかを確認し（ステップＳ２５１）、再生中であれば、現在の発話者が左発話者Ｃであるかどうかを判断する（ステップＳ２５２）。この判断は、マーカ用メモリ２３に登録されている録音時間と現在の再生時間とを比較し、現在の再生時間に該当する録音時間に対応して登録されている発話者（識別コード）を検索することによって判断することができる。その結果、現在の発話者が左発話者Ｃである場合（ステップＳ２５２でＹｅｓと判断された場合）には、そのまま再生処理を継続した状態で、再び図９に示す全体処理に戻る。一方、現在の発話者が左発話者Ｃでない場合、つまり発話者がすでに換わっている場合（ステップＳ２５２でＮｏと判断された場合）には、図１２に示した早送り処理を実行する（ステップＳ２５３）。すなわち、この場合には、次のマーカまで飛んで発話者を確認し、その発話者が左発話者Ｃとなるまで、マーカを飛ばす処理を繰り返すことになる。そして、発話者が再び左発話者Ｃになると通常の再生処理を開始して、ステップＳ２５１に戻ることになる。

ここで、上記の左再生処理の内容を、図７及び図１６を参照して具体的に説明する。

すなわち、録音データは、図７に示すように、右発話者Ａ、中発話者Ｂ、左発話者Ｃが任意に発話した順に録音されている。ここで、装置筐体１００のＬキーが押されると、システムコントローラ１は、図１６に示すように、図７に示す発話内容の中から、左発話者Ｃの発話内容のみを抽出し、１つの発話内容の再生を終了すると、「ピッ」という電子音を入れて次の発話内容を再生する、といった繰り返しで順次再生することになる。

以上が左再生処理であるが、右発話者Ａの発話内容のみを再生する右再生処理、及び中発話者Ｂの発話内容のみを再生する中再生処理も、上記左再生処理と同様に実施することができるので、ここでは説明を省略する。

＜スキップ処理＞
図１５を参照して、スキップ処理を説明する。ここでのスキップ処理とは、任意の発話者の発話内容を、特定時間（この例では最初から５秒間）再生すると、録音順に従って次の発話者の発話内容を特定時間再生する、といった処理を繰り返すことである。ただし、特定時間については、５秒に限定されるものではなく、例えば３秒等、任意に設定しておけばよい。

まず、再生中かどうかを確認し（ステップＳ２６１）、再生中であれば、アドレスカウンタ１ｅのカウント値から求めた再生時間から、図１１のステップＳ２２７でワークメモリ１ｃに登録した現在再生中の発話者の録音時間（すなわち、現在の発話者にマーカが切り替わったときの時間）を引いた時間が、特定時間である５秒を経過しているかどうかを判断する（ステップＳ２６２）。その結果、特定時間を経過していなければ、そのまま再生処理を継続する。一方、特定時間を経過していれば（ステップＳ２６２でＮｏと判断されれば）、図１２に示した早送り処理を実行する（ステップＳ２６３）。すなわち、この場合には、次のマーカまで飛んで、次の発話者の発話内容の再生処理を開始し、ステップＳ２６１に戻ることになる。

ここで、上記のスキップ処理の内容を、図７及び図１７を参照して具体的に説明する。

すなわち、録音データは、図７に示すように、右発話者Ａ、中発話者Ｂ、左発話者Ｃが任意に発話した順に録音されている。ここで、装置筐体１００のＬキーが長押しされると、システムコントローラ１は、図１７に示すように、図７に示す発話内容の中から、左発話者Ｃの発話内容のみを抽出し、かつ、１つの発話内容を最初から５秒間再生すると、「ピッ」という電子音を入れて次の発話内容を最初から５秒間再生する、といった繰り返しで順次スキップ再生することになる。なお、１つの発話内容が５秒に満たない場合には、全ての発話内容が再生された後、５秒経過を待つことなく「ピッ」という電子音を入れて、次の発話内容の再生に移行することになる。

以上が、ステップＳ１１５、Ｓ１１６、Ｓ１２９〜Ｓ１３４の各処理の説明である。

−実施形態２−
上記実施形態１では、図５に示すように、３人の発話者の発話内容を２本のマイクロホン３，４で録音する場合について説明しているが、本実施形態２では、例えば図１８に示すように、放射状に配置された３本のマイクロホン５１，５２，５３によって４人の発話者Ａ，Ｂ，Ｃ，Ｄの発話内容を録音する場合について説明する。この場合も、上記実施形態１と同様にして録音と各種再生とを行うことができる。

ここで、図１８に示す例では、３本のマイクロホン５１，５２，５３は１２０度の角度を保って放射状に均等に配置されており、発話者Ａはマイクロホン５１の前に位置し、発話者Ｂはマイク５２の前に位置し、発話者Ｃはマイクロホン５３とマイクロホン５２の間に位置し、発話者Ｄはマイクロホン５３とマイクロホン５１の間に位置している場合を例示している。

この場合のブロック図は省略するが、例えば図１の左マイクロホン３、マイクアンプ５、整流ダイオード９、積分回路１１、Ａ／Ｄコンバータ１３、ＧＣＡ１５からなる１つの音声信号入力系をもう１系統追加し、その追加分のＧＣＡの出力を加算アンプ１７の第３の端子に入力した回路構成とすればよい。

また、この場合の発話者の判断は、図１９に示す手法によって行うことができる。すなわち、マイクロホン５１から入力される音声の音量をＸ、マイクロホン５２から入力される音声の音量をＹ、マイクロホン５３から入力される音声の音量をＺとすると、コントローラ１では、下式（２）、（３）
ａ＝Ｚ−（Ｘ＋Ｙ）÷２・・・（２）
ｂ＝Ｘ−Ｙ・・・（３）
を計算し、そのときの計算結果であるａ，ｂの正負によって、図１９に示すように発話者を判断することができる。また、図１９に示す判断手法を発話者判断基準テーブルとして表現したのが図２０である。

つまり、計算結果であるａを横軸、ｂを縦軸とし、その交点を０として、右側を正、左側を負、上側を正、下側を負とすると、上記（２），（３）式の計算結果が、ａが正でｂが負である場合には発話者Ａと判断し、ａが負でｂが負である場合には発話者Ｂと判断し、ａが負でｂが正である場合は発話者Ｃと判断し、ａが正でｂが正である場合は発話者Ｄと判断する。そして、発話者Ａと判断された場合には、マイクロホン５１系統のＧＣＡの増幅率を１倍、マイクロホン５２系統のＧＣＡの増幅率を０．２倍、マイクロホン５３系統のＧＣＡの増幅率を０．２倍とし、発話者Ｂと判断された場合には、マイクロホン５１系統のＧＣＡの増幅率を０．２倍、マイクロホン５２系統のＧＣＡの増幅率を１倍、マイクロホン５３系統のＧＣＡの増幅率を０．２倍とし、発話者Ｃと判断された場合には、マイクロホン５１系統のＧＣＡの増幅率を０．２倍、マイクロホン５２系統のＧＣＡの増幅率を１倍、マイクロホン５３系統のＧＣＡの増幅率を１倍とし、発話者Ｄと判断された場合には、マイクロホン５１系統のＧＣＡの増幅率を１倍、マイクロホン５２系統のＧＣＡの増幅率を０．２倍、マイクロホン５３系統のＧＣＡの増幅率を１倍とする。

−実施の形態３−
図２１は、本実施形態３の音声録音再生装置の電気的構成の一例を示すブロック図、図２２は外観図である。

図２１及び図２２に示すように、本実施形態３の音声録音再生装置は、上記実施形態１の左側マイクロホン３と右側マイクロホン４の代りに、電話機のハンドセット３１の受話器３ａと送話器４ａとがその後の音声信号入力系に接続された構成となっている。すなわち、受話器３ａと送話器４ａ以降の回路構成は、上記実施形態１の回路構成と全く同じであるので、ここでは上記実施形態１の回路構成部材と同じ部材には同符号を付すこととし、詳細な説明は省略する。

また、本実施形態３の音声録音再生装置は、図２２に示すように、ハンドセット３１と電話機本体３２との間に接続されており、装置筐体２００の正面には、スピーカ２２と各種操作を行う操作パネル２とが配置されている。操作パネル２には、録音キー２ａ、再生キー２ｂ、停止キー２ｃ、巻戻キー２ｄ、早送キー２ｅ、音声ボリューム（回転スイッチ）２ｆ等の従来周知の機能キー等が設けられている他に、再生時に特定者の会話内容のみを再生する場合に使用される特定者選択キー２ｇが設けられている。特定者選択キー２ｇは、本実施形態３では相手側と当該電話機を使用する発話者の２名であるので、Ｒキー（相手側（受話））とＳキー（発話者（送話））の２つのキーを備えている。

また、本実施形態３では、会話者が、受話器３ａから入力される相手側と、当該電話機を使用する発話者の２名であるので、会話者判断基準テーブルの内容が上記実施形態１の発話者判断基準テーブルの内容とは異なっている。

図２３は、本実施形態３の会話者判断基準テーブルの構成例１を示している。

本構成例１の会話者判断基準は、受話器３ａから入力される相手側の音声（受話音声）の音量と、当該電話機を使用する発話者の音声（送話音声）の音量との比率Ｐに基づいて２つに区分されている。すなわち、下式（４）、
Ｐ＝Ｌ音量÷（Ｌ音量＋Ｒ音量）・・・（４）
（ただし、Ｌ音量：Ａ／Ｄコンバータ１３の値、Ｒ音量：Ａ／Ｄコンバータ１４の値）
の演算結果に基づき、比率ＰをＰ１（０〜０．５）、Ｐ２（０．５〜１）、の２つに区分している。そして、比率ＰがＰ１の区分内にある場合には送話音声、比率ＰがＰ２の区分内にある場合には受話音声と判断する。

また、この会話者判断基準テーブルには、各ＧＣＡ１５，１６の増幅率も各区分に対応して設定されている。具体的には、比率ＰがＰ１の区分内にある場合にはＧＣＡ１５の増幅率を０．２倍、ＧＣＡ１６の増幅率を１．０倍とし、比率ＰがＰ２の区分内にある場合にはＧＣＡ１５の増幅率を１．０倍、ＧＣＡ１６の増幅率を０．２倍としている。ただし、増幅率を抑えるときの倍率については、０．２倍に限定されるものではなく、例えば０．１倍〜０．５倍程度の範囲内で任意に設定すればよい。

従って、コントローラ１は、この会話者判断基準テーブルに格納されている会話者判断基準に基づき、会話者が当該電話機を使用する発話者（送話）であると判断した場合には、送話器４ａに対応するＧＣＡ１６の増幅率を１倍とし、受話器３ａに対応するＧＣＡ１５の増幅率を０．２倍として、受話器３ａからの入力を抑えるように制御する。また、会話者が相手側（受話）であると判断した場合には、受話器３ａに対応するＧＣＡ１５の増幅率を１倍とし、送話器４ａに対応するＧＣＡ１６の増幅率を０．２倍として、送話器４ａからの入力を抑えるように制御する。

図２４は、本実施形態３の会話者判断基準テーブルの構成例２を示している。

本構成例２の会話者判断基準は、受話器３ａから入力される相手側の音声（受話音声）の音量と、当該電話機を使用する使用者（発話者）の音声（送話音声）の音量との比率Ｐに基づいて３つに区分されている。すなわち、下式（５）、
Ｐ＝Ｌ音量÷（Ｌ音量＋Ｒ音量）・・・（５）
（ただし、Ｌ音量：Ａ／Ｄコンバータ１３の値、Ｒ音量：Ａ／Ｄコンバータ１４の値）の演算結果に基づき、比率ＰをＰ１（０〜０．３３）、Ｐ２（０．３３〜０．６７）、Ｐ３０．６７〜１）の３つに区分している。そして、比率ＰがＰ１の区分内にある場合には送話音声、比率ＰがＰ２の区分内にある場合には同時会話（すなわち、送話音声と受話音声の両方）、比率ＰがＰ３の区分内にある場合には受話音声と判断する。

また、この会話者判断基準テーブルには、各ＧＣＡ１５，１６の増幅率も各区分に対応して設定されている。具体的には、比率ＰがＰ１の区分内にある場合にはＧＣＡ１５の増幅率を０．２倍、ＧＣＡ１６の増幅率を１．０倍とし、比率ＰがＰ２の区分内にある場合にはＧＣＡ１５の増幅率を１倍、ＧＣＡ１６の増幅率を１倍とし、比率ＰがＰ３の区分内にある場合にはＧＣＡ１５の増幅率を１．０倍、ＧＣＡ１６の増幅率を０．２倍としている。ただし、増幅率を抑えるときの倍率については、０．２倍に限定されるものではなく、例えば０．１倍〜０．５倍程度の範囲内で任意に設定すればよい。

従って、コントローラ１は、この会話者判断基準テーブルに格納されている会話者判断基準に基づき、会話者が当該電話機を使用する発話者（送話）であると判断した場合には、送話器４ａに対応するＧＣＡ１６の増幅率を１倍とし、受話器３ａに対応するＧＣＡ１５の増幅率を０．２倍として、受話器３ａからの入力を抑えるように制御する。また、会話者が相手側（受話）であると判断した場合には、受話器３ａに対応するＧＣＡ１５の増幅率を１倍とし、送話器４ａに対応するＧＣＡ１６の増幅率を０．２倍として、送話器４ａからの入力を抑えるように制御する。また、会話者が相手側と発話者の同時会話であると判断した場合には、両方のＧＣＡ１５，１６の増幅率を共に１倍とする。

次に上記構成の音声録音再生装置における録音処理と再生処理について、図２５ないし図３１に示すフローチャートを参照してより具体的に説明する。ただし、ここでは図２３に示す会話者判断基準テーブルを使用する場合について説明する。なお、本実施形態３の音声録音再生装置においても初期化処理を行うが、初期化処理については、上記実施形態１の初期化処理（図８参照）と同じであるので、ここでは初期化処理の説明は省略する。

＜１０ｍｓｅｃの割り込み動作時の処理（録音から再生までの全体の処理）＞
次に、図２５を参照して、１０ｍｓｅｃの割り込み動作時の処理について説明する。

割り込みが発生すると、まず、各キーのオン、オフ状態、及びＲ，Ｓ各キーの長押し状態を確認する（ステップＳ３０１〜ステップＳ３０９）。そして、録音キー２ａが押されている場合には、録音フラグをオンにして（ステップＳ３１０）、ステップＳ３１９以降の処理に移る。また、再生キー２ｂが押されている場合には、再生フラグをオンにして（ステップＳ３１１）、ステップＳ３１９以降の処理に移る。また、停止キー２ｃが押されている場合には、全フラグをクリアするとともに、アドレスカウンタ１ｅを０にして（ステップＳ３１２）、ステップＳ３１９以降の処理に移る。また、巻戻キー２ｄが押されている場合には、通常の巻き戻し処理を行って（ステップＳ３１３）、ステップＳ３１９以降の処理に移る。また、早送キー２ｅが押されている場合には、通常の早送り処理を行って（ステップＳ３１４）、ステップＳ３１９以降の処理に移る。また、Ｒキーが押されている場合には、再生フラグをオンにするとともに、受話再生中フラグをオンにして（ステップＳ３１５）、ステップＳ３１９以降の処理に移る。また、Ｓキーが押されている場合には、再生フラグをオンにするとともに、送話再生中フラグをオンにして（ステップＳ３１６）、ステップＳ３１９移行の処理に移る。また、Ｒキーが長押しされた場合には、再生フラグをオンにするとともに、受話再生中フラグをオンにし、かつ、スキップフラグをオンにして（ステップＳ３１７）、ステップＳ３１９以降の処理に移る。また、Ｓキーが長押しされた場合には、再生フラグをオンにするとともに、送話再生中フラグをオンにし、かつ、スキップフラグをオンにして（ステップＳ３１８）、ステップＳ３１９以降の処理に移る。なお、Ｒ，Ｓ各キーが長押しされた場合の処理については、後ほど詳述する。

ステップＳ３１９〜ステップＳ３２３では、ステップＳ３１０〜ステップＳ３１８で設定されたフラグのオン、オフ状態を確認する。その結果、録音フラグがオンされている場合には、録音処理を実行する（ステップＳ３２４）。また、再生フラグがオンされている場合には、再生処理を実行する（ステップＳ３２５）。また、受話再生中フラグがオンされている場合には、受話再生処理を実行する（ステップＳ３２６）。また、送話再生中フラグがオンされている場合には、送話再生処理を実行する（ステップＳ３２７）。また、スキップフラグがオンされている場合には、スキップ再生処理を実行する（ステップＳ３２８）。

次に、上記ステップＳ３２４〜３２８の処理について、具体的に説明する。すなわち、以下に説明する各処理は、１０ｍｓｅｃの割り込み時に実行される。

＜録音処理＞
図２６を参照して、録音処理を説明する。

録音処理では、録音開始から自動的にインクリメントされているアドレスカウンタ１ｅのカウント値を時間に変換して、録音時間（録音開始からの時間）を求める（ステップＳ４０１）。次に、受話器３ａから入力される相手側の音声（受話音声）の音量、及び当該電話機を使用する発話者の音声（送話音声）の音量の比率Ｐと、会話者判断基準テーブル（図２３参照）に格納されている会話者判断基準とに基づき、現在の会話者が相手側（受話者）であるのか（ステップＳ４０２）、発話者（送話者）であるのか（ステップＳ４０５）を判断する。

ここで、現在の会話者が相手側（受話者）である場合（ステップＳ４０２でＹｅｓと判断された場合）には、次に、その受話者が前回割り込み時の会話者と同じ会話者であるかどうかを判断し（ステップＳ４０３）、同じ会話者である場合（ステップＳ４０３でＹｅｓと判断された場合）には、ステップＳ４０８に進み、会話者判断基準テーブルに格納されているＧＣＡの増幅率に従い、各ＧＣＡ１５，１６の増幅率を設定する。ただし、前回と同じである場合には、そのままの増幅率を継続することになる。

一方、前回の会話者が現在の受話者と異なる場合、つまり、前回の会話者が発話者（送話者）である場合（ステップＳ４０３でＮｏと判断された場合）には、マーカ用メモリ２３に、登録マーカ数をプラス１して登録するとともに、このプラス１した登録マーカ数の位置に、会話者の切り換わりの位置を示す現在までの録音時間と、現在の会話者である受話者の識別コード「Ｒ」とを登録する（ステップＳ４０４）。

一方、現在の会話者が発話者（送話者）である場合（ステップＳ４０５でＹｅｓと判断された場合）には、次に、その発話者（送話者）が前回割り込み時の会話者と同じ会話者であるかどうかを判断し（ステップＳ４０６）、同じ会話者である場合（ステップＳ４０６でＹｅｓと判断された場合）には、ステップＳ４０８に進み、会話者判断基準テーブルに格納されているＧＣＡの増幅率に従い、各ＧＣＡ１５，１６の増幅率を設定する。ただし、前回と同じである場合には、そのままの増幅率を継続することになる。

一方、前回の会話者が現在の発話者（送話者）と異なる場合、つまり、前回の会話者が相手側である受話者である場合（ステップＳ４０６でＮｏと判断された場合）には、マーカ用メモリ２３に、登録マーカ数をプラス１して登録するとともに、このプラス１した登録マーカ数の位置に、会話の切り換わりの位置を示す現在までの録音時間と、現在の会話者である発話者（送話者）の識別コード「Ｓ」とを登録する（ステップＳ４０７）。このようにして録音処理を終了した後は、再び図２５に示す全体処理に戻る。

＜再生処理＞
図２７を参照して、再生処理を説明する。

再生処理を開始すると、再生開始から自動的にインクリメントされているアドレスカウンタ１ｅのカウント値を時間に変換して、再生開始からの時間を求め（ステップＳ４２１）、その再生時間と録音時間とを比較する（ステップＳ４２２）。つまり、録音データの最後まで再生されたかを判断する。その結果、録音データが最後まで再生されている場合（ステップＳ４２２でＮｏと判断された場合）には、再生処理を終了し、ワークメモリ１ｃの全フラグをクリアし、アドレスカウンタ１ｅのカウント値を０にリセットして（ステップＳ４２３）、再生処理を終了した後は、再び図２５に示す全体処理に戻る。

一方、再生時間が録音時間より短い場合（ステップＳ４２２でＹｅｓと判断された場合）には、再生マーカ数をプラス１した再生マーカ数とマーカ用メモリ２３に登録されている登録マーカ数とを比較する（ステップＳ４２４）。その結果、プラス１した再生マーカ数が登録マーカ数と同じかそれよりも少ない場合（ステップＳ４２４でＮｏと判断された場合）には、未再生の録音データがあるため、そのまま再生処理を継続した状態で、再び図２５に示す全体処理に戻る。

一方、プラス１した再生マーカ数が登録マーカ数より少ない場合（ステップＳ４２４でＹｅｓと判断された場合）には、再生中のマーカの更新処理を行うため、プラス１した再生マーカ数の録音時間と、現在の再生時間とを比較する（ステップＳ４２５）。その結果、録音時間と再生時間とが異なる場合（つまり、再生時間が登録されている録音時間に達していない場合）には、そのまま再生処理を継続した状態で、再び図２５に示す全体処理に戻る。一方、再生時間が登録されている録音時間に達している場合には、現在の再生マーカ数にプラス１して（すなわち、マーカの位置を更新して）新たな再生マーカ数とし（ステップＳ４２６）、その新たな再生マーカ数に該当する会話者を、マーカ用メモリ２３の一致する登録マーカ数の会話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ４２７）。このステップＳ４２７での録音時間の保存処理は、後述するスキップ処理のときに特定時間（例えば、５秒等）を計測するのに必要となる。このようにして再生処理を終了した後は、再び図２５に示す全体処理に戻る。

＜早送り処理＞
図２８を参照して、早送り処理を説明する。ここで言う早送り処理とは、発話者を進める方向に切り換える処理のことであり、再生速度自体を上げる処理のことではない。

まず、再生中かどうかを確認し（ステップＳ４３１）、再生中であれば、現在の再生マーカ数にプラス１してマーカの位置を更新し、この更新した再生マーカ数とマーカ用メモリ２３に登録されている登録マーカ数とを比較する（ステップＳ４３２）。その結果、再生マーカ数が登録マーカ数と同じかそれよりも少ない場合（ステップＳ４３２でＹｅｓと判断された場合）には、現在の再生マーカ数にプラス１してマーカの位置を更新し（ステップＳ４３３）、この更新した再生マーカ数に該当する発話者を、マーカ用メモリ２３の一致する登録マーカ数の会話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ４３４）。次に、この録音時間をアドレスカウンタ１ｅの値に変換して、アドレスカウンタ１ｅのカウント値を更新し（ステップＳ４３５）、例えば早送りしたことを知らせる早送り音（例えば、「ピッ」という電子音）を発生して（ステップＳ４３６）、再び図２５に示す全体処理に戻る。一方、ステップＳ４３１の判断において再生中でないと判断された場合と、ステップ４３２において、現在の再生マーカ数にプラス１したマーカ数が登録マーカ数より大きい場合（ステップＳ４３２でＮｏと判断された場合）には、何もしないで再び図２５に示す全体処理に戻る。

＜巻き戻し処理＞
図２９を参照して、巻き戻し処理を説明する。ここで言う巻き戻し処理とは、発話者を戻す方向に切り換える処理のことであり、巻き戻し速度自体を上げる処理のことではない。

まず、再生中かどうかを確認し（ステップＳ４４１）、再生中であれば、現在の再生マーカ数が１より大きいかどうかを判断し（ステップＳ４４２）、１より大きい場合（ステップＳ４４２でＹｅｓと判断された場合）には、現在の再生マーカ数からマイナス１してマーカの位置を更新し（ステップＳ４４３）、その新たな再生マーカ数に該当する会話者を、マーカ用メモリ２３の一致する登録マーカ数の会話者から抽出してワークメモリ１ｃに保存するとともに、そのときの録音時間、すなわちマーカが切り替わったときの時間を保存する（ステップＳ４４４）。次に、この録音時間をアドレスカウンタ１ｅの値に変換して、アドレスカウンタ１ｅのカウント値を更新し（ステップＳ４４５）、例えば巻き戻ししたことを知らせる巻き戻し音（例えば、「ピッ」という電子音）を発生して（ステップＳ４４６）、再び図２５に示す全体処理に戻る。一方、ステップＳ４４１の判断において再生中でないと判断された場合と、ステップＳ４４２において、再生マーカ数が１未満であり、再生中のデータは先頭のデータで、そのデータより巻き戻すデータは存在しない場合（ステップＳ４４２でＮｏと判断された場合）には、何もしないで再び図２５に示す全体処理に戻る。

＜受話再生処理＞
図３０を参照して、受話再生処理を説明する。ここで、受話再生処理とは、相手側である受話者の発話内容のみを再生していく処理のことである。

まず、再生中かどうかを確認し（ステップＳ４５１）、再生中であれば、現在の会話者が受話者であるかどうかを判断する（ステップＳ４５２）。この判断は、マーカ用メモリ２３に登録されている録音時間と現在の再生時間とを比較し、現在の再生時間に該当する録音時間に対応して登録されている会話者（識別コード）を検索することによって判断することができる。その結果、現在の会話者が送話者である場合（ステップＳ４５２でＹｅｓと判断された場合）には、そのまま再生処理を継続した状態で、再び図２５に示す全体処理に戻る。一方、現在の会話者が受話者でない場合、つまり、会話者がすでに当該電話機の使用者である発話者（送話者）に換わっている場合（ステップＳ４５２でＮｏと判断された場合）には、図２８に示した早送り処理を実行する（ステップＳ４５３）。すなわち、この場合には、次のマーカまで飛んで会話者を確認し、その会話者が受話者となるまで、マーカを飛ばす処理を繰り返すことになる。そして、会話者が再び受話者になると通常の再生処理を開始して、ステップＳ４５１に戻ることになる。

以上が受話再生処理であるが、当該電話機の使用者である発話者（送話者）の発話内容のみを再生する送話再生処理も、上記受話再生処理と同様に実施することができるので、ここでは説明を省略する。

＜スキップ処理＞
図３１を参照して、スキップ処理を説明する。ここでのスキップ処理とは、任意の会話者の発話内容を、特定時間（この例では最初から５秒間）再生すると、録音順に従って次の会話者の発話内容を特定時間再生する、といった処理を繰り返すことである。ただし、特定時間については、５秒に限定されるものではなく、例えば３秒等、任意に設定しておけばよい。

まず、再生中かどうかを確認し（ステップＳ４６１）、再生中であれば、アドレスカウンタ１ｅのカウント値から求めた再生時間から、図２７のステップＳ４２７でワークメモリ１ｃに登録した現在再生中の会話者の録音時間（すなわち、現在の会話者にマーカが切り替わったときの時間）を引いた時間が、特定時間である５秒を経過しているかどうかを判断する（ステップＳ４６２）。その結果、特定時間を経過していなければ、そのまま再生処理を継続する。一方、特定時間を経過していれば（ステップＳ４６２でＮｏと判断されれば）、図２８に示した早送り処理を実行する（ステップＳ４６３）。すなわち、この場合には、次のマーカまで飛んで、次の会話者の発話内容の再生処理を開始し、ステップＳ４６１に戻ることになる。

以上が、ステップＳ３１３、Ｓ３１４、Ｓ３２４〜Ｓ３２８の各処理の説明である。

本発明の実施形態１に係る音声録音再生装置であるボイスレコーダの電気的構成の一例を示すブロック図である。コントローラの内部構成を機能的に示した説明図である。実施形態１のボイスレコーダの外観図である。実施形態１の発話者基準判断テーブルの一構成例を示す説明図である。実施形態１における各発話者の配置位置の例を示す説明図である。マーカ用メモリに登録されている内容を示す説明図である。具体的な録音例を示す説明図である。実施形態１における初期化処理を説明するためのフローチャートである。実施形態１における割り込み処理を説明するためのフローチャートである。実施形態１における録音処理を説明するためのフローチャートである。実施形態１における再生処理を説明するためのフローチャートである。実施形態１における早送処理を説明するためのフローチャートである。実施形態１における巻戻処理を説明するためのフローチャートである。実施形態１における左再生処理を説明するためのフローチャートである。実施形態１におけるスキップ処理を説明するためのフローチャートである。Ｌキーを押したときの再生内容を示す説明図である。Ｌキーを長押したときの再生内容を示す説明図である。マイクロホンが３本で発話者が４人の場合の各発話者の配置位置の例を示す説明図である。マイクロホンが３本で発話者が４人の場合の発話者の判断手法を示す説明図である。マイクロホンが３本で発話者が４人の場合の発話者基準判断テーブルの一構成例を示す説明図である。本発明の実施形態２に係る音声録音再生装置の電気的構成の一例を示すブロック図である。実施形態２のボイスレコーダの外観図である。実施形態２の会話者基準判断テーブルの構成例１を示す説明図である。実施形態２の会話者基準判断テーブルの構成例２を示す説明図である。実施形態２における割り込み処理を説明するためのフローチャートである。実施形態２における録音処理を説明するためのフローチャートである。実施形態２における再生処理を説明するためのフローチャートである。実施形態２における早送処理を説明するためのフローチャートである。実施形態２における巻戻処理を説明するためのフローチャートである。実施形態２における左再生処理を説明するためのフローチャートである。実施形態２におけるスキップ処理を説明するためのフローチャートである

符号の説明

１コントローラ
２操作パネル
３左マイクロホン
３ａ受話器
４右マイクロホン
４ａ送話器
５，６マイクアンプ
７，８バンドパスフィルタ
９，１０整流ダイオード
１１，１２積分回路
１３，１４Ａ／Ｄコンバータ
１５，１６ＧＣＡ
１７加算アンプ
１８Ａ／Ｄコンバータ
１９音声メモリ
２０Ｄ／Ａコンバータ
２１スピーカアンプ
２２スピーカ
２３マーカ用メモリ
３１ハンドセット
３２電話機本体
１００，２００装置筐体

Claims

複数のマイクロホンからの入力音声を録音する録音手段と、
前記録音手段で録音された録音データを再生する再生手段とを有する音声録音再生装置において、
前記録音手段から入力される音声の音量を計測する音量計測手段と、
前記音量計測手段による音量の計測結果に基づいて発話者を特定する発話者特定手段と、
前記発話者特定手段により特定された発話者が切り替わったことを検出する発話者切替検出手段とを備え、
前記発話者切替検出手段で発話者の切り替わりを検出した場合に録音データにマークを付与することを特徴とする音声録音再生装置。
前記発話者特定手段により特定された発話者の情報を録音データに付与する発話者情報付与手段と、
発話者を選択する発話者選択手段とを更に備え、
前記発話者情報付与手段により付与された発話者の情報の中で、前記発話者選択手段により選択された発話者の情報を検索し、検索された録音データを再生することを特徴とする請求項１に記載の音声録音再生装置。
前記発話者特定手段により特定された発話者の情報を録音データに付与する発話者情報付与手段と、
発話者を選択する発話者選択手段とを更に備え、
前記発話者情報付与手段により付与された発話者の情報の中で、前記発話者選択手段により選択された発話者の情報を検索し、検索された録音データをスキップして再生することを特徴とする請求項１に記載の音声録音再生装置。
再生する時間を計測するタイマーを更に備え、
前記発話者選択手段にて選択された発話者の録音データを再生する場合に、
録音データのマークの位置から、前記タイマーにより計測された特定時間だけ再生することを特徴とする請求項２または請求項３に記載の音声録音再生装置。
前記発話者特定手段は、複数のマイクロホンから入力される音声の音量の比率により発話者を特定することを特徴とする請求項１に記載の音声録音再生装置。
前記録音手段は、前記発話者特定手段により特定された発話者以外の入力音声を低く抑えて録音することを特徴とする請求項１に記載の音声録音再生装置。
電話機による会話の音声を録音する録音手段と、
前記録音手段で録音された録音データを再生する再生手段とを有する音声録音再生装置において、
電話機の電話回線から発話される相手側の音声の音量及び当該電話機の発話者の音声の音量を計測する音量計測手段と、
前記音量計測手段による音量の計測結果に基づいて、録音データの会話者が発話者側か相手側かを特定する会話者特定手段と、
前記会話者特定手段により会話者が切り替わったことを検出する会話者切替検出手段とを備え、
前記会話者切替検出手段で会話者の切り替わりを検出した場合に、録音データにマークを付与することを特徴とする音声録音再生装置。
前記会話者特定手段により特定された会話者の情報を録音データに付与する会話者情報付与手段と、
会話者を選択する会話者選択手段とを更に備え、
前記会話者情報付与手段により付与された会話者の情報の中で、前記会話者選択手段により選択された会話者の情報を検索し、検索された録音データを再生することを特徴とする請求項７に記載の音声録音再生装置。
前記会話者特定手段により特定された会話者の情報を録音データに付与する会話者情報付与手段と、
会話者を選択する会話者選択手段とを更に備え、
前記会話者情報付与手段により付与された会話者の情報の中で、前記会話者選択手段により選択された会話者の情報を検索し、検索された録音データをスキップして再生することを特徴とする請求項７に記載の音声録音再生装置。
再生する時間を計測するタイマーを更に備え、
前記会話者選択手段にて選択された会話者の録音データを再生する場合に、録音データのマークの位置から、前記タイマーにより計測された特定時間だけ再生することを特徴とする請求項８または請求項９に記載の音声録音再生装置。
前記会話者特定手段は、電話回線から発話される相手側の音声の音量と当該電話機の発話者の音声の音量との比率により会話者を特定することを特徴とする請求項７に記載の音声録音再生装置。
前記録音手段は、前記会話者特定手段により特定された会話者以外の入力音声を低く抑えて録音することを特徴とする請求項７に記載の音声録音再生装置。