JPH07168599A - Voice recognizing and reproducing device - Google Patents
Voice recognizing and reproducing deviceInfo
- Publication number
- JPH07168599A JPH07168599A JP5313626A JP31362693A JPH07168599A JP H07168599 A JPH07168599 A JP H07168599A JP 5313626 A JP5313626 A JP 5313626A JP 31362693 A JP31362693 A JP 31362693A JP H07168599 A JPH07168599 A JP H07168599A
- Authority
- JP
- Japan
- Prior art keywords
- threshold value
- sound
- silence
- recording
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000012544 monitoring process Methods 0.000 claims abstract description 4
- 239000004065 semiconductor Substances 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 5
- 230000015556 catabolic process Effects 0.000 abstract 1
- 238000006731 degradation reaction Methods 0.000 abstract 1
- 238000000034 method Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Abstract
Description
【0001】[0001]
【産業上の利用分野】本発明は音声記録再生装置に関す
る。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice recording / reproducing apparatus.
【0002】[0002]
【従来の技術】従来より、記録媒体に磁気テ―プを使用
したいわゆるテ―プレコ―ダと呼ばれる音声記録再生装
置が普及している。このように磁気テ―プを使用した装
置は、長時間の音声を記録できる利点を有するが、装置
を小型化することが困難であると共に、音声のアクセス
に時間がかかるという欠点がある。2. Description of the Related Art Conventionally, a voice recording / reproducing apparatus called a so-called tape recorder using a magnetic tape as a recording medium has been widely used. As described above, the device using the magnetic tape has an advantage of being able to record a voice for a long time, but has a drawback that it is difficult to downsize the device and it takes time to access the voice.
【0003】この欠点を解決すべく、近年、記録媒体に
半導体メモリを使用した、いわゆるデジタルレコ―ダと
呼ばれる音声記録再生装置が開発されつつある。デジタ
ルレコ―ダはメカニズムが不要なため容易に小型化でき
るとともに、記録媒体を着脱可能な音声カ―トリッジに
収納しているので取り扱い上の利点が多い。In order to solve this drawback, in recent years, an audio recording / reproducing apparatus called a so-called digital recorder using a semiconductor memory as a recording medium is being developed. Since the digital recorder does not require a mechanism, it can be easily miniaturized, and since the recording medium is housed in a removable audio cartridge, it has many handling advantages.
【0004】ところで、このようなデジタルレコ―ダに
おいては、音声デ―タは符号化されて半導体メモリに記
録されるが、より高能率にメモリに格納するために無音
区間は符号化せずに有音区間のみを符号化して、その継
続時間情報だけを記録するようにしたものや、有音区間
と無音区間とで符号化ビット配分量を切り替えるように
したものが考案されており、その一例が特開平4−16
1999号公報に開示されている。By the way, in such a digital recorder, the voice data is encoded and recorded in the semiconductor memory, but in order to store the voice data in the memory more efficiently, the silent section is not encoded. One in which only the voiced section is encoded and only the duration information is recorded, and one in which the encoding bit allocation amount is switched between the voiced section and the silent section have been devised. Japanese Patent Laid-Open No. 4-16
It is disclosed in the 1999 publication.
【0005】また、有音・無音区間の検出方法として従
来からよく用いられてきた方法に、音声パワ―や自己相
関関数に着目し、これをしきい値判定するものが知られ
ている。さらに、日本音響学会講演論文集3−7−15
(滝沢・則松他著、平成1年3月発行)は、背景雑音レ
ベルに適応してしきい値を自動的に調整する方法を開示
している。Further, as a method that has been often used as a method for detecting a voiced / non-voiced area, there is known a method that pays attention to a voice power or an autocorrelation function and judges the threshold value. Furthermore, Proceedings of the Acoustical Society of Japan 3-7-15
(Takizawa, Norimatsu et al., Published in March, 1991) discloses a method for automatically adjusting a threshold value in accordance with a background noise level.
【0006】[0006]
【発明が解決しようとする課題】しかしながら、このよ
うな音声パワ―や自己相関関数による方法では、話者や
周囲の環境への依存性が高く、安定した有音・無音区間
の検出が困難であり、その誤検出のために再生音声の音
質が大きく劣化するという問題点があった。However, such a method using the voice power and the autocorrelation function has a high dependency on the speaker and the surrounding environment, and it is difficult to detect a stable voiced / silent section. However, there is a problem that the sound quality of the reproduced voice is greatly deteriorated due to the erroneous detection.
【0007】また、背景雑音レベルに適応してしきい値
を自動的に調整する方法においても、実際のさまざまな
周囲環境の違いに自動的に追従できず、誤検出しやすい
という問題点があった。Further, even in the method of automatically adjusting the threshold value in accordance with the background noise level, there is a problem in that it is not possible to automatically follow the actual differences in various surrounding environments and it is easy to make an erroneous detection. It was
【0008】本発明の音声記録再生装置はこのような課
題に着目してなされたものであり、その目的とするとこ
ろは、周囲の環境の影響による再生音声の音質劣化を最
小限に抑えることができる音声記録再生装置を提供する
ことにある。The audio recording / reproducing apparatus of the present invention has been made in view of such a problem, and an object thereof is to minimize the deterioration of the sound quality of reproduced audio due to the influence of the surrounding environment. An object is to provide an audio recording / reproducing device capable of performing the same.
【0009】[0009]
【課題を解決するための手段】上記の目的を達成するた
めに、本発明は、入力された音声信号をデジタル信号に
変換した後符号化して半導体メモリに記録し、この半導
体メモリに記録された信号を復号化した後アナログ信号
に変換して再生出力する音声記録再生装置において、予
め定められたフレ―ム間隔に分割して入力されたデジタ
ル信号の特徴パラメ―タを求める特徴パラメ―タ算出手
段と、この特徴パラメ―タ算出手段からの出力信号が有
音に係るものか無音に係るものかをしきい値判定する有
音/無音判定手段と、この有音/無音判定手段による判
定結果に基づいて符号化ビット配分量を切り換える符号
化ビット配分量切り換え手段と、この有音/無音判定手
段のしきい値を任意に可変調整可能なしきい値調整手段
とを具備する。In order to achieve the above-mentioned object, according to the present invention, an input audio signal is converted into a digital signal, encoded, recorded in a semiconductor memory, and recorded in the semiconductor memory. In a voice recording / reproducing apparatus that decodes a signal, converts it into an analog signal, and reproduces and outputs it, characteristic parameter calculation for obtaining characteristic parameters of a digital signal input by dividing it into predetermined frame intervals Means, a sound / silence judging means for threshold value judgment of whether the output signal from the characteristic parameter calculating means is related to sound or silence, and a judgment result by the sound / silence judging means. The coding bit distribution amount switching means for switching the coding bit distribution amount based on the above, and the threshold value adjusting means capable of variably adjusting the threshold value of the voice / silence judging means.
【0010】また、上記しきい値調整手段は、所定の操
作により自動的にしきい値を変化させながら所定時間、
試し録音を行なった後その内容を再生する動作を繰り返
す試し録音再生手段と、外部操作により上記動作を停止
させてその時のしきい値を設定するためのしきい値選択
手段とを具備する。The threshold value adjusting means automatically changes the threshold value by a predetermined operation for a predetermined time.
A trial recording / reproducing means for repeating the operation of reproducing the contents after performing the trial recording and a threshold value selecting means for stopping the above operation by an external operation and setting a threshold value at that time are provided.
【0011】[0011]
【作用】すなわち、本発明の音声記録再生装置において
は、予め定められたフレ―ム間隔に分割して入力された
デジタル音声信号の特徴パラメ―タを求め、この特徴パ
ラメ―タが有音に係るものか無音に係るものかをしきい
値によって判定し、判定結果に基づいて符号化ビット配
分量を切り換える。このときのしきい値は任意に可変調
整可能である。That is, in the audio recording / reproducing apparatus of the present invention, the characteristic parameters of the digital audio signal input by dividing the audio recording / reproducing apparatus into predetermined frame intervals are obtained, and the characteristic parameters are converted into the sound. Whether it is related or silence is determined by a threshold value, and the coded bit allocation amount is switched based on the determination result. The threshold value at this time can be variably adjusted.
【0012】また、しきい値調整を行なう場合、所定の
操作により自動的にしきい値を変化させながら所定時
間、試し録音を行なった後その内容を再生する動作を繰
り返し、外部操作により上記動作を停止させてその時の
しきい値を設定する。Further, when the threshold value is adjusted, the operation of reproducing the contents after performing a trial recording for a predetermined time while changing the threshold value automatically by a predetermined operation is repeated, and the above operation is performed by an external operation. Stop and set the threshold at that time.
【0013】[0013]
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。図1は第1実施例に係る音声記録再生装置
の構成を示す図である。同図において、マイク1はマイ
クアンプ2とA/D変換器3とを介してフレームエネル
ギー計算部4に接続されている。このフレームエネルギ
ー計算部4は有音/無音判定部5を介して符号/復号化
部9の第1端子に接続されている。Embodiments of the present invention will now be described in detail with reference to the drawings. FIG. 1 is a diagram showing the configuration of an audio recording / reproducing apparatus according to the first embodiment. In the figure, the microphone 1 is connected to the frame energy calculation unit 4 via a microphone amplifier 2 and an A / D converter 3. The frame energy calculation unit 4 is connected to the first terminal of the encoding / decoding unit 9 via the voice / silence determining unit 5.
【0014】この符号/復号化部9の第2端子はD/A
変換器8の入力端子に接続されるとともに、第3端子は
メモリ制御部10を介して音声メモリ部11に接続され
ている。また、D/A変換器8の出力端子は抵抗R1を
介して、他端が接地された抵抗R2の一端と、スイッチ
S3の一端に接続されている。The second terminal of the encoder / decoder 9 is a D / A
The third terminal is connected to the input terminal of the converter 8, and the third terminal is connected to the audio memory unit 11 via the memory control unit 10. The output terminal of the D / A converter 8 is connected via a resistor R1 to one end of a resistor R2 whose other end is grounded and one end of a switch S3.
【0015】D/A変換器8の出力端子はさらにスイッ
チS1のb側接点に接続され、かつこのa側接点は電源
+V(例えば5ボルト)に接続されている。さらに、こ
のスイッチS1の支点は、他端が接地され可変抵抗VR
からなる再生ボリウムの一端に接続されている。The output terminal of the D / A converter 8 is further connected to the b-side contact of the switch S1, and this a-side contact is connected to the power source + V (for example, 5 volts). Further, the fulcrum of this switch S1 is grounded at the other end, and the variable resistor VR is connected.
Is connected to one end of a playback volume.
【0016】さらにスピーカ6はパワーアンプ7に接続
され、このパワーアンプ7はスイッチS3の他端に接続
されるとともにスイッチS2のc側接点に接続されてい
る。また、スイッチS2のd側接点はシステム制御部1
2に接続されるとともに、その支点は再生ボリウムの可
変端子に接続されている。Further, the speaker 6 is connected to a power amplifier 7, and the power amplifier 7 is connected to the other end of the switch S3 and the c-side contact of the switch S2. Further, the d-side contact of the switch S2 is the system control unit 1
2 and its fulcrum is connected to the variable terminal of the reproduction volume.
【0017】ここで、上記したスイッチS1乃至S3と
抵抗R1、R2とはモニタ手段を構成する。さらに、シ
ステム制御部12は操作入力部13に接続されるととも
に、各部の制御を行なうべくスイッチ1、スイッチ2、
スイッチ3と、有音/無音判定部5と符号/復号化部9
とメモリ制御部10と音声メモリ部11とに接続されて
いる。Here, the switches S1 to S3 and the resistors R1 and R2 constitute a monitor means. Further, the system control unit 12 is connected to the operation input unit 13 and also has switches 1, 2 and 3 for controlling each unit.
Switch 3, voice / silence determination unit 5, and encoding / decoding unit 9
Is connected to the memory control unit 10 and the voice memory unit 11.
【0018】上記した構成において、録音時、マイク1
から供給される音声はマイクアンプ2で増幅されたの
ち、A/D変換器3で例えば8kHzのサンプリング周
波数でデジタルデ―タS(i) に変換される。このデジタ
ルデ―タS(i) は予め定められたフレ―ム間隔(例えば
20msが使用され、160サンプルに相当する)に分
割されてフレ―ムエネルギ―計算部4にて次式で表され
るフレ―ムエネルギ―Eが求められる。In the above structure, the microphone 1 is used during recording.
The voice supplied from the device is amplified by the microphone amplifier 2 and then converted into digital data S (i) by the A / D converter 3 at a sampling frequency of, for example, 8 kHz. This digital data S (i) is divided into a predetermined frame interval (for example, 20 ms is used, which corresponds to 160 samples) and is expressed by the frame energy calculating section 4 by the following equation. Frame energy E is required.
【0019】[0019]
【数1】 [Equation 1]
【0020】ここで、Nはフレ―ム長(すなわち160
サンプル)を示す。求められたフレ―ムエネルギ―Eは
有音/無音判定部5で予め定められているしきい値と比
較され、Eがしきい値より大きければそのフレ―ム音声
は有音、それ以外は無音と判定する。ここで、上記しき
い値は録音環境に対応するために使用者の操作により可
変することができるがこれについては後述する。有音/
無音判定された入力音声信号は符号/復号化部9で所定
の符号化が施される。例えば有音と判定されたフレ―ム
についてはADPCM(Adaptive DifferentialPulse C
ode Modulation )符号化が施されるが、無音フレ―ム
については符号化せず無音フレ―ムが継続した数を計数
する。符号化デ―タはメモリ制御部10を介して音声メ
モリ部11に記録される。Where N is the frame length (ie 160
(Sample) is shown. The obtained frame energy E is compared with a predetermined threshold value in the voice / silence determining unit 5, and if E is larger than the threshold value, the frame voice is voiced, otherwise the voice is silent. To determine. Here, the threshold value can be changed by the operation of the user to correspond to the recording environment, which will be described later. Voice /
The encoding / decoding unit 9 performs a predetermined encoding on the input voice signal for which silence has been determined. For example, for a frame that is determined to be voiced, ADPCM (Adaptive Differential Pulse C
ode Modulation) is encoded, but silent frames are not coded and the number of continuous silent frames is counted. The encoded data is recorded in the audio memory unit 11 via the memory control unit 10.
【0021】一方、再生時には、記録されているデ―タ
のうち再生すべきデ―タが音声メモリ部11からメモリ
制御部10を介して読み出され、符号/復号化部9で復
号化された後D/A変換器8でアナログ音声信号に戻さ
れる。このとき、制御部12からの制御信号によってス
イッチS1はb側に、スイッチS2はc側に閉じた状態
に保持され、またスイッチS3は開いた状態に保持され
る。したがって、この場合、アナログ音声信号は可変抵
抗VRからなる再生ボリウムを経由してパワ―アンプ7
で増幅されたのちスピ―カ6より音声として出力され
る。On the other hand, at the time of reproduction, of the recorded data, the data to be reproduced is read from the audio memory section 11 via the memory control section 10 and decoded by the encoding / decoding section 9. After that, the D / A converter 8 restores the analog voice signal. At this time, the switch S1 is held in the b side, the switch S2 is held in the c side, and the switch S3 is held in the open state by the control signal from the control unit 12. Therefore, in this case, the analog audio signal passes through the reproduction volume constituted by the variable resistor VR and then the power amplifier 7
After being amplified by, it is output as sound from the speaker 6.
【0022】上記した録音及び再生、さらに停止等の動
作タイミングは操作入力部13から送られてくる信号に
応答してシステム制御部12により制御される。以下に
第1実施例に係るしきい値調整動作を図2のフロ―チャ
―トを参照して説明する。The operation timings of the above-mentioned recording and reproduction, and stop, etc. are controlled by the system control unit 12 in response to the signal sent from the operation input unit 13. The threshold value adjusting operation according to the first embodiment will be described below with reference to the flowchart of FIG.
【0023】まず、使用者が操作入力部13より録音操
作を行うと(ステップS1)、システム制御部12の制
御動作によって図1におけるスイッチS1をa側に、ス
イッチS2をd側に閉じ、またスイッチS3を閉じた状
態にした後(ステップS2)、録音動作を開始する。First, when the user performs a recording operation from the operation input section 13 (step S1), the control operation of the system control section 12 closes the switch S1 to the a side and the switch S2 to the d side in FIG. After the switch S3 is closed (step S2), the recording operation is started.
【0024】これにより符号/復号化部9で得られた符
号化デ―タは、上記したようにメモリ制御部10を介し
て音声メモリ部11に記録されるが、上記ステップS2
の動作によってスイッチS3は閉じられているので、同
時に音声メモリ部11に記録された符号化デ―タは符号
/復号化部9で復号化されD/A変換器8でアナログ音
声信号に戻されたのち、抵抗R1を経由してパワ―アン
プ7で増幅されスピ―カ6より音声として出力される。
これによって使用者は録音した音声を復号化した音声を
ただちに聴いてモニタすることができる(ステップS
3)。ここで、スピ―カ6の代わりにイヤホン等を使用
して音声をモニタすることも可能である。As a result, the encoded data obtained by the encoding / decoding unit 9 is recorded in the audio memory unit 11 via the memory control unit 10 as described above.
Since the switch S3 is closed by the operation of, the coded data recorded in the voice memory section 11 at the same time is decoded by the coding / decoding section 9 and returned to the analog voice signal by the D / A converter 8. After that, it is amplified by the power amplifier 7 via the resistor R1 and is output as sound from the speaker 6.
As a result, the user can immediately listen to and monitor the sound obtained by decoding the recorded sound (step S).
3). Here, it is also possible to use an earphone or the like instead of the speaker 6 to monitor the voice.
【0025】次に、ステップS4ではモニタ音声を聴い
てモニタ音声の音質が良いか否かを判断、すなわち背景
ノイズによる悪影響によって音質が劣化しているかどう
かを判断し、音質が良くない場合は再生ボリウムを調整
する(ステップS5)。このときスイッチS1はa側に
かつ、スイッチS2はd側に閉じられているので、シス
テム制御部12にはそのときの再生ボリウムの位置に応
じた電圧値が供給される。システム制御部12はこの電
圧値をデジタル値に変換し、例えば、図5に示すような
テーブルを参照して調整によって得られた電圧値に対応
するしきい値を有音/無音判定部5に再設定する(ステ
ップS6)。そして再びステップS4に戻り、モニタ音
声の音質が最も良くなるまで繰り返す。Next, in step S4, the monitor sound is listened to and it is judged whether or not the sound quality of the monitor sound is good, that is, it is judged whether or not the sound quality is deteriorated due to the adverse effect of background noise. Adjust the volume (step S5). At this time, since the switch S1 is closed to the side a and the switch S2 is closed to the side d, the system controller 12 is supplied with a voltage value according to the position of the reproduction volume at that time. The system control unit 12 converts this voltage value into a digital value, and, for example, refers to a table as shown in FIG. 5 and sets a threshold value corresponding to the voltage value obtained by the adjustment to the sound / silence determination unit 5. Reset (step S6). Then, the process returns to step S4 again, and is repeated until the sound quality of the monitor sound becomes the best.
【0026】以下に本発明の第2実施例を説明する。前
記した第1実施例ではしきい値の調整を録音動作中に行
なったが、本実施例では録音する前に所定時間、しきい
値を変化させながら試し録音を行ない、その結果に応じ
てしきい値を決定するようにしたものである。図3は第
2実施例の構成を示す図であり、図1に示すモニタ手段
を構成するスイッチS1乃至S3と抵抗R1、R2を省
略した構成となっている。The second embodiment of the present invention will be described below. In the first embodiment described above, the threshold value was adjusted during the recording operation, but in this embodiment, the trial recording is performed while changing the threshold value for a predetermined time before recording, and according to the result. The threshold value is determined. FIG. 3 is a diagram showing the configuration of the second embodiment, in which the switches S1 to S3 and the resistors R1 and R2 constituting the monitor means shown in FIG. 1 are omitted.
【0027】以下に、第2実施例に係るしきい値調整動
作を図4のフローチャートを参照して説明する。まず使
用者が試し録音操作(例えば操作入力部13に配置され
た図示せぬ録音釦としきい値調整釦とを同時に押下する
こと)を行なうと(ステップST1)、図示せぬカウン
タのカウント値tを1、かつ他のカウンタのカウント値
iを0に設定する(ステップST2)。ここでは、例え
ば図6のテーブルに示すようなカウント値t=1に対応
するしきい値(ここでは26dB)を有音/無音判定部
5にセットし、ステップST4で所定時間(例えば3秒
間)試し録音を行なう。The threshold value adjusting operation according to the second embodiment will be described below with reference to the flowchart of FIG. First, when the user performs a trial recording operation (for example, simultaneously pressing a recording button (not shown) and a threshold value adjusting button arranged on the operation input unit 13) (step ST1), a count value t of a counter (not shown) is set. Is set to 1 and the count value i of the other counter is set to 0 (step ST2). Here, for example, a threshold value (26 dB in this case) corresponding to the count value t = 1 as shown in the table of FIG. 6 is set in the sound / silence determination unit 5, and a predetermined time (for example, 3 seconds) is set in step ST4. Make a trial recording.
【0028】図6のテーブルではしきい値として10段
階の値が用意されているので、カウント値tは1から1
0まで変化させることができる。次に、ステップST5
でカウント値iを1だけ増分させた後、ステップST6
でカウント値iが10以下か否かを判断し、10以下で
あればステップST7に進んでカウント値tを1だけ増
分してステップST3に進む。In the table shown in FIG. 6, ten threshold values are prepared, so the count value t is from 1 to 1.
It can be changed to 0. Next, step ST5
After incrementing the count value i by 1 in step ST6, step ST6
It is determined whether or not the count value i is 10 or less. If it is 10 or less, the process proceeds to step ST7, increments the count value t by 1 and proceeds to step ST3.
【0029】一方、ステップST6でカウント値iが1
0を越える場合はステップST8に進んでカウント値i
が20以下か否かを判断する。ここで20以下であれば
ステップST9でカウント値tを1だけ減じてステップ
ST3に進み、上記のステップをカウント値iが20に
なるまで繰り返す。以上の動作によって10段階のしき
い値が3秒間隔で変化しながら、それぞれのしきい値に
ついて2回ずつ録音されることになる。On the other hand, in step ST6, the count value i is 1
If it exceeds 0, the process proceeds to step ST8 and the count value i
Is 20 or less. If it is 20 or less, the count value t is decremented by 1 in step ST9, the process proceeds to step ST3, and the above steps are repeated until the count value i reaches 20. By the above operation, the threshold value in 10 steps is changed at intervals of 3 seconds, and each threshold value is recorded twice.
【0030】次にカウント値iが20を越えた場合はス
テップST10に進みカウント値をt=1、i=0にセ
ットするとともに、次のステップST11でカウント値
tに対応するしきい値をセットする。次に試し録音され
た内容を例えば3秒間再生する(ステップST12)。
次のステップST13では使用者がその再生内容を聴い
て再生音の音質が良いか否かを判断する。ここで音質が
良くない場合はカウント値iを1だけ増分して(ステッ
プST14)、次のステップST15でカウント値iが
10以下か否かを判断する。ここで10以下の場合は次
のステップST16でカウント値tを1だけ増分してス
テップST11に進む。Next, when the count value i exceeds 20, the process proceeds to step ST10 to set the count values to t = 1 and i = 0, and at the next step ST11 to set the threshold value corresponding to the count value t. To do. Next, the content of the trial recording is reproduced for, for example, 3 seconds (step ST12).
In the next step ST13, the user listens to the reproduced content and determines whether or not the reproduced sound quality is good. If the sound quality is not good, the count value i is incremented by 1 (step ST14), and it is determined in the next step ST15 whether the count value i is 10 or less. If it is 10 or less, the count value t is incremented by 1 in the next step ST16 and the process proceeds to step ST11.
【0031】一方、ステップST15でカウント値iが
10を越えた場合はステップST17に進み、カウント
値iが20になるまでステップST18でカウント値t
を1だけ減じながらステップST11に進む。On the other hand, when the count value i exceeds 10 in step ST15, the process proceeds to step ST17, and the count value t is counted in step ST18 until the count value i reaches 20.
Is decreased by 1, and the process proceeds to step ST11.
【0032】そして、ステップST13で使用者が音質
が良いと判断した時点でステップST19に進んでしき
い値調整釦を押下して、その時のカウント値tに対応す
るしきい値を保持する。When the user determines in step ST13 that the sound quality is good, the process proceeds to step ST19, where the threshold value adjustment button is pressed to hold the threshold value corresponding to the count value t at that time.
【0033】また、ステップST17においてカウント
値iが20を越えたときはステップST20に進んで、
例えばカウント値t=5に対応するしきい値を有音/無
音判定部5に自動的にセットする。When the count value i exceeds 20 in step ST17, the process proceeds to step ST20.
For example, a threshold value corresponding to the count value t = 5 is automatically set in the sound / silence determination unit 5.
【0034】なお、上記した第2実施例において、録音
動作中以外には使用しない釦、例えば、頭出し信号を記
録するためのIマ―ク(Instruction マーク)釦を、録
音する前に押下することによって予め定められた時間
(例えば10秒間)、上記のしきい値調整ができるよう
にすることも可能である。Incidentally, in the above-mentioned second embodiment, a button which is not used except during the recording operation, for example, an I mark (Instruction mark) button for recording a cue signal is pressed before recording. Therefore, it is possible to allow the above threshold adjustment for a predetermined time (for example, 10 seconds).
【0035】以上のように、第1実施例に係る音声記録
再生装置は、入力された音声信号をデジタル信号に変換
した後符号化して半導体メモリ(音声メモリ部11)に
記録し、半導体メモリに記録された信号を復号化した後
アナログ信号に変換して再生出力する音声記録再生装置
において、予め定められたフレ―ム間隔に分割して入力
されたデジタル信号の特徴パラメ―タを求める特徴パラ
メ―タ算出手段すなわち、入力されたデジタル信号のフ
レームエネルギーEを計算するフレームエネルギー計算
部4と、特徴パラメ―タ算出手段としてのフレームエネ
ルギー計算部4からの出力信号が有音に係るものか無音
に係るものかをしきい値判定する有音/無音判定手段
(有音/無音判定部5)と、有音/無音判定手段による
判定結果に基づいて符号化ビット配分量を切り換える符
号化ビット配分量切り換え手段すなわち、有音と判定さ
れたフレームについてはADPCM符号化するが、無音
フレームについては符号化せず無音フレームが継続した
数を計数するシステム制御部12と、有音/無音判定手
段のしきい値を任意に可変調整可能なしきい値調整手段
(再生ボリウム及びシステム制御部12)とを具備す
る。As described above, the audio recording / reproducing apparatus according to the first embodiment converts the input audio signal into a digital signal, encodes it, records it in the semiconductor memory (audio memory unit 11), and stores it in the semiconductor memory. In a voice recording / reproducing apparatus that decodes a recorded signal, converts it to an analog signal, and reproduces and outputs it, a characteristic parameter for obtaining a characteristic parameter of a digital signal divided into predetermined frame intervals. -The means for calculating the frame energy, ie, the frame energy calculating section 4 for calculating the frame energy E of the inputted digital signal, and the output signal from the frame energy calculating section 4 as the means for calculating the characteristic parameters is related to the presence of voice or silence. Based on the judgment result by the sound / silence judgment unit (sound / silence judgment unit 5) and the sound / silence judgment unit. Coded bit allocation amount switching means for switching the encoded bit allocation amount, that is, system control for counting the number of continuous silent frames without ADPCM coding for frames determined to be voiced The unit 12 and threshold value adjusting means (reproduction volume and system control section 12) capable of variably adjusting the threshold value of the sound / silence judging means are provided.
【0036】さらに、上記した第1実施例の構成におい
て、上記しきい値調整手段は、復号化された音声信号を
モニタするモニタ手段(スイッチS1乃至S3と抵抗R
1、R2)を具備している。Further, in the configuration of the first embodiment described above, the threshold value adjusting means is a monitor means (switches S1 to S3 and a resistor R for monitoring the decoded voice signal).
1, R2).
【0037】さらに、上記した第1実施例の構成におい
て、しきい値調整手段は再生ボリウム調整手段(再生ボ
リウム)を含んでいる。さらに、上記した第1実施例の
構成において、第2実施例に係るしきい値調整手段は、
所定の操作により、例えば録音釦としきい値調整釦とを
同時に押下げることにより、自動的にしきい値を変化さ
せながら所定時間(例えば3秒間)、試し録音を行なっ
た後その内容を再生する動作を繰り返す試し録音再生手
段(システム制御部12)と、外部操作、例えばしきい
値調整釦を押下げることにより上記動作を停止させてそ
の時のしきい値を設定するためのしきい値選択手段(シ
ステム制御部12)とを具備する。Further, in the structure of the first embodiment described above, the threshold value adjusting means includes a reproducing volume adjusting means (reproducing volume). Further, in the configuration of the first embodiment described above, the threshold adjusting means according to the second embodiment is
An operation of performing a trial recording for a predetermined time (for example, 3 seconds) while automatically changing the threshold value by pressing the record button and the threshold value adjusting button at the same time by a predetermined operation, and then reproducing the content. Repeating recording / reproducing means (system control section 12) and threshold selecting means for setting the threshold value at that time by stopping the above operation by external operation, for example, pressing down a threshold value adjusting button ( System control unit 12).
【0038】さらに、上記した第1実施例の構成におい
て、第2実施例に係る制御手段(システム制御部12)
は、所定の操作釦の操作を条件に、すなわち録音動作中
以外は使用しない釦例えばIマーク釦を押下げた場合、
予め定められた時間(例えば10秒間)、再生ボリウム
調整手段によるしきい値調整を行なう。Furthermore, in the configuration of the first embodiment described above, the control means (system control unit 12) according to the second embodiment.
Is a condition that a predetermined operation button is operated, that is, when a button that is not used except during the recording operation, such as an I mark button, is pressed,
The threshold value is adjusted by the reproduction volume adjusting means for a predetermined time (for example, 10 seconds).
【0039】上記した第1実施例に係る音声記録再生装
置によれば、使用者が再生音声の音質をモニタしながら
有音/無音判定のしきい値を設定できるので、録音環境
に応じた符号化ができ、再生音声の音質劣化を最小限に
抑えることができる。According to the voice recording / reproducing apparatus in the first embodiment described above, the user can set the threshold value for voiced / non-voiced determination while monitoring the sound quality of the reproduced voice. The quality of the reproduced voice can be minimized.
【0040】また、上記した第2実施例に係る音声記録
再生装置によれば、実際に録音する前にしきい値の調整
を行なえるので、録音データの初めから周囲の環境の影
響による再生音声の音質劣化を最小限に抑えることがで
きる。Further, according to the audio recording / reproducing apparatus in the second embodiment described above, the threshold value can be adjusted before the actual recording, so that the reproduced audio from the beginning of the recorded data is influenced by the surrounding environment. Sound quality deterioration can be minimized.
【図1】第1実施例に係る音声記録再生装置の構成を示
す図である。FIG. 1 is a diagram showing a configuration of an audio recording / reproducing apparatus according to a first embodiment.
【図2】第1実施例に係るしきい値調整動作を示すフロ
―チャ―トである。FIG. 2 is a flowchart showing a threshold value adjusting operation according to the first embodiment.
【図3】第1実施例に係る音声記録再生装置の構成を示
す図である。FIG. 3 is a diagram showing a configuration of an audio recording / reproducing apparatus according to a first embodiment.
【図4】第2実施例に係るしきい値調整動作を示すフロ
ーチャートである。FIG. 4 is a flowchart showing a threshold adjustment operation according to the second embodiment.
【図5】再生ボリウムの電圧値とこれに応じて設定され
るしきい値とを示すテーブルである。FIG. 5 is a table showing a voltage value of a reproduction volume and a threshold value set according to the voltage value.
【図6】カウンタ値tとこれに応じて設定されるしきい
値とを示すテーブルである。FIG. 6 is a table showing a counter value t and a threshold value set accordingly.
1…マイク、2…マイクアンプ、3…A/D変換器、4
…フレームエネルギー計算部、5…有音/無音判定部、
6…スピーカ、7…パワーアンプ、8…D/A変換器、
9…符号/復号化部、10…メモリ制御部、11…音声
メモリ部、12…システム制御部、13…操作入力部。1 ... Microphone, 2 ... Microphone amplifier, 3 ... A / D converter, 4
... Frame energy calculation unit, 5 ... Voice / silence determination unit,
6 ... speaker, 7 ... power amplifier, 8 ... D / A converter,
9 ... Encoding / decoding section, 10 ... Memory control section, 11 ... Voice memory section, 12 ... System control section, 13 ... Operation input section.
Claims (5)
換した後符号化して半導体メモリに記録し、この半導体
メモリに記録された信号を復号化した後アナログ信号に
変換して再生出力する音声記録再生装置において、 予め定められたフレ―ム間隔に分割して入力されたデジ
タル信号の特徴パラメ―タを求める特徴パラメ―タ算出
手段と、 この特徴パラメ―タ算出手段からの出力信号が有音に係
るものか無音に係るものかをしきい値判定する有音/無
音判定手段と、 この有音/無音判定手段による判定結果に基づいて符号
化ビット配分量を切り換える符号化ビット配分量切り換
え手段と、 この有音/無音判定手段のしきい値を任意に可変調整可
能なしきい値調整手段とを具備したことを特徴とする音
声記録再生装置。1. A voice recording in which an input voice signal is converted into a digital signal, encoded and recorded in a semiconductor memory, the signal recorded in the semiconductor memory is decoded, converted into an analog signal and reproduced and output. In the reproducing apparatus, characteristic parameter calculating means for obtaining characteristic parameters of a digital signal divided into predetermined frame intervals and inputted, and an output signal from the characteristic parameter calculating means is sounded. Sound / silence determination means for threshold value determination as to whether it is related to sound or silence, and coded bit distribution amount switching means for switching the coded bit distribution amount based on the determination result by this sound / silence determination means. And a threshold value adjusting means capable of variably adjusting the threshold value of the sound / silence judging means.
音声信号をモニタするモニタ手段を具備したことを特徴
とする請求項1記載の音声記録再生装置。2. The audio recording / reproducing apparatus according to claim 1, wherein the threshold value adjusting means comprises a monitor means for monitoring the decoded audio signal.
整手段を含むことを特徴とする請求項1又は2記載の音
声記録再生装置。3. The audio recording / reproducing apparatus according to claim 1, wherein the threshold value adjusting means includes a reproducing volume adjusting means.
より自動的にしきい値を変化させながら所定時間、試し
録音を行なった後その内容を再生する動作を繰り返す試
し録音再生手段と、外部操作により上記動作を停止させ
てその時のしきい値を設定するためのしきい値選択手段
と、を具備したことを特徴とする請求項2記載の音声記
録再生装置。4. The threshold value adjusting means includes a trial recording / reproducing means for repeating the operation of reproducing the contents after performing a trial recording for a predetermined time while automatically changing the threshold value by a predetermined operation. 3. The audio recording / reproducing apparatus according to claim 2, further comprising a threshold value selecting means for stopping the operation by operation and setting a threshold value at that time.
予め定められた時間、再生ボリウム調整手段によるしき
い値調整を可能にする制御手段を具備したことを特徴と
する請求項3記載の音声記録再生装置。5. A control means for enabling threshold adjustment by a reproduction volume adjusting means for a predetermined time before recording on condition that a predetermined operation button is operated. The audio recording and reproducing apparatus described.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5313626A JPH07168599A (en) | 1993-12-14 | 1993-12-14 | Voice recognizing and reproducing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5313626A JPH07168599A (en) | 1993-12-14 | 1993-12-14 | Voice recognizing and reproducing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07168599A true JPH07168599A (en) | 1995-07-04 |
Family
ID=18043589
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5313626A Withdrawn JPH07168599A (en) | 1993-12-14 | 1993-12-14 | Voice recognizing and reproducing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07168599A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013076843A1 (en) * | 2011-11-24 | 2015-04-27 | トヨタ自動車株式会社 | Sound source detection device |
-
1993
- 1993-12-14 JP JP5313626A patent/JPH07168599A/en not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2013076843A1 (en) * | 2011-11-24 | 2015-04-27 | トヨタ自動車株式会社 | Sound source detection device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4893197A (en) | Pause compression and reconstitution for recording/playback apparatus | |
KR20000022351A (en) | Method and device for detecting voice section, and speech velocity conversion method device utilizing the method and the device | |
KR20080027165A (en) | Data recording apparatus, data recording method and data recording program | |
JPH07168599A (en) | Voice recognizing and reproducing device | |
JPH09185397A (en) | Speech information recording device | |
US7043440B2 (en) | Play back apparatus | |
US6539350B1 (en) | Method and circuit arrangement for speech level measurement in a speech signal processing system | |
JP3420831B2 (en) | Bone conduction voice noise elimination device | |
JPH11167396A (en) | Voice recording and reproducing device | |
JPH10116097A (en) | Voice reproducing device | |
JP3189587B2 (en) | Audio time base converter | |
JPH0764584A (en) | Automatic reproducing speed adjusting device for speech information | |
JP3022619B2 (en) | Automatic adjustment device for information playback speed | |
JP3201327B2 (en) | Recording and playback device | |
JPH0772896A (en) | Device for compressing/expanding sound | |
JP2006317768A (en) | Speaking speed conversion apparatus and speaking speed conversion program for controlling the speaking speed conversion apparatus | |
JP2002287800A (en) | Speech signal processor | |
KR0141237B1 (en) | Audio signal recording / playback method and apparatus | |
JPH06332500A (en) | Voice reproducing device with variable speed reproducing function | |
JPH0830293A (en) | Voice information processing device | |
JP2848603B2 (en) | Voice recording and playback device | |
JPH0816199A (en) | Sound recording device | |
JPH103300A (en) | Digital audio recording and reproducing device | |
JPH0990994A (en) | Sound recorder starting by voice | |
JPH07160300A (en) | Voice recording device and voice reproducing device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20010306 |