SU1394232A1 - Method of identifying a talker - Google Patents
Method of identifying a talker Download PDFInfo
- Publication number
- SU1394232A1 SU1394232A1 SU864044386A SU4044386A SU1394232A1 SU 1394232 A1 SU1394232 A1 SU 1394232A1 SU 864044386 A SU864044386 A SU 864044386A SU 4044386 A SU4044386 A SU 4044386A SU 1394232 A1 SU1394232 A1 SU 1394232A1
- Authority
- SU
- USSR - Soviet Union
- Prior art keywords
- speaker
- average values
- threshold
- speech
- fragments
- Prior art date
Links
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
Изобретение относитс к речевой информатике о Цель изобретени - упрощение процесса прин ти решени о смене говор щего по свойствам принимаемых речевых сообщений о Свойство выделенных характеристик речи начальных фрагментов монотонных участков позвол ет идентифицировать Говор щего путем формировани последовательностей средних значений высоты тона и относительной энергии верхних формант , формировани текущих средних значений последовательностей средних значений и сравнени абсолютных значений относительно уклонений последних значений от соответствующих текущих значенийо Если уклон не пре- вьшает порог, который устанавливает в пределах 10-ЗОЙ, то говор щего верифицируют , если он превьшает этот порог, то говор щего замен ют„ 1 ил I (ЛThe invention relates to speech informatics. The purpose of the invention is to simplify the process of deciding whether to change the speaker by the properties of received speech messages. The property of the selected speech characteristics of the initial fragments of monotonic regions allows one to identify the Speaker by forming sequences of average values of pitch and relative energy of upper formant, forming current average values of sequences of average values and comparing absolute values with respect to deviations n If the slope does not exceed the threshold, which sets within 10-ZOY, then the speaker is verified, if he exceeds this threshold, then the speaker is replaced by „1 Il I (L
Description
Изобретение относитс к приборостроению дл речевой информатики и Предназначено дл контрол за воз можной сменой говор щего в системах св зи и системах голосового управлени ,The invention relates to instrumentation for speech informatics and is intended to control the possible change of speaker in communication systems and voice control systems,
Цель изобретени - упрощение процесса прин ти решени о смене говор щего по свойствам принимаемых ре- чевых сообщенийThe purpose of the invention is to simplify the process of making a decision about changing the speaker by the properties of received voice messages.
Упрощение процесса достигаетс выделением из речевых сигналов только тех фрагментов речи, которыми начинаютс монотонные участки речевых сообщений В пределах этих монотонны начальных участков, длительность которых составл ет с, высота тона голоса и относительна энерги .третьей и четвертой формант измен ютс не более чем на 30%, а сами эти характеристики речи мен ютс незначительно от фрагмента к фрагменту и вл ютс разными у различных людей Это свойство выделенных характеристик ре чи начальных фрагментов монотонных участков позвол ет идентифицировать говор щего путем формировани последовательностей средних значений высоты тона и относительной энергии верхних формант, формировани текущих средних значений последовательностей средних значений и сравнени абсолютных значений относительных уклонений последних средних значе- НИИ от соответствующих текущих средних значений Если уклонени не пре- выщают порог, который устанавливают в пределах 10-30%, то говор щего верифицируют , если они превьппают этот порог, то принимают решение о смене говор щегоSimplification of the process is achieved by extracting from speech signals only those fragments of speech that begin the monotonous parts of speech messages. Within these monotone initial parts, the duration of which is, the pitch of the voice and the relative energy of the third and fourth formant change by no more than 30%. and these speech characteristics themselves vary slightly from fragment to fragment and are different in different people. This is a property of the selected characteristics of speech of the initial fragments of monotonous parts of poses. It identifies the speaker by forming sequences of mean values of pitch and relative energy of upper formant, forming current average values of sequences of average values and comparing the absolute values of relative deviations of the latter average values from the corresponding current average values. If the deviations do not exceed the threshold that set within 10-30%, then the speaker is verified, if they exceed this threshold, then they decide to change the speaker
На чертеже показана блок-схема устройства дл реализации предлагаемого способа The drawing shows a block diagram of the device for implementing the proposed method
Блок-схема содержит сегментатор 1 соединенный с выделителем 2 параметров сегментов речи, блок 3 формировани средних значений, блок 4 формировани текущих средних последовател ностей средних значений, блок 5 выделени абсолютных значений относительно уклонений последних средних значений от соответствующих текущих средних и блок 6 пороговой логики.The block diagram contains a segmenter 1 connected to the selector 2 parameters of speech segments, a block 3 forming averages, a block 4 forming a current average sequences of averages, a block 5 extracting absolute values relative to the deviations of the last averages from the corresponding current averages and block 6 threshold logic.
Вход сегментатора вл етс входом устройства, а выход блока пороговой логики - выходом этого устройстваThe input of the segmenter is the input of the device, and the output of the threshold logic block is the output of this device.
Выделение только начальных фрагметов речевого сигнала, характеризующегос своей монотонностью, которое производитс сегментатором 1, и послдующие вьщелени параметров сегментов выделителем. 2 параметров, формирование средних и текущих средних значений формировател ми 3 и 4, выделение абсолютных значений относительных уклонений средних от текущих средних блоком 5 и прин тие рещени о верификации или смене говор щего в блоке 6 пороговой логики позвол ют исключить из процесса измерений индивидуальных характеристик речи говор щего множество динамических характеристик речи, которые могут быть использованы только в сложных процессах опознавани образцов с привлечением множества заранее формируемых эталонных образцов динамических свойств артикул ционных особенностей говор щего.The selection of only the initial fragments of the speech signal, characterized by its monotony, which is performed by the segmenter 1, and the subsequent selection of the parameters of the segments by the selector. 2 parameters, the formation of average and current average values by the formers 3 and 4, the selection of absolute values of relative deviations of the average from the current average by block 5 and the decision to verify or change the speaker of the threshold logic in block 6 allows to exclude individual speech characteristics from the measurement process speaker has a variety of dynamic speech characteristics that can only be used in complex sample recognition processes involving a multitude of preformed reference samples amicheskih properties article tional features talker.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864044386A SU1394232A1 (en) | 1986-04-02 | 1986-04-02 | Method of identifying a talker |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SU864044386A SU1394232A1 (en) | 1986-04-02 | 1986-04-02 | Method of identifying a talker |
Publications (1)
Publication Number | Publication Date |
---|---|
SU1394232A1 true SU1394232A1 (en) | 1988-05-07 |
Family
ID=21229147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
SU864044386A SU1394232A1 (en) | 1986-04-02 | 1986-04-02 | Method of identifying a talker |
Country Status (1)
Country | Link |
---|---|
SU (1) | SU1394232A1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105765654A (en) * | 2013-11-28 | 2016-07-13 | 弗劳恩霍夫应用研究促进协会 | Hearing assistance device with fundamental frequency modification |
CN107633844A (en) * | 2017-10-10 | 2018-01-26 | 杭州嘉楠耘智信息科技股份有限公司 | Apparatus control method and device |
-
1986
- 1986-04-02 SU SU864044386A patent/SU1394232A1/en active
Non-Patent Citations (1)
Title |
---|
Авторское свидетельство СССР № 898496, кло G 10 L 9/06, 20о05.80. Опубликованна за вка JP 56-80100, кл G 10 L 9/06, OU07.81o * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105765654A (en) * | 2013-11-28 | 2016-07-13 | 弗劳恩霍夫应用研究促进协会 | Hearing assistance device with fundamental frequency modification |
CN107633844A (en) * | 2017-10-10 | 2018-01-26 | 杭州嘉楠耘智信息科技股份有限公司 | Apparatus control method and device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827837B (en) | Whale activity audio classification method based on deep learning | |
KR100569612B1 (en) | Voice activity detection method and device | |
DE2918533C2 (en) | ||
CN1248192C (en) | Semi-monitoring speaker self-adaption | |
CA2171009A1 (en) | Method and apparatus for selecting an encoding rate in a variable rate vocoder | |
KR880700387A (en) | Speech processing system and voice processing method | |
SU1394232A1 (en) | Method of identifying a talker | |
GB8723297D0 (en) | Pattern comparison in pattern recognition | |
CN108986844B (en) | Speech endpoint detection method based on speaker speech characteristics | |
Bezdel et al. | Speech recognition using zero-crossing measurements and sequence information | |
RU98115720A (en) | METHOD FOR AUTOMATIC PERSONAL IDENTIFICATION | |
Shobbrook et al. | High rising tones in southern British English | |
CN1337670A (en) | Fast voice identifying method for Chinese phrase of specific person | |
US20030050774A1 (en) | Method and system for phonetic recognition | |
KR100363251B1 (en) | Method of judging end point of voice | |
KR100350003B1 (en) | A system for determining a word from a speech signal | |
JPH04115299A (en) | Method and device for voiced/voiceless sound decision making | |
JPS59111699A (en) | Speaker recognition system | |
SU920823A2 (en) | Speech identification device | |
CN109727599A (en) | The children amusement facility and control method of interactive voice based on internet communication | |
KR100435578B1 (en) | Method and system for phonetic recognition | |
WO2002027711A1 (en) | Method and device for analyzing a spoken sequence of numbers | |
KR100316776B1 (en) | Continuous digits recognition device and method thereof | |
WO1992020064A1 (en) | Speaker recognition method | |
JPH02123400A (en) | High efficiency voice encoder |