[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

RU2345422C2 - Imaging method and device intended for speech sound propagation detection - Google Patents

Imaging method and device intended for speech sound propagation detection Download PDF

Info

Publication number
RU2345422C2
RU2345422C2 RU2006140930/12A RU2006140930A RU2345422C2 RU 2345422 C2 RU2345422 C2 RU 2345422C2 RU 2006140930/12 A RU2006140930/12 A RU 2006140930/12A RU 2006140930 A RU2006140930 A RU 2006140930A RU 2345422 C2 RU2345422 C2 RU 2345422C2
Authority
RU
Russia
Prior art keywords
sound
speech
propagation
sound propagation
vertical
Prior art date
Application number
RU2006140930/12A
Other languages
Russian (ru)
Other versions
RU2006140930A (en
Inventor
Эдуард Борисович Попов (RU)
Эдуард Борисович Попов
Константин Валерьевич Белынский (RU)
Константин Валерьевич Белынский
Светлана Эдуардовна Попова (RU)
Светлана Эдуардовна Попова
Original Assignee
Эдуард Борисович Попов
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Эдуард Борисович Попов filed Critical Эдуард Борисович Попов
Priority to RU2006140930/12A priority Critical patent/RU2345422C2/en
Publication of RU2006140930A publication Critical patent/RU2006140930A/en
Application granted granted Critical
Publication of RU2345422C2 publication Critical patent/RU2345422C2/en

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

FIELD: physics, acoustics.
SUBSTANCE: invention refers to speech sound propagation detectors and deaf-mute spatial orientation facilities. Sound propagation is displayed relative to direction of listener's direct sight on colour displays by means of vertical indicating strips of width varying depending on sound propagation change. Indicating strips travel across displays field relative to neutral position depending on sound propagation from above or from below with respect to patient's head. Colour of vertical indicating strips varies depending on speech distribution propagation change in two potential opposite directions: in front or behind. The device contains eyeglass frame with left and right eyepieces, two ear arms with mounted microphones, left and right speech perception and imaging channels, speech sound identification unit, left and right colour liquid crystal displays. The central microphone is mounted by means of ball-and-socket joint on eyeglass frame bridge.
EFFECT: development of speech sound propagation detector and deaf-mute spatial orientation facility.
2 cl, 3 dwg

Description

Изобретение относится к техническим средствам распознавания речи, а именно распознавания направления распространения звука речи, и предназначено для обеспечения жизнедеятельности глухонемых и слабослышащих людей. Распознавание речи обеспечивается путем формирования цветографических изображений, являющихся функцией звуков речи. Изобретение может быть использовано в качестве технического средства обучения глухонемых людей при освоении разговорной речи.The invention relates to technical means of speech recognition, namely recognition of the direction of speech sound propagation, and is intended to ensure the life of deaf and hard of hearing people. Speech recognition is provided by forming colorographic images, which are a function of speech sounds. The invention can be used as a technical tool for the training of deaf-mute people in the development of colloquial speech.

В ранее поданной заявке №2004139176/12 (042581) авторы изложили способ и конструкцию устройства для распознавания смысла речи глухонемыми людьми. Эффективность применения данного устройства в существенной степени будет зависеть от того, насколько точно человек будет распознавать с помощью данного устройства при наличии нескольких собеседников, кто из них в данный момент говорит. Это можно сделать только при условии, что в данном устройстве технически реализован надежный способ визуального распознавания направления распространения звука речи. Распознавание направления распространения звука очень важно для глухонемого человека в момент поступления звукового сигнала тревоги: сигнал приближающего автомобиля или поезда, звук летящего самолета, сигнал грузового крана на стройке и так далее. Направление распространения звука относительно головы человека может быть любым, и глухонемой человек должен надежно визуально его распознавать.In a previously filed application No. 2004139176/12 (042581), the authors set forth a method and design of a device for recognizing the meaning of speech by deaf and dumb people. The effectiveness of the use of this device will largely depend on how accurately a person will recognize with the help of this device, if there are several interlocutors, which of them is currently talking. This can be done only on condition that this device technically implements a reliable method of visual recognition of the direction of speech sound propagation. Recognition of the direction of sound propagation is very important for a deaf-mute person at the time of the sound of an alarm: the signal of an approaching car or train, the sound of a flying airplane, the signal of a cargo crane at a construction site and so on. The direction of sound propagation relative to the human head can be any, and a deaf-mute person must reliably visually recognize it.

В ранее поданной заявке №2004139176/12 (042581) авторы изложили способ распознавания звука по двум направлениям относительно головы слушателя (справа и слева) за счет применения левого и правого каналов формирования изображения для распознавания речи. Однако этого недостаточно для распознавания направления распространения звука спереди, сзади, сверху и снизу. Для определения всех возможных направлений распространения звука необходимо иметь как минимум три микрофона, разнесенных в пространстве на конечное расстояние между собой.In a previously filed application No. 2004139176/12 (042581), the authors set forth a method for recognizing sound in two directions relative to the listener's head (left and right) through the use of left and right image forming channels for speech recognition. However, this is not enough to recognize the direction of sound propagation from the front, back, top and bottom. To determine all possible directions of sound propagation, it is necessary to have at least three microphones spaced in space at a finite distance between each other.

Настоящее изобретение относится к техническим средствам распознавания направления распространения звука путем визуализации цветографических символов направления распространения звука на цветном экране практически синхронно с развитием речи.The present invention relates to technical means for recognizing the direction of sound propagation by visualizing the colorographic symbols of the direction of sound propagation on a color screen almost synchronously with the development of speech.

Наиболее близким к предлагаемому изобретению является способ формирования изображения на экране в зависимости от направления распространения звука речи, описанный в [1] (патент US 6629076 B1, опубликован 30.09.2003) В описании данного устройства на Fig.5 показано, что направление распространения звука индицируется на дисплее в виде стрелок 64. Стрелки 64 позволяют индицировать направления распространения звуковых волн, лежащих только в одной плоскости - плоскости расположения векторов максимальной чувствительности лепестковых диаграмм звуковой чувствительности всех микрофонов 12, расположенных на оправе и дужках очков. Из описания изобретения и расположения микрофонов 12, представленных на Fig.1, следует, что при таком расположении микрофонов 12 невозможно идентифицировать направление звуков приходящих сверху и снизу по отношению к голове человека так как в заявленном устройстве нет микрофонов, лепестковая диаграмма звуковой чувствительности которых была бы направлена вверх по отношению к голове человека. Это является существенным недостатком заявленного устройства. Кроме того, предложенный способ визуализации посредством стрелок 64 (Fig.5) не позволяет визуализировать все пространственные направления распространения звуков, так как стрелки 64 всегда расположены в одной плоскости и отображают направление вектора распространения звука только в одной плоскости координат Х и Y, что недостаточно для отображения пространственного направления вектора распространения звука, для чего необходимы обязательно три координаты: X, Y, Z. Отличия предложенного способа распознавания направления распространения звуков речи от известного способа изложенного в [1]:Closest to the proposed invention is a method of forming an image on the screen depending on the direction of propagation of speech sound, described in [1] (US patent 6629076 B1, published September 30, 2003). In the description of this device in Fig. 5 it is shown that the direction of sound propagation is indicated on the display in the form of arrows 64. Arrows 64 allow you to indicate the direction of propagation of sound waves lying in only one plane - the plane of the location of the vectors of maximum sensitivity of the petal diagrams of sound Creation of all microphones 12 located on the frame and the temples of the glasses. From the description of the invention and the location of the microphones 12 shown in Fig. 1, it follows that with such an arrangement of the microphones 12 it is impossible to identify the direction of the sounds coming from above and below with respect to the human head since the claimed device does not have microphones whose petal diagram of sound sensitivity would be directed upward in relation to a person’s head. This is a significant drawback of the claimed device. In addition, the proposed method of visualization using arrows 64 (Fig. 5) does not allow visualization of all spatial directions of sound propagation, since arrows 64 are always located in the same plane and display the direction of the sound propagation vector in only one plane of the X and Y coordinates, which is insufficient for displaying the spatial direction of the sound propagation vector, for which three coordinates are necessary: X, Y, Z. Differences in the proposed method for recognizing the sound propagation direction speech by the known method described in [1]:

1. Предлагаемый способ позволяет определять и визуально распознавать направления распространения звуков речи по каждой из трех пространственных координат X, Y, Z.1. The proposed method allows to determine and visually recognize the direction of propagation of speech sounds along each of the three spatial coordinates X, Y, Z.

2. Распознавание направления распространения звуков речи осуществляется посредством формирования на цветном экране цветной вертикальной индикаторной полосы, меняющей свою ширину, положение и цвет в зависимости от изменения направления распространения звуков речи по каждой из трех пространственных координат X, Y, Z.2. Recognition of the propagation direction of speech sounds is carried out by forming a color vertical indicator strip on the color screen that changes its width, position and color depending on the change in the propagation direction of speech sounds along each of the three spatial coordinates X, Y, Z.

3. В конструкцию устройства, позволяющего реализовать данный способ распознавания направления распространения звуков речи, вводится центральный микрофон, установленный на шаровом шарнире на переносице очков, причем так, что данный микрофон и, следовательно, его лепестковая диаграмма звуковой чувствительности вместе с микрофоном может вручную перемещаться в любом направлении в пределах заданного пространственного телесного угла, включая направление вверх по отношению к голове человека.3. A central microphone mounted on a ball joint on the nose bridge is introduced into the design of the device, which allows implementing this method of recognizing the direction of propagation of speech sounds, so that this microphone and, therefore, its lobe diagram of sound sensitivity together with the microphone can be manually moved to any direction within a given spatial solid angle, including an upward direction with respect to the human head.

В основу устройства для распознавания направления распространения звуков речи положено устройство для распознавания смысла речи, предложенное и описанное авторами данной заявки в ранее поданной теми же авторами заявке №2004139176/12 (042581).The basis of the device for recognizing the direction of propagation of speech sounds is a device for recognizing the meaning of speech, proposed and described by the authors of this application in the previously filed by the same authors application No. 2004139176/12 (042581).

Техническим результатом изобретения является повышение информативности звуковой информации, воспринимаемой глухонемым и слабослышащим человеком.The technical result of the invention is to increase the information content of sound information perceived by a deaf and hard of hearing person.

Указанный технический результат достигается тем, что в известном способе формирования изображения для распознавания направления распространения звука речи, включающем преобразование звука посредством микрофонов в сигналы звука, автоматическое регулирование уровня сигналов звука, идентификацию сигналов звуков, отображение сигналов звука на левом и правом цветных жидкокристаллических дисплеях, согласно изобретению направление распространения звука отображается относительно направления прямого взгляда слушателя на левом цветном дисплее посредством левой вертикальной индикаторной полосы, расположенной вдоль левой вертикальной стороны левого дисплея и на правом дисплее посредством правой вертикальной индикаторной полосы, расположенной вдоль правой вертикальной стороны правого дисплея, причем ширина данных вертикальных индикаторных полос меняется противоположно друг другу в зависимости от изменения направления распространения звука: справа или слева, кроме того, вертикальные индикаторные левая и правая полосы перемещаются по полю дисплеев относительно среднего положения, отмеченного на экранах вертикальными неподвижными метками, вверх или вниз в зависимости от того, приходит ли звук речи сверху или снизу по отношению к голове человека, цвет вертикальных индикаторных полос меняется в зависимости от изменения направления распространения звука речи по двум возможным противоположным направлениям: спереди или сзади.The specified technical result is achieved by the fact that in the known method of image formation for recognizing the direction of propagation of speech sound, including converting sound through microphones into sound signals, automatically adjusting the level of sound signals, identifying sound signals, displaying sound signals on the left and right color liquid crystal displays, according to the invention, the direction of sound propagation is displayed relative to the direction of direct view of the listener on the left color by means of the left vertical indicator strip located along the left vertical side of the left display and on the right display by the right vertical indicator strip located along the right vertical side of the right display, the width of these vertical indicator stripes changing opposite to each other depending on the change in the direction of sound propagation: right or left, in addition, the vertical indicator left and right stripes move along the display field relative to the medium of the position indicated on the screens by vertical fixed marks, up or down depending on whether the sound of speech comes from above or below in relation to the person’s head, the color of the vertical indicator bars changes depending on the change in the direction of speech propagation in two possible opposite directions: front or back.

Указанный технический результат достигается также тем, что известное устройство формирования изображения для распознавания направления распространения звука речи, содержащее оправу очков с левым и правым окулярами, два заушника с установленными на каждом из них микрофонами, левый и правый каналы восприятия речи и формирования изображения, блок идентификации звуков речи, левый и правый цветные жидкокристаллические дисплеи, согласно изобретению имеет центральный микрофон, установленный посредством шарового шарнира на переносице оправы очков.The specified technical result is also achieved by the fact that the known image-forming device for recognizing the direction of the speech sound propagation, containing a spectacle frame with left and right eyepieces, two earhooks with microphones installed on each of them, left and right channels of speech perception and image formation, identification unit speech sounds, the left and right color liquid crystal displays according to the invention have a central microphone mounted by means of a ball joint on the nose bridge you points.

Рассмотрим способ формирования изображения, служащий для распознавания направления распространения звуков речи. На Фиг.1 на поле правого дисплея 1 представлено изображение группы цветографических символов 2, сущность которых раскрыта в заявке №2004139176/12 (042581). На поле правого дисплея 1 также изображена подвижная вертикальная индикаторная полоса 3, расположенная вдоль правой вертикальной стороны поля дисплея, и неподвижная остроконечная метка 4, служащая для индикации среднего положения полосы 3. На поле полосы 3 строго в середине по вертикали расположена подвижная метка 5, которая перемещается вверх, вниз вместе с вертикальной индикаторной полосой 3. По соотношению взаимных положений подвижной 5 и неподвижной 4 меток человек определяет, куда сместилась вертикальная индикаторная полоса 3 - вверх или вниз. На левом дисплее, расположенном на левом окуляре очков, цветная вертикальная индикаторная полоса и остроконечная метка располагаются вдоль левой стороны поля левого дисплея.Consider an image forming method for recognizing the direction of propagation of speech sounds. Figure 1 on the field of the right display 1 presents an image of a group of color symbols 2, the essence of which is disclosed in the application No. 2004139176/12 (042581). On the field of the right display 1 is also shown a moving vertical indicator strip 3 located along the right vertical side of the display field, and a fixed pointed mark 4, which serves to indicate the middle position of the strip 3. On the field of the strip 3, strictly moving in the vertical direction is the moving mark 5, which moves up and down together with the vertical indicator strip 3. By the ratio of the relative positions of the movable 5 and fixed 4 marks, the person determines where the vertical indicator strip 3 has moved - up and and down. On the left display, located on the left eyepiece of the glasses, a colored vertical indicator strip and a pointed mark are located along the left side of the left display field.

В жизненной практике человеку приходится многократно ориентировать свой слуховой аппарат (пара ушей) по направлению максимальной чувствительности его к источнику звука с целью максимально точной идентификации характера тревожного звука или с целью точной идентификации смысла речи. Для этих целей человеку придан универсальный телесный орган - шея человека. Шея позволяет мобильно ориентировать голову человека и, следовательно, органы слуха и зрения в нужном направлении. Она играет роль своеобразного шарнира. Яблоко глаза человека также играет роль шарового шарнира.In life practice, a person has to repeatedly orient his hearing aid (a pair of ears) in the direction of his maximum sensitivity to a sound source in order to most accurately identify the nature of the disturbing sound or to accurately identify the meaning of speech. For these purposes, a universal bodily organ is attached to a person - the neck of a person. The neck allows you to mobilely orient the head of a person and, therefore, the organs of hearing and vision in the right direction. She plays the role of a kind of hinge. The apple of the human eye also plays the role of a ball joint.

В технических устройствах шаровые шарниры применяются часто там, где необходимо сориентировать струю воды, воздуха или поток света в нужном направлении. Шаровые шарниры используют в конструкции прожекторов, антенн, воздушных вентиляторов, студийных манипуляторах с закрепленными на них микрофонами. Корреспонденты радио и телевидения ориентируют свои микрофоны всегда в направлении максимальной силы звучания голоса говорящего человека. Отсюда следует, что весьма целесообразно использовать микрофоны с применением шарниров.In technical devices, ball joints are often used where it is necessary to orient a stream of water, air or a stream of light in the desired direction. Ball joints are used in the design of floodlights, antennas, air fans, studio manipulators with microphones mounted on them. Correspondents of radio and television always orient their microphones in the direction of maximum sound power of the voice of the talking person. It follows that it is very advisable to use microphones using hinges.

Техническое устройство, посредством которого формируется цветографическое изображение звуков речи и цветных вертикальных индикаторных полос, реализуется с помощью специализированных очков, представленных на фиг.2.The technical device by means of which a colorographic image of speech sounds and colored vertical indicator strips is formed is implemented using specialized glasses presented in figure 2.

Данное устройство имеет оправу 1, два окуляра 2 и 3, два цветных жидкокристаллических дисплея 4 и 5, расположенных в верхних зонах окуляров очков; две корректирующие линзы 6 и 7, наложенные на плоскости двух цветных жидкокристаллических дисплеев со стороны глаз наблюдателя; два заушника 8 и 9, два боковых микрофона 10 и 11 центральный микрофон 12, причем ось максимальной звуковой чувствительности микрофона 12 может перемещаться в пределах телесного угла 14 за счет установки его на шаровом шарнире 13; блок идентификации звуков речи (БИЗ) 15 с двухканальным приемопередающим радиоустройством.This device has a frame 1, two eyepieces 2 and 3, two color liquid crystal displays 4 and 5, located in the upper zones of the eyepieces of glasses; two corrective lenses 6 and 7, superimposed on the plane of two color liquid crystal displays from the side of the observer's eyes; two earhooks 8 and 9, two side microphones 10 and 11, the central microphone 12, and the axis of the maximum sound sensitivity of the microphone 12 can move within the solid angle 14 by installing it on a ball joint 13; a unit for identifying speech sounds (BIZ) 15 with a two-channel transceiver radio device.

Человеку для стереофонического восприятия звука природой придано два слуховых аппарата (уха), разнесенных в пространстве на некоторое расстояние, примерно равное диаметру головы. При распространении звука звуковая волна, последовательно во времени, достигает сначала слухового аппарата одного уха, а затем с запаздыванием (со сдвигом по фазе) и пониженным звуковым давлением достигает слухового аппарата другого уха. По тому, как велика величина запаздывания при распространении звуковой волны и как уменьшается сила звучания в другом ухе, соответствующие структуры мозга человека фиксируют направление распространения звука речи по отношению к голове человека, тем самым реализуя стереофонический эффект.For stereophonic perception of sound, nature is given two hearing aids (ears), spaced in space at a distance approximately equal to the diameter of the head. When sound propagates, a sound wave, sequentially in time, first reaches the hearing aid of one ear, and then with delay (with a phase shift) and reduced sound pressure reaches the hearing aid of the other ear. According to the magnitude of the delay in the propagation of the sound wave and how the sound power in the other ear decreases, the corresponding structures of the human brain fix the direction of the propagation of speech sound in relation to the human head, thereby realizing a stereo effect.

Таким же образом в предлагаемом авторами техническом устройстве для реализации стереофонического эффекта необходимо наличие одновременно нескольких микрофонов, позволяющих воспринимать звук по трем пространственным координатам Х, Y, Z одновременно. С технической точки зрения реализация стереофонического эффекта и, следовательно, определение направления распространения звука в пространстве возможно при наличии трех микрофонов 10, 11, 12 разнесенных в пространстве, как это показано на Фиг.2. Лепестковая диаграмма звуковой чувствительности левого микрофона 10 направлена влево по отношению к голове человека. Для правого микрофона 11 она направлена вправо. Для центрального микрофона 12 ось максимальной звуковой чувствительности может перемещаться в пределах телесного угла 14 за счет установки его на шаровом шарнире 13, причем она может быть направлена за счет шарнира 13 также вверх и вперед по отношению к голове человека.In the same way, in the technical device proposed by the authors, for the realization of the stereo effect, it is necessary to have several microphones simultaneously, allowing to perceive sound along the three spatial coordinates X, Y, Z at the same time. From a technical point of view, the implementation of the stereo effect and, therefore, the determination of the direction of sound propagation in space is possible with three microphones 10, 11, 12 spaced in space, as shown in FIG. 2. The petal diagram of the sound sensitivity of the left microphone 10 is directed to the left with respect to the human head. For the right microphone 11, it is directed to the right. For the central microphone 12, the axis of maximum sound sensitivity can move within the solid angle 14 by installing it on the ball joint 13, and it can also be directed up and forth with respect to the human head due to the joint 13.

Одновременно микрофоны 10, 11, 12 будут воспринимать звуковые волны, приходящие по направлениям спереди и сзади по отношению к голове человека, но микрофоны 10, 11 будут делать это с меньшей чувствительностью, что не мешает идентифицировать эти направления.At the same time, microphones 10, 11, 12 will perceive sound waves coming in the front and back directions with respect to the human head, but microphones 10, 11 will do this with less sensitivity, which does not interfere with identifying these directions.

Центральный микрофон 12 обеспечивает восприятие звуков речи, приходящих сверху и спереди (при повороте его по направлению «вперед»), с большей чувствительностью и снизу с меньшей чувствительностью по отношению к паре микрофонов 10, 11. Этот факт позволяет определять направления распространения звука речи как сверху, так и снизу по отношению к голове человека. Так как данный микрофон 12 закреплен на переносице оправы очков и смещен по отношению боковых микрофонов 10 и 11 вперед на некоторое расстояние, то это позволяет за счет стереофонического эффекта определить с помощью него и боковых микрофонов 10, 11 также направление звука, приходящего спереди или сзади по отношению к голове человека.The central microphone 12 provides the perception of speech sounds coming from above and from the front (when turning it in the “forward” direction), with greater sensitivity and lower with less sensitivity with respect to a pair of microphones 10, 11. This fact allows us to determine the direction of speech sound propagation as above , and from below in relation to the human head. Since this microphone 12 is mounted on the nose bridge of the spectacle frame and is shifted forward by a certain distance with respect to the side microphones 10 and 11, this makes it possible to determine the direction of sound coming from the front or rear using it and the side microphones 10, 11 relation to the human head.

Крепление центрального микрофона 12 на шаровом шарнире 13 позволяет глухонемому человеку самостоятельно вручную менять направление ориентации микрофона 12 и тем самым выбирать оптимальный режим восприятия звука речи. Это очень важно делать при наличии шумов, нарушающих четкое восприятие звуков речи.The mounting of the central microphone 12 on the ball joint 13 allows the deaf-mute person to manually manually change the orientation of the microphone 12 and thereby choose the optimal mode of perception of speech sound. This is very important to do in the presence of noise that violates the clear perception of speech sounds.

Блок 15 идентификации звуков речи является общим для левого и правого каналов. Посредством этого блока осуществляется спектральный анализ сигналов звуков речи, идентификация звуков речи, например по способу, изложенному в [3]-[9], и определяется направление распространения звука речи. Обмен информацией между блоком 13 и электронными устройствами, расположенными в заушниках 8 и 9, осуществляется по радиоканалу.The speech sound identification unit 15 is common to the left and right channels. Through this unit, a spectral analysis of speech sound signals is carried out, speech sounds are identified, for example, by the method described in [3] - [9], and the direction of speech sound propagation is determined. The exchange of information between block 13 and electronic devices located in the earhooks 8 and 9 is carried out over the air.

Техническое устройство формирования изображения для распознавания направления распространения звука речи, представленное на фиг.2, имеет три независимых канала для восприятия речи и формирования изображения: левый канал формирования изображения (ЛКФИ), правый канал формирования изображения (ПКФИ), центральный канал (ЦК), служащий для определения направления распространения звука речи с максимальной чувствительностью в пределах телесного угла 14 и с пониженной чувствительность во всех направлениях за пределами данного угла. Левый канал (ЛКФИ) включает левый микрофон 11, электронное устройство управления, расположенное в левом заушнике 8, левый цветной жидкокристаллический дисплей 4 и левую корректирующую линзу 6.The technical device for image formation for recognizing the direction of propagation of the sound of speech, presented in figure 2, has three independent channels for speech perception and image formation: the left channel of the image formation (LKFI), the right channel of the image formation (PKFI), the central channel (CC), serving to determine the direction of speech sound propagation with maximum sensitivity within the solid angle 14 and with reduced sensitivity in all directions outside the given angle. The left channel (LKFI) includes a left microphone 11, an electronic control device located in the left earhook 8, the left color liquid crystal display 4 and the left correction lens 6.

Правый канал формирования изображения (ПКФИ) звуков речи включает соответственно правый микрофон 11, электронное устройство управления, расположенное в правом заушнике 9, правый цветной жидкокристаллический дисплей 5 и правую корректирующую линзу 7. Центральный канал (ЦК) включает центральный микрофон 12 и электронное устройство управления расположенное в правом заушнике 9.The right channel for imaging (PCFI) of speech sounds includes, respectively, a right microphone 11, an electronic control device located in the right earhook 9, a right color liquid crystal display 5 and a right correction lens 7. The central channel (CC) includes a central microphone 12 and an electronic control device located in the right earhook 9.

Три независимых канала (ЛКФИ, ПКФИ, ЦК) для восприятия речи и формирования изображения позволяют также реализовывать стереофонический эффект и тем самым позволяют повысить ориентацию глухонемого человека в пространстве путем наблюдения на двух дисплеях двух подвижных вертикальных индикаторных полос, указывающих направление распространения звука относительно головы глухонемого человека.Three independent channels (LKPF, PKFI, CC) for speech perception and image formation also allow you to realize a stereo effect and thereby increase the orientation of a deaf-mute person in space by observing on two displays two moving vertical indicator bars indicating the direction of sound propagation relative to the head of a deaf-mute person .

Перемещение вертикальных индикаторных полос 3 (см. Фиг.1) вверх от среднего положения, отмеченного меткой 4, вдоль оси ординат означает, что звук речи приходит сверху относительно головы человека. Перемещение вертикальных индикаторных полос 3 (см. Фиг.1) вниз от среднего положения, отмеченного меткой 4, вдоль оси ординат означает, что звук речи приходит снизу относительно головы человека. Расстояние между неподвижной меткой 4 и подвижной меткой 5 пропорционально силе звука приходящего сверху или снизу по отношению к голове человека. Увеличение ширины правой индикаторной полосы на правом дисплее и одновременное уменьшение ширины левой индикаторной полосы на левом дисплее означает, что звук речи приходит справа от человека. Увеличение ширины левой вертикальной индикаторной полосы на левом дисплее и одновременное уменьшение ширины правой вертикальной индикаторной полосы означает, что звук речи приходит слева от человека. Если звук приходит спереди относительно головы человека, то обе (левая и правая) индикаторные полосы принимают один, принятый только для направления «спереди», цвет. Если звук приходит сзади относительно головы слушателя, то обе (левая и правая) индикаторные полосы меняют свой цвет на другой, принятый только для направления «сзади». Способ и устройство формирования изображения для распознавания направления распространения сигнала звука, включающее два независимых канала формирования изображения и центральный канал, реализованы с помощью структурной схемы, представленной на Фиг.3.The movement of the vertical indicator strip 3 (see Figure 1) up from the middle position, marked 4, along the ordinate axis means that the sound of speech comes from above relative to the person’s head. Moving the vertical indicator strips 3 (see Figure 1) down from the middle position, marked 4, along the ordinate axis means that the sound of speech comes from below relative to the person’s head. The distance between the fixed mark 4 and the moving mark 5 is proportional to the strength of the sound coming from above or below in relation to the person’s head. Increasing the width of the right indicator strip on the right display and simultaneously reducing the width of the left indicator strip on the left display means that the sound of speech comes to the right of the person. Increasing the width of the left vertical indicator strip on the left display and simultaneously reducing the width of the right vertical indicator strip means that the sound of speech comes to the left of the person. If the sound comes in front of the person’s head, then both (left and right) indicator strips take one color, adopted only for the “front” direction. If the sound comes from behind the head of the listener, then both (left and right) indicator strips change color to another, adopted only for the direction of "back". A method and apparatus for image formation for recognizing the direction of propagation of a sound signal, including two independent image forming channels and a central channel, are implemented using the block diagram shown in FIG. 3.

Устройство формирования изображения для распознавания направления распространения сигнала звука включает левый канал формирования изображения (ЛКФИ) 1, все элементы которого размещены в левом заушнике очков наблюдателя, правый канал формирования изображения (ПКФИ) 2, центральный канал (ЦК) 28, все элементы которого расположены в правом заушнике очков, и блок идентификации звука (БИЗ) 3, который располагается в нагрудном кармане рубашки человека. На Фиг.3 ЛКФИ, ПКФИ, ЦК И БИЗ обведены пунктирными линиями. Описание работы левого (ЛКФИ) 1 и правого (ПКФИ) 2 каналов подробно рассмотрено в заявке №2004139176/12 (042581), поданной авторами ранее. Надо еще раз отметить, что по совокупности сигналов, поступающих на входы 1 и 2 контроллера 15 по программе, заложенной в контроллер 15, определяется направление распространения звука относительно головы глухонемого человека: справа или слева. Данное направление, как это указывалось ранее, отображается на дисплеях в виде цветных вертикальных индикаторных полос 3 (см. Фиг.1), меняющих свою ширину.An imaging device for recognizing the direction of propagation of a sound signal includes a left channel for image formation (LKFI) 1, all of whose elements are located in the left earhook of the observer's glasses, a right channel for image formation (PCFI) 2, a central channel (CC) 28, all of which are located in right earhook glasses, and sound identification block (BIZ) 3, which is located in the breast pocket of a person’s shirt. Figure 3 LCFI, PKFI, CC and BIZ circled by dashed lines. A description of the operation of the left (LCFI) 1 and right (PKFI) 2 channels is discussed in detail in the application No. 2004139176/12 (042581), filed by the authors earlier. It should be noted once again that according to the set of signals supplied to the inputs 1 and 2 of the controller 15, the direction of sound propagation relative to the head of a deaf-mute person is determined by the program embedded in the controller 15: from the right or from the left. This direction, as indicated earlier, is displayed on the displays in the form of colored vertical indicator strips 3 (see Figure 1), changing their width.

Взаимопротивоположное изменение ширины вертикальных индикаторных полос на левом и правом дисплеях как раз и является способом визуализации стереофонического эффекта при восприятии звука речи.The mutually opposite change in the width of the vertical indicator stripes on the left and right displays is precisely the way to visualize the stereo effect when perceiving the sound of speech.

Центральный канал (ЦК) 28 включает: центральный микрофон (М3) 29, усилитель (У3) 30, полосовой фильтр (ПФ3) 31, звено автоматической регулировки уровня сигнала звука (АРУ3) 32, аналого-цифровой преобразователь (АЦП3) 33, звено запаздывания по времени (ЗЗ 3) 34. Все радиоэлементы (ЦК) 28 расположены в правом заушнике очков.The central channel (CC) 28 includes: a central microphone (M3) 29, an amplifier (U3) 30, a bandpass filter (PF3) 31, a link for automatically adjusting the sound signal level (AGC3) 32, an analog-to-digital converter (ADC3) 33, a delay link by time (ЗЗ 3) 34. All radioelements (CC) 28 are located in the right earhook of points.

В соответствии с структурной схемой, представленной на Фиг.3, для центрального канала (ЦК) 28 выход микрофона (М3) 29 соединен с входом 1 усилителя (У3) 30, выход усилителя 30 соединен с входом полосового фильтра (ПФ3) 31 и с входом (АЦП3) 33. Выход полосового фильтра 31 соединен с входом звена (АРУ3) 32. Выход звена (АРУ3) 32 соединен с входом 2 усилителя (У3) 30. Выход (АЦП3) 33 соединен с входом звена запаздывания 34, выход звена запаздывания 34 соединен одновременно с двумя входами: входом 3 контроллера (КР2) 25 и входом 3 контроллера (КР1) 10. Центральный канал (ЦК) 28 работает следующим образом. Звук речи воспринимается микрофоном 29, преобразуется в сигнал звука речи, который поступает на вход 1 нормирующего усилителя 30. Усилитель 30 служит для управления величиной уровня сигнала звука на выходе данного усилителя 30 при возможном существенном изменении силы звука. Для этого служит специальное звено автоматической регулировки уровня сигнала 32. Посредством полосового фильтра 31 из сигнала звука выделяется сигнал наиболее употребительных и стабильных формант, и посредством данного сигнала осуществляется управление звеном (АРУ3) 32. Выходной сигнал звена 32 автоматически по входу 2 звена 30 изменяет коэффициент усиления усилителя (У3) 30, тем самым автоматически удерживается, нормируется в пределах технически обоснованного, уровень сигнала на выходе усилителя 30. С выхода усилителя 30 нормированный сигнал поступает на вход (АЦП3) 33, посредством которого производится оцифровка входного аналогового сигнала. Выходной цифровой сигнал звука речи с выхода (АЦП3) 33 поступает на вход звена запаздывания по времени 34. С выхода звена 34 выходной сигнал поступает одновременно на входы двух звеньев: вход 3 звена 10 и вход 3 звена 25. С появлением звукового сигнала на выходе центрального микрофона (М3) 29 меняются значения цифровых кодов на входах 3 звеньев 10, 25 и, следовательно, смещаются вверх или вниз относительно среднего положения, отмеченного меткой 4, цветные вертикальные индикаторные полосы на экранах левого и правого дисплеев, сигнализируя этим, что звук приходит сверху или снизу. Звено 34 выполняет те же функции, что и звенья 9 и 24. Блок идентификации звуков 3 имеет две самостоятельные ветви обработки сигналов звука, причем контроллер 15 обеспечивает работу ЛКФИ, а контроллер 16 обеспечивает работу ПКФИ. Передатчики 13 и 17, а также приемники 14 и 18 двухканальные, с частотным или временным разделением в работе двух каналов.In accordance with the structural diagram shown in FIG. 3, for the central channel (CC) 28, the microphone output (M3) 29 is connected to the input 1 of the amplifier (U3) 30, the output of the amplifier 30 is connected to the input of the bandpass filter (PF3) 31 and with the input (ADC3) 33. The output of the band-pass filter 31 is connected to the input of the link (AGC3) 32. The output of the link (AGC3) 32 is connected to the input 2 of amplifier (U3) 30. The output (ADC3) 33 is connected to the input of the delay link 34, the output of the delay link 34 connected simultaneously with two inputs: input 3 of the controller (КР2) 25 and input 3 of the controller (КР1) 10. Central channel (CC) 28 operation em as follows. The sound of speech is perceived by the microphone 29, is converted into a speech sound signal, which is fed to the input 1 of the normalizing amplifier 30. The amplifier 30 is used to control the value of the sound signal level at the output of this amplifier 30 with a possible significant change in sound power. For this, a special link for automatic adjustment of signal level 32 is used. By means of a band-pass filter 31, the signal of the most common and stable formants is extracted from the sound signal, and through this signal the link (AGC3) 32 is controlled. The output signal of link 32 automatically changes the coefficient at input 2 of link 30 the gain of the amplifier (U3) 30, thereby automatically being kept, normalized within the range of technically justified, the signal level at the output of amplifier 30. From the output of amplifier 30, the normalized signal stays at the input (ADC3) 33, through which the digitization of the input analog signal. The output digital signal of speech sound from the output (ADC3) 33 is fed to the input of the time delay link 34. From the output of the link 34, the output signal is sent simultaneously to the inputs of two links: input 3 of link 10 and input 3 of link 25. With the appearance of an audio signal at the output of the central microphone (M3) 29, the values of the digital codes at the inputs of 3 links 10, 25 change and, therefore, are shifted up or down relative to the middle position marked 4, the colored vertical indicator bars on the screens of the left and right displays, signaling that the sound comes from above or below. Link 34 performs the same functions as links 9 and 24. The sound identification unit 3 has two independent branches of processing sound signals, moreover, the controller 15 provides the operation of the LCFI, and the controller 16 provides the work of the PCFI. Transmitters 13 and 17, as well as receivers 14 and 18 are two-channel, with frequency or time separation in the operation of two channels.

Перечень чертежейList of drawings

Фиг.1 - Цветографическое изображение сигналов звуков на цветном экране, на примере слова «ПРО-ШУ»Figure 1 - Colorographic image of sound signals on a color screen, for example, the word "PRO-SHU"

Фиг.2 - Устройство формирования изображения для распознавания смысла речи и направления распространения звука речи.Figure 2 - An image forming apparatus for recognizing the meaning of speech and the direction of propagation of speech sound.

Фиг.3 - Структурная схема устройства формирования изображения для распознавания смысла речи и направления распространения звука речи.Figure 3 - Block diagram of an image forming apparatus for recognizing the meaning of speech and the direction of propagation of speech sound.

Сведения, подтверждающие возможность осуществления изобретения.Information confirming the possibility of carrying out the invention.

Предлагаемое изобретение может быть реализовано с помощью устройства, конструкция которого приведена на Фиг.2 и структурная схема которого приведена на Фиг.3. Элементы устройства могут быть выполнены с помощью аналоговых и цифровых микросхем, студийных малогабаритных радиоприемников и радиопередатчиков, цифровых контроллеров и цветных жидкокристаллических дисплеев, широко применяемых в цифровых фотоаппаратах и фотокамерах.The present invention can be implemented using a device whose design is shown in Figure 2 and a structural diagram of which is shown in Figure 3. Elements of the device can be made using analog and digital microcircuits, small-sized studio radios and radio transmitters, digital controllers and color liquid crystal displays, which are widely used in digital cameras and cameras.

ЛитератураLiterature

1. Патент US 6629076 В1, опубликован 30.09.2003 г.1. Patent US 6629076 B1, published September 30, 2003.

2. Заявка RU №2004139176/12 (042581), МПК G09B 21/00 (2006.01), G10L/06 (2006.01).2. Application RU No. 2004139176/12 (042581), IPC G09B 21/00 (2006.01), G10L / 06 (2006.01).

3. Патент RU №2230375, МПК 7 G10L 15/00, 17/00, опубликован в 2004 г., БИ №16 (II ч.) стр.437.3. Patent RU No. 2230375, IPC 7 G10L 15/00, 17/00, published in 2004, BI No. 16 (II part) p. 437.

4. Патент RU №2234746, МПК 7 G10L 19/02, опубликован 2004.08.20.4. Patent RU No. 2234746, IPC 7 G10L 19/02, published 2004.08.20.

5. Патент РФ №2047912, МПК G10L 7/06, опубликован 10.11.1995.5. RF patent No. 2047912, IPC G10L 7/06, published November 10, 1995.

6. Патент РФ №2161826, МПК G10L 17/00, опубликован 10.01.2001.6. RF patent №2161826, IPC G10L 17/00, published January 10, 2001.

7. Патент США №6411930, МПК G10L 15/08, 25.06.2002.7. US patent No. 6411930, IPC G10L 15/08, 06/25/2002.

8. Патент США №5995927, МПК G10L 9/00, 30.11.199.8. US patent No. 5995927, IPC G10L 9/00, 11/30/199.

9. Патент США №6389392, МПК G10L 17/00, 14.05.2002.9. US patent No. 6389392, IPC G10L 17/00, 05/14/2002.

Claims (2)

1. Способ формирования изображения для распознавания направления распространения звука речи, включающий преобразование звука посредством микрофонов в сигналы звука, автоматическое регулирование уровня сигналов звука, идентификацию сигналов звуков, отображение сигналов звука на левом и правом цветных жидкокристаллических дисплеях, отличающийся тем, что направление распространения звука отображается относительно направления прямого взгляда слушателя на левом цветном дисплее посредством левой вертикальной индикаторной полосы, расположенной вдоль левой вертикальной стороны левого дисплея и на правом дисплее посредством правой вертикальной индикаторной полосы, расположенной вдоль правой вертикальной стороны правого дисплея, причем ширина данных вертикальных индикаторных полос меняется противоположно друг другу в зависимости от изменения направления распространения звука: справа или слева, при этом вертикальные индикаторные левая и правая полосы перемещаются по полю дисплеев относительно среднего положения, отмеченного на экранах вертикальными неподвижными метками, вверх или вниз в зависимости от того приходит ли звук речи сверху или снизу по отношению к голове человека, цвет вертикальных индикаторных полос меняется в зависимости от изменения направления распространения звука речи по двум возможным противоположным направлениям: спереди или сзади.1. An image forming method for recognizing a sound propagation direction of a speech, including converting sound through microphones into sound signals, automatically adjusting the sound signal level, identifying sound signals, displaying sound signals on the left and right color liquid crystal displays, wherein the sound propagating direction is displayed relative to the direct gaze of the listener on the left color display by means of the left vertical indicator strip, lying along the left vertical side of the left display and on the right display by means of a right vertical indicator strip located along the right vertical side of the right display, and the width of these vertical indicator stripes changes opposite to each other depending on the change in the direction of sound propagation: right or left, while vertical indicator left and right strips move along the field of displays relative to the middle position, marked on the screens as vertical motionless marks, up or down, depending on whether the sound of speech comes from above or below in relation to the person’s head, the color of the vertical indicator stripes changes depending on the change in the direction of speech sound propagation in two possible opposite directions: front or back. 2. Устройство формирования изображения для распознавания направления распространения звука речи, содержащее оправу очков с левым и правым окулярами, два заушника с установленными на каждом из них микрофонами, левый и правый каналы восприятия речи и формирования изображения, блок идентификации звуков речи, левый и правый цветные жидкокристаллические дисплеи, отличающееся тем, что имеет центральный микрофон, установленный посредством шарового шарнира на переносице оправы очков. 2. An imaging device for recognizing the direction of propagation of speech sound, containing a spectacle frame with left and right eyepieces, two earhooks with microphones installed on each of them, left and right channels of speech perception and image formation, speech sound identification block, left and right color liquid crystal displays, characterized in that it has a central microphone mounted by means of a ball joint on the nose bridge of the spectacle frame.
RU2006140930/12A 2006-11-20 2006-11-20 Imaging method and device intended for speech sound propagation detection RU2345422C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2006140930/12A RU2345422C2 (en) 2006-11-20 2006-11-20 Imaging method and device intended for speech sound propagation detection

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2006140930/12A RU2345422C2 (en) 2006-11-20 2006-11-20 Imaging method and device intended for speech sound propagation detection

Publications (2)

Publication Number Publication Date
RU2006140930A RU2006140930A (en) 2008-05-27
RU2345422C2 true RU2345422C2 (en) 2009-01-27

Family

ID=39586219

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2006140930/12A RU2345422C2 (en) 2006-11-20 2006-11-20 Imaging method and device intended for speech sound propagation detection

Country Status (1)

Country Link
RU (1) RU2345422C2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU198673U1 (en) * 2020-03-27 2020-07-21 Общество с ограниченной ответственностью "Сенсор-Тех" PORTABLE SPEECH AND SOUND RECOGNITION
RU2727883C2 (en) * 2015-10-13 2020-07-24 Сони Корпорейшн Information processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2727883C2 (en) * 2015-10-13 2020-07-24 Сони Корпорейшн Information processing device
RU198673U1 (en) * 2020-03-27 2020-07-21 Общество с ограниченной ответственностью "Сенсор-Тех" PORTABLE SPEECH AND SOUND RECOGNITION

Also Published As

Publication number Publication date
RU2006140930A (en) 2008-05-27

Similar Documents

Publication Publication Date Title
US11579837B2 (en) Audio profile for personalized audio enhancement
WO2016054860A1 (en) Head wearing type vision auxiliary system for patient with vision disorder
WO2016086440A1 (en) Wearable guiding device for the blind
US11234092B2 (en) Remote inference of sound frequencies for determination of head-related transfer functions for a user of a headset
JP2016208348A (en) Display device, display device control method, and program
EP4236361A2 (en) Audio system using individualized sound profiles
KR101885473B1 (en) Smart glass to help visually impaired
US11178481B2 (en) Ear-plug assembly for hear-through audio systems
CN106651873B (en) A Zebra Crossing Detection Glasses for Visually Impaired Persons Based on RGB-D Camera and Stereo Sound
KR20140091195A (en) Glasses and control method thereof
KR20180018587A (en) Portable system that allows the blind or visually impaired to understand the environment by sound or touch
US20240412754A1 (en) Audio system for spatializing virtual sound sources
US11843922B1 (en) Calibrating an audio system using a user's auditory steady state response
US11670321B2 (en) Audio visual correspondence based signal augmentation
EP3918817A1 (en) Compensating for effects of headset on head related transfer functions
RU2345422C2 (en) Imaging method and device intended for speech sound propagation detection
CN104090385A (en) Intelligent anti-cheating spectacles
CN115151858A (en) Hearing aid system capable of being integrated into glasses frame
Vítek et al. New possibilities for blind people navigation
US11290837B1 (en) Audio system using persistent sound source selection for audio enhancement
US11171621B2 (en) Personalized equalization of audio output based on ambient noise detection
EP4186244A1 (en) Virtual microphone calibration based on displacement of the outer ear
KR101455830B1 (en) Glasses and control method thereof
US20230071778A1 (en) Foveated beamforming for augmented reality devices and wearables
EP4432053A1 (en) Modifying a sound in a user environment in response to determining a shift in user attention

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20091121