DE102014108371B4 - Method for voice control of entertainment electronic devices - Google Patents
Method for voice control of entertainment electronic devices Download PDFInfo
- Publication number
- DE102014108371B4 DE102014108371B4 DE102014108371.7A DE102014108371A DE102014108371B4 DE 102014108371 B4 DE102014108371 B4 DE 102014108371B4 DE 102014108371 A DE102014108371 A DE 102014108371A DE 102014108371 B4 DE102014108371 B4 DE 102014108371B4
- Authority
- DE
- Germany
- Prior art keywords
- user
- voice input
- electronic device
- control unit
- command words
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004891 communication Methods 0.000 claims abstract description 13
- 238000011156 evaluation Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Verfahren zum Steuern eines unterhaltungselektronischen Geräts, wobei das unterhaltungselektronische Gerät mindestens eine Steuereinheit, eine Kommunikationseinheit, eine Anzeigeeinheit und Mittel mindestens zum Empfangen von Spracheingaben aufweist, wobei mit dem unterhaltungselektronischen Gerät Fernsehsendungen empfangbar sind und wobei nach Erhalt einer Spracheingabe von einem Nutzer die Steuereinheit diese Spracheingabe analysiert und feststellt, ob diese Spracheingabe aus einzelnen Befehlsworten oder einem vollständigen Satz mit darin enthaltenen Befehlsworten besteht, und die Steuereinheit anhand der ausgewerteten Befehlswörter eine Steuerfunktion generiert, wenn die Spracheingabe des Nutzers mindestens eine Sequenz von zwei Befehlsworten enthält und dem Nutzer eine Spracheingabe optisch und/oder akustisch vorschlägt, welche die von ihm empfangenen Befehlsworte enthält und als vollständiger Satz ausgebildet ist.A method of controlling an entertainment electronic device, wherein the entertainment electronic device comprises at least one control unit, a communication unit, a display unit, and means for receiving voice input, wherein television programs are receivable with the entertainment electronic device, and upon receiving a voice input from a user, the control unit inputs that voice input analyzes and determines whether this voice input consists of individual command words or a complete set of command words contained therein, and the control unit generates a control function based on the evaluated command words, if the user's speech input contains at least a sequence of two command words and the user a voice input visually and / or proposes acoustically, which contains the command words received from him and is designed as a complete sentence.
Description
Die vorliegende Erfindung betrifft ein Verfahren zur Sprachsteuerung von unterhaltungselektronischen Geräten. Das unterhaltungselektronische Gerät weist mindestens eine Steuereinheit, eine Kommunikationseinheit, eine Anzeigeeinheit und Mittel mindestens zum Empfangen von Spracheingaben auf.The present invention relates to a method for voice control of entertainment electronic devices. The entertainment electronic device has at least one control unit, a communication unit, a display unit, and means for at least receiving voice input.
Unterhaltungselektronische Geräte, wie beispielsweise Fernsehgeräte, können über Spracheingaben von einem Nutzer gesteuert werden. Hierzu wird der Spracheingabemodus des unterhaltungselektronischen Gerätes aktiviert und anschließend werden Befehle zum Betrieb des unterhaltungselektronischen Gerätes von einem Nutzer eingegeben. In den meisten Fällen erfolgt die Eingabe der Spracheingaben durch Steuerung des unterhaltungselektronischen Gerätes über einzelne Kommandos. Dadurch soll sichergestellt werden, dass das unterhaltungselektronische Gerät die Benutzereingaben richtig versteht und nicht durch Wörter, die nicht zur Steuerung vorgesehen sind, falsche Befehle ausgeführt werden.Consumer electronic devices such as televisions may be controlled by a user via voice input. For this purpose, the voice input mode of the entertainment electronic device is activated, and then commands for operating the entertainment electronic device are entered by a user. In most cases, the voice input is entered by controlling the electronic entertainment device via individual commands. This is to ensure that the entertainment electronic device correctly understands the user input and does not execute erroneous commands through words that are not intended for control.
Es sind auch Sprachsteuerungen für elektronische Geräte bekannt, die es einem Nutzer erlauben, in einer natürlichen Sprache Befehle für das elektronische Gerät auszugeben. Die Befehle werden beispielsweise in einem vollständigen Satz ausgegeben, wobei das unterhaltungselektronische Gerät die in dem Satz enthaltenen Befehlsworte erkennt und eine entsprechende Steuerung vornimmt. Ein Beispiel dafür ist in der
Darüber hinaus sind Einrichtungen bekannt, die bei einer Spracheingabe störende Hintergrundgeräusche herausfiltern und einen steuerungsberechtigten Benutzer durch eine Sprachanalyse ermitteln. Auch dies ist aus der zuvor genannten Patentschrift
Aus der
Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zum Steuern eines unterhaltungselektronischen Gerätes zu verbessern, wobei die Steuerung vereinfacht und im Hinblick auf die Eingabegewohnheiten des Benutzers verbessert werden soll, um eine zuverlässigere Erkennung und Auswertung von Steuerbefehlen zu erreichen.The object of the present invention is to improve a method for controlling an entertainment electronic device, wherein the control should be simplified and improved with regard to the user's input habits in order to achieve a more reliable detection and evaluation of control commands.
Die Aufgabe wird durch ein Verfahren mit den in Anspruch 1 angegebenen Verfahrensschritten gelöst.The object is achieved by a method having the method steps specified in claim 1.
Vorteilhafte Weiterbildungen der Erfindung sind in den Unteransprüchen im Detail angegeben.Advantageous developments of the invention are specified in the dependent claims in detail.
Bei einem erfindungsgemäßen Verfahren zum Steuern eines unterhaltungselektronischen Gerätes, wobei das unterhaltungselektronische Gerät mindestens eine Steuereinheit, eine Kommunikationseinheit, eine Anzeigeeinheit und Mittel mindestens zum Empfangen von Spracheingaben aufweist und dazu ausgebildet ist, Fernsehsendungen zu empfangen, analysiert die Steuereinheit nach Erhalt einer Spracheingabe von einem Nutzer diese Spracheingabe und stellt fest, ob diese Spracheingabe aus einzelnen Befehlsworten oder einem vollständigen Satz mit darin enthaltenen Befehlsworten besteht, wobei die Steuereinheit anhand der ausgewerteten Befehlswörter eine Steuerfunktion generiert, wenn die Spracheingabe des Nutzers mindestens eine Sequenz von zwei Befehlsworten enthält. Die Steuereinheit schlägt dem Nutzer eine Spracheingabe optisch und/oder akustisch vor, welche die von ihm empfangenen Befehlsworte enthält und als vollständiger Satz ausgebildet ist. Spricht der Nutzer beispielsweise einen Steuerbefehl (Spracheingabe) aus, der aus zwei einzelnen Befehlsworten besteht, jedoch nicht als vollständiger Satz ausgebildet ist, so wird durch die Steuereinheit dem Nutzer optisch und/oder akustisch vorgeschlagen, dass und wie eine verbesserte Spracheingabe erfolgen kann. Insbesondere bei der Verwendung von einzelnen Befehlsworten (Kommandosprache), ergeben sich häufig Fehlinterpretationen von Systemen zur Steuerung von unterhaltungselektronischen Geräten. Wird jedoch ein vollständiger Satz als Spracheingabe zur Steuerung eines unterhaltungselektronischen Gerätes ausgegeben, so kann durch die Auswertung des Satzes mit den darin enthaltenen Befehlsworten eine zuverlässigere Steuerung gewährleistet werden. Die Steuereinheit gibt daher dem Nutzer eine Hilfestellung, indem die Steuereinheit dem Nutzer angibt, dass eine natürliche Spracheingabe möglich ist und bietet ihm darüber hinaus einen Vorschlag für eine derartige Eingabe.In a method according to the invention for controlling an entertainment electronic device, wherein the entertainment electronic device has at least one control unit, a communication unit, a display unit and means for at least receiving voice inputs and is adapted to receive television broadcasts, the control unit analyzes upon receipt of a voice input from a user this voice input and determines whether that voice input consists of individual command words or a complete set of command words contained therein, the control unit generating a control function based on the evaluated command words if the user's speech input contains at least a sequence of two command words. The control unit proposes visually and / or acoustically to the user a speech input which contains the command words received from it and is designed as a complete sentence. For example, if the user speaks a control command (voice input) consisting of two individual command words but is not configured as a complete sentence, the control unit will optically and / or acoustically suggest to the user that and how an improved voice input can take place. In particular, when using individual command words (command language), often result in misinterpretations of systems for controlling entertainment electronic devices. However, if a complete sentence is output as voice input for controlling an entertainment electronic device, more reliable control can be ensured by evaluating the sentence with the command words contained therein. The control unit therefore provides the user with assistance in that the control unit indicates to the user that a natural speech input is possible and moreover offers him a suggestion for such an input.
Bei dem Verfahren wird vermieden, dass durch die Eingabe eines einzelnen Befehlswortes eine Steuerfunktion ausgeführt wird. Wenn beispielsweise ein Nutzer sich unterhält und ein Befehlswort, wie z. B. „aus”, verwendet, erfolgt keine Steuerfunktion für das unterhaltungselektronische Gerät. Spricht der Nutzer jedoch einen Satz mit den Befehlswörtern „aus” und „Fernseher” aus (beispielsweise „schalte Fernseher aus”), so erkennt die Steuereinheit einen Befehl für das unterhaltungselektronische Gerät und generiert eine Steuerfunktion, z. B. Fernseher ausschalten. The method avoids that a control function is executed by the input of a single command word. For example, if a user is talking and a command word, such. B. "off" used, there is no control function for the entertainment electronic device. However, when the user speaks a sentence with the command words "off" and "TV" (for example, "turn off TV"), the control unit recognizes a command for the entertainment electronic device and generates a control function, e.g. B. Turn off the TV.
Bei der Analyse und der anschließenden Überprüfung der Spracheingabe können verschiedene Kriterien vorgegeben sein, welche das Vorliegen einer Sequenz von zwei Befehlsworten definieren. Beispielsweise kann eine bestimmte maximale Anzahl von Wörtern zwischen zwei vermeintlichen Befehlswörtern zulässig sein, wobei ein Überschreiten dieser Anzahl gegen das Vorliegen einer Sequenz von zwei Befehlswörtern spricht. Darüber hinaus werden bei der Analyse der Spracheingabe des Nutzers auch Synonyme für die erkannten Befehlsworte herangezogen, um eine Sequenz von zwei Befehlsworten zu erkennen. Um zu ermitteln, ob zwei erkannte Befehlsworte zu einer erfindungsgemäßen Sequenz von mindestens zwei Befehlsworten gehören, kann die Steuereinheit Pausen in der Spracheingabe des Nutzers ermitteln, um somit Abschnitte festzulegen, die zur Erkennung einer Sequenz dienen.In the analysis and the subsequent verification of the speech input, various criteria can be provided which define the presence of a sequence of two command words. For example, a certain maximum number of words between two putative command words may be allowed, wherein exceeding this number speaks against the presence of a sequence of two command words. In addition, in analyzing the user's voice input, synonyms are also used for the detected command words to detect a sequence of two command words. In order to determine whether two recognized command words belong to a sequence according to the invention of at least two command words, the control unit can detect pauses in the speech input of the user, thus defining sections which serve to identify a sequence.
Bei dem erfindungsgemäßen Verfahren erfolgt daher eine zuverlässige Erkennung von tatsächlich vorliegenden Steuerbefehlen für das unterhaltungselektronische Gerät.In the method according to the invention, therefore, a reliable detection of actually present control commands for the entertainment electronic device.
Die Steuereinheit kann eine Anzeige auf der Anzeigeeinheit generieren, welche die von dem Nutzer empfangene Spracheingabe in Textform und/oder eine von der Steuereinheit vorgeschlagene Spracheingabe in Textform anzeigt und/oder die Steuereinheit eine Sprachausgabe aufweist, die mindestens eine interpretierte Spracheingabe ausgibt. Eine interpretierte Spracheingabe umfasst eine Sprachausgabe dessen, was die Steuereinheit als Steuerbefehl für das unterhaltungselektronische Gerät erkannt hat. So kann die interpretierte Spracheingabe sich von der tatsächlichen Spracheingabe durch den Nutzer unterscheiden. Die interpretierte Spracheingabe kann beispielsweise Synonyme von zwei erkannten Befehlsworten umfassen, wobei die tatsächlich von dem Nutzer eingegebenen Befehlsworte nicht in der interpretierten Spracheingabe enthalten sind. Zusätzlich oder alternativ dazu kann auf der Anzeigeeinheit eine Anzeige generiert werden, die die von dem Nutzer erkannte Spracheingabe wörtlich wiedergibt. Alternativ oder zusätzlich hierzu kann eine von der Steuereinheit vorgeschlagene Spracheingabe in Textform angezeigt werden, wobei die vorgeschlagene Texteingabe, wie die interpretierte Spracheingabe, nicht den gleichen Wortlaut der tatsächlichen Spracheingabe des Nutzers aufweisen muss.The control unit may generate a display on the display unit which displays in text form the voice input in text form and / or a voice input proposed by the control unit and / or the control unit has a voice output which outputs at least one interpreted voice input. An interpreted voice input comprises a voice output of what the control unit has recognized as a control command for the entertainment electronic device. Thus, the interpreted speech input may differ from the actual speech input by the user. For example, the interpreted speech input may include synonyms of two recognized command words, with the command words actually input by the user not included in the interpreted speech input. Additionally or alternatively, a display can be generated on the display unit, which reproduces the speech input recognized by the user verbatim. Alternatively or additionally, a voice input suggested by the control unit may be displayed in textual form, wherein the proposed text input, such as the interpreted voice input, need not have the same wording of the user's actual voice input.
Die von dem Nutzer in einer Spracheingabe empfangenen logischen Verknüpfungen der einzelnen Befehlsworte können gespeichert werden und die Steuereinheit kann eine Sprachausgabe unterdrücken, wenn von dem Nutzer in einem vorgebbaren Zeitraum öfter als eine bestimmbare Anzahl eine Spracheingabe mit einer im Wesentlichen ähnlichen Verknüpfung der einzelnen Befehlsworte empfangen wird. Beispielsweise hat der Nutzer eine Sequenz von zwei Befehlsworten zur Steuerung des unterhaltungselektronischen Gerätes mehrfach als einzelne Kommandos eingegeben, wodurch über die Steuereinheit des unterhaltungselektronischen Gerätes ein Hinweis auf eine natürliche Spracheingabe ausgegeben worden ist. Ändert der Nutzer sein Verhalten jedoch nicht und verwendet weiterhin einzelne Befehlsworte, so kann von der Steuereinheit ein Hinweis auf eine natürliche Spracheingabe unterdrückt werden. In diesem Fall „lernt” die Steuereinheit, dass der Nutzer eine natürliche Spracheingabe nicht wünscht und verhindert, dass der Nutzer durch oft wiederkehrende und gleiche Hinweise zur Verwendung der Sprachsteuerung entmutigt wird, die Sprachsteuerung des unterhaltungselektronischen Geräts zu benutzen. Oft wiederkehrende Hinweise können bei einem Nutzer den Eindruck erwecken, er bediene das unterhaltungselektronische nicht richtig. Um eventuellen Fehlern vorzubeugen, würde ein Nutzer dann gänzlich auf die Sprachsteuerung verzichten. Dadurch, dass die Steuereinheit oft wiederkehrende und gleiche Sprachausgaben unterdrückt, wird der Nutzer nicht entmutigt.The logical links of the individual command words received by the user in a voice input may be stored and the control unit may suppress a voice output if the user receives a voice input having a substantially similar linkage of the individual command words more than a determinable number of times within a predeterminable time period , For example, the user has repeatedly input a sequence of two command words for controlling the entertainment electronic device as individual commands, whereby an indication of natural voice input has been output through the control unit of the entertainment electronic device. However, if the user does not change his behavior and continues to use individual command words, then the control unit can suppress an indication of natural speech input. In this case, the control unit "learns" that the user does not want a natural voice input and prevents the user from being discouraged from using the voice control of the entertainment electronic device by often recurring and similar advice on using the voice control. Frequently recurring clues can give users the impression that they are not using the entertainment electronic correctly. In order to prevent any errors, a user would then completely renounce the voice control. The fact that the control unit often suppresses recurrent and same voice output does not discourage the user.
Hierbei kann die Steuereinheit ebenfalls die als Kommando empfangenen Befehlsworte mit Synonymen abgleichen, so dass auch bei wechselnden Befehlsworten mit der gleichen Bedeutung ein Hinweis auf eine natürliche Spracheingabe unterdrückt wird. Die logischen Verknüpfungen stellen sicher, dass der Zusammenhang, in welchem die mindestens zwei Befehlsworte stehen, gleich oder zumindest ähnlich ist. Beispielsweise sollte ein Hinweis auf eine natürliche Spracheingabe nicht unterdrückt werden, nur weil in einer Sequenz von mindestens zwei Befehlswörtern beispielsweise die Wörter „heute” und „Programm” enthalten sind. Als logische Verknüpfung ist hierbei auch zu verstehen, ob die Spracheingaben des Nutzers beispielsweise für die Steuerung des unterhaltungselektronischen Geräts (Lautstärke, Helligkeit, Videotext, etc.) oder für die Informationsbeschaffung (z. B. Suchen in EPG-Daten nach bestimmten Filmen) vorgesehen sind.Here, the control unit can also match the command words received as a command with synonyms, so that even with changing command words with the same meaning an indication of a natural speech input is suppressed. The logical links ensure that the context in which the at least two command words are located is the same or at least similar. For example, an indication of natural speech input should not be suppressed simply because the words "today" and "program" are included in a sequence of at least two command words, for example. A logical link here is also to be understood as meaning whether the user's voice inputs are intended, for example, for the control of the entertainment electronic device (volume, brightness, videotext, etc.) or for the acquisition of information (eg searches in EPG data for specific films) are.
Die Steuereinheit kann eine Sprachausgabe unterdrücken, wenn eine bestimmte Sprachausgabe in einem vorgebbaren Zeitraum öfter als eine bestimmbare Anzahl ausgegeben worden ist. Hat die Steuereinheit eine bestimmte Sprachausgabe mehrfach ausgegeben, so kann aus den oben genannten Gründen ebenfalls darauf verzichtet werden, diese Sprachausgabe zu generieren. Beispielsweise verwendet der Nutzer verschiedene Befehlsworte innerhalb einer Sequenz, wobei die Steuereinheit anhand der vorstehend genannten Kriterien keine Übereinstimmung festgestellt hat. Die Steuereinheit erkennt jedoch über die Ausgabe der Steuereinheit, dass die Sprachausgabe mehrfach bereits ausgegeben worden ist, und verhindert das Ausgeben einer solchen.The control unit can suppress a voice output if a particular one Speech output in a predetermined period of time has been issued more than a determinable number. If the control unit has issued a certain voice output several times, it can also be dispensed with for the reasons mentioned above to generate this voice output. For example, the user uses different command words within a sequence, and the controller has found no match based on the above criteria. However, the control unit recognizes, via the output of the control unit, that the voice output has already been issued several times, and prevents it from being output.
Die Spracheingabe kann über eine Fernsteuerung für das unterhaltungselektronische Gerät erfolgen, wobei die Fernsteuerung ein Mikrofon und eine Kommunikationseinheit aufweist und die über das Mikrofon empfangenen Spracheingaben des Nutzers über die Kommunikationseinheit der Fernsteuerung an die Kommunikationseinheit des unterhaltungselektronischen Gerätes gesendet und der Steuereinheit übermittelt werden. Eine Spracheingabe über eine Fernsteuerung verhindert das Risiko, dass Störgeräusche oder andere Personen die Spracheingaben des Nutzers verfälschen. Wenn keine Fernsteuerung für die Spracheingabe verwendet wird, weist entsprechend das unterhaltungselektronische Gerät ein Mikrofon und entsprechende Mittel zum Verarbeiten der Spracheingaben auf.The voice input can be made via a remote control for the entertainment electronic device, wherein the remote control has a microphone and a communication unit and sent via the microphone speech inputs of the user via the communication unit of the remote control to the communication unit of the entertainment electronic device and transmitted to the control unit. Voice input via remote control prevents the risk of noise or other people distorting the user's voice input. Accordingly, if no remote control is used for the voice input, the entertainment electronic device has a microphone and corresponding means for processing the voice inputs.
Zur Generierung der interpretierten Sprachausgabe kann eine semantische Analyse der Sequenz von mindestens zwei Befehlsworten im Hinblick auf die Bedeutung der mindestens zwei Befehlsworte in deren Zusammenhang durchgeführt werden und die interpretierte Spracheingabe inhaltlich die Spracheingabe des Nutzers wiedergeben. Die interpretierte Spracheingabe kann daher völlig verschieden zu der Spracheingabe durch den Nutzer sein. Gibt ein Nutzer beispielsweise als Spracheingabe den Befehl „das ist mir viel zu leise” aus, kann die interpretierte Spracheingabe „erhöhe die Lautstärke des Fernsehgerätes” umfassen.In order to generate the interpreted speech output, a semantic analysis of the sequence of at least two command words with regard to the meaning of the at least two command words in their context can be carried out and the interpreted speech input can reproduce the speech input of the user. The interpreted speech input may therefore be completely different from the user's speech input. For example, if a user types the command "Much too quiet" as voice input, the interpreted voice input may include "Increase the volume of the TV."
Das Verfahren kann in einem unterhaltungselektronischen Gerät zur Anwendung kommen, das ein Fernsehgerät, ein Laptop, ein PC, ein Smartphone, ein Tablet-Computer oder eine mit einem Bildschirm verbundenen Set-Top-Box sein kann. Das Verfahren kann aber auch in einer Kombination solcher unterhaltungselektronischer Geräte mit einer Fernsteuerung oder in einer Fernsteuerung, die eine herkömmliche Fernbedienung, ein Smartphone, ein Tablet-Computer, ein PC, ein Laptop, ein PDA oder Mobiltelefon sein kann, zur Anwendung kommen.The method may be used in an entertainment electronic device, which may be a television, a laptop, a PC, a smartphone, a tablet computer, or a set-top box connected to a display. However, the method can also be used in a combination of such entertainment electronic devices with a remote control or in a remote control, which may be a conventional remote control, a smartphone, a tablet computer, a PC, a laptop, a PDA or a mobile phone.
Weitere Vorteile, Merkmale, Anwendungen und Ausführungsbeispiele ergeben sich aus der nachfolgenden Figurenbeschreibung von nicht einschränkend zu verstehenden Ausführungsbeispielen.Further advantages, features, applications and embodiments will become apparent from the following description of the figures of non-limiting embodiments to be understood.
In der Zeichnung zeigt:In the drawing shows:
Bei einem unterhaltungselektronischen Gerät wird durch eine Nutzereingabe oder automatisch nach dem Inbetriebnehmen eines unterhaltungselektronischen Gerätes, beispielsweise eines Fernsehgerätes, über eine spezielle Software das unterhaltungselektronische Gerät in einen Spracheingabemodus versetzt. Das unterhaltungselektronische Gerät verfügt über ein Mikrofon und Mittel zum Empfangen und Auswerten von Spracheingaben. Zusätzlich dazu verfügt eine Fernsteuerung für das unterhaltungselektronische Gerät über ein Mikrofon und Mittel zum Senden von Spracheingaben an das unterhaltungselektronische Gerät. Das unterhaltungselektronische Gerät kann somit über Spracheingaben durch einen Nutzer gesteuert werden. In einem ersten Spracheingabemodus gibt der Nutzer die Spracheingaben über die Fernsteuerung ein. In einem zweiten Spracheingabemodus gibt der Nutzer die Spracheingaben über das unterhaltungselektronische Gerät ein.In an entertainment electronic device, the entertainment electronic device is set in a voice input mode by a user input or automatically after the commissioning of an entertainment electronic device, such as a television set, via special software. The entertainment electronic device has a microphone and means for receiving and evaluating voice input. In addition, a remote controller for the entertainment electronic device has a microphone and means for sending voice input to the entertainment electronic device. The entertainment electronic device can thus be controlled via voice inputs by a user. In a first voice input mode, the user enters the voice inputs via the remote control. In a second voice input mode, the user inputs the voice inputs via the entertainment electronic device.
Das unterhaltungselektronische Gerät weist eine Steuereinheit auf, welche die Funktionen zur Steuerung des unterhaltungselektronischen Gerätes ausführt. Das unterhaltungselektronische Gerät weist Mittel zum Empfang von Fernsehsendungen über Kabel, Satellit, Antenne und/oder das Internet auf. Darüber hinaus kann die Steuereinheit die Verarbeitung der Spracheingaben des Nutzers über eine Internetverbindung an eine externe Auswerteeinrichtung senden, die die Auswertung der Spracheingabe des Nutzers vornimmt und eine ausgewertete Spracheingabe an die Steuereinheit des unterhaltungselektronischen Gerätes sendet.The entertainment electronic device has a control unit which performs the functions for controlling the entertainment electronic device. The entertainment electronic device has means for receiving television broadcasts via cable, satellite, antenna and / or the Internet. In addition, the control unit can send the processing of the user's voice inputs via an Internet connection to an external evaluation device, which performs the evaluation of the user's voice input and sends an evaluated voice input to the control unit of the entertainment electronic device.
Alternativ dazu kann die Steuereinheit des unterhaltungselektronischen Gerätes selbstständig die Auswertung der Spracheingabe des Nutzers vornehmen. Das unterhaltungselektronische Gerät kann ferner einen Speicher aufweisen, in dem von einem Nutzer eingegebene Spracheingaben zur Steuerung des unterhaltungselektronischen Gerätes und zur Suche nach Informationen über empfangbare Fernsehsendungen sowie die hierfür ausgegebenen Sprachausgaben und interpretierten Spracheingaben des unterhaltungselektronischen Gerätes gespeichert werden.Alternatively, the control unit of the entertainment electronic device can independently carry out the evaluation of the speech input of the user. The entertainment electronic device may further comprise a memory in which user input voice inputs are stored for controlling the entertainment electronic device and searching for information about receivable television broadcasts and the voice output and interpreted voice inputs of the entertainment electronic device output therefor.
Nachdem sich das unterhaltungselektronische Gerät in einem Spracheingabemodus befindet und ein Nutzer oder Betrachter eine Spracheingabe ausgibt, erfolgt durch die Steuereinheit des unterhaltungselektronischen Gerätes oder einer externen Auswerteinrichtung die Analyse und Auswertung der Spracheingabe.After the entertainment electronic device is in a voice input mode and a user or viewer is viewing a voice input device Voice input, is carried out by the control unit of the entertainment electronic device or an external evaluation device, the analysis and evaluation of voice input.
In Schritt
Ist die Spracheingabe des Nutzers in Schritt
Ist keine ähnliche Spracheingabe für die aktuell von einem Nutzer ausgegebene Spracheingabe in einem definierten Zeitraum ausgegeben worden, so erzeugt die Steuereinheit des unterhaltungselektronischen Gerätes optisch oder akustisch als auch optisch und akustisch einen Hinweis auf eine natürliche Spracheingabe in Schritt
Nach der inhaltlichen Wiedergabe der Spracheingabe in Schritt
Nachdem der Befehl ausgeführt worden ist, wird das Verfahren zur Sprachsteuerung beendet, wenn beispielsweise der Spracheingabemodus beendet wird. Alternativ kann nach dem Ausführen des Befehls in Schritt
Das Ausführen eines Befehls muss daher nicht das Ende des Verfahrens bedeuten. Vielmehr wird ein Benutzer oder Betrachter nach der inhaltlichen Wiedergabe der Spracheingabe in Schritt
Eine in natürlicher Sprache als vollständiger Satz ausgegebene Sprachausgabe des Nutzers oder Betrachters ermöglicht für das unterhaltungselektronische Gerät eine zuverlässigere Ermittlung des gewünschten Steuerbefehls bzw. der gewünschten Suchanfrage. Hierbei kann aus dem Zusammenhang und der Verknüpfung von einzelnen erkannten Befehlswörtern gezielt bestimmt werden, nach welchen Inhalten ein Betrachter oder Benutzer suchen will oder welche Steuerung er vornehmen möchte. Die Ausgabe von Hinweisen auf natürliche Spracheingaben dient dem Betrachter oder Benutzer nicht nur als Hilfestellung sondern lehrt ihm einen optimalen Umgang mit dem unterhaltungselektronischen Gerät und der Verwendung von Spracheingaben. Die Zuverlässigkeit der Spracherkennung wird damit merklich erhöht. Sollte jedoch ein Betrachter oder Benutzer Vorbehalte gegen eine derartige Spracheingabe haben, so erkennt das unterhaltungselektronische Gerät die wiederholt als einzelne Befehlsworte eingegebenen Spracheingaben und verzichtet darauf, Hinweise auf natürliche Spracheingaben zu generieren und auszugeben.A speech output of the user or viewer in natural language as a complete sentence allows the entertainment electronic device to more reliably determine the desired control command or query. In this case, it can be determined from the context and the linkage of individual recognized command words, which contents a viewer or user wants to search for or which control he would like to carry out. The output of hints to natural speech inputs not only helps the viewer or user but also teaches him how to best use the entertainment electronic device and how to use voice input. The reliability of speech recognition is thus increased significantly. However, should a viewer or user have reservations about such voice input, the entertainment electronic device recognizes the voice inputs repeatedly input as individual command words and refrains from generating and outputting indications of natural voice input.
Die Fernsteuerung kann eine Fernbedienung, ein Smartphone, ein Tablet, ein PC, ein Laptop, ein PDA oder ein Mobiltelefon sein. Ist die Fernsteuerung z. B. durch ein Smartphone realisiert, so weist dieses Mittel zum Aufnehmen von Spracheingaben von einem Nutzer auf. Ferner weist das Smartphone Einrichtungen für eine Nahbereichskommunikation (z. B. Bluetooth) mit dem unterhaltungselektronischen Gerät (z. B. Fernsehgerät) auf. Auf dem Smartphone ist für die Steuerung des unterhaltungselektronischen Geräts eine Anwendungssoftware („App”) installiert, welche nach einer Aktivierung durch den Nutzer in der Lage ist, mit dem Fernsehgerät zu kommunizieren und Steuerbefehle von dem Nutzer zu empfangen und an das Fernsehgerät zu senden. Die Anwendungssoftware des Smartphone kann auch die Interpretation und Analyse der Spracheingaben des Nutzers realisieren. Dabei wird der Steuereinheit des Fernsehgeräts von dem Smartphone (Fernsteuerung) eine interpretierte Spracheingabe übermittelt. Ferner können auf dem Display des Smartphones die tatsächlich ausgegebene Spracheingabe des Nutzers, die interpretierte Spracheingabe, ein Hinweis auf eine natürliche Spracheingabe einschließlich einer möglichen vorgeschlagenen Spracheingabe und z. B. Suchergebnisse dargestellt werden, wobei die Suchergebnisse von dem Fernsehgerät an das Smartphone gesendet werden. Lautsprecher des Smartphones können sämtliche Spracheingaben und Sprachausgaben (z. B. Hinweis auf natürliche Spracheingabe, vorgeschlagene Spracheingabe, Suchergebnisse, Bestätigung von Änderungen, etc.) wiedergeben.The remote control can be a remote control, a smartphone, a tablet, a PC, a laptop, a PDA or a mobile phone. Is the remote control z. B. realized by a smartphone, so this has means for recording voice input from a user. Further, the smartphone has facilities for short-range communication (eg, Bluetooth) with the entertainment electronic device (eg, TV). An application software ("app") is installed on the smartphone for the control of the entertainment electronic device, which upon activation by the user is able to communicate with the television and receive and send control commands from the user to the television. The application software of the smartphone can also realize the interpretation and analysis of the user's voice input. In this case, the control unit of the TV is transmitted from the smartphone (remote control) an interpreted voice input. Further, on the display of the smartphone, the user's actual voice input, the interpreted voice input, an indication of a natural voice input, including a possible suggested voice input, and e.g. B. Search results are displayed, the search results are sent from the TV to the smartphone. Speakers on the smartphone can play back all voice input and output (eg, natural voice input, suggested voice input, search results, confirmation of changes, etc.).
BezugszeichenlisteLIST OF REFERENCE NUMBERS
- 1010
- Startbegin
- 1212
- Spracheingabevoice input
- 1414
- Analyseanalysis
- 1616
- ÜberprüfungVerification
- 1818
- Vergleichcomparison
- 2020
- Wiedergabereproduction
- 2222
- HinweisNote
- 2424
- AusführenTo run
- 2626
- EndeThe End
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102014108371.7A DE102014108371B4 (en) | 2014-06-13 | 2014-06-13 | Method for voice control of entertainment electronic devices |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102014108371.7A DE102014108371B4 (en) | 2014-06-13 | 2014-06-13 | Method for voice control of entertainment electronic devices |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102014108371A1 DE102014108371A1 (en) | 2015-12-17 |
DE102014108371B4 true DE102014108371B4 (en) | 2016-04-14 |
Family
ID=54706264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102014108371.7A Active DE102014108371B4 (en) | 2014-06-13 | 2014-06-13 | Method for voice control of entertainment electronic devices |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102014108371B4 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE19533541C1 (en) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Method for the automatic control of one or more devices by voice commands or by voice dialog in real time and device for executing the method |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US20020082844A1 (en) * | 2000-12-20 | 2002-06-27 | Van Gestel Henricus Antonius Wilhelmus | Speechdriven setting of a language of interaction |
US6553345B1 (en) * | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
US20050114141A1 (en) * | 2003-09-05 | 2005-05-26 | Grody Stephen D. | Methods and apparatus for providing services using speech recognition |
-
2014
- 2014-06-13 DE DE102014108371.7A patent/DE102014108371B4/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
DE19533541C1 (en) * | 1995-09-11 | 1997-03-27 | Daimler Benz Aerospace Ag | Method for the automatic control of one or more devices by voice commands or by voice dialog in real time and device for executing the method |
US6553345B1 (en) * | 1999-08-26 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Universal remote control allowing natural language modality for television and multimedia searches and requests |
US20020082844A1 (en) * | 2000-12-20 | 2002-06-27 | Van Gestel Henricus Antonius Wilhelmus | Speechdriven setting of a language of interaction |
US20050114141A1 (en) * | 2003-09-05 | 2005-05-26 | Grody Stephen D. | Methods and apparatus for providing services using speech recognition |
Also Published As
Publication number | Publication date |
---|---|
DE102014108371A1 (en) | 2015-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60005326T2 (en) | DETECTION UNITS WITH COMPLEMENTARY LANGUAGE MODELS | |
DE112016004863T5 (en) | Parameter collection and automatic dialog generation in dialog systems | |
DE102012212185B4 (en) | Maintaining and providing language models | |
DE102016125508A1 (en) | Discovery system for voice actions | |
DE102014109122A1 (en) | Systems and methods for result-based arbitration in speech dialogue systems | |
DE60032982T2 (en) | Speech recognition for controlling a device | |
DE102015103385A1 (en) | Steer voice input based on eye tracking | |
DE102019119171A1 (en) | VOICE RECOGNITION FOR VEHICLE VOICE COMMANDS | |
DE112015006325T5 (en) | Information providing system | |
DE102015106280B4 (en) | Systems and methods for compensating for speech artifacts in speech recognition systems | |
DE102014002543A1 (en) | Method for detecting at least two information to be acquired with information content to be linked by a voice dialogue device, voice dialogue device and motor vehicle | |
DE10220521B4 (en) | Method and system for processing voice data and classifying calls | |
DE102015121098A1 (en) | Multimodal answer to a multimodal search | |
DE112019007274T5 (en) | AUTOMATIC SUBTITLING OF AUDIBLE PORTIONS OF CONTENT ON A COMPUTER DEVICE | |
DE102018114453A1 (en) | Interactive sessions | |
EP3095114B1 (en) | Method and system for generating a control command | |
EP3735688B1 (en) | Method, device and computer-readable storage medium having instructions for processing a speech input, motor vehicle, and user terminal with speech processing | |
DE102014108371B4 (en) | Method for voice control of entertainment electronic devices | |
EP3115886B1 (en) | Method for operating a voice controlled system and voice controlled system | |
DE102007042583B4 (en) | Method for communication between a natural person and an artificial speech system and communication system | |
DE102006045719A1 (en) | Medical system e.g. computer tomograph, has voice input unit with training module, which is designed to interpret voice data set and to produce training control signal based on interpretation results | |
DE102019219406A1 (en) | CONTEXT-SENSITIVE VOICE DIALOGUE SYSTEM | |
DE102019008981A1 (en) | Easier finding of verbal commands using multimodal interfaces | |
DE102017122298A1 (en) | Dynamically setting a speech recognition system | |
DE102009027253A1 (en) | Arrangement for multimodal operation of media device e.g. TV set, has receiving unit with two cameras arranged at media-device or at required existing wireless remote control such that optical axes of objectives cut into each other |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R082 | Change of representative | ||
R016 | Response to examination communication | ||
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R084 | Declaration of willingness to licence | ||
R081 | Change of applicant/patentee |
Owner name: LOEWE IP HOLDING LTD., CY Free format text: FORMER OWNER: LOEWE TECHNOLOGIES GMBH, 96317 KRONACH, DE |
|
R082 | Change of representative |
Representative=s name: HARMSEN UTESCHER RECHTSANWALTSPARTNERSCHAFT MB, DE |