DE102015212650A1 - Method and system for the computer-aided processing of a voice input - Google Patents
Method and system for the computer-aided processing of a voice input Download PDFInfo
- Publication number
- DE102015212650A1 DE102015212650A1 DE102015212650.1A DE102015212650A DE102015212650A1 DE 102015212650 A1 DE102015212650 A1 DE 102015212650A1 DE 102015212650 A DE102015212650 A DE 102015212650A DE 102015212650 A1 DE102015212650 A1 DE 102015212650A1
- Authority
- DE
- Germany
- Prior art keywords
- data
- online
- mobile unit
- sub
- offline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 134
- 238000012545 processing Methods 0.000 title claims abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 5
- 238000012546 transfer Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Navigation (AREA)
- Telephonic Communication Services (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zum rechnergestützten Verarbeiten einer Spracheingabe für eine mobile Einheit (1) und einen externen Server (10), zwischen denen zumindest zeitweise eine datentechnische Verbindung besteht. Dabei werden zumindest zwei Teilprozesse (Pn, P1, P2) ausgeführt, die sowohl von der mobilen Einheit (1) als auch von dem externen Server (10) ausführbar sind. Die Erfindung betrifft ferner ein System zum rechnergestützten Verarbeiten einer Spracheingabe mit einer mobilen Einheit (1) und einem externen Server (10). Dabei ist durch eine Erfassungseinheit der mobilen Einheit (1) die Spracheingabe erfassbar. Die mobile Einheit (1) und der externe Server (10) umfassen jeweils eine Datenschnittstelle (6a, 6b) und jeweils eine Recheneinheit (5a, 5b). Dabei ist durch die Datenschnittstelle (6a) der mobilen Einheit (1) und die Datenschnittstelle (6b) des externen Servers (10) wenigstens zeitweise eine datentechnische Verbindung zwischen der mobilen Einheit (1) und dem externen Server (10) herstellbar. Zumindest zwei Teilprozesse (Pn, P1, P2) sind sowohl von der Recheneinheit (5a) der mobilen Einheit (1) als auch von der Recheneinheit (5b) des externen Servers (10) ausführbar.The invention relates to a method for the computer-aided processing of a voice input for a mobile unit (1) and an external server (10), between which at least temporarily a data connection exists. In this case, at least two sub-processes (Pn, P1, P2) are executed, which are executable both by the mobile unit (1) and by the external server (10). The invention further relates to a system for computer-aided processing of a voice input with a mobile unit (1) and an external server (10). In this case, the speech input can be detected by a detection unit of the mobile unit (1). The mobile unit (1) and the external server (10) each comprise a data interface (6a, 6b) and in each case a computing unit (5a, 5b). In this case, at least temporarily a data-technical connection between the mobile unit (1) and the external server (10) can be produced by the data interface (6a) of the mobile unit (1) and the data interface (6b) of the external server (10). At least two sub-processes (Pn, P1, P2) can be executed both by the arithmetic unit (5a) of the mobile unit (1) and by the arithmetic unit (5b) of the external server (10).
Description
Die Erfindung betrifft ein Verfahren zum rechnergestützten Verarbeiten einer Spracheingabe für eine mobile Einheit und einen externen Server, zwischen denen zumindest zeitweise eine datentechnische Verbindung besteht. Dabei werden zumindest zwei Teilprozesse ausgeführt, die sowohl von der mobilen Einheit als auch vom dem externen Server ausführbar sind. Die Erfindung betrifft ferner ein System zum rechnergestützten Verarbeiten einer Spracheingabe mit einer mobilen Einheit und einem externen Server.The invention relates to a method for the computer-aided processing of a voice input for a mobile unit and an external server, between which at least temporarily a data connection exists. At least two sub-processes are executed, which can be executed both by the mobile unit and by the external server. The invention further relates to a system for computer-aided processing of a voice input with a mobile unit and an external server.
Spracherkennungssysteme finden ein breites Anwendungsspektrum für Bediensysteme. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Auch hat sich die Bedienung von Einrichtungen eines Fahrzeugs über Spracheingaben als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Beispielsweise werden zur Eingabe komplexer Sachverhalte entsprechende Informationen durch ein Sprachdialogsystem sequentiell vom Nutzer abgefragt. Speech recognition systems find a wide range of applications for operating systems. This applies equally to the operation of devices and the completion of telephone tasks using voice computers, such as telephone banking. Also, the operation of facilities of a vehicle via voice inputs has become established as an essential feature of current user interfaces in the vehicle. For example, to input complex facts corresponding information is queried sequentially by a user through a speech dialogue system.
Es ist dabei von entscheidender Bedeutung, dass die Erkennung und Interpretation einer Spracheingabe des Nutzers möglichst fehlerfrei und schnell erfolgt. Hierfür wurden zwar bereits verschiedene Methoden vorgeschlagen, die zur Implementierung notwendige große Rechenkapazität erschwert allerdings häufig den Einsatz, etwa im Bereich mobiler Geräte und insbesondere in Fahrzeugen. Ein Ansatz zur Lösung dieses Problems ist, die Rechenaufgaben auf einen über das Internet erreichbaren Server auszulagern. Dies setzt allerdings voraus, dass das Spracherkennungssystem jederzeit Daten mit dem Server austauschen kann, was insbesondere in Gebieten mit lückenhafter Abdeckung durch Mobilfunknetze nicht jederzeit gewährleistet ist. It is of crucial importance that the recognition and interpretation of a user's speech input is as error-free and fast as possible. Although various methods have already been proposed for this, the large computing capacity required for the implementation frequently makes deployment difficult, for example in the field of mobile devices and in particular in vehicles. One approach to solving this problem is to outsource the computational tasks to a server accessible via the Internet. However, this presupposes that the voice recognition system can exchange data with the server at any time, which is not always guaranteed, especially in areas with incomplete coverage by mobile radio networks.
Das in der
Dazu wird anhand der Spracheingabe des Fahrers eine Schlagworterkennung durchgeführt, wobei Schlagworte auch in einer externen Quelle, etwa per Internetverbindung, in einer Datenbank gefunden werden. For this purpose, based on the voice input of the driver, a keyword recognition is performed, with keywords are also found in an external source, such as an Internet connection, in a database.
Bei der in der
Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Verfahren und ein System der oben genannten Art zur Verfügung zu stellen, bei denen eine Spracheingabe zuverlässig und unter optimaler Ausnutzung aller verfügbaren Ressourcen verarbeitet wird. The present invention has for its object to provide a method and a system of the above type, in which a voice input is processed reliably and with optimum utilization of all available resources.
Erfindungsgemäß wird diese Aufgabe durch ein Verfahren mit den Merkmalen des Anspruchs 1 sowie ein System mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen. According to the invention this object is achieved by a method having the features of
Bei dem erfindungsgemäßen Verfahren der oben genannten Art wird die Spracheingabe von der mobilen Einheit erfasst. Es werden (a) für den ersten Teilprozess offline-Inputdaten und online-Inputdaten erzeugt und (b) die online-Inputdaten an den externen Server übertragen, falls die datentechnische Verbindung besteht. In einem weiteren Schritt (c) wird von der mobilen Einheit der aktuelle Teilprozess ausgeführt, wobei anhand der offline-Inputdaten offline-Outputdaten erzeugt werden. Ferner wird (d), falls die online-Inputdaten an den externen Server übertragen worden oder von ihm erzeugt worden sind, der aktuelle Teilprozess von dem externen Server ausgeführt, wobei anhand der online-Inputdaten online-Outputdaten erzeugt werden. Falls die datentechnische Verbindung besteht, werden die online-Outputdaten an die mobile Einheit übertragen. Schließlich werden (e) neue offline-Inputdaten und neue online-Inputdaten für den nächsten Teilprozess erzeugt. Dabei werden die Schritte (c) bis (e) für jeden der Teilprozesse ausgeführt, bis der letzte Teilprozess ausgeführt worden ist. Dabei wird jeweils der nächste Teilprozess ausgeführt und der Ablauf der Schritte (c) bis (e) wiederholt bis zum Abschluss des letzten Teilprozesses.In the method according to the invention of the type mentioned above, the voice input is detected by the mobile unit. It generates (a) offline input data and online input data for the first sub-process and (b) transfers the online input data to the external server if the data connection exists. In a further step (c), the mobile unit performs the current sub-process, whereby offline output data is generated on the basis of the offline input data. Further, if the online input data has been transmitted to or generated by the external server, (d) the current thread is executed by the external server, generating online output data from the on-line input data. If the data link exists, the online output data is transmitted to the mobile unit. Finally, (e) new offline input data and new online input data are generated for the next subprocess. Thereby, steps (c) to (e) are executed for each of the sub-processes until the last sub-process has been executed. In each case, the next sub-process is executed and the sequence of steps (c) to (e) is repeated until the end of the last sub-process.
Die mobile Einheit ist insbesondere in einem Fahrzeug angeordnet oder in dieses integriert. The mobile unit is arranged in particular in a vehicle or integrated in this.
Das erfindungsgemäße Verfahren dient der Verarbeitung einer Spracheingabe mit zumindest zwei Teilprozessen. Dies ist beispielsweise typisch für Sprachsteuerungsverfahren, bei denen anhand von Audiodaten gesprochener Sprache durch einen Spracherkenner ein maschinenlesbarer Text erzeugt wird, durch den im weiteren Verlauf Befehle erkannt und ausgeführt werden. In weiteren Schritten können die Daten weiterverarbeitet oder analysiert werden, etwa um die Zuverlässigkeit der Sprachsteuerung zu verbessern. The inventive method is used to process a voice input with at least two sub-processes. This is typical, for example, for voice control methods in which a machine-readable text is generated on the basis of audio data of spoken speech by a speech recognizer, by means of which commands are subsequently recognized and executed. In further steps, the data can be further processed or analyzed, for example to improve the reliability of the voice control.
Unter „Teilprozessen“ werden im Folgenden modulare Funktionalitäten verstanden, die von Rechnern ausgeführt werden. Dabei werden insbesondere anhand von Inputdaten Outputdaten erzeugt. Die einzelnen Teilprozesse können dabei nach- oder nebeneinander ausgeführt werden. Die Inputdaten zur Ausführung eines Teilprozesses können von einem beliebigen geeigneten Rechner erzeugt worden sein und die Outputdaten können von einem beliebigen geeigneten Rechner weiterverarbeitet werden. In the following, "sub-processes" are understood to mean modular functions that are executed by computers. In particular, input data is used to generate output data. The individual sub-processes can be executed after or next to each other. The input data for executing a sub-process may have been generated by any suitable computer and the output data may be further processed by any suitable computer.
Insbesondere werden die zumindest zwei Teilprozesse bei der Verarbeitung der Spracheingabe nacheinander ausgeführt, wobei ein Teilprozess Outputdaten erzeugt, die entweder direkt als Inputdaten für den darauf folgenden Teilprozess dienen oder aus denen die Inputdaten für den darauf folgenden Teilprozess erzeugt werden. Die Teilprozesse können etwa mehrere aufeinander aufbauende Schritte der Verarbeitung der Spracheingabe umfassen. In particular, the at least two sub-processes are executed one after the other during the processing of the speech input, whereby a sub-process generates output data which either directly serve as input data for the subsequent sub-process or from which the input data for the subsequent sub-process are generated. The sub-processes may comprise, for example, several consecutive steps of processing the speech input.
Die datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server kann insbesondere drahtlos erfolgen, beispielsweise durch ein lokales Netzwerk oder ein größeres Netzwerk, beispielsweise das Internet. Ferner kann die Verbindung über ein Telekommunikationsnetz, etwa ein Telefonnetz, oder ein drahtloses lokales Netzwerk (WLAN) hergestellt werden. Ferner kann die Datenverbindung durch den Anschluss eines Datenkabels erfolgen. Die Verbindung kann auch über eine andere Einheit hergestellt werden, die selbst eine Verbindung zu dem externen Server herstellen kann. Beispielsweise kann eine datentechnische Verbindung zwischen der mobilen Einheit und einem mit dem Internet verbundenen Mobiltelefon bestehen, etwa durch ein Datenkabel oder eine Funkverbindung, etwa per Bluetooth. Insbesondere kann die Verbindung zu dem externen Server über das Internet hergestellt werden.The data connection between the mobile unit and the external server can in particular be wireless, for example, by a local network or a larger network, such as the Internet. Furthermore, the connection can be made via a telecommunications network, such as a telephone network, or a wireless local area network (WLAN). Furthermore, the data connection can be made by connecting a data cable. The connection can also be made through another device that can itself connect to the external server. For example, a data connection may exist between the mobile unit and a mobile telephone connected to the Internet, for example by means of a data cable or a radio connection, for example via Bluetooth. In particular, the connection to the external server can be made via the Internet.
Die Spracheingabe wird von der mobilen Einheit erfasst, beispielsweise durch ein in diese integriertes Mikrofon. Die Spracheingabe kann allerdings auch auf indirekte Weise erfasst werden, beispielsweise durch Abrufen einer Spracheingabe, die bei einer weiteren Einrichtung gespeichert ist. The voice input is detected by the mobile unit, for example by a built-in microphone. However, the voice input may also be detected indirectly, for example by retrieving a voice input stored at another device.
Bei der Erfassung der Spracheingabe werden insbesondere Audiodaten erfasst und gespeichert. Ferner kann eine erste Verarbeitung der Daten der Spracheingabe erfolgen, beispielsweise eine Kompression nach an sich bekannten Verfahren. When capturing the speech input, in particular audio data are recorded and stored. Furthermore, a first processing of the data of the speech input can take place, for example a compression according to methods known per se.
Um den ersten Teilprozess durchführen zu können, werden Inputdaten für die mobile Einheit und den externen Server erzeugt. Im Folgenden beziehen sich die Begriffe Offline-Inputdaten und Offline-Outputdaten auf die mobile Einheit und die Begriffe Online-Inputdaten und Online-Outputdaten auf den externen Server. Zur Durchführung des ersten Teilprozesses werden die erzeugten Online-Inputdaten an den externen Server übertragen. Besteht gerade keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server, so kann die Übertragung nicht durchgeführt werden. In diesem Fall wird der erste Teilprozess zunächst nur von der mobilen Einheit durchgeführt. Wird die datentechnische Verbindung zu einem späteren Zeitpunkt hergestellt, so können die Online-Inputdaten an den externen Server übertragen werden und der erste Teilprozess kann vom externen Server durchgeführt werden. Als Ergebnis des ersten Teilprozesses werden Offline- bzw. Online-Outputdaten erzeugt. In order to be able to carry out the first sub-process, input data is generated for the mobile unit and the external server. In the following, the terms offline input data and offline output data refer to the mobile unit and the terms online input data and online output data to the external server. To carry out the first subprocess, the generated online input data is transmitted to the external server. If there is currently no data connection between the mobile unit and the external server, then the transfer can not be performed. In this case, the first sub-process is initially performed only by the mobile unit. If the data connection is established at a later time, the online input data can be transmitted to the external server and the first sub-process can be performed by the external server. As a result of the first sub-process, offline or online output data are generated.
Zur Durchführung des nächsten Teilprozesses müssen nun neue Offline- und Online-Inputdaten erzeugt werden. Dies kann insbesondere anhand der bei dem ersten Teilprozess erzeugten Outputdaten erfolgen. Besteht keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server, so stehen den beiden Komponenten jeweils nur die eigenen Outputdaten zur Verfügung. In diesem Fall werden die neuen Online-Inputdaten von dem externen Server und die neuen Offline-Inputdaten von der mobilen Einheit erzeugt. Besteht dagegen die datentechnische Verbindung und wurden die Online-Outputdaten an die mobile Einheit übertragen, so kann die mobile Einheit die neuen Online- und Offline-Inputdaten anhand der im zuvor durchgeführten Teilprozess erzeugten Outputdaten erzeugen. In diesem Fall können identische Online- und Offline-Inputdaten erzeugt werden. To carry out the next subprocess, new offline and online input data must now be generated. This can be done in particular on the basis of the output data generated in the first sub-process. If there is no data connection between the mobile unit and the external server, then only the own output data is available to the two components. In this case, the new online input data is generated by the external server and the new offline input data is generated by the mobile unit. On the other hand, if the data connection exists and the online output data has been transmitted to the mobile unit, the mobile unit can generate the new online and offline input data based on the output data generated in the previously performed subprocess. In this case, identical online and offline input data can be generated.
Es wird nun der nächste Teilprozess durchgeführt, wobei die neuen Online- und Offline-Inputdaten verwendet werden. Wurden die Online-Inputdaten von der mobilen Einheit erzeugt, so müssen diese zunächst an den externen Server übertragen werden. Dies kann für beliebig viele Teilprozesse wiederholt werden, bis der letzte Teilprozess ausgeführt wurde. The next subprocess is now performed, using the new online and offline input data. If the online input data were generated by the mobile unit, they must first be transferred to the external server. This can be repeated for any number of subprocesses until the last subprocess has been executed.
Auf diese Weise können die Teilprozesse parallel von der mobilen Einheit und dem externen Server durchgeführt werden. Besteht zu dem jeweiligen Zeitpunkt die datentechnische Verbindung, so kann zwischen der Durchführung der einzelnen Teilprozesse ein Zusammenführen und Abgleichen der jeweiligen Outputdaten erfolgen. In this way, the sub-processes can be performed in parallel by the mobile unit and the external server. If the data connection exists at the respective time, a merger and adjustment of the respective output data can take place between the execution of the individual sub-processes.
Insbesondere kann somit sichergestellt werden, dass beide Komponenten die gleichen Inputdaten verwenden und dass die resultierenden Outputdaten somit vergleichbar sind. In particular, it can thus be ensured that both components use the same input data and that the resulting output data are thus comparable.
So können vorteilhafterweise die Ressourcen der mobilen Einheit und des externen Servers gleichzeitig genutzt werden, wobei insbesondere bei einer instabilen datentechnischen Verbindung der gesamte parallele Ablauf der mehreren Teilprozesse zwischen den einzelnen Teilprozessen koordiniert werden kann.Thus, advantageously, the resources of the mobile unit and the external server can be used simultaneously, in particular in the case of an unstable data connection, the entire parallel sequence of the plurality of sub-processes can be coordinated between the individual sub-processes.
Es werden dabei zumindest zwei Teilprozesse parallel von der mobilen Einheit und dem externen Server durchgeführt und zwischenzeitlich koordiniert, soweit die datentechnische Verbindung einen Abgleich zwischen den einzelnen Teilprozessen erlaubt. Soweit die datentechnische Verbindung dies zulässt, werden die Outputdaten der beiden Komponenten zwischen jedem Teilprozess zusammengebracht und für den folgenden Teilprozess werden insbesondere die gleichen Offline- und Online-Inputdaten erzeugt. Wenn allerdings für einen Zeitraum keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server besteht, so kann die Verarbeitung der Daten zu der Spracheingabe für einzelne Teilprozesse dennoch ohne Koordinierung fortgesetzt werden, nämlich von der mobilen Einheit bzw. dem externen Server. Dies erlaubt unter Ausnutzung der modularen Verarbeitung der Spracheingabe eine hohe Flexibilität des gesamten Verfahrens.At least two sub-processes are carried out in parallel by the mobile unit and the external server and coordinated in the meantime, as far as the data connection permits a comparison between the individual sub-processes. As far as the data connection permits, the output data of the two components are brought together between each subprocess and, in particular, the same offline and online input data are generated for the following subprocess. If, however, there is no data connection between the mobile unit and the external server for a period of time, the processing of the data for the voice input for individual sub-processes can nevertheless be continued without coordination, namely by the mobile unit or the external server. This allows a high flexibility of the whole process by utilizing the modular processing of voice input.
Bei einer Ausbildung umfasst einer der Teilprozesse eine Spracherkennung, wobei die Offline-Inputdaten und die Online-Inputdaten identisch sind und anhand der Spracheingabe erzeugt werden. Ferner umfassen die Offline-Outputdaten und die Online-Outputdaten jeweils maschinenlesbare Textdaten.In one embodiment, one of the sub-processes includes speech recognition, wherein the offline input data and the online input data are identical and generated based on the speech input. Further, the offline output data and the online output data each include machine-readable text data.
Dadurch kann vorteilhafterweise ein Spracherkennungsmodul parallel durch die mobile Einheit und den externen Server durchgeführt werden. Insbesondere wird dabei eine automatische Spracherkennung (automated speech recognition, ASR) durchgeführt. Dies kann nach an sich bekannten Verfahren erfolgen. Es wird dabei insbesondere von der Spracheingabe in Form von Audiodaten ausgegangen. Es wird ein maschinenlesbarer Text erzeugt, wobei insbesondere ein Sprachmodell zur Erkennung verwendet wird. Das Sprachmodell umfasst etwa einen Wort- und Ausdrucksschatz, wobei insbesondere einzelne Wörter, Wortgruppen und sprachliche Konstruktionen repräsentiert sind, aber auch statistische Zusammenhänge der einzelnen Wörter und Wortgruppen zueinander repräsentiert sind. Dabei kann das Sprachmodell weitere ergänzende Daten umfassen. Der zur Durchführung der Spracherkennung benötigte Rechenaufwand ist insbesondere abhängig vom Umfang des Sprachmodells.As a result, advantageously, a voice recognition module can be performed in parallel by the mobile unit and the external server. In particular, an automatic speech recognition (ASR) is performed. This can be done by methods known per se. It is assumed in particular by the speech input in the form of audio data. A machine-readable text is generated, wherein in particular a language model is used for recognition. The language model comprises about a vocabulary and expression, in particular, individual words, phrases and linguistic constructions are represented, but also statistical relationships of the individual words and phrases are represented to each other. The language model may include further supplementary data. The computational effort required to carry out the speech recognition depends, in particular, on the size of the language model.
Ferner hängt die Qualität der Spracherkennung von dem Sprachmodell ab. Da die Rechenkapazität der mobilen Einheit typischerweise gering ist gegenüber dem externen Server, können mobile Einheiten häufig lediglich eine grundlegende Spracherkennung anhand eines einfacheren Sprachmodells durchführen, während der externe Server in der Regel eine höherwertige Spracherkennung leisten kann. Die Qualität der durchgeführten Spracherkennung kann nach an sich bekannten Verfahren bewertet werden, beispielsweise kann ein Konfidenzwert bestimmt werden.Furthermore, the quality of speech recognition depends on the language model. Since the computing capacity of the mobile unit is typically small compared to the external server, mobile units often can only perform basic speech recognition using a simpler speech model, while the external server can typically provide higher quality speech recognition. The quality of the speech recognition performed can be evaluated according to known methods, for example, a confidence value can be determined.
Bei einer Weiterbildung umfasst einer der Teilprozesse die Erzeugung einer semantischen Analyse. Dabei umfassen die Offline-Inputdaten und die Online-Inputdaten jeweils maschinenlesbare Textdaten und die Offline-Outputdaten und die Online-Outputdaten umfassen jeweils Analysedaten.In one development, one of the sub-processes includes the generation of a semantic analysis. The offline input data and the online input data each comprise machine-readable text data, and the offline output data and the online output data each include analysis data.
Dadurch kann vorteilhafterweise eine semantische Analyse unter Einbeziehung der Rechenkapazitäten der mobilen Einheit und des externen Servers erfolgen. Insbesondere kann nach an sich bekannten Verfahren ein natural language understanding (NLU) durchgeführt werden. Beispielsweise können Schlagworte erkannt werden. Insbesondere werden anhand der maschinenlesbaren Textdaten Anweisungen erzeugt, die im Folgenden als Anweisungen an das System übertragen und ausgeführt werden können. This advantageously makes it possible to carry out a semantic analysis involving the computing capacities of the mobile unit and the external server. In particular, natural language understanding (NLU) can be carried out by methods known per se. For example, keywords can be recognized. In particular, statements are generated from the machine-readable text data, which in the following can be transmitted and executed as instructions to the system.
Bei einer weiteren Ausbildung umfasst einer der Teilprozesse die Durchführung einer Suche. Dabei umfassen die Offline-Inputdaten und die Online-Inputdaten jeweils Analysedaten und die Offline-Outputdaten und die Online-Outputdaten umfassen jeweils Suchergebnisdaten.In another embodiment, one of the sub-processes includes performing a search. The offline input data and the online input data respectively include analysis data, and the offline output data and the online output data each include search result data.
Dadurch kann vorteilhafterweise eine Suchfunktionalität implementiert werden, beispielsweise innerhalb einer Sprachsteuerung. Die Suche kann dabei nach an sich bekannten Verfahren erfolgen, wobei insbesondere eine Suchanfrage anhand der Analysedaten erzeugt wird und Suchergebnisse als Outputdaten erzeugt werden. Beispielsweise kann eine Datenbank mit Datensätzen anhand einer Suchanfrage durchsucht werden. Die Suchergebnisdaten können in diesem Fall etwa eine Liste mit für die Suchanfrage relevanten Datensätzen umfassen. As a result, advantageously, a search functionality can be implemented, for example within a voice control. The search can be carried out according to methods known per se, wherein in particular a search query is generated on the basis of the analysis data and search results are generated as output data. For example, a database of records can be searched by a search query. The search result data in this case may include a list of records relevant to the search query.
Bei einer Ausbildung werden, falls in Schritt (d) die Online-Outputdaten an die mobile Einheit übertragen wurden, die in Schritt (e) erzeugten neuen Online-Inputdaten und neuen Offline-Inputdaten für den jeweils nächsten Teilprozess anhand eines Vergleichs der Online-Outputdaten und der Offline-Outputdaten erzeugt.In one embodiment, if in step (d) the on-line output data has been transmitted to the mobile unit, the new online input data generated in step (e) and new offline input data for the next respective sub-process will be based on a comparison of the online output data and the offline output data is generated.
Dadurch kann vorteilhafterweise das Vorliegen von parallel erzeugten Offline- und Online-Outputdaten genutzt werden, um die neuen Offline- und Online-Inputdaten zu erzeugen. Insbesondere wird bestimmt, welche Outputdaten am besten geeignet sind, wobei ein Vergleich der Outputdaten durchgeführt wird. Im einfachsten Falle können die dabei gewählten Outputdaten direkt als neue Inputdaten verwendet werden. Ferner können aber auch die neuen Inputdaten anhand beider zuvor erzeugter Outputdaten erzeugt werden. Insbesondere sind die dabei erzeugten Online- und Offline-Inputdaten im Wesentlichen identisch. As a result, advantageously the presence of offline and online output data generated in parallel can be used to generate the new offline and online input data. In particular, it is determined which output data is most suitable, with a comparison of the output data being performed. In the simplest case, the selected output data can be used directly as new input data. Furthermore, the new input data can also be generated based on both previously generated output data. In particular, they are there generated online and offline input data essentially identical.
Bei einer Weiterbildung werden, falls in Schritt (d) die Online-Outputdaten nicht an die mobile Einheit übertragen wurden, in Schritt (e) die neuen Online-Inputdaten anhand der Online-Outputdaten erzeugt und die neuen Offline-Inputdaten anhand der Offline-Outputdaten erzeugt. In a development, if in step (d) the online output data has not been transmitted to the mobile unit, in step (e) the new online input data is generated from the online output data and the new offline input data is generated from the offline output data generated.
Dadurch kann vorteilhafterweise der nächste Teilprozess durchgeführt werden, auch wenn die Datenverbindung es nicht zulässt, dass die neuen Inputdaten zentral erzeugt werden. Dies bedeutet insbesondere, dass die im nächsten Schritt verwendeten Online- und Offline-Inputdaten nicht miteinander identisch sind. Stattdessen werden zwei oder mehr Teilprozesse parallel zueinander von der mobilen Einheit und dem externen Server durchgeführt, ohne dass ein Zwischenabgleich erfolgt. Dies ist insbesondere dann von Bedeutung, wenn die datentechnische Verbindung nicht fortlaufend besteht.As a result, advantageously, the next sub-process can be carried out, even if the data connection does not allow the new input data to be generated centrally. This means, in particular, that the online and offline input data used in the next step are not identical to one another. Instead, two or more subprocesses are performed in parallel by the mobile unit and the external server without any intermediate adjustment. This is particularly important if the data connection does not exist continuously.
Bei einer weiteren Ausbildung wird, falls in Schritt (d) die Online-Outputdaten an die mobile Einheit übertragen wurden, nachdem bereits ein weiterer Teilprozess gestartet wurde, anhand eines Vergleichs der Online-Outputdaten mit den zugeordneten Offline-Outputdaten bestimmt, ob die späteren Teilprozesse mit nochmal erzeugten neuen Online-Inputdaten und neuen Offline-Inputdaten nochmals durchgeführt werden sollen.In a further embodiment, if in step (d) the online output data has been transmitted to the mobile unit, after another sub-process has already been started, it is determined based on a comparison of the online output data with the associated offline output data, whether the later sub-processes to be carried out again with newly generated online input data and new offline input data.
Dadurch kann insbesondere eine zeitliche Verzögerung bei der parallelen Durchführung der Teilprozesse berücksichtigt werden. Die zeitliche Verzögerung kann etwa dadurch entstehen, dass die datentechnische Verbindung nicht dauerhaft besteht oder die Datenübertragung mit nur geringer Bandbreite erfolgt. Dies kann zur Folge haben, dass die von dem externen Server erzeugten Online-Outputdaten die mobile Einheit erst erreichen, nachdem angenommen wurde, dass keine Datenübertragung stattfinden wird. In diesem Fall setzt die mobile Einheit die Durchführung mit dem nächsten Teilprozess fort, wobei die Online-Outputdaten zunächst unberücksichtigt bleiben, da diese zum Durchführungszeitpunkt noch nicht zur Verfügung standen. Umgekehrt kann die zeitliche Verzögerung etwa auf einer langsameren Durchführung eines Teilprozesses durch die mobile Einheit begründet sein. As a result, in particular a delay in the parallel execution of the sub-processes can be taken into account. The time delay may arise, for example, because the data connection does not exist permanently or the data transmission takes place with only a small bandwidth. This may result in the online output data generated by the external server reaching the mobile unit only after it has been assumed that no data transmission will take place. In this case, the mobile unit continues execution with the next thread, with the on-line output data initially disregarded as they were not available at the time of execution. Conversely, the time delay may be due to a slower execution of a sub-process by the mobile unit.
In diesem Fall kann der externe Server die Durchführung des nächsten Teilprozesses beginnen, ohne dabei die Offline-Outputdaten zu berücksichtigen. Es kann also insgesamt eine der Komponenten die Abfolge der Teilprozesse schneller durchführen als die andere. Stehen nun Outputdaten einer der Komponenten für einen Teilprozess verspätet zur Verfügung, so kann eine verspätete Analyse durchgeführt werden, ob die neu hinzukommenden Outputdaten besser zur Durchführung des nächsten Teilprozesses geeignet sind. In diesem Fall kann bestimmt werden, dass der folgende Teilprozess mit Inputdaten nochmals durchgeführt wird, wobei die neu hinzugekommenen Outputdaten bei der Erzeugung der Inputdaten berücksichtigt werden. Dies erlaubt insbesondere die Behandlung von Fällen, bei denen die Verarbeitung und Datenübertragung keine vollständig parallele und synchrone Durchführung der Teilprozesse erlaubt. In this case, the external server can start performing the next thread without considering the offline output data. Thus, one component as a whole can perform the sequence of sub-processes faster than the other. If output data of one of the components for a sub-process are available late, a delayed analysis can be carried out as to whether the newly added output data is better suited for carrying out the next sub-process. In this case, it can be determined that the following sub-process is carried out again with input data, the newly added output data being taken into account in the generation of the input data. This allows in particular the treatment of cases in which the processing and data transmission does not allow fully parallel and synchronous execution of the sub-processes.
Bei einer Ausbildung werden, nachdem der letzte Teilprozess ausgeführt worden ist, anhand der Offline-Outputdaten und der Online-Outputdaten finale Outputdaten erzeugt.In training, after the last thread has been executed, final output data is generated from the offline output data and the online output data.
Dadurch kann vorteilhafterweise ein optimiertes Ergebnis der Durchführung sämtlicher Teilprozesse erzeugt werden. Das optimierte Ergebnis kann beispielsweise ausgegeben werden oder zur Durchführung weiterer Funktionen verwendet werden, etwa bei der Sprachsteuerung einer Einrichtung. As a result, an optimized result of the execution of all sub-processes can advantageously be generated. For example, the optimized result may be output or used to perform other functions, such as the voice control of a device.
Bei dem erfindungsgemäßen System der oben genannten Art ist durch eine Erfassungseinheit der mobilen Einheit die Spracheingabe erfassbar. Ferner umfassen die mobile Einheit und der externe Server jeweils eine Datenschnittstelle und jeweils eine Recheneinheit. Dabei ist durch die Datenschnittstelle der mobilen Einheit und die Datenschnittstelle des externen Servers wenigstens zeitweise eine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server herstellbar. Ferner sind zumindest zwei Teilprozesse sowohl von der Recheneinheit der mobilen Einheit als auch von der Recheneinheit des externen Servers ausführbar.In the system according to the invention of the type mentioned above, the speech input can be detected by a detection unit of the mobile unit. Furthermore, the mobile unit and the external server each comprise a data interface and a respective computing unit. In this case, at least temporarily a data connection between the mobile unit and the external server can be produced by the data interface of the mobile unit and the data interface of the external server. Furthermore, at least two sub-processes can be executed both by the arithmetic unit of the mobile unit and by the arithmetic unit of the external server.
Das erfindungsgemäße System ist insbesondere ausgebildet, das vorstehend beschriebene erfindungsgemäße Verfahren zu implementieren. Das System weist somit dieselben Vorteile auf wie das erfindungsgemäße Verfahren.The system according to the invention is in particular designed to implement the method according to the invention described above. The system thus has the same advantages as the method according to the invention.
Die Recheneinheiten der mobilen Einheit und des externen Servers sind insbesondere dazu ausgebildet, die Durchführung der Teilprozesse von der mobilen Einheit und von dem externen Server zu koordinieren. Sie sind dazu ausgebildet, dass (a) für den ersten Teilprozess offline-Inputdaten und online-Inputdaten erzeugbar sind und (b) die online-Inputdaten an den externen Server übertragbar sind, falls die datentechnische Verbindung besteht. In einem weiteren Schritt (c) ist der aktuelle Teilprozess von der mobilen Einheit ausführbar, wobei anhand der offline-Inputdaten offline-Outputdaten erzeugbar sind. Ferner ist (d), falls die online-Inputdaten an den externen Server übertragen worden oder von ihm erzeugt worden sind, der aktuelle Teilprozess von dem externen Server ausführbar, wobei anhand der online-Inputdaten online-Outputdaten erzeugbar sind. Falls die datentechnische Verbindung besteht, sind die online-Outputdaten an die mobile Einheit übertragbar. Schließlich sind (e) neue offline-Inputdaten und neue online-Inputdaten für den nächsten Teilprozess erzeugbar. Dabei sind die Schritte (c) bis (e) für jeden der Teilprozesse ausführbar, bis der letzte Teilprozess ausgeführt worden ist. Dabei ist jeweils der nächste Teilprozess ausführbar und der Ablauf der Schritte (c) bis (e) ist wiederholbar bis zum Abschluss des letzten Teilprozesses.The computing units of the mobile unit and of the external server are in particular designed to coordinate the execution of the sub-processes by the mobile unit and by the external server. They are designed so that (a) offline input data and online input data can be generated for the first subprocess and (b) the online input data can be transmitted to the external server if the data connection exists. In a further step (c), the current subprocess can be executed by the mobile unit, wherein offline output data can be generated on the basis of the offline input data. Further, if the online input data has been transmitted to or generated by the external server, (d) the current thread is executable by the external server, using the Input data online output data can be generated. If the data connection exists, the online output data is transferable to the mobile unit. Finally, (e) new offline input data and new online input data can be generated for the next sub-process. The steps (c) to (e) are executable for each of the sub-processes until the last sub-process has been executed. In each case, the next sub-process can be executed and the sequence of steps (c) to (e) can be repeated until the end of the last sub-process.
Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug zu den Zeichnungen erläutert.The invention will now be explained by means of embodiments with reference to the drawings.
Mit Bezug zu
Das erfindungsgemäße System umfasst eine mobile Einheit
Durch die Erfassungseinheit
Die Erfassungseinheit
Die Recheneinheit
Die Spracherkenner
Insbesondere können die Daten der Spracheingabe, die von der Erfassungseinheit
Mit Bezug zu
Das Ausführungsbeispiel wird von dem in
Anschließend wird der erste Teilprozess P1 durchgeführt. Dies erfolgt parallel durch die mobile Einheit
Die Erzeugung
Bei den parallel durchgeführten Offline- und Online-Spracherkennungsschritten
Der erkannte Text wird als zweite Inputdaten für den zweiten Teilprozess P2, in diesem Fall eine semantische Analyse, verwendet. Die zweiten Offline-Inputdaten Ioff 2 und die zweiten Online-Inputdaten Ion 2 sind daher im Wesentlichen identisch. Die zweiten Online-Inputdaten Ion 2 werden an den externen Server
In einem weiteren Ausführungsbeispiel wird anschließend analog zu dem ersten Teilprozess P1 und dem zweiten Teilprozess P2 eine Reihe weiterer Teilprozesse Pn durchgeführt. Insbesondere wird dabei eine Suchanfrage verarbeitet, die anhand der semantischen Analyse im zweiten Teilprozess P2 erkannt wurde. Die Verarbeitung erfolgt analog zu den oben beschriebenen Schritten, d.h. es werden von der mobilen Einheit
Mit Bezug zu
Das Verfahren wird durch das oben mit Bezug zu
Analog zu dem mit Bezug zu
Anschließend wird der zweite Teilprozess P2 durchgeführt, wobei in einem Schritt
In dem gezeigten Fall des Ausführungsbeispiels erkennt das System, dass die datentechnische Verbindung nicht besteht, und die Erzeugung
In einem weiteren Ausführungsbeispiel umfassen die Schritte
Mit Bezug zu
Die Durchführung des Verfahrens erfolgt mit dem in
Zunächst wird in einem ersten Schritt
In dem gezeigten Fall des Ausführungsbeispiels wird zu dieser Zeit die Durchführung des ersten Teilprozesses P1 durch den externen Server
Wird dagegen festgestellt, dass die ersten Online-Outputdaten Oon 1, die durch den externen Server
Die gezeigten Fälle des Ausführungsbeispiels des erfindungsgemäßen Verfahrens können auch in Kombination auftreten. Insbesondere kann eine beliebige Zahl weiterer Teilprozesse analog zu den dargestellten Teilprozessen Pn durchgeführt werden. Dabei werden zeitliche Verzögerungen, etwa durch eine instabile datentechnische Verbindung und/oder die unterschiedliche Leistungsfähigkeit der mobilen Einheit
In einem weiteren Ausführungsbeispiel umfasst die Verarbeitung der Spracheingabe auch Teilprozesse, die lediglich von der mobilen Einheit
BezugszeichenlisteLIST OF REFERENCE NUMBERS
- 11
- Mobile Einheit Mobile unit
- 22
- Erfassungseinheit acquisition unit
- 2a2a
- Mikrofon microphone
- 3a3a
- Spracherkenner der mobilen Einheit Speech recognizer of the mobile unit
- 3b3b
- Spracherkenner des externen Servers Speech recognizer of the external server
- 4a4a
- Semantikerkenner der mobilen Einheit Semantic identifier of the mobile unit
- 4b4b
- Semantikerkenner des externen Servers Semantic identifier of the external server
- 5a5a
- Recheneinheit der mobilen Einheit Arithmetic unit of the mobile unit
- 5b5b
- Recheneinheit des externen Servers Arithmetic unit of the external server
- 6a6a
- Datenschnittstelle der mobilen Einheit Data interface of the mobile unit
- 6b6b
- Datenschnittstelle des externen Servers Data interface of the external server
- 7a7a
- Suchmaschine der mobilen Einheit Search engine of the mobile unit
- 7b7b
- Suchmaschine des externen Servers Search engine of the external server
- 1010
- Externer Server External server
- P1, P2, PnP1, P2, Pn
- Teilprozesse subprocesses
- Ion 1, Ion 2, Ion n I on 1 , I on 2 , I on n
- Online-Inputdaten Online input data
- Ioff 1, Ioff 2, Ioff n I off 1 , I off 2 , I off n
- Offline-Inputdaten Offline Input data
- Oon 1, Oon 2, Oon n O on 1 , O on 2 , O on n
- Online-Outputdaten Online output data
- Ooff 1, Ooff 2, Ooff n O off 1 , O off 2 , O off n
- Offline-Outputdaten Offline output data
- 201, 301, 401201, 301, 401
- Erfassung einer Spracheingabe Recording a voice input
- 202, 302, 402202, 302, 402
- Erzeugung der ersten Inputdaten Generation of the first input data
- 203a, 303a, 403a203a, 303a, 403a
- Durchführung erster Teilprozess (mobile Einheit) Implementation of the first sub-process (mobile unit)
- 203b, 303b, 403b203b, 303b, 403b
- Durchführung erster Teilprozess (externer Server) Execution of the first subprocess (external server)
- 204, 404, 404'204, 404, 404 '
- Erzeugung der ersten Inputdaten Generation of the first input data
- 205a, 305a, 405a, 405a'205a, 305a, 405a, 405a '
- Durchführung erster Teilprozess (mobile Einheit) Implementation of the first sub-process (mobile unit)
- 205b, 305b, 405b'205b, 305b, 405b '
- Durchführung erster Teilprozess (externer Server) Execution of the first subprocess (external server)
- 206, 306, 406206, 306, 406
- Erzeugung finale Outputdaten Generation final output data
- 304a304a
- Erzeugung der zweiten Inputdaten (mobile Einheit) Generation of the second input data (mobile unit)
- 304b304b
- Erzeugung der zweiten Inputdaten (externer Server) Generation of the second input data (external server)
- 407407
- Abbruch cancellation
ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- DE 102012022630 A1 [0004] DE 102012022630 A1 [0004]
- WO 2014/060054 A1 [0006] WO 2014/060054 A1 [0006]
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102015212650.1A DE102015212650B4 (en) | 2015-07-07 | 2015-07-07 | Method and system for computer-assisted processing of a speech input |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102015212650.1A DE102015212650B4 (en) | 2015-07-07 | 2015-07-07 | Method and system for computer-assisted processing of a speech input |
Publications (2)
Publication Number | Publication Date |
---|---|
DE102015212650A1 true DE102015212650A1 (en) | 2017-01-12 |
DE102015212650B4 DE102015212650B4 (en) | 2020-02-13 |
Family
ID=57584165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102015212650.1A Active DE102015212650B4 (en) | 2015-07-07 | 2015-07-07 | Method and system for computer-assisted processing of a speech input |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102015212650B4 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017216513A1 (en) | 2017-09-19 | 2018-09-27 | Audi Ag | A method of processing a voice input over which a user specifies a location on an operator terminal, and operating device and motor vehicle |
DE102017213946A1 (en) | 2017-08-10 | 2019-02-14 | Audi Ag | A method of rendering a recognition result of an automatic online speech recognizer for a mobile terminal and a mediation apparatus |
DE102019201413A1 (en) | 2019-02-04 | 2020-08-06 | Volkswagen Aktiengesellschaft | Method for operating and / or controlling a dialog system |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132084A1 (en) * | 2011-11-18 | 2013-05-23 | Soundhound, Inc. | System and method for performing dual mode speech recognition |
DE102012022630A1 (en) | 2012-11-20 | 2013-06-06 | Daimler Ag | Method for communication of driver with driver assistance system of motor vehicle positioned in autonomous driving mode, involves processing natural-language input and carrying out natural-language output of information to driver |
US8543397B1 (en) * | 2012-10-11 | 2013-09-24 | Google Inc. | Mobile device voice activation |
US20130346078A1 (en) * | 2012-06-26 | 2013-12-26 | Google Inc. | Mixed model speech recognition |
WO2014060054A1 (en) | 2012-10-16 | 2014-04-24 | Audi Ag | Speech recognition in a motor vehicle |
US20140136183A1 (en) * | 2012-11-12 | 2014-05-15 | Nuance Communications, Inc. | Distributed NLU/NLP |
-
2015
- 2015-07-07 DE DE102015212650.1A patent/DE102015212650B4/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130132084A1 (en) * | 2011-11-18 | 2013-05-23 | Soundhound, Inc. | System and method for performing dual mode speech recognition |
US20130346078A1 (en) * | 2012-06-26 | 2013-12-26 | Google Inc. | Mixed model speech recognition |
US8543397B1 (en) * | 2012-10-11 | 2013-09-24 | Google Inc. | Mobile device voice activation |
WO2014060054A1 (en) | 2012-10-16 | 2014-04-24 | Audi Ag | Speech recognition in a motor vehicle |
US20140136183A1 (en) * | 2012-11-12 | 2014-05-15 | Nuance Communications, Inc. | Distributed NLU/NLP |
DE102012022630A1 (en) | 2012-11-20 | 2013-06-06 | Daimler Ag | Method for communication of driver with driver assistance system of motor vehicle positioned in autonomous driving mode, involves processing natural-language input and carrying out natural-language output of information to driver |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102017213946A1 (en) | 2017-08-10 | 2019-02-14 | Audi Ag | A method of rendering a recognition result of an automatic online speech recognizer for a mobile terminal and a mediation apparatus |
US10783881B2 (en) | 2017-08-10 | 2020-09-22 | Audi Ag | Method for processing a recognition result of an automatic online speech recognizer for a mobile end device as well as communication exchange device |
DE102017213946B4 (en) | 2017-08-10 | 2022-11-10 | Audi Ag | Method for processing a recognition result of an automatic online speech recognizer for a mobile terminal |
DE102017216513A1 (en) | 2017-09-19 | 2018-09-27 | Audi Ag | A method of processing a voice input over which a user specifies a location on an operator terminal, and operating device and motor vehicle |
DE102019201413A1 (en) | 2019-02-04 | 2020-08-06 | Volkswagen Aktiengesellschaft | Method for operating and / or controlling a dialog system |
US11620994B2 (en) | 2019-02-04 | 2023-04-04 | Volkswagen Aktiengesellschaft | Method for operating and/or controlling a dialog system |
Also Published As
Publication number | Publication date |
---|---|
DE102015212650B4 (en) | 2020-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69725802T2 (en) | Pre-filtering using lexical trees for speech recognition | |
DE60222093T2 (en) | METHOD, MODULE, DEVICE AND VOICE RECOGNITION SERVER | |
DE69622565T2 (en) | METHOD AND DEVICE FOR DYNAMICALLY ADJUSTING A LARGE VOCABULARY LANGUAGE IDENTIFICATION SYSTEM AND USING RESTRICTIONS FROM A DATABASE IN A VOICE LABELING LANGUAGE IDENTIFICATION SYSTEM | |
DE102012212185B4 (en) | Maintaining and providing language models | |
EP1361739A1 (en) | Method and system for speech signal processing with preceding language recognition | |
DE3236832A1 (en) | METHOD AND DEVICE FOR VOICE ANALYSIS | |
DE102006042059A1 (en) | Audio collecting device, has probability value specifying unit for specifying probability value, which is indicative for probability of existence of audio source in pre-determined direction | |
DE10030105A1 (en) | Speech recognition device | |
DE19942178C1 (en) | Method of preparing database for automatic speech processing enables very simple generation of database contg. grapheme-phoneme association | |
DE102006055864A1 (en) | Dialogue adaptation and dialogue system for implementation | |
DE60220763T2 (en) | AUTOMATIC DIALOGUE SYSTEM WITH A DATABASE-BASED LANGUAGE MODEL | |
EP1361737A1 (en) | Method and system for speech signal processing and classification of dialogues | |
DE102015212650B4 (en) | Method and system for computer-assisted processing of a speech input | |
EP0987682B1 (en) | Method for adapting linguistic language models | |
EP1361740A1 (en) | Method and system for dialogue speech signal processing | |
EP3152753B1 (en) | Assistance system that can be controlled by means of voice inputs, having a functional device and a plurality of voice recognition modules | |
DE2003150B2 (en) | ||
EP3095114A1 (en) | Method and system for generating a control command | |
EP3735688B1 (en) | Method, device and computer-readable storage medium having instructions for processing a speech input, motor vehicle, and user terminal with speech processing | |
DE69801493T2 (en) | LANGUAGE ANALYSIS SYSTEM | |
WO2001086634A1 (en) | Method for creating a speech database for a target vocabulary in order to train a speech recognition system | |
DE19849855C1 (en) | Method for using a computer system to generate a text expression automatically while retaining meaning determines a statistical model on a number of preset pairs of word meanings and associated expressions. | |
DE4243181C2 (en) | Voice-controlled device and method for its operation | |
EP1340169A2 (en) | Method and device for automatically issuing information using a search engine | |
DE10220522A1 (en) | Method and system for processing voice data using voice recognition and frequency analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R012 | Request for examination validly filed | ||
R016 | Response to examination communication | ||
R082 | Change of representative |
Representative=s name: REITSTOETTER KINZEBACH, DE |
|
R018 | Grant decision by examination section/examining division | ||
R020 | Patent grant now final | ||
R082 | Change of representative |
Representative=s name: MEISSNER BOLTE PATENTANWAELTE RECHTSANWAELTE P, DE |