[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE102015212650A1 - Method and system for the computer-aided processing of a voice input - Google Patents

Method and system for the computer-aided processing of a voice input Download PDF

Info

Publication number
DE102015212650A1
DE102015212650A1 DE102015212650.1A DE102015212650A DE102015212650A1 DE 102015212650 A1 DE102015212650 A1 DE 102015212650A1 DE 102015212650 A DE102015212650 A DE 102015212650A DE 102015212650 A1 DE102015212650 A1 DE 102015212650A1
Authority
DE
Germany
Prior art keywords
data
online
mobile unit
sub
offline
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE102015212650.1A
Other languages
German (de)
Other versions
DE102015212650B4 (en
Inventor
Daniel Lüddecke
Marius Spika
Eva BERNER
Jens Schneider
Sebastian Varges
Britta Berlet
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Volkswagen AG
Original Assignee
Volkswagen AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Volkswagen AG filed Critical Volkswagen AG
Priority to DE102015212650.1A priority Critical patent/DE102015212650B4/en
Publication of DE102015212650A1 publication Critical patent/DE102015212650A1/en
Application granted granted Critical
Publication of DE102015212650B4 publication Critical patent/DE102015212650B4/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Navigation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zum rechnergestützten Verarbeiten einer Spracheingabe für eine mobile Einheit (1) und einen externen Server (10), zwischen denen zumindest zeitweise eine datentechnische Verbindung besteht. Dabei werden zumindest zwei Teilprozesse (Pn, P1, P2) ausgeführt, die sowohl von der mobilen Einheit (1) als auch von dem externen Server (10) ausführbar sind. Die Erfindung betrifft ferner ein System zum rechnergestützten Verarbeiten einer Spracheingabe mit einer mobilen Einheit (1) und einem externen Server (10). Dabei ist durch eine Erfassungseinheit der mobilen Einheit (1) die Spracheingabe erfassbar. Die mobile Einheit (1) und der externe Server (10) umfassen jeweils eine Datenschnittstelle (6a, 6b) und jeweils eine Recheneinheit (5a, 5b). Dabei ist durch die Datenschnittstelle (6a) der mobilen Einheit (1) und die Datenschnittstelle (6b) des externen Servers (10) wenigstens zeitweise eine datentechnische Verbindung zwischen der mobilen Einheit (1) und dem externen Server (10) herstellbar. Zumindest zwei Teilprozesse (Pn, P1, P2) sind sowohl von der Recheneinheit (5a) der mobilen Einheit (1) als auch von der Recheneinheit (5b) des externen Servers (10) ausführbar.The invention relates to a method for the computer-aided processing of a voice input for a mobile unit (1) and an external server (10), between which at least temporarily a data connection exists. In this case, at least two sub-processes (Pn, P1, P2) are executed, which are executable both by the mobile unit (1) and by the external server (10). The invention further relates to a system for computer-aided processing of a voice input with a mobile unit (1) and an external server (10). In this case, the speech input can be detected by a detection unit of the mobile unit (1). The mobile unit (1) and the external server (10) each comprise a data interface (6a, 6b) and in each case a computing unit (5a, 5b). In this case, at least temporarily a data-technical connection between the mobile unit (1) and the external server (10) can be produced by the data interface (6a) of the mobile unit (1) and the data interface (6b) of the external server (10). At least two sub-processes (Pn, P1, P2) can be executed both by the arithmetic unit (5a) of the mobile unit (1) and by the arithmetic unit (5b) of the external server (10).

Description

Die Erfindung betrifft ein Verfahren zum rechnergestützten Verarbeiten einer Spracheingabe für eine mobile Einheit und einen externen Server, zwischen denen zumindest zeitweise eine datentechnische Verbindung besteht. Dabei werden zumindest zwei Teilprozesse ausgeführt, die sowohl von der mobilen Einheit als auch vom dem externen Server ausführbar sind. Die Erfindung betrifft ferner ein System zum rechnergestützten Verarbeiten einer Spracheingabe mit einer mobilen Einheit und einem externen Server.The invention relates to a method for the computer-aided processing of a voice input for a mobile unit and an external server, between which at least temporarily a data connection exists. At least two sub-processes are executed, which can be executed both by the mobile unit and by the external server. The invention further relates to a system for computer-aided processing of a voice input with a mobile unit and an external server.

Spracherkennungssysteme finden ein breites Anwendungsspektrum für Bediensysteme. Dies betrifft gleichermaßen die Bedienung von Geräten sowie die Erledigung fernmündlicher Aufgaben mittels Sprachcomputer, beispielsweise Telefon-Banking. Auch hat sich die Bedienung von Einrichtungen eines Fahrzeugs über Spracheingaben als wesentliches Merkmal aktueller Benutzerschnittstellen im Fahrzeug etabliert. Beispielsweise werden zur Eingabe komplexer Sachverhalte entsprechende Informationen durch ein Sprachdialogsystem sequentiell vom Nutzer abgefragt. Speech recognition systems find a wide range of applications for operating systems. This applies equally to the operation of devices and the completion of telephone tasks using voice computers, such as telephone banking. Also, the operation of facilities of a vehicle via voice inputs has become established as an essential feature of current user interfaces in the vehicle. For example, to input complex facts corresponding information is queried sequentially by a user through a speech dialogue system.

Es ist dabei von entscheidender Bedeutung, dass die Erkennung und Interpretation einer Spracheingabe des Nutzers möglichst fehlerfrei und schnell erfolgt. Hierfür wurden zwar bereits verschiedene Methoden vorgeschlagen, die zur Implementierung notwendige große Rechenkapazität erschwert allerdings häufig den Einsatz, etwa im Bereich mobiler Geräte und insbesondere in Fahrzeugen. Ein Ansatz zur Lösung dieses Problems ist, die Rechenaufgaben auf einen über das Internet erreichbaren Server auszulagern. Dies setzt allerdings voraus, dass das Spracherkennungssystem jederzeit Daten mit dem Server austauschen kann, was insbesondere in Gebieten mit lückenhafter Abdeckung durch Mobilfunknetze nicht jederzeit gewährleistet ist. It is of crucial importance that the recognition and interpretation of a user's speech input is as error-free and fast as possible. Although various methods have already been proposed for this, the large computing capacity required for the implementation frequently makes deployment difficult, for example in the field of mobile devices and in particular in vehicles. One approach to solving this problem is to outsource the computational tasks to a server accessible via the Internet. However, this presupposes that the voice recognition system can exchange data with the server at any time, which is not always guaranteed, especially in areas with incomplete coverage by mobile radio networks.

Das in der DE 10 2012 022 630 A1 beschriebene Verfahren zur Kommunikation eines Fahrers mit einem Fahrerassistenzsystem sieht vor, dass der Fahrer natürlichsprachliche Anfragen an das System richtet, die verarbeitet und natürlichsprachlich beantwortet werden. That in the DE 10 2012 022 630 A1 described method for communication of a driver with a driver assistance system provides that the driver directed natural language requests to the system, which are processed and answered natural language.

Dazu wird anhand der Spracheingabe des Fahrers eine Schlagworterkennung durchgeführt, wobei Schlagworte auch in einer externen Quelle, etwa per Internetverbindung, in einer Datenbank gefunden werden. For this purpose, based on the voice input of the driver, a keyword recognition is performed, with keywords are also found in an external source, such as an Internet connection, in a database.

Bei der in der WO 2014/060054 A1 beschriebenen Spracherkennung werden aus Spracheingaben eines Benutzers in einem Fahrzeug durch einen (lokalen) Onboard-Spracherkenner und einen (externen) Offboard-Spracherkenner Erkennungsergebnisse erzeugt. Es kann nun der beste Sprachtext ausgewählt werden, etwa anhand der Konfidenzwerte für die einzelnen Erkennungsergebnisse. When in the WO 2014/060054 A1 Speech recognition described above is generated from speech inputs of a user in a vehicle by a (local) onboard speech recognizer and an offboard external speech recognizer recognition results. The best language text can now be selected, for example based on the confidence values for the individual recognition results.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Verfahren und ein System der oben genannten Art zur Verfügung zu stellen, bei denen eine Spracheingabe zuverlässig und unter optimaler Ausnutzung aller verfügbaren Ressourcen verarbeitet wird. The present invention has for its object to provide a method and a system of the above type, in which a voice input is processed reliably and with optimum utilization of all available resources.

Erfindungsgemäß wird diese Aufgabe durch ein Verfahren mit den Merkmalen des Anspruchs 1 sowie ein System mit den Merkmalen des Anspruchs 9 gelöst. Vorteilhafte Ausgestaltungen und Weiterbildungen ergeben sich aus den abhängigen Ansprüchen. According to the invention this object is achieved by a method having the features of claim 1 and a system having the features of claim 9. Advantageous embodiments and further developments emerge from the dependent claims.

Bei dem erfindungsgemäßen Verfahren der oben genannten Art wird die Spracheingabe von der mobilen Einheit erfasst. Es werden (a) für den ersten Teilprozess offline-Inputdaten und online-Inputdaten erzeugt und (b) die online-Inputdaten an den externen Server übertragen, falls die datentechnische Verbindung besteht. In einem weiteren Schritt (c) wird von der mobilen Einheit der aktuelle Teilprozess ausgeführt, wobei anhand der offline-Inputdaten offline-Outputdaten erzeugt werden. Ferner wird (d), falls die online-Inputdaten an den externen Server übertragen worden oder von ihm erzeugt worden sind, der aktuelle Teilprozess von dem externen Server ausgeführt, wobei anhand der online-Inputdaten online-Outputdaten erzeugt werden. Falls die datentechnische Verbindung besteht, werden die online-Outputdaten an die mobile Einheit übertragen. Schließlich werden (e) neue offline-Inputdaten und neue online-Inputdaten für den nächsten Teilprozess erzeugt. Dabei werden die Schritte (c) bis (e) für jeden der Teilprozesse ausgeführt, bis der letzte Teilprozess ausgeführt worden ist. Dabei wird jeweils der nächste Teilprozess ausgeführt und der Ablauf der Schritte (c) bis (e) wiederholt bis zum Abschluss des letzten Teilprozesses.In the method according to the invention of the type mentioned above, the voice input is detected by the mobile unit. It generates (a) offline input data and online input data for the first sub-process and (b) transfers the online input data to the external server if the data connection exists. In a further step (c), the mobile unit performs the current sub-process, whereby offline output data is generated on the basis of the offline input data. Further, if the online input data has been transmitted to or generated by the external server, (d) the current thread is executed by the external server, generating online output data from the on-line input data. If the data link exists, the online output data is transmitted to the mobile unit. Finally, (e) new offline input data and new online input data are generated for the next subprocess. Thereby, steps (c) to (e) are executed for each of the sub-processes until the last sub-process has been executed. In each case, the next sub-process is executed and the sequence of steps (c) to (e) is repeated until the end of the last sub-process.

Die mobile Einheit ist insbesondere in einem Fahrzeug angeordnet oder in dieses integriert. The mobile unit is arranged in particular in a vehicle or integrated in this.

Das erfindungsgemäße Verfahren dient der Verarbeitung einer Spracheingabe mit zumindest zwei Teilprozessen. Dies ist beispielsweise typisch für Sprachsteuerungsverfahren, bei denen anhand von Audiodaten gesprochener Sprache durch einen Spracherkenner ein maschinenlesbarer Text erzeugt wird, durch den im weiteren Verlauf Befehle erkannt und ausgeführt werden. In weiteren Schritten können die Daten weiterverarbeitet oder analysiert werden, etwa um die Zuverlässigkeit der Sprachsteuerung zu verbessern. The inventive method is used to process a voice input with at least two sub-processes. This is typical, for example, for voice control methods in which a machine-readable text is generated on the basis of audio data of spoken speech by a speech recognizer, by means of which commands are subsequently recognized and executed. In further steps, the data can be further processed or analyzed, for example to improve the reliability of the voice control.

Unter „Teilprozessen“ werden im Folgenden modulare Funktionalitäten verstanden, die von Rechnern ausgeführt werden. Dabei werden insbesondere anhand von Inputdaten Outputdaten erzeugt. Die einzelnen Teilprozesse können dabei nach- oder nebeneinander ausgeführt werden. Die Inputdaten zur Ausführung eines Teilprozesses können von einem beliebigen geeigneten Rechner erzeugt worden sein und die Outputdaten können von einem beliebigen geeigneten Rechner weiterverarbeitet werden. In the following, "sub-processes" are understood to mean modular functions that are executed by computers. In particular, input data is used to generate output data. The individual sub-processes can be executed after or next to each other. The input data for executing a sub-process may have been generated by any suitable computer and the output data may be further processed by any suitable computer.

Insbesondere werden die zumindest zwei Teilprozesse bei der Verarbeitung der Spracheingabe nacheinander ausgeführt, wobei ein Teilprozess Outputdaten erzeugt, die entweder direkt als Inputdaten für den darauf folgenden Teilprozess dienen oder aus denen die Inputdaten für den darauf folgenden Teilprozess erzeugt werden. Die Teilprozesse können etwa mehrere aufeinander aufbauende Schritte der Verarbeitung der Spracheingabe umfassen. In particular, the at least two sub-processes are executed one after the other during the processing of the speech input, whereby a sub-process generates output data which either directly serve as input data for the subsequent sub-process or from which the input data for the subsequent sub-process are generated. The sub-processes may comprise, for example, several consecutive steps of processing the speech input.

Die datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server kann insbesondere drahtlos erfolgen, beispielsweise durch ein lokales Netzwerk oder ein größeres Netzwerk, beispielsweise das Internet. Ferner kann die Verbindung über ein Telekommunikationsnetz, etwa ein Telefonnetz, oder ein drahtloses lokales Netzwerk (WLAN) hergestellt werden. Ferner kann die Datenverbindung durch den Anschluss eines Datenkabels erfolgen. Die Verbindung kann auch über eine andere Einheit hergestellt werden, die selbst eine Verbindung zu dem externen Server herstellen kann. Beispielsweise kann eine datentechnische Verbindung zwischen der mobilen Einheit und einem mit dem Internet verbundenen Mobiltelefon bestehen, etwa durch ein Datenkabel oder eine Funkverbindung, etwa per Bluetooth. Insbesondere kann die Verbindung zu dem externen Server über das Internet hergestellt werden.The data connection between the mobile unit and the external server can in particular be wireless, for example, by a local network or a larger network, such as the Internet. Furthermore, the connection can be made via a telecommunications network, such as a telephone network, or a wireless local area network (WLAN). Furthermore, the data connection can be made by connecting a data cable. The connection can also be made through another device that can itself connect to the external server. For example, a data connection may exist between the mobile unit and a mobile telephone connected to the Internet, for example by means of a data cable or a radio connection, for example via Bluetooth. In particular, the connection to the external server can be made via the Internet.

Die Spracheingabe wird von der mobilen Einheit erfasst, beispielsweise durch ein in diese integriertes Mikrofon. Die Spracheingabe kann allerdings auch auf indirekte Weise erfasst werden, beispielsweise durch Abrufen einer Spracheingabe, die bei einer weiteren Einrichtung gespeichert ist. The voice input is detected by the mobile unit, for example by a built-in microphone. However, the voice input may also be detected indirectly, for example by retrieving a voice input stored at another device.

Bei der Erfassung der Spracheingabe werden insbesondere Audiodaten erfasst und gespeichert. Ferner kann eine erste Verarbeitung der Daten der Spracheingabe erfolgen, beispielsweise eine Kompression nach an sich bekannten Verfahren. When capturing the speech input, in particular audio data are recorded and stored. Furthermore, a first processing of the data of the speech input can take place, for example a compression according to methods known per se.

Um den ersten Teilprozess durchführen zu können, werden Inputdaten für die mobile Einheit und den externen Server erzeugt. Im Folgenden beziehen sich die Begriffe Offline-Inputdaten und Offline-Outputdaten auf die mobile Einheit und die Begriffe Online-Inputdaten und Online-Outputdaten auf den externen Server. Zur Durchführung des ersten Teilprozesses werden die erzeugten Online-Inputdaten an den externen Server übertragen. Besteht gerade keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server, so kann die Übertragung nicht durchgeführt werden. In diesem Fall wird der erste Teilprozess zunächst nur von der mobilen Einheit durchgeführt. Wird die datentechnische Verbindung zu einem späteren Zeitpunkt hergestellt, so können die Online-Inputdaten an den externen Server übertragen werden und der erste Teilprozess kann vom externen Server durchgeführt werden. Als Ergebnis des ersten Teilprozesses werden Offline- bzw. Online-Outputdaten erzeugt. In order to be able to carry out the first sub-process, input data is generated for the mobile unit and the external server. In the following, the terms offline input data and offline output data refer to the mobile unit and the terms online input data and online output data to the external server. To carry out the first subprocess, the generated online input data is transmitted to the external server. If there is currently no data connection between the mobile unit and the external server, then the transfer can not be performed. In this case, the first sub-process is initially performed only by the mobile unit. If the data connection is established at a later time, the online input data can be transmitted to the external server and the first sub-process can be performed by the external server. As a result of the first sub-process, offline or online output data are generated.

Zur Durchführung des nächsten Teilprozesses müssen nun neue Offline- und Online-Inputdaten erzeugt werden. Dies kann insbesondere anhand der bei dem ersten Teilprozess erzeugten Outputdaten erfolgen. Besteht keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server, so stehen den beiden Komponenten jeweils nur die eigenen Outputdaten zur Verfügung. In diesem Fall werden die neuen Online-Inputdaten von dem externen Server und die neuen Offline-Inputdaten von der mobilen Einheit erzeugt. Besteht dagegen die datentechnische Verbindung und wurden die Online-Outputdaten an die mobile Einheit übertragen, so kann die mobile Einheit die neuen Online- und Offline-Inputdaten anhand der im zuvor durchgeführten Teilprozess erzeugten Outputdaten erzeugen. In diesem Fall können identische Online- und Offline-Inputdaten erzeugt werden. To carry out the next subprocess, new offline and online input data must now be generated. This can be done in particular on the basis of the output data generated in the first sub-process. If there is no data connection between the mobile unit and the external server, then only the own output data is available to the two components. In this case, the new online input data is generated by the external server and the new offline input data is generated by the mobile unit. On the other hand, if the data connection exists and the online output data has been transmitted to the mobile unit, the mobile unit can generate the new online and offline input data based on the output data generated in the previously performed subprocess. In this case, identical online and offline input data can be generated.

Es wird nun der nächste Teilprozess durchgeführt, wobei die neuen Online- und Offline-Inputdaten verwendet werden. Wurden die Online-Inputdaten von der mobilen Einheit erzeugt, so müssen diese zunächst an den externen Server übertragen werden. Dies kann für beliebig viele Teilprozesse wiederholt werden, bis der letzte Teilprozess ausgeführt wurde. The next subprocess is now performed, using the new online and offline input data. If the online input data were generated by the mobile unit, they must first be transferred to the external server. This can be repeated for any number of subprocesses until the last subprocess has been executed.

Auf diese Weise können die Teilprozesse parallel von der mobilen Einheit und dem externen Server durchgeführt werden. Besteht zu dem jeweiligen Zeitpunkt die datentechnische Verbindung, so kann zwischen der Durchführung der einzelnen Teilprozesse ein Zusammenführen und Abgleichen der jeweiligen Outputdaten erfolgen. In this way, the sub-processes can be performed in parallel by the mobile unit and the external server. If the data connection exists at the respective time, a merger and adjustment of the respective output data can take place between the execution of the individual sub-processes.

Insbesondere kann somit sichergestellt werden, dass beide Komponenten die gleichen Inputdaten verwenden und dass die resultierenden Outputdaten somit vergleichbar sind. In particular, it can thus be ensured that both components use the same input data and that the resulting output data are thus comparable.

So können vorteilhafterweise die Ressourcen der mobilen Einheit und des externen Servers gleichzeitig genutzt werden, wobei insbesondere bei einer instabilen datentechnischen Verbindung der gesamte parallele Ablauf der mehreren Teilprozesse zwischen den einzelnen Teilprozessen koordiniert werden kann.Thus, advantageously, the resources of the mobile unit and the external server can be used simultaneously, in particular in the case of an unstable data connection, the entire parallel sequence of the plurality of sub-processes can be coordinated between the individual sub-processes.

Es werden dabei zumindest zwei Teilprozesse parallel von der mobilen Einheit und dem externen Server durchgeführt und zwischenzeitlich koordiniert, soweit die datentechnische Verbindung einen Abgleich zwischen den einzelnen Teilprozessen erlaubt. Soweit die datentechnische Verbindung dies zulässt, werden die Outputdaten der beiden Komponenten zwischen jedem Teilprozess zusammengebracht und für den folgenden Teilprozess werden insbesondere die gleichen Offline- und Online-Inputdaten erzeugt. Wenn allerdings für einen Zeitraum keine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server besteht, so kann die Verarbeitung der Daten zu der Spracheingabe für einzelne Teilprozesse dennoch ohne Koordinierung fortgesetzt werden, nämlich von der mobilen Einheit bzw. dem externen Server. Dies erlaubt unter Ausnutzung der modularen Verarbeitung der Spracheingabe eine hohe Flexibilität des gesamten Verfahrens.At least two sub-processes are carried out in parallel by the mobile unit and the external server and coordinated in the meantime, as far as the data connection permits a comparison between the individual sub-processes. As far as the data connection permits, the output data of the two components are brought together between each subprocess and, in particular, the same offline and online input data are generated for the following subprocess. If, however, there is no data connection between the mobile unit and the external server for a period of time, the processing of the data for the voice input for individual sub-processes can nevertheless be continued without coordination, namely by the mobile unit or the external server. This allows a high flexibility of the whole process by utilizing the modular processing of voice input.

Bei einer Ausbildung umfasst einer der Teilprozesse eine Spracherkennung, wobei die Offline-Inputdaten und die Online-Inputdaten identisch sind und anhand der Spracheingabe erzeugt werden. Ferner umfassen die Offline-Outputdaten und die Online-Outputdaten jeweils maschinenlesbare Textdaten.In one embodiment, one of the sub-processes includes speech recognition, wherein the offline input data and the online input data are identical and generated based on the speech input. Further, the offline output data and the online output data each include machine-readable text data.

Dadurch kann vorteilhafterweise ein Spracherkennungsmodul parallel durch die mobile Einheit und den externen Server durchgeführt werden. Insbesondere wird dabei eine automatische Spracherkennung (automated speech recognition, ASR) durchgeführt. Dies kann nach an sich bekannten Verfahren erfolgen. Es wird dabei insbesondere von der Spracheingabe in Form von Audiodaten ausgegangen. Es wird ein maschinenlesbarer Text erzeugt, wobei insbesondere ein Sprachmodell zur Erkennung verwendet wird. Das Sprachmodell umfasst etwa einen Wort- und Ausdrucksschatz, wobei insbesondere einzelne Wörter, Wortgruppen und sprachliche Konstruktionen repräsentiert sind, aber auch statistische Zusammenhänge der einzelnen Wörter und Wortgruppen zueinander repräsentiert sind. Dabei kann das Sprachmodell weitere ergänzende Daten umfassen. Der zur Durchführung der Spracherkennung benötigte Rechenaufwand ist insbesondere abhängig vom Umfang des Sprachmodells.As a result, advantageously, a voice recognition module can be performed in parallel by the mobile unit and the external server. In particular, an automatic speech recognition (ASR) is performed. This can be done by methods known per se. It is assumed in particular by the speech input in the form of audio data. A machine-readable text is generated, wherein in particular a language model is used for recognition. The language model comprises about a vocabulary and expression, in particular, individual words, phrases and linguistic constructions are represented, but also statistical relationships of the individual words and phrases are represented to each other. The language model may include further supplementary data. The computational effort required to carry out the speech recognition depends, in particular, on the size of the language model.

Ferner hängt die Qualität der Spracherkennung von dem Sprachmodell ab. Da die Rechenkapazität der mobilen Einheit typischerweise gering ist gegenüber dem externen Server, können mobile Einheiten häufig lediglich eine grundlegende Spracherkennung anhand eines einfacheren Sprachmodells durchführen, während der externe Server in der Regel eine höherwertige Spracherkennung leisten kann. Die Qualität der durchgeführten Spracherkennung kann nach an sich bekannten Verfahren bewertet werden, beispielsweise kann ein Konfidenzwert bestimmt werden.Furthermore, the quality of speech recognition depends on the language model. Since the computing capacity of the mobile unit is typically small compared to the external server, mobile units often can only perform basic speech recognition using a simpler speech model, while the external server can typically provide higher quality speech recognition. The quality of the speech recognition performed can be evaluated according to known methods, for example, a confidence value can be determined.

Bei einer Weiterbildung umfasst einer der Teilprozesse die Erzeugung einer semantischen Analyse. Dabei umfassen die Offline-Inputdaten und die Online-Inputdaten jeweils maschinenlesbare Textdaten und die Offline-Outputdaten und die Online-Outputdaten umfassen jeweils Analysedaten.In one development, one of the sub-processes includes the generation of a semantic analysis. The offline input data and the online input data each comprise machine-readable text data, and the offline output data and the online output data each include analysis data.

Dadurch kann vorteilhafterweise eine semantische Analyse unter Einbeziehung der Rechenkapazitäten der mobilen Einheit und des externen Servers erfolgen. Insbesondere kann nach an sich bekannten Verfahren ein natural language understanding (NLU) durchgeführt werden. Beispielsweise können Schlagworte erkannt werden. Insbesondere werden anhand der maschinenlesbaren Textdaten Anweisungen erzeugt, die im Folgenden als Anweisungen an das System übertragen und ausgeführt werden können. This advantageously makes it possible to carry out a semantic analysis involving the computing capacities of the mobile unit and the external server. In particular, natural language understanding (NLU) can be carried out by methods known per se. For example, keywords can be recognized. In particular, statements are generated from the machine-readable text data, which in the following can be transmitted and executed as instructions to the system.

Bei einer weiteren Ausbildung umfasst einer der Teilprozesse die Durchführung einer Suche. Dabei umfassen die Offline-Inputdaten und die Online-Inputdaten jeweils Analysedaten und die Offline-Outputdaten und die Online-Outputdaten umfassen jeweils Suchergebnisdaten.In another embodiment, one of the sub-processes includes performing a search. The offline input data and the online input data respectively include analysis data, and the offline output data and the online output data each include search result data.

Dadurch kann vorteilhafterweise eine Suchfunktionalität implementiert werden, beispielsweise innerhalb einer Sprachsteuerung. Die Suche kann dabei nach an sich bekannten Verfahren erfolgen, wobei insbesondere eine Suchanfrage anhand der Analysedaten erzeugt wird und Suchergebnisse als Outputdaten erzeugt werden. Beispielsweise kann eine Datenbank mit Datensätzen anhand einer Suchanfrage durchsucht werden. Die Suchergebnisdaten können in diesem Fall etwa eine Liste mit für die Suchanfrage relevanten Datensätzen umfassen. As a result, advantageously, a search functionality can be implemented, for example within a voice control. The search can be carried out according to methods known per se, wherein in particular a search query is generated on the basis of the analysis data and search results are generated as output data. For example, a database of records can be searched by a search query. The search result data in this case may include a list of records relevant to the search query.

Bei einer Ausbildung werden, falls in Schritt (d) die Online-Outputdaten an die mobile Einheit übertragen wurden, die in Schritt (e) erzeugten neuen Online-Inputdaten und neuen Offline-Inputdaten für den jeweils nächsten Teilprozess anhand eines Vergleichs der Online-Outputdaten und der Offline-Outputdaten erzeugt.In one embodiment, if in step (d) the on-line output data has been transmitted to the mobile unit, the new online input data generated in step (e) and new offline input data for the next respective sub-process will be based on a comparison of the online output data and the offline output data is generated.

Dadurch kann vorteilhafterweise das Vorliegen von parallel erzeugten Offline- und Online-Outputdaten genutzt werden, um die neuen Offline- und Online-Inputdaten zu erzeugen. Insbesondere wird bestimmt, welche Outputdaten am besten geeignet sind, wobei ein Vergleich der Outputdaten durchgeführt wird. Im einfachsten Falle können die dabei gewählten Outputdaten direkt als neue Inputdaten verwendet werden. Ferner können aber auch die neuen Inputdaten anhand beider zuvor erzeugter Outputdaten erzeugt werden. Insbesondere sind die dabei erzeugten Online- und Offline-Inputdaten im Wesentlichen identisch. As a result, advantageously the presence of offline and online output data generated in parallel can be used to generate the new offline and online input data. In particular, it is determined which output data is most suitable, with a comparison of the output data being performed. In the simplest case, the selected output data can be used directly as new input data. Furthermore, the new input data can also be generated based on both previously generated output data. In particular, they are there generated online and offline input data essentially identical.

Bei einer Weiterbildung werden, falls in Schritt (d) die Online-Outputdaten nicht an die mobile Einheit übertragen wurden, in Schritt (e) die neuen Online-Inputdaten anhand der Online-Outputdaten erzeugt und die neuen Offline-Inputdaten anhand der Offline-Outputdaten erzeugt. In a development, if in step (d) the online output data has not been transmitted to the mobile unit, in step (e) the new online input data is generated from the online output data and the new offline input data is generated from the offline output data generated.

Dadurch kann vorteilhafterweise der nächste Teilprozess durchgeführt werden, auch wenn die Datenverbindung es nicht zulässt, dass die neuen Inputdaten zentral erzeugt werden. Dies bedeutet insbesondere, dass die im nächsten Schritt verwendeten Online- und Offline-Inputdaten nicht miteinander identisch sind. Stattdessen werden zwei oder mehr Teilprozesse parallel zueinander von der mobilen Einheit und dem externen Server durchgeführt, ohne dass ein Zwischenabgleich erfolgt. Dies ist insbesondere dann von Bedeutung, wenn die datentechnische Verbindung nicht fortlaufend besteht.As a result, advantageously, the next sub-process can be carried out, even if the data connection does not allow the new input data to be generated centrally. This means, in particular, that the online and offline input data used in the next step are not identical to one another. Instead, two or more subprocesses are performed in parallel by the mobile unit and the external server without any intermediate adjustment. This is particularly important if the data connection does not exist continuously.

Bei einer weiteren Ausbildung wird, falls in Schritt (d) die Online-Outputdaten an die mobile Einheit übertragen wurden, nachdem bereits ein weiterer Teilprozess gestartet wurde, anhand eines Vergleichs der Online-Outputdaten mit den zugeordneten Offline-Outputdaten bestimmt, ob die späteren Teilprozesse mit nochmal erzeugten neuen Online-Inputdaten und neuen Offline-Inputdaten nochmals durchgeführt werden sollen.In a further embodiment, if in step (d) the online output data has been transmitted to the mobile unit, after another sub-process has already been started, it is determined based on a comparison of the online output data with the associated offline output data, whether the later sub-processes to be carried out again with newly generated online input data and new offline input data.

Dadurch kann insbesondere eine zeitliche Verzögerung bei der parallelen Durchführung der Teilprozesse berücksichtigt werden. Die zeitliche Verzögerung kann etwa dadurch entstehen, dass die datentechnische Verbindung nicht dauerhaft besteht oder die Datenübertragung mit nur geringer Bandbreite erfolgt. Dies kann zur Folge haben, dass die von dem externen Server erzeugten Online-Outputdaten die mobile Einheit erst erreichen, nachdem angenommen wurde, dass keine Datenübertragung stattfinden wird. In diesem Fall setzt die mobile Einheit die Durchführung mit dem nächsten Teilprozess fort, wobei die Online-Outputdaten zunächst unberücksichtigt bleiben, da diese zum Durchführungszeitpunkt noch nicht zur Verfügung standen. Umgekehrt kann die zeitliche Verzögerung etwa auf einer langsameren Durchführung eines Teilprozesses durch die mobile Einheit begründet sein. As a result, in particular a delay in the parallel execution of the sub-processes can be taken into account. The time delay may arise, for example, because the data connection does not exist permanently or the data transmission takes place with only a small bandwidth. This may result in the online output data generated by the external server reaching the mobile unit only after it has been assumed that no data transmission will take place. In this case, the mobile unit continues execution with the next thread, with the on-line output data initially disregarded as they were not available at the time of execution. Conversely, the time delay may be due to a slower execution of a sub-process by the mobile unit.

In diesem Fall kann der externe Server die Durchführung des nächsten Teilprozesses beginnen, ohne dabei die Offline-Outputdaten zu berücksichtigen. Es kann also insgesamt eine der Komponenten die Abfolge der Teilprozesse schneller durchführen als die andere. Stehen nun Outputdaten einer der Komponenten für einen Teilprozess verspätet zur Verfügung, so kann eine verspätete Analyse durchgeführt werden, ob die neu hinzukommenden Outputdaten besser zur Durchführung des nächsten Teilprozesses geeignet sind. In diesem Fall kann bestimmt werden, dass der folgende Teilprozess mit Inputdaten nochmals durchgeführt wird, wobei die neu hinzugekommenen Outputdaten bei der Erzeugung der Inputdaten berücksichtigt werden. Dies erlaubt insbesondere die Behandlung von Fällen, bei denen die Verarbeitung und Datenübertragung keine vollständig parallele und synchrone Durchführung der Teilprozesse erlaubt. In this case, the external server can start performing the next thread without considering the offline output data. Thus, one component as a whole can perform the sequence of sub-processes faster than the other. If output data of one of the components for a sub-process are available late, a delayed analysis can be carried out as to whether the newly added output data is better suited for carrying out the next sub-process. In this case, it can be determined that the following sub-process is carried out again with input data, the newly added output data being taken into account in the generation of the input data. This allows in particular the treatment of cases in which the processing and data transmission does not allow fully parallel and synchronous execution of the sub-processes.

Bei einer Ausbildung werden, nachdem der letzte Teilprozess ausgeführt worden ist, anhand der Offline-Outputdaten und der Online-Outputdaten finale Outputdaten erzeugt.In training, after the last thread has been executed, final output data is generated from the offline output data and the online output data.

Dadurch kann vorteilhafterweise ein optimiertes Ergebnis der Durchführung sämtlicher Teilprozesse erzeugt werden. Das optimierte Ergebnis kann beispielsweise ausgegeben werden oder zur Durchführung weiterer Funktionen verwendet werden, etwa bei der Sprachsteuerung einer Einrichtung. As a result, an optimized result of the execution of all sub-processes can advantageously be generated. For example, the optimized result may be output or used to perform other functions, such as the voice control of a device.

Bei dem erfindungsgemäßen System der oben genannten Art ist durch eine Erfassungseinheit der mobilen Einheit die Spracheingabe erfassbar. Ferner umfassen die mobile Einheit und der externe Server jeweils eine Datenschnittstelle und jeweils eine Recheneinheit. Dabei ist durch die Datenschnittstelle der mobilen Einheit und die Datenschnittstelle des externen Servers wenigstens zeitweise eine datentechnische Verbindung zwischen der mobilen Einheit und dem externen Server herstellbar. Ferner sind zumindest zwei Teilprozesse sowohl von der Recheneinheit der mobilen Einheit als auch von der Recheneinheit des externen Servers ausführbar.In the system according to the invention of the type mentioned above, the speech input can be detected by a detection unit of the mobile unit. Furthermore, the mobile unit and the external server each comprise a data interface and a respective computing unit. In this case, at least temporarily a data connection between the mobile unit and the external server can be produced by the data interface of the mobile unit and the data interface of the external server. Furthermore, at least two sub-processes can be executed both by the arithmetic unit of the mobile unit and by the arithmetic unit of the external server.

Das erfindungsgemäße System ist insbesondere ausgebildet, das vorstehend beschriebene erfindungsgemäße Verfahren zu implementieren. Das System weist somit dieselben Vorteile auf wie das erfindungsgemäße Verfahren.The system according to the invention is in particular designed to implement the method according to the invention described above. The system thus has the same advantages as the method according to the invention.

Die Recheneinheiten der mobilen Einheit und des externen Servers sind insbesondere dazu ausgebildet, die Durchführung der Teilprozesse von der mobilen Einheit und von dem externen Server zu koordinieren. Sie sind dazu ausgebildet, dass (a) für den ersten Teilprozess offline-Inputdaten und online-Inputdaten erzeugbar sind und (b) die online-Inputdaten an den externen Server übertragbar sind, falls die datentechnische Verbindung besteht. In einem weiteren Schritt (c) ist der aktuelle Teilprozess von der mobilen Einheit ausführbar, wobei anhand der offline-Inputdaten offline-Outputdaten erzeugbar sind. Ferner ist (d), falls die online-Inputdaten an den externen Server übertragen worden oder von ihm erzeugt worden sind, der aktuelle Teilprozess von dem externen Server ausführbar, wobei anhand der online-Inputdaten online-Outputdaten erzeugbar sind. Falls die datentechnische Verbindung besteht, sind die online-Outputdaten an die mobile Einheit übertragbar. Schließlich sind (e) neue offline-Inputdaten und neue online-Inputdaten für den nächsten Teilprozess erzeugbar. Dabei sind die Schritte (c) bis (e) für jeden der Teilprozesse ausführbar, bis der letzte Teilprozess ausgeführt worden ist. Dabei ist jeweils der nächste Teilprozess ausführbar und der Ablauf der Schritte (c) bis (e) ist wiederholbar bis zum Abschluss des letzten Teilprozesses.The computing units of the mobile unit and of the external server are in particular designed to coordinate the execution of the sub-processes by the mobile unit and by the external server. They are designed so that (a) offline input data and online input data can be generated for the first subprocess and (b) the online input data can be transmitted to the external server if the data connection exists. In a further step (c), the current subprocess can be executed by the mobile unit, wherein offline output data can be generated on the basis of the offline input data. Further, if the online input data has been transmitted to or generated by the external server, (d) the current thread is executable by the external server, using the Input data online output data can be generated. If the data connection exists, the online output data is transferable to the mobile unit. Finally, (e) new offline input data and new online input data can be generated for the next sub-process. The steps (c) to (e) are executable for each of the sub-processes until the last sub-process has been executed. In each case, the next sub-process can be executed and the sequence of steps (c) to (e) can be repeated until the end of the last sub-process.

Die Erfindung wird nun anhand von Ausführungsbeispielen mit Bezug zu den Zeichnungen erläutert.The invention will now be explained by means of embodiments with reference to the drawings.

1 zeigt ein Ausführungsbeispiel des erfindungsgemäßen Systems, 1 shows an embodiment of the system according to the invention,

2 zeigt ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer dauerhaften datentechnischen Verbindung, 2 shows an embodiment of the method according to the invention with a permanent data connection,

3 zeigt das Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer zwischenzeitlich unterbrochenen datentechnischen Verbindung und 3 shows the embodiment of the method according to the invention with an interrupted in the meantime data connection and

4 zeigt das Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer zeitlich verzögerten Durchführung von Teilprozessen. 4 shows the embodiment of the method according to the invention with a time-delayed implementation of sub-processes.

Mit Bezug zu 1 wird ein Ausführungsbeispiel des erfindungsgemäßen Systems erläutert. In reference to 1 an embodiment of the system according to the invention will be explained.

Das erfindungsgemäße System umfasst eine mobile Einheit 1 und einen externen Server 10. Die mobile Einheit 1 kann dabei in einem Fahrzeug angeordnet oder in dieses integriert sein. Die mobile Einheit 1 und der externe Server 10 umfassen jeweils eine Datenschnittstelle 6a und 6b sowie jeweils eine Recheneinheit 5a und 5b. Die mobile Einheit 1 umfasst ferner eine Erfassungseinheit 2 mit einem Mikrofon 2a. The system according to the invention comprises a mobile unit 1 and an external server 10 , The mobile unit 1 can be arranged in a vehicle or integrated into this. The mobile unit 1 and the external server 10 each comprise a data interface 6a and 6b and in each case one arithmetic unit 5a and 5b , The mobile unit 1 further comprises a detection unit 2 with a microphone 2a ,

Durch die Erfassungseinheit 2 können Spracheingaben eines Nutzers erfasst werden, wobei der Nutzer im gezeigten Ausführungsbeispiel den Beginn einer Spracheingabe signalisiert, indem er einen push-to-talk Schalter (PTT) drückt. Die vom Nutzer gesprochene Spracheingabe wird daraufhin erfasst und aufgezeichnet. Es wird eine Zwischenspeicherung vorgenommen, sodass die Spracheingabedaten für eine weitere Verwendung zur Verfügung stehen. Insbesondere werden dabei Audiodaten aufgezeichnet. Der Beginn der Spracheingabe kann auch auf andere Weise erkannt werden, beispielsweise nach Aktivieren einer Funktion, die eine Sprachsteuerung zulässt. By the registration unit 2 Voice inputs of a user can be detected, wherein the user in the illustrated embodiment signals the beginning of a voice input by pressing a push-to-talk switch (PTT). The voice input spoken by the user is then captured and recorded. A caching is performed so that the voice input data is available for further use. In particular, audio data is recorded. The beginning of speech input can also be recognized in other ways, for example after activating a function that allows voice control.

Die Erfassungseinheit 2 ist mit der Recheneinheit 5a der mobilen Einheit 1 gekoppelt und die gespeicherten Daten der Spracheingabe können übertragen werden. Die Recheneinheit 5a der mobilen Einheit 1 ist ferner mit der Datenschnittstelle 6a der mobilen Einheit 1 gekoppelt. Ferner ist die Recheneinheit 5b des externen Servers 10 mit der Datenschnittstelle 6b des externen Servers 10 gekoppelt. Zwischen den Datenschnittstellen 6a und 6b der mobilen Einheit 1 und des externen Servers 10 kann eine datentechnische Verbindung hergestellt werden. Dies erfolgt im gezeigten Ausführungsbeispiel über ein Mobilfunknetz, durch das die mobile Einheit 1 Zugang zum Internet hat und die datentechnische Verbindung zum externen Server 10 herstellen kann. Dadurch können, solange die datentechnische Verbindung besteht, Daten ausgetauscht und übertragen werden. The registration unit 2 is with the arithmetic unit 5a the mobile unit 1 coupled and the stored data of voice input can be transmitted. The arithmetic unit 5a the mobile unit 1 is also with the data interface 6a the mobile unit 1 coupled. Furthermore, the arithmetic unit 5b the external server 10 with the data interface 6b the external server 10 coupled. Between the data interfaces 6a and 6b the mobile unit 1 and the external server 10 a data connection can be established. This is done in the illustrated embodiment via a mobile network through which the mobile unit 1 Has access to the Internet and the data connection to the external server 10 can produce. As a result, as long as the data connection exists, data can be exchanged and transmitted.

Die Recheneinheit 5a der mobilen Einheit 1 umfasst einen Spracherkenner 3a, einen Semantikerkenner 4a und eine Suchmaschine 7a. Analog dazu umfasst auch die Recheneinheit 5b des externen Servers 10 einen Spracherkenner 3b, einen Semantikerkenner 4b und eine Suchmaschine 7b. The arithmetic unit 5a the mobile unit 1 includes a speech recognizer 3a , a semantic expert 4a and a search engine 7a , Analogously, the computing unit also includes 5b the external server 10 a speech recognizer 3b , a semantic expert 4b and a search engine 7b ,

Die Spracherkenner 3a und 3b der mobilen Einheit 1 und des externen Servers 10 erzeugen anhand von Daten einer Spracheingabe jeweils maschinenlesbare Textdaten. Anhand solcher Textdaten erzeugen die Semantikerkenner 4a und 4b der mobilen Einheit 1 und des Servers 10 jeweils Analysedaten. Die Suchmaschinen 7a und 7b der mobilen Einheit 1 und des externen Servers 10 führen anhand solcher Analysedaten und/oder einer Suchanfrage jeweils eine Suche durch und erzeugen dabei Suchergebnisdaten. Zum Beispiel wird im gezeigten Ausführungsbeispiel die Datenbasis einer Datenbank durchsucht, wobei einzelne Einträge ausgegeben werden, die für eine Suchanfrage relevant sind. The speech recognizers 3a and 3b the mobile unit 1 and the external server 10 generate machine-readable text data based on data from a voice input. Based on such text data, the semantic experts generate 4a and 4b the mobile unit 1 and the server 10 each analysis data. The search engines 7a and 7b the mobile unit 1 and the external server 10 perform a search on the basis of such analysis data and / or a search query and thereby generate search result data. For example, in the exemplary embodiment shown, the database of a database is searched, whereby individual entries are output which are relevant for a search request.

Insbesondere können die Daten der Spracheingabe, die von der Erfassungseinheit 2 erfasst werden, direkt als Inputdaten für die Spracherkenner 3a und 3b verwendet werden, die durch die Spracherkenner 3a und 3b erzeugten Textdaten können direkt als Inputdaten für die Semantikerkenner 4a und 4b verwendet werden und die von den Semantikerkennern 4a und 4b erzeugten Analysedaten können direkt von den Suchmaschinen 7a und 7b als Suchanfrage interpretiert werden. Es spielt dabei keine Rolle, von welcher Komponente des Systems, ob der mobilen Einheit 1 oder dem externen Server 10, die Daten erzeugt wurden, die dem jeweils nächsten Schritt als Input dienen. Das System ist also modular aufgebaut, wobei die einzelnen Module untereinander austauschbar sind.In particular, the data of the speech input provided by the detection unit 2 be captured directly as input data for the speech recognizers 3a and 3b used by the speech recognizers 3a and 3b generated text data can be used directly as input data for the semantic connoisseurs 4a and 4b used by semantic experts 4a and 4b generated analytic data can be obtained directly from the search engines 7a and 7b be interpreted as a search query. It does not matter what component of the system, whether the mobile unit 1 or the external server 10 , the data was generated, which serve as the next step as input. The system is thus modular, with the individual modules being interchangeable.

Mit Bezug zu 2 wird das Ausführungsbeispiel des erfindungsgemäßen Systems sowie ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer dauerhaften datentechnischen Verbindung erläutert. In reference to 2 is the embodiment of the system according to the invention and a Embodiment of the method according to the invention explained with a permanent data connection.

Das Ausführungsbeispiel wird von dem in 1 dargestellten System ausgeführt. In einem ersten Schritt 201 wird eine Spracheingabe eines Nutzers erfasst. Die dabei erfassten Audiodaten der Spracheingaben werden in einem weiteren Schritt 202 zur Erzeugung erster Inputdaten verwendet. Dabei werden erste Offline-Inputdaten Ioff 1 und erste Online-Inputdaten Ion 1 erzeugt, die im gezeigten Fall identisch sind. Die ersten Online-Inputdaten Ion 1 werden über die datentechnische Verbindung an den Server 10 übertragen. The embodiment is of the in 1 shown executed system. In a first step 201 a voice input from a user is recorded. The recorded audio data of the voice inputs are in a further step 202 used to generate first input data. Here, first offline input data I off 1 and first online input data I on 1 are generated, which are identical in the case shown. The first online input data I on 1 are sent via the data connection to the server 10 transfer.

Anschließend wird der erste Teilprozess P1 durchgeführt. Dies erfolgt parallel durch die mobile Einheit 1 und durch den externen Server 10, wobei bei der Durchführung 203a des ersten Teilprozesses P1 durch die mobile Einheit 1 erste Offline-Outputdaten Ooff 1 erzeugt werden. Parallel dazu werden bei der Durchführung 203b des ersten Teilprozesses P1 durch den externen Server 10 erste Online-Outputdaten Oon 1 erzeugt. Letztere werden von dem externen Server 10 zu der mobilen Einheit 1 übertragen und in einem Schritt 204 werden anhand der ersten Offline-Outputdaten Ooff 1 und der ersten Online-Outputdaten Oon 1 zweite Inputdaten zur Durchführung des zweiten Teilprozesses P2 erzeugt. Dabei werden zweite Offline-Inputdaten Ioff 2 und zweite Online-Inputdaten Ion 2 erzeugt. Subsequently, the first sub-process P1 is performed. This is done in parallel by the mobile unit 1 and through the external server 10 , while carrying out 203a of the first sub-process P1 by the mobile unit 1 first offline output data O off 1 are generated. In parallel, be in the process of implementation 203b of the first sub-process P1 by the external server 10 first online output data O on 1 generated. The latter are from the external server 10 to the mobile unit 1 transferred and in one step 204 are generated on the basis of the first offline output data O off 1 and the first online output data O on 1 second input data for performing the second sub-process P2. In this case, second offline input data I off 2 and second online input data I on 2 are generated.

Die Erzeugung 204 erfolgt durch einen Vergleich der ersten Offline-Outputdaten Ooff 1 und der ersten Online-Outputdaten Oon 1. Bei dem gezeigten Beispiel wird im ersten Teilprozess P1 eine Spracherkennung vorgenommen. Dabei wird anhand der im ersten Schritt 201 erfassten Spracheingabe ein maschinenlesbarer Text erkannt. The production 204 is done by comparing the first offline output data O off 1 and the first online output data O on 1 . In the example shown, speech recognition is performed in the first sub-process P1. It is based on the first step 201 detected speech input recognized a machine-readable text.

Bei den parallel durchgeführten Offline- und Online-Spracherkennungsschritten 203a und 203b werden zusätzlich zu jeweils einem erkannten Text Konfidenzwerte bestimmt, die die Qualität der Spracherkennung angeben. Im darauffolgenden Schritt 204 kann anhand dieser Konfidenzwerte der qualitativ bessere erkannte Text bestimmt werden. Alternativ oder zusätzlich zu dem Vergleich der Outputdaten können allgemeine Auswahlregeln definiert sein. Beispielsweise kann angenommen werden, dass stets die von dem externen Server 10 erzeugten Outputdaten gewählt werden sollen. In parallel offline and online speech recognition steps 203a and 203b In addition to a recognized text in each case, confidence values are determined which specify the quality of the speech recognition. In the following step 204 can be determined based on these confidence levels of better quality recognized text. As an alternative or in addition to the comparison of the output data, general selection rules can be defined. For example, it can always be assumed that the one from the external server 10 generated output data should be selected.

Der erkannte Text wird als zweite Inputdaten für den zweiten Teilprozess P2, in diesem Fall eine semantische Analyse, verwendet. Die zweiten Offline-Inputdaten Ioff 2 und die zweiten Online-Inputdaten Ion 2 sind daher im Wesentlichen identisch. Die zweiten Online-Inputdaten Ion 2 werden an den externen Server 10 übertragen. Der zweite Teilprozess P2 wird in den Verfahrensschritten 205a und 205b von der mobilen Einheit 1 bzw. von dem externen Server 10 durchgeführt. Dabei werden die zweiten Offline-Outputdaten Ooff 2 bzw. die zweiten Online-Outputdaten Oon 2 erzeugt. Letztere werden über die datentechnische Verbindung an die mobile Einheit 1 übertragen. Die zweiten Outputdaten Ooff 2 und Oon 2 werden in den abschließenden Schritt 206 miteinander verglichen und es wird bestimmt, welche der Analysedaten als finale Outputdaten dienen sollen. Dabei wird im dargestellten Fall eine Plausibilitätsprüfung anhand von erkannten Schlagworten durchgeführt.The recognized text is used as second input data for the second sub-process P2, in this case a semantic analysis. The second offline input data I off 2 and the second online input data I on 2 are therefore essentially identical. The second online input data I on 2 are sent to the external server 10 transfer. The second sub-process P2 is in the process steps 205a and 205b from the mobile unit 1 or from the external server 10 carried out. In this case, the second offline output data O off 2 or the second online output data O on 2 are generated. The latter are connected via the data connection to the mobile unit 1 transfer. The second output data O off 2 and O on 2 are in the final step 206 compared with each other and it is determined which of the analysis data should serve as final output data. In the illustrated case, a plausibility check is carried out on the basis of recognized keywords.

In einem weiteren Ausführungsbeispiel wird anschließend analog zu dem ersten Teilprozess P1 und dem zweiten Teilprozess P2 eine Reihe weiterer Teilprozesse Pn durchgeführt. Insbesondere wird dabei eine Suchanfrage verarbeitet, die anhand der semantischen Analyse im zweiten Teilprozess P2 erkannt wurde. Die Verarbeitung erfolgt analog zu den oben beschriebenen Schritten, d.h. es werden von der mobilen Einheit 1 anhand der Offline-Inputdaten Ioff n Offline-Outputdaten Ooff n erzeugt und es werden von dem externen Server 10 anhand der Online-Inputdaten Ion n Online-Outputdaten Oon n erzeugt. Diese werden schließlich wieder zur mobilen Einheit 1 übertragen und es wird durch einen Vergleich bestimmt, welche Outputdaten weiterverwendet oder verworfen werden sollen. In a further exemplary embodiment, a series of further sub-processes Pn is then carried out analogously to the first sub-process P1 and the second sub-process P2. In particular, a search request is processed that was recognized on the basis of the semantic analysis in the second sub-process P2. The processing is analogous to the steps described above, ie it will be handled by the mobile unit 1 Based on the offline input data I off n offline output data O off n generated and it will be from the external server 10 generated on the basis of the online input data I on n online output data O on n . These eventually become a mobile unit again 1 and it is determined by a comparison which output data should be reused or discarded.

Mit Bezug zu 3 wird das Ausführungsbeispiel des erfindungsgemäßen Systems sowie das Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer zwischenzeitlich unterbrochenen datentechnischen Verbindung erläutert.In reference to 3 the embodiment of the system according to the invention and the embodiment of the method according to the invention is explained with an intermittently interrupted data connection.

Das Verfahren wird durch das oben mit Bezug zu 1 erläuterte System ausgeführt. Dies geschieht im Wesentlichen analog zu dem oben mit Bezug zu 2 erläuterten Ausführungsbeispiel. Im Unterschied dazu ist in diesem Fall allerdings die datentechnische Verbindung zwischenzeitlich unterbrochen, was in 3 durch eine mehrfache Linie angedeutet ist. Es ist daher nicht möglich, die bei der Durchführung des ersten Teilprozesses P1 durch den externen Server 10 erzeugten ersten Online-Outputdaten Oon 1 an die mobile Einheit 1 zu übertragen. Umgekehrt können die zweiten Online-Inputdaten Ion 2 zur Durchführung des zweiten Teilprozesses P2 nicht von der mobilen Einheit 1 an den externen Server 10 übertragen werden.The method is described by the above with reference to 1 explained system executed. This is essentially analogous to that described above with reference to 2 illustrated embodiment. In contrast, in this case, however, the data connection is interrupted in the meantime, which in 3 is indicated by a multiple line. It is therefore not possible in the implementation of the first sub-process P1 by the external server 10 generated first online output data O on 1 to the mobile unit 1 transferred to. Conversely, the second online input data I on 2 for carrying out the second partial process P2 can not be provided by the mobile unit 1 to the external server 10 be transmitted.

Analog zu dem mit Bezug zu 2 erläuterten Ausführungsbeispiel werden in einem ersten Schritt 301 Daten einer Spracheingabe eines Nutzers erfasst. Diese Daten werden in einem zweiten Schritt 302 zur Erzeugung von ersten Offline-Inputdaten Ioff 1 und ersten Online-Inputdaten Ion 1 verwendet. Die ersten Online-Inputdaten Ion 1 werden an den externen Server 10 übertragen. Anschließend wird der erste Teilprozess P1 von der mobilen Einheit 1 in einem Schritt 303a durchgeführt, wobei erste Offline-Outputdaten Ooff 1 erzeugt werden, während parallel die Durchführung durch den externen Server 10 in einem Schritt 303b erfolgt, wobei erste Online-Outputdaten Oon 1 erzeugt werden. Nach Abschluss des ersten Teilprozesses P1 werden in einem Offline-Schritt 304a und einem Online-Schritt 304b die zweiten Offline-Inputdaten Ioff 2 bzw. die zweiten Online-Inputdaten Ion 2 erzeugt. Diese sind im Allgemeinen nicht gleich zueinander. Analogous to that related to 2 explained embodiment are in a first step 301 Data of a voice input of a user recorded. This data will be in a second step 302 used to generate first offline input data I off 1 and first online input data I on 1 . The first online input data I on 1 will be sent to the external server 10 transfer. Subsequently, the first sub-process P1 of the mobile unit 1 in one step 303a performed, wherein first offline output data O off 1 are generated, while in parallel the execution by the external server 10 in one step 303b takes place, wherein first online output data O on 1 are generated. After completion of the first subprocess P1 are in an offline step 304a and an online step 304b generates the second offline input data I off 2 and the second online input data I on 2 . These are generally not equal to each other.

Anschließend wird der zweite Teilprozess P2 durchgeführt, wobei in einem Schritt 305a durch die mobile Einheit 1 zweite Offline-Outputdaten Ooff 2 erzeugt werden und in einem Schritt 305b durch den externen Server 10 zweite Online-Outputdaten Oon 2 erzeugt werden. Da im dargestellten Fall die datentechnische Verbindung wieder hergestellt wurde, werden die erzeugten zweiten Online-Outputdaten Oon 2 an die mobile Einheit übertragen und in einem weiteren Schritt 306 wird anhand der zweiten Offline-Outputdaten Ooff 2 und der zweiten Online-Outputdaten Oon 2 bestimmt, welches die finalen Outputdaten sein sollen.Subsequently, the second sub-process P2 is performed, wherein in one step 305a through the mobile unit 1 second offline output data O off 2 are generated and in one step 305b through the external server 10 second online output data O on 2 are generated. Since the data connection has been restored in the case shown, the generated second online output data O on 2 are transmitted to the mobile unit and in a further step 306 is determined from the second offline output data O off 2 and the second online output data O on 2 , which should be the final output data.

In dem gezeigten Fall des Ausführungsbeispiels erkennt das System, dass die datentechnische Verbindung nicht besteht, und die Erzeugung 304a der zweiten Offline-Inputdaten Ioff 2 erfolgt sofort nach der Erzeugung 303a der ersten Offline-Outputdaten Ooff 1. Ferner erfolgt die Erzeugung der zweiten Online-Inputdaten Ion 2 in Schritt 304b sofort nach der Erzeugung 303b der ersten Online-Outputdaten Oon 1.In the case of the embodiment shown, the system recognizes that the data link does not exist and the generation 304a the second offline input data I off 2 takes place immediately after the generation 303a the first offline output data O off 1 . Furthermore, the generation of the second online input data I on 2 takes place in step 304b immediately after the production 303b the first online output data O on 1 .

In einem weiteren Ausführungsbeispiel umfassen die Schritte 304a und 304b der Erzeugung der zweiten Inputdaten eine Wartebedingung, wobei für eine bestimmte Zeit gewartet wird, ob beide erste Outputdaten vorliegen oder ob diese nicht übertragen werden. Nach Ablauf der bestimmten Zeit erfolgt die Erzeugung der Inputdaten anhand der vorliegenden Outputdaten des zuvor durchgeführten Teilprozesses Pn.In another embodiment, the steps include 304a and 304b the generation of the second input data, a waiting condition, being waited for a certain time whether both first output data is present or whether they are not transmitted. After the specific time has elapsed, the generation of the input data takes place on the basis of the present output data of the previously executed subprocess Pn.

Mit Bezug zu 4 wird das Ausführungsbeispiel des erfindungsgemäßen Systems und das Ausführungsbeispiel des erfindungsgemäßen Verfahrens mit einer zeitlich verzögerten Durchführung von Teilprozessen erläutert.In reference to 4 the embodiment of the system according to the invention and the embodiment of the method according to the invention with a time-delayed implementation of sub-processes will be explained.

Die Durchführung des Verfahrens erfolgt mit dem in 1 dargestellten System. Im Unterschied zu den mit Bezug zu 2 und 3 dargestellten Fällen erfolgt die Durchführung der einzelnen Schritte auf dem externen Server 10 und der mobilen Einheit 1 nicht synchron.The procedure is carried out with the in 1 illustrated system. Unlike the related to 2 and 3 In the cases shown, the individual steps are carried out on the external server 10 and the mobile unit 1 not in sync.

Zunächst wird in einem ersten Schritt 401 eine Spracheingabe eines Nutzers erfasst und es werden in einem zweiten Schritt 402 erste Offline-Inputdaten Ioff 1 und erste Online-Inputdaten Ion 1 erzeugt. Diese sind im gezeigten Fall im Wesentlichen gleich. Die ersten Online-Inputdaten Ion 1 werden zum externen Server 10 übertragen. Die Durchführung des ersten Teilprozesses P1 erfolgt durch den externen Server 10 in einem Online-Schritt 403b und durch die mobile Einheit in einem Offline-Schritt 403a. Dabei dauert die Durchführung des Online-Schrittes 403b länger als die Durchführung des Offline-Schrittes 403a. Das heißt, es werden erste Offline-Outputdaten Ooff 1 erzeugt, während die ersten Online-Outputdaten Oon 1 noch nicht vorliegen. Das System setzt daher die Verarbeitung der Spracheingabe durch die mobile Einheit 1 im nächsten Schritt 404 fort, wobei anhand der ersten Offline-Outputdaten Ooff 1 zweite Offline-Inputdaten Ioff 2 erzeugt werden und anhand dieser der zweite Teilprozess P2 in einem weiteren Schritt 405a durchgeführt wird. First, in a first step 401 recorded a voice input of a user and it will be in a second step 402 first offline input data I off 1 and first online input data I on 1 generated. These are essentially the same in the case shown. The first online input data I on 1 becomes the external server 10 transfer. The implementation of the first sub-process P1 is performed by the external server 10 in an online step 403b and by the mobile unit in an offline step 403a , It takes the execution of the online step 403b longer than performing the offline step 403a , That is, first offline output data O off 1 is generated, while the first online output data O on 1 is not yet present. The system therefore sets the processing of the speech input by the mobile unit 1 in the next step 404 on the basis of the first offline output data O off 1 second offline input data I off 2 are generated and based on this, the second sub-process P2 in a further step 405a is carried out.

In dem gezeigten Fall des Ausführungsbeispiels wird zu dieser Zeit die Durchführung des ersten Teilprozesses P1 durch den externen Server 10 abgeschlossen und es werden erste Online-Outputdaten Oon 1 erzeugt und an die mobile Einheit 1 übertragen. In einem parallelen Schritt 404‘ wird überprüft, ob die ersten Offline-Outputdaten Ooff 1 gegenüber den hinzugekommenen ersten Online-Outputdaten Oon 1 eine ausreichende Qualität aufweisen. Falls in diesem Schritt 404‘ bestimmt wird, dass die von der mobilen Einheit 1 erzeugten ersten Offline-Outputdaten Ooff 1 gut genug sind (dieser Fall ist in der 4 nicht dargestellt), so wird die Ausführung der Teilprozesse Pn so fortgesetzt, wie sie bereits begonnen wurde und es werden zweite Online-Inputdaten Ion 2, die im Wesentlichen den zuvor im Schritt 404 erzeugten zweiten Offline-Inputdaten Ioff 2 entsprechen, an den externen Server 10 übertragen und zur Durchführung des zweiten Teilprozesses P2 verwendet.In the case of the embodiment shown, at this time, the execution of the first sub-process P1 is performed by the external server 10 completed and first online output data O on 1 is generated and sent to the mobile unit 1 transfer. In a parallel step 404 ' it is checked whether the first offline output data O off 1 with respect to the added first online output data O on 1 have a sufficient quality. If in this step 404 ' that is determined by the mobile unit 1 O off 1 are good enough (this case is in the 4 not shown), the execution of the sub-processes Pn is continued as it was already started and there are second online input data I on 2 , which is essentially the one previously in step 404 generated second offline input data I off 2 , to the external server 10 transferred and used to carry out the second sub-process P2.

Wird dagegen festgestellt, dass die ersten Online-Outputdaten Oon 1, die durch den externen Server 10 erzeugt wurden, besser zur Fortsetzung geeignet sind, so wird die Durchführung 405a des zweiten Teilprozesses P2 durch die mobile Einheit 1 abgebrochen (407) und es werden nochmal zweite Offline-Inputdaten Ioff 2 und zweite Online-Inputdaten Ion 2 erzeugt. Letztere werden an den externen Server 10 übertragen, wo daraufhin in einem Online-Schritt 405b‘ zweite Online-Outputdaten Oon 2 erzeugt und an die mobile Einheit 1 übertragen werden. Parallel dazu werden durch die mobile Einheit 1 in einem Offline-Schritt 405a‘ anhand der zweiten Offline-Inputdaten Ioff 2 zweite Offline-Outputdaten Ooff 2 erzeugt. In einem abschließenden Schritt 406 wird bestimmt, welche der zweiten Outputdaten als finale Outputdaten verwendet werden.On the other hand, it is found that the first online output data O on 1 , by the external server 10 are produced, are better suited to the continuation, so will the implementation 405a of the second sub-process P2 by the mobile unit 1 canceled ( 407 ) and again second offline input data I off 2 and second online input data I on 2 are generated. The latter are sent to the external server 10 then transfer where in an online step 405b ' second online output data O on 2 generated and sent to the mobile unit 1 be transmitted. In parallel, by the mobile unit 1 in an offline step 405a ' Based on the second offline input data I off 2 second offline output data O off 2 generated. In a final step 406 It is determined which of the second output data will be used as the final output data.

Die gezeigten Fälle des Ausführungsbeispiels des erfindungsgemäßen Verfahrens können auch in Kombination auftreten. Insbesondere kann eine beliebige Zahl weiterer Teilprozesse analog zu den dargestellten Teilprozessen Pn durchgeführt werden. Dabei werden zeitliche Verzögerungen, etwa durch eine instabile datentechnische Verbindung und/oder die unterschiedliche Leistungsfähigkeit der mobilen Einheit 1 und des externen Servers 10 berücksichtigt. The illustrated cases of the embodiment of the method according to the invention can also occur in combination. In particular, any number of further sub-processes can be carried out analogously to the illustrated sub-processes Pn. There are time delays, such as an unstable data connection and / or the different performance of the mobile unit 1 and the external server 10 considered.

In einem weiteren Ausführungsbeispiel umfasst die Verarbeitung der Spracheingabe auch Teilprozesse, die lediglich von der mobilen Einheit 1 oder von dem externen Server 1 ausgeführt werden können. Dazu gehört etwa die Durchführung einer Suche auf Basis einer Datenbank des externen Servers 10, auf die die mobile Einheit 1 nicht direkt zugreifen kann, oder der Zugriff auf eine Einrichtung der mobilen Einheit, etwa eines Navigationssystems, eines Kalenderprogramms, eines Adressbuchs oder einer Multimediaeinrichtung, auf die der externe Server 10 nicht direkt zugreifen kann. Dies ist kein Teilprozess Pn im oben beschriebenen Sinne einer modularen Funktionalität, die sowohl durch die mobile Einheit 1 und den externen Server 10 ausgeführt werden kann. Dennoch können auch solche speziellen Funktionalitäten der Systemkomponenten anhand von Outputdaten, die erfindungsgemäß erzeugt wurden, ausgeführt werden und/oder sie können Inputdaten zur Ausführung weiterer Teilprozesse Pn erzeugen. In a further embodiment, the processing of the voice input also includes sub-processes that are only from the mobile unit 1 or from the external server 1 can be executed. This includes conducting a search based on a database of the external server 10 to which the mobile unit 1 can not directly access, or access to a device of the mobile unit, such as a navigation system, a calendar program, an address book or a multimedia device to which the external server 10 can not access directly. This is not a subprocess Pn in the sense of modular functionality described above, which is used by both the mobile unit 1 and the external server 10 can be executed. Nevertheless, such special functionalities of the system components can also be carried out on the basis of output data which were generated according to the invention and / or they can generate input data for executing further subprocesses Pn.

BezugszeichenlisteLIST OF REFERENCE NUMBERS

11
Mobile Einheit  Mobile unit
22
Erfassungseinheit  acquisition unit
2a2a
Mikrofon  microphone
3a3a
Spracherkenner der mobilen Einheit  Speech recognizer of the mobile unit
3b3b
Spracherkenner des externen Servers  Speech recognizer of the external server
4a4a
Semantikerkenner der mobilen Einheit  Semantic identifier of the mobile unit
4b4b
Semantikerkenner des externen Servers  Semantic identifier of the external server
5a5a
Recheneinheit der mobilen Einheit  Arithmetic unit of the mobile unit
5b5b
Recheneinheit des externen Servers  Arithmetic unit of the external server
6a6a
Datenschnittstelle der mobilen Einheit  Data interface of the mobile unit
6b6b
Datenschnittstelle des externen Servers  Data interface of the external server
7a7a
Suchmaschine der mobilen Einheit  Search engine of the mobile unit
7b7b
Suchmaschine des externen Servers  Search engine of the external server
1010
Externer Server  External server
P1, P2, PnP1, P2, Pn
Teilprozesse  subprocesses
Ion 1, Ion 2, Ion n I on 1 , I on 2 , I on n
Online-Inputdaten  Online input data
Ioff 1, Ioff 2, Ioff n I off 1 , I off 2 , I off n
Offline-Inputdaten  Offline Input data
Oon 1, Oon 2, Oon n O on 1 , O on 2 , O on n
Online-Outputdaten  Online output data
Ooff 1, Ooff 2, Ooff n O off 1 , O off 2 , O off n
Offline-Outputdaten  Offline output data
201, 301, 401201, 301, 401
Erfassung einer Spracheingabe Recording a voice input
202, 302, 402202, 302, 402
Erzeugung der ersten Inputdaten Generation of the first input data
203a, 303a, 403a203a, 303a, 403a
Durchführung erster Teilprozess (mobile Einheit) Implementation of the first sub-process (mobile unit)
203b, 303b, 403b203b, 303b, 403b
Durchführung erster Teilprozess (externer Server) Execution of the first subprocess (external server)
204, 404, 404'204, 404, 404 '
Erzeugung der ersten Inputdaten Generation of the first input data
205a, 305a, 405a, 405a'205a, 305a, 405a, 405a '
Durchführung erster Teilprozess (mobile Einheit) Implementation of the first sub-process (mobile unit)
205b, 305b, 405b'205b, 305b, 405b '
Durchführung erster Teilprozess (externer Server) Execution of the first subprocess (external server)
206, 306, 406206, 306, 406
Erzeugung finale Outputdaten Generation final output data
304a304a
Erzeugung der zweiten Inputdaten (mobile Einheit) Generation of the second input data (mobile unit)
304b304b
Erzeugung der zweiten Inputdaten (externer Server) Generation of the second input data (external server)
407407
Abbruch cancellation

ZITATE ENTHALTEN IN DER BESCHREIBUNG QUOTES INCLUDE IN THE DESCRIPTION

Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of the documents listed by the applicant has been generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA assumes no liability for any errors or omissions.

Zitierte PatentliteraturCited patent literature

  • DE 102012022630 A1 [0004] DE 102012022630 A1 [0004]
  • WO 2014/060054 A1 [0006] WO 2014/060054 A1 [0006]

Claims (9)

Verfahren zum rechnergestützten Verarbeiten einer Spracheingabe für eine mobile Einheit (1) und einen externen Server (10), zwischen denen zumindest zeitweise eine datentechnische Verbindung besteht, wobei zumindest zwei Teilprozesse (Pn, P1, P2) ausgeführt werden, die sowohl von der mobilen Einheit (1) als auch vom dem externen Server (10) ausführbar sind, bei dem die Spracheingabe von der mobilen Einheit erfasst wird und die folgenden Schritte ausgeführt werden: (a) für den ersten Teilprozess werden offline-Inputdaten (Ioff 1, Ioff n) und online-Inputdaten (Ion 1, Ion n) erzeugt, (b) falls die datentechnische Verbindung besteht, werden die online-Inputdaten (Ion 1, Ion n) an den externen Server übertragen, (c) von der mobilen Einheit (1) wird der aktuelle Teilprozess (Pn, P1, P2) ausgeführt, wobei anhand der offline-Inputdaten (Ioff 1, Ioff n) offline-Outputdaten (Ooff 1, Ooff n) erzeugt werden, (d) falls die online-Inputdaten (Ion 1, Ion n) an den externen Server übertragen worden oder von ihm erzeugt worden sind, wird von dem externen Server (10) der aktuelle Teilprozess (Pn, P1, P2) ausgeführt, wobei anhand der online-Inputdaten (Ion 1, Ion n) online-Outputdaten (Oon 1, Oon n) erzeugt werden, und, falls die datentechnische Verbindung besteht, werden die online-Outputdaten (Oon 1, Oon n) an die mobile Einheit (1) übertragen, und (e) neue offline-Inputdaten (Ioff 2, Ioff n) und neue online-Inputdaten (Ion 2, Ion n) werden für den nächsten Teilprozess (Pn, P1, P2) erzeugt; wobei die Schritte (c) bis (e) für jeden der Teilprozesse (Pn, P1, P2) ausgeführt werden, wobei jeweils der nächste Teilprozess (Pn, P1, P2) ausgeführt wird, bis der letzte Teilprozess (Pn, P1, P2) ausgeführt worden ist. Method for the computer-aided processing of a voice input for a mobile unit ( 1 ) and an external server ( 10 ), between which at least temporarily a data connection exists, wherein at least two sub-processes (Pn, P1, P2) are carried out, both by the mobile unit ( 1 ) as well as from the external server ( 10 ), in which the voice input is detected by the mobile unit and the following steps are performed: (a) for the first sub-process, offline input data (I off 1 , I off n ) and online input data (I on 1 , I on n ), (b) if the data link exists, the online input data (I on 1 , I on n ) is transmitted to the external server, (c) from the mobile unit ( 1 ), the current sub-process (Pn, P1, P2) is executed, using the offline input data (I off 1 , I off n ) offline output data (O off 1 , O off n ) generated, (d) if the online Input data (I on 1 , I on n ) have been transmitted to or generated by the external server, the external server ( 10 ) the current sub-process (Pn, P1, P2) is executed, wherein on the basis of the online input data (I on 1 , I on n ) online output data (O on 1 , O on n ) are generated, and, if the data connection exists , the online output data (O on 1 , O on n ) is transmitted to the mobile unit (1), and (e) new offline input data (I off 2 , I off n ) and new online input data (I on 2 , I on n ) are generated for the next sub-process (Pn, P1, P2); wherein the steps (c) to (e) are carried out for each of the sub-processes (Pn, P1, P2), wherein in each case the next sub-process (Pn, P1, P2) is carried out until the last sub-process (Pn, P1, P2) has been executed. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass einer der Teilprozesse (Pn, P1, P2) eine Spracherkennung umfasst, wobei die offline-Inputdaten (Ioff n) und die online-Inputdaten (Ion n) identisch sind und anhand der Spracheingabe erzeugt werden, und die offline-Outputdaten (Ooff n) und die online-Outputdaten (Oon n) jeweils maschinenlesbare Textdaten umfassen. A method according to claim 1, characterized in that one of the sub-processes (Pn, P1, P2) comprises a speech recognition, wherein the offline input data (I off n ) and the online input data (I on n ) are identical and generated based on the voice input and the offline output data (O off n ) and the online output data (O on n ) each comprise machine-readable text data. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass einer der Teilprozesse (Pn, P1, P2) die Erzeugung einer semantischen Analyse umfasst, wobei die offline-Inputdaten (Ioff n) und die online-Inputdaten (Ion n) jeweils maschinenlesbare Textdaten umfassen und die offline-Outputdaten (Ooff n) und die online-Outputdaten (Oon n) jeweils Analysedaten umfassen. Method according to one of the preceding claims, characterized in that one of the sub-processes (Pn, P1, P2) comprises the generation of a semantic analysis, the offline input data (I off n ) and the online input data (I on n ) each being machine-readable Comprise text data and the offline output data (O off n ) and the online output data (O on n ) each comprise analysis data. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass einer der Teilprozesse (Pn, P1, P2) die Durchführung einer Suche umfasst, wobei die offline-Inputdaten (Ioff n) und die online-Inputdaten (Ion n) jeweils Analysedaten umfassen und die offline-Outputdaten (Ooff n) und die online-Outputdaten (Oon n) jeweils Suchergebnisdaten umfassen. Method according to one of the preceding claims, characterized in that one of the sub-processes (Pn, P1, P2) comprises carrying out a search, wherein the offline input data (I off n ) and the online input data (I on n ) each comprise analysis data and the offline output data (O off n ) and the online output data (O on n ) each include search result data. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass, falls in Schritt (d) die online-Outputdaten (Oon 1, Oon n) an die mobile Einheit (1) übertragen wurden, die in Schritt (e) erzeugten neuen online-Inputdaten (Ion 2, Ion n) und neuen offline-Inputdaten (Ioff 2, Ioff n) für den jeweils nächsten Teilprozess (Pn, P1, P2) anhand eines Vergleichs der online-Outputdaten (Oon 1, Oon n) und der offline-Outputdaten (Ooff 1, Ooff n) erzeugt werden. Method according to one of the preceding claims, characterized in that, if in step (d) the online output data (O on 1 , O on n ) has been transmitted to the mobile unit (1), the new one generated in step (e) is online -Inputdaten (I on 2, I on n) and new offline input data (I off 2, I off n) for the respective next partial process (Pn, P1, P2) based on a comparison of the online-output data (O on 1, O on n ) and the offline output data (O off 1 , O off n ) are generated. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass, falls in Schritt (d) die online-Outputdaten (Oon 1, Oon n) nicht an die mobile Einheit (1) übertragen wurden, in Schritt (e) die neuen online-Inputdaten (Ion 2, Ion n) anhand der online-Outputdaten (Oon 1, Oon n) erzeugt werden und die neuen offline-Inputdaten (Ioff 2, Ioff n) anhand der offline-Outputdaten (Ooff 1, Ooff n) erzeugt werden. Method according to one of the preceding claims, characterized in that, if in step (d) the online output data (O on 1 , O on n ) were not transmitted to the mobile unit (1), in step (e) the new ones online Input data (I on 2 , I on n ) are generated from the online output data (O on 1 , O on n ) and the new offline input data (I off 2 , I off n ) from the offline output data (O off 1 , O off n ) are generated. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass, falls in Schritt (d) die online-Outputdaten (Oon 1, Oon n) an die mobile Einheit (1) übertragen wurden, nachdem bereits ein weiterer Teilprozess (Pn, P1, P2) gestartet wurde, anhand eines Vergleichs der online-Outputdaten (Oon 1, Oon n) mit den zugeordneten offline-Outputdaten (Ooff 1, Ooff n) bestimmt wird, ob die späteren Teilprozesse (Pn, P1, P2) mit nochmal erzeugten neuen online-Inputdaten (Ion 2, Ion n) und neuen offline-Inputdaten (Ioff 2, Ioff n) nochmals durchgeführt werden sollen. Method according to one of the preceding claims, characterized in that, if in step (d) the online output data (O on 1 , O on n ) were transmitted to the mobile unit (1), after already a further sub-process (Pn, P1 , P2) was started, based on a comparison of the online output data (O on 1 , O on n ) with the associated offline output data (O off 1 , O off n ) determines whether the later sub-processes (Pn, P1, P2 ) with newly generated new online input data (I on 2 , I on n ) and new offline input data (I off 2 , I off n ) should be carried out again. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass, nachdem der letzte Teilprozess (Pn, P1, P2) ausgeführt worden ist, anhand der offline-Outputdaten (Ooff n) und der online-Outputdaten (Oon n) finale Outputdaten erzeugt werden. Method according to one of the preceding claims, characterized in that, after the last sub-process (Pn, P1, P2) has been executed, based on the offline output data (O off n ) and the online output data (O on n ) produces final output data become. System zum rechnergestützten Verarbeiten einer Spracheingabe mit einer mobilen Einheit (1) und einem externen Server (10), wobei durch eine Erfassungseinheit der mobilen Einheit (1) die Spracheingabe erfassbar ist und die mobile Einheit (1) und der externe Server (10) jeweils eine Datenschnittstelle (6a, 6b) und jeweils eine Recheneinheit (5a, 5b) umfassen, wobei durch die Datenschnittstelle (6a) der mobilen Einheit (1) und die Datenschnittstelle (6b) des externen Servers (10) wenigstens zeitweise eine datentechnische Verbindung zwischen der mobilen Einheit (1) und dem externen Server (10) herstellbar ist und zumindest zwei Teilprozesse (Pn, P1, P2) sowohl von der Recheneinheit (5a) der mobilen Einheit (1) als auch von der Recheneinheit (5b) des externen Servers (10) ausführbar sind. System for the computer-aided processing of a voice input with a mobile unit ( 1 ) and an external server ( 10 ), wherein a detection unit of the mobile unit ( 1 ) the voice input is detectable and the mobile unit ( 1 ) and the external server ( 10 ) each have a data interface ( 6a . 6b ) and one arithmetic unit ( 5a . 5b ), whereby through the data interface ( 6a ) of the mobile unit ( 1 ) and the data interface ( 6b ) of the external server ( 10 ) at least temporarily a data connection between the mobile unit ( 1 ) and the external server ( 10 ) and at least two sub-processes (Pn, P1, P2) can be produced both by the arithmetic unit ( 5a ) of the mobile unit ( 1 ) when also from the arithmetic unit ( 5b ) of the external server ( 10 ) are executable.
DE102015212650.1A 2015-07-07 2015-07-07 Method and system for computer-assisted processing of a speech input Active DE102015212650B4 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE102015212650.1A DE102015212650B4 (en) 2015-07-07 2015-07-07 Method and system for computer-assisted processing of a speech input

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102015212650.1A DE102015212650B4 (en) 2015-07-07 2015-07-07 Method and system for computer-assisted processing of a speech input

Publications (2)

Publication Number Publication Date
DE102015212650A1 true DE102015212650A1 (en) 2017-01-12
DE102015212650B4 DE102015212650B4 (en) 2020-02-13

Family

ID=57584165

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102015212650.1A Active DE102015212650B4 (en) 2015-07-07 2015-07-07 Method and system for computer-assisted processing of a speech input

Country Status (1)

Country Link
DE (1) DE102015212650B4 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017216513A1 (en) 2017-09-19 2018-09-27 Audi Ag A method of processing a voice input over which a user specifies a location on an operator terminal, and operating device and motor vehicle
DE102017213946A1 (en) 2017-08-10 2019-02-14 Audi Ag A method of rendering a recognition result of an automatic online speech recognizer for a mobile terminal and a mediation apparatus
DE102019201413A1 (en) 2019-02-04 2020-08-06 Volkswagen Aktiengesellschaft Method for operating and / or controlling a dialog system

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132084A1 (en) * 2011-11-18 2013-05-23 Soundhound, Inc. System and method for performing dual mode speech recognition
DE102012022630A1 (en) 2012-11-20 2013-06-06 Daimler Ag Method for communication of driver with driver assistance system of motor vehicle positioned in autonomous driving mode, involves processing natural-language input and carrying out natural-language output of information to driver
US8543397B1 (en) * 2012-10-11 2013-09-24 Google Inc. Mobile device voice activation
US20130346078A1 (en) * 2012-06-26 2013-12-26 Google Inc. Mixed model speech recognition
WO2014060054A1 (en) 2012-10-16 2014-04-24 Audi Ag Speech recognition in a motor vehicle
US20140136183A1 (en) * 2012-11-12 2014-05-15 Nuance Communications, Inc. Distributed NLU/NLP

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130132084A1 (en) * 2011-11-18 2013-05-23 Soundhound, Inc. System and method for performing dual mode speech recognition
US20130346078A1 (en) * 2012-06-26 2013-12-26 Google Inc. Mixed model speech recognition
US8543397B1 (en) * 2012-10-11 2013-09-24 Google Inc. Mobile device voice activation
WO2014060054A1 (en) 2012-10-16 2014-04-24 Audi Ag Speech recognition in a motor vehicle
US20140136183A1 (en) * 2012-11-12 2014-05-15 Nuance Communications, Inc. Distributed NLU/NLP
DE102012022630A1 (en) 2012-11-20 2013-06-06 Daimler Ag Method for communication of driver with driver assistance system of motor vehicle positioned in autonomous driving mode, involves processing natural-language input and carrying out natural-language output of information to driver

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102017213946A1 (en) 2017-08-10 2019-02-14 Audi Ag A method of rendering a recognition result of an automatic online speech recognizer for a mobile terminal and a mediation apparatus
US10783881B2 (en) 2017-08-10 2020-09-22 Audi Ag Method for processing a recognition result of an automatic online speech recognizer for a mobile end device as well as communication exchange device
DE102017213946B4 (en) 2017-08-10 2022-11-10 Audi Ag Method for processing a recognition result of an automatic online speech recognizer for a mobile terminal
DE102017216513A1 (en) 2017-09-19 2018-09-27 Audi Ag A method of processing a voice input over which a user specifies a location on an operator terminal, and operating device and motor vehicle
DE102019201413A1 (en) 2019-02-04 2020-08-06 Volkswagen Aktiengesellschaft Method for operating and / or controlling a dialog system
US11620994B2 (en) 2019-02-04 2023-04-04 Volkswagen Aktiengesellschaft Method for operating and/or controlling a dialog system

Also Published As

Publication number Publication date
DE102015212650B4 (en) 2020-02-13

Similar Documents

Publication Publication Date Title
DE69725802T2 (en) Pre-filtering using lexical trees for speech recognition
DE60222093T2 (en) METHOD, MODULE, DEVICE AND VOICE RECOGNITION SERVER
DE69622565T2 (en) METHOD AND DEVICE FOR DYNAMICALLY ADJUSTING A LARGE VOCABULARY LANGUAGE IDENTIFICATION SYSTEM AND USING RESTRICTIONS FROM A DATABASE IN A VOICE LABELING LANGUAGE IDENTIFICATION SYSTEM
DE102012212185B4 (en) Maintaining and providing language models
EP1361739A1 (en) Method and system for speech signal processing with preceding language recognition
DE3236832A1 (en) METHOD AND DEVICE FOR VOICE ANALYSIS
DE102006042059A1 (en) Audio collecting device, has probability value specifying unit for specifying probability value, which is indicative for probability of existence of audio source in pre-determined direction
DE10030105A1 (en) Speech recognition device
DE19942178C1 (en) Method of preparing database for automatic speech processing enables very simple generation of database contg. grapheme-phoneme association
DE102006055864A1 (en) Dialogue adaptation and dialogue system for implementation
DE60220763T2 (en) AUTOMATIC DIALOGUE SYSTEM WITH A DATABASE-BASED LANGUAGE MODEL
EP1361737A1 (en) Method and system for speech signal processing and classification of dialogues
DE102015212650B4 (en) Method and system for computer-assisted processing of a speech input
EP0987682B1 (en) Method for adapting linguistic language models
EP1361740A1 (en) Method and system for dialogue speech signal processing
EP3152753B1 (en) Assistance system that can be controlled by means of voice inputs, having a functional device and a plurality of voice recognition modules
DE2003150B2 (en)
EP3095114A1 (en) Method and system for generating a control command
EP3735688B1 (en) Method, device and computer-readable storage medium having instructions for processing a speech input, motor vehicle, and user terminal with speech processing
DE69801493T2 (en) LANGUAGE ANALYSIS SYSTEM
WO2001086634A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recognition system
DE19849855C1 (en) Method for using a computer system to generate a text expression automatically while retaining meaning determines a statistical model on a number of preset pairs of word meanings and associated expressions.
DE4243181C2 (en) Voice-controlled device and method for its operation
EP1340169A2 (en) Method and device for automatically issuing information using a search engine
DE10220522A1 (en) Method and system for processing voice data using voice recognition and frequency analysis

Legal Events

Date Code Title Description
R012 Request for examination validly filed
R016 Response to examination communication
R082 Change of representative

Representative=s name: REITSTOETTER KINZEBACH, DE

R018 Grant decision by examination section/examining division
R020 Patent grant now final
R082 Change of representative

Representative=s name: MEISSNER BOLTE PATENTANWAELTE RECHTSANWAELTE P, DE