DE102023201104A1 - Method for generating additional training data for training a machine learning algorithm - Google Patents
Method for generating additional training data for training a machine learning algorithm Download PDFInfo
- Publication number
- DE102023201104A1 DE102023201104A1 DE102023201104.2A DE102023201104A DE102023201104A1 DE 102023201104 A1 DE102023201104 A1 DE 102023201104A1 DE 102023201104 A DE102023201104 A DE 102023201104A DE 102023201104 A1 DE102023201104 A1 DE 102023201104A1
- Authority
- DE
- Germany
- Prior art keywords
- training data
- machine learning
- learning algorithm
- data
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 297
- 238000010801 machine learning Methods 0.000 title claims abstract description 132
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000006073 displacement reaction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 5
- 230000003416 augmentation Effects 0.000 description 4
- 230000003190 augmentative effect Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Feedback Control In General (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, wobei das Verfahren (1) folgende Schritte aufweist: Erfassen von ein zu modellierendes System betreffenden Daten (2), Erzeugen von gelabelten Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens basierend auf den erfassten Daten (3), und Erzeugen von zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens, wobei das Erzeugen von zusätzlichen Trainingsdaten ein Erzeugen von uninformativen Trainingsdaten basierend den erzeugten gelabelten Trainingsdaten aufweist (4).The invention relates to a method for generating additional training data for training a machine learning algorithm, wherein the method (1) comprises the following steps: acquiring data relating to a system to be modeled (2), generating labeled training data for training the machine learning algorithm based on the acquired data (3), and generating additional training data for training the machine learning algorithm, wherein the generation of additional training data comprises generating uninformative training data based on the generated labeled training data (4).
Description
Die Erfindung betrifft ein Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, und insbesondere ein Verfahren zum Erzeugen von zusätzlichen, uninformativen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens.The invention relates to a method for generating additional training data for training a machine learning algorithm, and in particular to a method for generating additional, uninformative training data for training a machine learning algorithm.
Algorithmen des maschinellen Lernens basieren darauf, dass Verfahren der Statistik verwendet werden, um eine Datenverarbeitungsanlage derart zu trainieren, dass diese eine bestimmte Aufgabe ausführen kann, ohne dass diese ursprünglich explizit hierzu programmiert wurde. Das Ziel des maschinellen Lernens besteht dabei darin, Algorithmen zu konstruieren, die aus Daten lernen und Vorhersagen treffen können. Diese Algorithmen erstellen mathematische Modelle, mit denen beispielsweise Daten klassifiziert werden und Eingangsdaten in Ausgangsdaten abgebildet werden können.Machine learning algorithms are based on the use of statistical methods to train a data processing system so that it can perform a specific task without it originally being explicitly programmed to do so. The goal of machine learning is to construct algorithms that can learn from data and make predictions. These algorithms create mathematical models that can be used, for example, to classify data and map input data into output data.
Dabei kann ein zu modellierendes System beispielsweise durch Messungen erfasst werden, wobei anhand von Messwerten beispielsweise ein empirisches Modell erstellt werden und ein Algorithmus des maschinellen Lernens entsprechend trainiert werden kann. Hierbei kann es jedoch beispielsweise zu Situationen kommen, in denen es unmöglich ist, einen zu modellierenden Prozess beziehungsweise ein zu modellierendes System vollständig durchzumessen. Dies kann jedoch zur Folge haben, dass für die empirische Modellbildung beziehungsweise das entsprechende Trainieren des Algorithmus des maschinellen Lernens nur partielle Daten aus einem Teilraum zur Verfügung stehen, wobei jedoch im Betrieb auch Prozesszustände auftreten können, die durch diese Trainingsdaten nicht erfasst sind.A system to be modelled can be recorded, for example, through measurements, whereby an empirical model can be created based on measured values and a machine learning algorithm can be trained accordingly. However, situations can arise in which it is impossible to completely measure a process or system to be modelled. However, this can result in only partial data from a subspace being available for the empirical modeling or the corresponding training of the machine learning algorithm, although process states can also occur during operation that are not captured by this training data.
Als Lösung dieses Problems wurden Augmentationsverfahren vorgeschlagen, das heißt Verfahren zur Erzeugung zusätzlicher Trainingsdaten. Als nachteilig erweist sich bei bekannten Augmentationsverfahren jedoch, dass diese sehr komplex sind und viele Computerressourcen, insbesondere Speicher- und Rechenkapazitäten erfordern, so dass diese mit gewöhnlichen Datenverarbeitungsanlagen nur schwer zu realisieren sind.Augmentation methods, i.e. methods for generating additional training data, have been proposed as a solution to this problem. However, the disadvantage of known augmentation methods is that they are very complex and require a lot of computer resources, especially storage and computing capacity, so that they are difficult to implement with conventional data processing systems.
Beim Steuern eines steuerbaren Systems durch einen Algorithmus des maschinellen Lernens kommt es ferner häufig auch dazu, dass Algorithmen des maschinellen Lernens unbekannte Eingangsdaten fälschlicherweise bestimmten Ausgangsdaten zuordnen, obwohl die Eingangsdaten keiner Klasse beziehungsweise keinen Ausgabedaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können, was zu sicherheitskritischen Situationen beim Steuern einer sicherheitskritischen Anwendung basierend auf dem Algorithmus des maschinellen Lernens führen kann, da derartige Situationen beim Trainieren des Algorithmus des maschinellen Lernens für gewöhnlich nicht berücksichtigt werden.Furthermore, when controlling a controllable system using a machine learning algorithm, machine learning algorithms often incorrectly assign unknown input data to certain output data, even though the input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability, which can lead to safety-critical situations when controlling a safety-critical application based on the machine learning algorithm, since such situations are usually not taken into account when training the machine learning algorithm.
Aus der Druckschrift
Der Erfindung liegt somit die Aufgabe zugrunde, ein verbessertes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens anzugeben.The invention is therefore based on the object of specifying an improved method for generating additional training data for training a machine learning algorithm.
Die Erfindung wird gelöst durch ein Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß den Merkmalen des Patentanspruchs 1.The invention is solved by a method for generating additional training data for training a machine learning algorithm according to the features of patent claim 1.
Die Aufgabe wird zudem auch gelöst durch ein System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß den Merkmalen des Patentanspruchs 8.The object is also achieved by a system for generating additional training data for training a machine learning algorithm according to the features of
Offenbarung der ErfindungDisclosure of the invention
Gemäß einer Ausführungsform der Erfindung wird diese Aufgabe gelöst durch ein Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, wobei das Verfahren ein Erfassen von ein zu modellierendes System betreffenden Daten, ein Erzeugen von gelabelten Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens basierend auf den erfassten Daten, und ein Erzeugen von zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens, wobei das Erzeugen von zusätzlichen Trainingsdaten ein Erzeugen von uninformativen Trainingsdaten basierend auf den erzeugten gelabelten Trainingsdaten aufweist.According to one embodiment of the invention, this object is achieved by a method for generating additional training data for training a machine learning algorithm, wherein the method comprises acquiring data relating to a system to be modeled, generating labeled training data for training the machine learning algorithm based on the acquired data, and generating additional training data for training the machine learning algorithm, wherein the generation of additional training data comprises generating uninformative training data based on rend on the generated labeled training data.
Die Schritte des Verfahrens können insbesondere auf einem Computer ausgeführt werden. Mit anderen Worten, das Verfahren kann insbesondere ein computerimplementiertes Verfahren sein.The steps of the method can in particular be carried out on a computer. In other words, the method can in particular be a computer-implemented method.
Unter ein zu modellierendes System beziehungsweise eine Anwendung des Algorithmus des maschinellen Lernens betreffenden Daten werden dabei Daten, welche durch den trainierten Algorithmus des maschinellen Lernens zukünftig verarbeitet werden sollen, das heißt mögliche Eingangsdaten des trainierten Algorithmus des maschinellen Lernens verstanden.The data relating to a system to be modelled or an application of the machine learning algorithm refers to data which are to be processed by the trained machine learning algorithm in the future, i.e. possible input data of the trained machine learning algorithm.
Unter gelabelten Trainingsdaten werden weiter entsprechende annotierte beziehungsweise mit entsprechenden Ground-Truth-Informationen versehene Daten beziehungsweise Trainingsdaten verstanden.Labeled training data also refers to data or training data that are annotated or provided with corresponding ground truth information.
Unter uninformativen Trainingsdaten werden zudem Trainingsdaten verstanden, welche auf Eingangsdaten beziehungsweise Eingabedaten basieren, die keinen Ausgangsdaten beziehungsweise Ausgabewerten des Algorithmus des maschinellen Lernens eindeutig zugeordnet werden können. So basiert die Zuordnung von Eingangsdaten zu Ausgangsdaten durch einen Algorithmus des maschinellen Lernens für gewöhnlich auf probabilistischen Verfahren beziehungsweise Wahrscheinlichkeitswerten, wobei uninformative Trainingsdaten auf Eingabedaten basieren, welche keinen Ausgabedaten mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden können.Uninformative training data also includes training data that is based on input data or input data that cannot be clearly assigned to any output data or output values of the machine learning algorithm. The assignment of input data to output data by a machine learning algorithm is usually based on probabilistic methods or probability values, with uninformative training data based on input data that cannot be clearly assigned to any output data with a certain probability and can in particular be assigned to several different output values with the same probability.
Die uninformativen Trainingsdaten repräsentieren somit Situationen, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.The uninformative training data therefore represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that during training of the machine learning algorithm, it is also possible to train how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
Insgesamt wird somit ein verbessertes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben.Overall, an improved method for generating additional training data for training a machine learning algorithm is provided.
In einer Ausführungsform weist der Schritt des Erzeugens von zusätzlichen Trainingsdaten weiter ein Auswählen von ersten gelabelten Trainingsdaten und zweiten gelabelten Trainingsdaten aus den erzeugten gelabelten Trainingsdaten, ein Ermitteln eines Mittelpunktes zwischen den Eingangsdaten der ersten gelabelten Trainingsdaten und den Eingangsdaten der zweiten gelabelten Trainingsdaten, und ein anschließendes Verschieben des ermittelten Mittelpunktes orthogonal zu einem Verbindungsvektor, welcher die Eingangsdaten der ersten gelabelten Trainingsdaten und die Eingangsdaten der zweiten gelabelten Trainingsdaten miteinander verbindet, durch Hinzufügen eines Rauschsignals zu dem ermittelten Mittelpunkt auf.In one embodiment, the step of generating additional training data further comprises selecting first labeled training data and second labeled training data from the generated labeled training data, determining a midpoint between the input data of the first labeled training data and the input data of the second labeled training data, and then shifting the determined midpoint orthogonal to a connection vector connecting the input data of the first labeled training data and the input data of the second labeled training data by adding a noise signal to the determined midpoint.
Unter Mittelpunkt wird hierbei insbesondere ein arithmetisches Mittel der Eingangsdaten verstanden, wobei durch den Mittelpunkt repräsentierte Eingangsdaten für gewöhnlich keiner Klasse beziehungsweise keinen Ausgangsdaten eindeutig zugeordnet werden können.The center point is understood here in particular to be an arithmetic mean of the input data, whereby input data represented by the center point cannot usually be clearly assigned to any class or output data.
Unter Rauschsignal wird hierbei eine Störgröße beziehungsweise eine zusätzliche Abweichung verstanden.A noise signal is understood to be a disturbance or an additional deviation.
Dass der bestimmte Mittelpunkt orthogonal zu dem Verbindungsvektor durch Hinzufügen eines Rauschsignals zu dem bestimmten Mittelpunkt verschoben wird, bedeutet weiter, dass der bestimmte Mittelpunkt entlang einer Orthogonale um einen durch das Rauschsignal vorgegebenen Wert verschoben wird.That the specific center point is shifted orthogonally to the connection vector by adding a noise signal to the specific center point further means that the specific center point is shifted along an orthogonal line by a value predetermined by the noise signal.
Somit können basierend auf einfachen algebraischen Operationen zusätzliche Trainingsdaten erzeugt werden, welche nicht nur eine Mischung aus den bekannten Trainingsdaten darstellen, sondern systematisch uninformative Trainingsdaten, welche keiner Klasse zugehören, ohne dass aufwendige und ressourcenintensive Operationen beziehungsweise Anpassungen vonnöten wären. Da die zusätzlichen, uninformativen Trainingsdaten dabei basierend auf einfachen algebraischen Operationen erzeugt werden, werden vergleichsweise wenig Computerressourcen zum Erzeugen der zusätzlichen Trainingsdaten benötigt, so dass das Verfahren beispielsweise auch auf Steuergeräten eines Kraftfahrzeuges, welche vergleichsweise geringe Computerressourcen aufweisen, ausgeführt werden kann.Thus, based on simple algebraic operations, additional training data can be generated that not only represents a mixture of the known training data, but systematically uninformative training data that does not belong to any class, without the need for complex and resource-intensive operations or adjustments. Since the additional, uninformative training data is generated based on simple algebraic operations, comparatively few computer resources are required to generate the additional training data, so that the method can also be carried out, for example, on control units of a motor vehicle, which have comparatively low computer resources.
Bei dem Rauschsignal kann es sich dabei um einen Zufallsvektor handeln.The noise signal can be a random vector.
Unter einem Zufallsvektor wird dabei ein Vektor verstanden, in welchem N beziehungsweise eine gewisse Anzahl an Zufallsvariablen zusammengefasst sind.A random vector is a vector in which N or a certain number of random variables are summarized.
Die systematisch erzeugten, zusätzlichen uninformativen Trainingsdaten können somit auf einfache Art und Weise durch Addieren eines Zufallsvektors beziehungsweise basierend auf einfachen Vektoroperationen erzeugt werden, ohne dass aufwendige und ressourcenintensive Operationen vonnöten wären.The systematically generated, additional uninformative training data can thus be generated in a simple manner by adding a random vector or based on simple vector operations, without the need for complex and resource-intensive operations.
Der Schritt des Erzeugens von zusätzlichen Trainingsdaten kann zudem auch ein Erzeugen von zusätzlichen Trainingsdaten durch Interpolation zwischen erzeugten uninformativen Trainingsdaten und erzeugtem gelabelten Trainingsdaten aufweisen.The step of generating additional training data may also comprise generating additional training data by interpolation between generated uninformative training data and generated labeled training data.
Unter Interpolation wird hierbei eine näherungsweise Ermittlung eines unbekannten Wertes mithilfe von beziehungsweise basierend auf bekannten Werten an benachbarten Stellen verstanden.Interpolation is understood to mean the approximate determination of an unknown value using or based on known values at neighboring locations.
Somit können basierend auf den erzeugten, zusätzlichen uninformativen Trainingsdaten basierend auf einfachen mathematischen Operationen auch noch weitere zusätzliche Trainingsdaten erzeugt werden, ohne dass aufwendige und ressourcenintensive Operationen vonnöten wären.Thus, based on the generated additional uninformative training data, additional training data can be generated based on simple mathematical operations without the need for complex and resource-intensive operations.
Die das zu modellierende System betreffenden Daten können ferner Sensordaten aufweisen.The data relating to the system to be modelled may also include sensor data.
Ein Sensor, welcher auch als (Mess-)Fühler bezeichnet wird, ist ein technisches Bauteil, das bestimmte physikalische oder chemische Eigenschaften und/oder die stoffliche Beschaffenheit seiner Umgebung qualitativ oder als Messgröße quantitativ erfassen kann.A sensor, which is also called a (measuring) probe, is a technical component that can detect certain physical or chemical properties and/or the material properties of its environment qualitatively or quantitatively as a measured value.
Somit können auf einfache Art und Weise Gegebenheiten außerhalb der eigentlichen Datenverarbeitungsanlage, auf welcher die zusätzlichen Trainingsdaten erzeugt werden, erfasst und bei der Erzeugung von zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens berücksichtigt werden.In this way, conditions outside the actual data processing system on which the additional training data is generated can be easily recorded and taken into account when generating additional training data for training the machine learning algorithm.
Mit einer weiteren Ausführungsform der Erfindung wird auch ein Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, wobei das Verfahren ein Bereitstellen von Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens, ein Erzeugen von zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens durch ein obenstehend beschriebenes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, und ein Trainieren des Algorithmus des maschinellen Lernens basierend auf den bereitgestellten Trainingsdaten und den erzeugten zusätzlichen Trainingsdaten aufweist.A further embodiment of the invention also provides a method for training a machine learning algorithm, the method comprising providing training data for training the machine learning algorithm, generating additional training data for training the machine learning algorithm by a method described above for generating additional training data for training a machine learning algorithm, and training the machine learning algorithm based on the provided training data and the generated additional training data.
Somit wird ein Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, welches auf durch ein verbessertes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten zusätzlichen Trainingsdaten basiert. Insbesondere werden dabei zusätzliche uninformative Trainingsdaten erzeugt, welche Situationen repräsentieren, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.Thus, a method for training a machine learning algorithm is specified, which is based on additional training data generated by an improved method for generating additional training data for training a machine learning algorithm. In particular, additional uninformative training data is generated which represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that during training of the machine learning algorithm, it can also be trained how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
Die bereitgestellten Trainingsdaten können dabei den während der Anwendung des Verfahrens zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten gelabelten Trainingsdaten entsprechen. Ferner können die Trainingsdaten aber auch unabhängig von der Anwendung des Verfahrens zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens bereitgestellt werden.The training data provided can correspond to the labeled training data generated during the application of the method for generating additional training data for training a machine learning algorithm. Furthermore, the training data can also be provided independently of the application of the method for generating additional training data for training a machine learning algorithm.
Mit einer weiteren Ausführungsform der Erfindung wird weiter auch ein Verfahren zum Steuern eines steuerbaren Systems basierend auf einem Algorithmus des maschinellen Lernens angegeben, wobei das Verfahren ein Bereitstellen eines Algorithmus des maschinellen Lernens zum Steuern des steuerbaren Systems, wobei der Algorithmus des maschinellen Lernens durch ein obenstehend beschriebenes Verfahren zum Trainieren eines Algorithmus des maschinellen Lernens trainiert wurde, und ein Steuern des steuerbaren Systems basierend auf dem bereitgestellten Algorithmus des maschinellen Lernens aufweist.A further embodiment of the invention also provides a method for controlling a controllable system based on a machine learning algorithm, the method comprising providing a machine learning algorithm for controlling the controllable system, the machine learning algorithm having been trained by a method for training a machine learning algorithm described above, and controlling the controllable system based on the provided machine learning algorithm.
Unter einem steuerbaren System wird dabei ein Robotiksystem verstanden, beispielsweise ein Fahrerassistenzsystem eines Kraftfahrzeuges oder eine Funktion eines autonom fahrenden Kraftfahrzeuges.A controllable system is understood to be a robotic system, for example a driver assistance system of a motor vehicle or a function of an autonomously driving motor vehicle.
Somit wird ein Verfahren zum Steuern eines steuerbaren Systems angegeben, welches auf einem basierend auf durch ein verbessertes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten, zusätzlichen Trainingsdaten trainierten Algorithmus des maschinellen Lernens basiert. Insbesondere werden dabei zusätzliche uninformative Trainingsdaten erzeugt, welche Situationen repräsentieren, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.Thus, a method is provided for controlling a controllable system which is based on additional training data generated by an improved method for generating additional training data for training a machine learning algorithm. nized machine learning algorithm. In particular, additional uninformative training data is generated which represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that during the training of the machine learning algorithm, it can also be trained how the machine learning algorithm should react in such situations in which an input value cannot be clearly assigned to an output value with a certain probability and in particular can be assigned to several different output values with the same probability.
Mit einer weiteren Ausführungsform der Erfindung wird außerdem auch ein System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, wobei das System eine Erfassungseinheit, welche ausgebildet ist, ein zu modellierendes System betreffende Daten zu erfassen, eine erste Erzeugungseinheit, welche ausgebildet ist, gelabelte Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens basierend auf den erfassten Daten zu erzeugen, und eine zweite Erzeugungseinheit, welche ausgebildet ist, zusätzliche Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens zu erzeugen, wobei das Erzeugen von zusätzlichen Trainingsdaten ein Erzeugen von uninformativen Trainingsdaten basierend auf den erzeugten gelabelten Trainingsdaten aufweist, aufweist.A further embodiment of the invention also provides a system for generating additional training data for training a machine learning algorithm, the system comprising a detection unit designed to detect data relating to a system to be modeled, a first generation unit designed to generate labeled training data for training the machine learning algorithm based on the detected data, and a second generation unit designed to generate additional training data for training the machine learning algorithm, the generation of additional training data comprising generating uninformative training data based on the generated labeled training data.
Somit wird ein verbessertes System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben. Die uninformativen Trainingsdaten repräsentieren dabei Situationen, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.This provides an improved system for generating additional training data for training a machine learning algorithm. The uninformative training data represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that during training of the machine learning algorithm, it is also possible to train how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
In einer Ausführungsform weist die zweite Erzeugungseinheit eine Auswahleinheit, welche ausgebildet ist, erste gelabelte Trainingsdaten und zweiten gelabelte Trainingsdaten aus den erzeugten gelabelten Trainingsdaten auszuwählen, eine Ermittlungseinheit, welche ausgebildet ist, einen Mittelpunkt zwischen den Eingangsdaten der ersten gelabelten Trainingsdaten und den Eingangsdaten der zweiten gelabelten Trainingsdaten zu ermitteln, und eine Verschiebungseinheit, welche ausgebildet ist, den ermittelten Mittelpunktorthogonal zu einem Verbindungsvektor, welcher die Eingangsdaten der ersten gelabelten Trainingsdaten und die Eingangsdaten der zweiten gelabelten Trainingsdaten miteinander verbindet, durch Hinzufügen eines Rauschsignals zu dem bestimmten Mittelpunkt zu verschieben, auf. Somit können basierend auf einfachen algebraischen Operationen zusätzliche Trainingsdaten erzeugt werden, welche nicht nur eine Mischung aus den bekannten Trainingsdaten darstellen, sondern systematisch uninformative Trainingsdaten, welche keiner Klasse zugehören, ohne dass aufwendige und ressourcenintensive Operationen vonnöten wären. Da die zusätzlichen, uninformativen Trainingsdaten dabei basierend auf einfachen algebraischen Operationen erzeugt werden, werden vergleichsweise wenig Computerressourcen zum Erzeugen der zusätzlichen Trainingsdaten benötigt, so dass das Verfahren beispielsweise auch auf Steuergeräten eines Kraftfahrzeuges, welche vergleichsweise geringe Computerressourcen aufweisen, ausgeführt werden kann.In one embodiment, the second generation unit has a selection unit which is designed to select first labeled training data and second labeled training data from the generated labeled training data, a determination unit which is designed to determine a midpoint between the input data of the first labeled training data and the input data of the second labeled training data, and a displacement unit which is designed to shift the determined midpoint orthogonally to a connection vector which connects the input data of the first labeled training data and the input data of the second labeled training data to one another by adding a noise signal to the determined midpoint. Thus, based on simple algebraic operations, additional training data can be generated which not only represent a mixture of the known training data, but systematically uninformative training data which do not belong to any class, without the need for complex and resource-intensive operations. Since the additional, uninformative training data are generated based on simple algebraic operations, comparatively few computer resources are required to generate the additional training data, so that the method can also be carried out, for example, on control units of a motor vehicle, which have comparatively low computer resources.
Dabei kann es sich bei dem Rauschsignal um einen Zufallsvektor handelt. Die systematisch erzeugten, zusätzlichen uninformativen Trainingsdaten können somit auf einfache Art und Weise durch Addieren eines Zufallsvektors beziehungsweise basierend auf einfachen Vektoroperationen erzeugt werden, ohne dass aufwendige und ressourcenintensive Operationen vonnöten wären.The noise signal can be a random vector. The systematically generated, additional uninformative training data can thus be generated in a simple manner by adding a random vector or based on simple vector operations, without the need for complex and resource-intensive operations.
Die zweite Erzeugungseinheit kann ferner zudem ausgebildet sein, zusätzliche Trainingsdaten durch Interpolation zwischen erzeugten uninformativen Trainingsdaten und erzeugten gelabelten Trainingsdaten zu erzeugen. Somit können basierend auf den erzeugten, zusätzlichen uninformativen Trainingsdaten basierend auf einfachen mathematischen Operationen auch noch weitere zusätzliche Trainingsdaten erzeugt werden, ohne dass aufwendige und ressourcenintensive Operationen vonnöten wären.The second generation unit can also be designed to generate additional training data by interpolation between generated uninformative training data and generated labeled training data. Thus, based on the generated, additional uninformative training data, further additional training data can be generated based on simple mathematical operations, without the need for complex and resource-intensive operations.
Die eine Anwendung des Algorithmus des maschinellen Lernens betreffenden Daten können ferner wiederum Sensordaten aufweisen. Somit können auf einfache Art und Weise Gegebenheiten außerhalb der eigentlichen Datenverarbeitungsanlage, auf welcher die zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens erzeugt werden, erfasst und bei der Erzeugung von zusätzlichen Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens berücksichtigt werden.The data relating to an application of the machine learning algorithm can also comprise sensor data. In this way, circumstances outside the actual data processing system on which the additional training data for training the machine learning algorithm are generated can be easily recorded and used when generating additional training data for training. ren of the machine learning algorithm.
Mit einer weiteren Ausführungsform der Erfindung wird außerdem auch ein System zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, wobei das System eine erste Bereitstellungseinheit, welche ausgebildet ist, Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens bereitzustellen, eine zweite Bereitstellungseinheit, welche ausgebildet ist, zusätzliche Trainingsdaten zum Trainieren des Algorithmus des maschinellen Lernens bereitzustellen, wobei die zusätzlichen Trainingsdaten durch ein obenstehend beschriebenes System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugt wurden, und eine Trainingseinheit, welche ausgebildet ist, den Algorithmus des maschinellen Lernens basierend auf den bereitgestellten Trainingsdaten und den bereitgestellten zusätzlichen Trainingsdaten zu trainieren, aufweist.A further embodiment of the invention also provides a system for training a machine learning algorithm, the system comprising a first provision unit designed to provide training data for training the machine learning algorithm, a second provision unit designed to provide additional training data for training the machine learning algorithm, the additional training data having been generated by a system described above for generating additional training data for training a machine learning algorithm, and a training unit designed to train the machine learning algorithm based on the provided training data and the provided additional training data.
Somit wird ein System zum Trainieren eines Algorithmus des maschinellen Lernens angegeben, welches auf durch ein verbessertes System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten, zusätzlichen Trainingsdaten basiert. Insbesondere werden dabei zusätzliche uninformative Trainingsdaten erzeugt, welche Situationen repräsentieren, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.Thus, a system for training a machine learning algorithm is specified, which is based on additional training data generated by an improved system for generating additional training data for training a machine learning algorithm. In particular, additional uninformative training data is generated which represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that, during training of the machine learning algorithm, it can also be trained how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
Mit einer weiteren Ausführungsform der Erfindung wird ferner auch ein System zum Steuern eines steuerbaren Systems basierend auf einem Algorithmus des maschinellen Lernens angegeben, wobei das System einen Bereitstellungseinheit, welche ausgebildet ist, einen Algorithmus des maschinellen Lernens zum Steuern des steuerbaren Systems bereitzustellen, wobei der Algorithmus des maschinellen Lernens durch ein obenstehend beschriebenes System zum Trainieren eines Algorithmus des maschinellen Lernens trainiert wurde, und eine Steuereinheit zum Steuern des steuerbaren Systems basierend auf dem bereitgestellten Algorithmus des maschinellen Lernens aufweist.A further embodiment of the invention also provides a system for controlling a controllable system based on a machine learning algorithm, the system comprising a provision unit which is designed to provide a machine learning algorithm for controlling the controllable system, the machine learning algorithm having been trained by a system for training a machine learning algorithm described above, and a control unit for controlling the controllable system based on the provided machine learning algorithm.
Somit wird ein System zum Steuern eines steuerbaren Systems angegeben, welches auf einem basierend auf durch ein verbessertes System zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens erzeugten, zusätzlichen Trainingsdaten trainierten Algorithmus des maschinellen Lernens basiert. Insbesondere werden dabei zusätzliche uninformative Trainingsdaten erzeugt, welche Situationen repräsentieren, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.Thus, a system is specified for controlling a controllable system, which is based on a machine learning algorithm trained on the basis of additional training data generated by an improved system for generating additional training data for training a machine learning algorithm. In particular, additional uninformative training data is generated which represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that, during training of the machine learning algorithm, it can also be trained how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
Zusammenfassend ist festzustellen, dass mit der vorliegenden Erfindung ein Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens, und insbesondere ein Verfahren zum Erzeugen von zusätzlichen, uninformativen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens angegeben wird.In summary, the present invention provides a method for generating additional training data for training a machine learning algorithm, and in particular a method for generating additional, uninformative training data for training a machine learning algorithm.
Die beschriebenen Ausgestaltungen und Weiterbildungen lassen sich beliebig miteinander kombinieren.The described designs and further training courses can be combined as desired.
Weitere mögliche Ausgestaltungen, Weiterbildungen und Implementierungen der Erfindung umfassen auch nicht explizit genannte Kombinationen von zuvor oder im Folgenden bezüglich der Ausführungsbeispiele beschriebenen Merkmalen der Erfindung.Further possible embodiments, further developments and implementations of the invention also include combinations of features of the invention described above or below with respect to the embodiments that are not explicitly mentioned.
Kurze Beschreibung der ZeichnungenShort description of the drawings
Die beiliegenden Zeichnungen sollen ein weiteres Verständnis der Ausführungsformen der Erfindung vermitteln. Sie veranschaulichen Ausführungsformen und dienen im Zusammenhang mit der Beschreibung der Erklärung von Prinzipien und Konzepten der Erfindung.The accompanying drawings are intended to provide a further understanding of embodiments of the invention. They illustrate embodiments and, in conjunction with the description, serve to explain principles and concepts of the invention.
Andere Ausführungsformen und viele der genannten Vorteile ergeben sich im Hinblick auf die Zeichnungen. Die dargestellten Elemente der Zeichnungen sind nicht notwendigerweise maßstabsgetreu zueinander gezeigt.Other embodiments and many of the above advantages will become apparent upon consideration of the drawings. The illustrated elements of the drawings are not necessarily shown to scale with respect to one another.
Es zeigen:
-
1 zeigt ein Flussdiagramm eines Verfahrens zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß Ausführungsformen der Erfindung; und -
2 zeigt ein schematisches Blockschaltbild eines Systems zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens gemäß Ausführungsformen der Erfindung.
-
1 shows a flowchart of a method for generating additional training data for training a machine learning algorithm according to embodiments of the invention; and -
2 shows a schematic block diagram of a system for generating additional training data for training a machine learning algorithm according to embodiments of the invention.
In den Figuren der Zeichnungen bezeichnen gleiche Bezugszeichen gleiche oder funktionsgleiche Elemente, Bauteile oder Komponenten, soweit nichts Gegenteiliges angegeben ist.In the figures of the drawings, identical reference symbols designate identical or functionally identical elements, parts or components, unless otherwise stated.
Zum Trainieren eines Algorithmus des maschinellen Lernens kann ein zu modellierendes System beispielsweise durch Messungen erfasst werden, wobei anhand von Messwerten beispielsweise ein empirisches Modell erstellt werden und ein Algorithmus des maschinellen Lernens entsprechend trainiert werden kann. Hierbei kann es jedoch beispielsweise zu Situationen kommen, in denen es unmöglich ist, einen zu modellierenden Prozess beziehungsweise ein zu modellierendes System vollständig durchzumessen. Dies kann jedoch zur Folge haben, dass für die empirische Modellbildung beziehungsweise das entsprechende Trainieren des Algorithmus des maschinellen Lernens nur partielle Daten aus einem Teilraum zur Verfügung stehen, wobei jedoch im Betrieb auch Prozesszustände auftreten können, die durch diese Trainingsdaten nicht erfasst sind.To train a machine learning algorithm, a system to be modelled can be recorded, for example, through measurements, whereby an empirical model can be created based on measured values and a machine learning algorithm can be trained accordingly. However, situations can arise in which it is impossible to completely measure a process or system to be modelled. However, this can result in only partial data from a subspace being available for the empirical modeling or the corresponding training of the machine learning algorithm, although process states can also occur during operation that are not captured by this training data.
Als Lösung dieses Problems wurden Augmentationsverfahren vorgeschlagen, das heißt Verfahren zur Erzeugung zusätzlicher Trainingsdaten. Als nachteilig erweist sich bei bekannten Augmentationsverfahren jedoch, dass diese sehr komplex sind und viele Computerressourcen, insbesondere Speicher- und Rechenkapazitäten erfordern, so dass diese mit gewöhnlichen Datenverarbeitungsanlagen nur schwer zu realisieren sind.Augmentation methods, i.e. methods for generating additional training data, have been proposed as a solution to this problem. However, the disadvantage of known augmentation methods is that they are very complex and require a lot of computer resources, especially storage and computing capacity, so that they are difficult to implement with conventional data processing systems.
Beim Steuern eines steuerbaren Systems durch einen Algorithmus des maschinellen Lernens kommt es ferner häufig auch dazu, dass Algorithmen des maschinellen Lernens unbekannte Eingangsdaten fälschlicherweise bestimmten Ausgangsdaten zuordnen, obwohl die Eingangsdaten keiner Klasse beziehungsweise keinen Ausgabedaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können, was zu sicherheitskritischen Situationen beim Steuern einer sicherheitskritischen Anwendung basierend auf dem Algorithmus des maschinellen Lernens führen kann, da derartige Situationen beim Trainieren des Algorithmus des maschinellen Lernens für gewöhnlich nicht berücksichtigt werden.Furthermore, when controlling a controllable system using a machine learning algorithm, machine learning algorithms often incorrectly assign unknown input data to certain output data, even though the input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability, which can lead to safety-critical situations when controlling a safety-critical application based on the machine learning algorithm, since such situations are usually not taken into account when training the machine learning algorithm.
Die uninformativen Trainingsdaten repräsentieren dabei Situationen, in denen Eingangsdaten keiner Klasse beziehungsweise keinen Ausgangsdaten genau entsprechen beziehungsweise nicht mit einer gewissen Wahrscheinlichkeit einem möglichen Ausgabewert eindeutig zugeordnet werden können. Dies hat den Vorteil, dass während des Trainierens des Algorithmus des maschinellen Lernens auch trainiert werden kann, wie der Algorithmus des maschinellen Lernens in derartigen Situationen, in denen ein Eingabewert keinem Ausgabewert mit einer gewissen Wahrscheinlichkeit eindeutig zugeordnet werden und vielmehr insbesondere mit derselben Wahrscheinlichkeit mehreren unterschiedlichen Ausgabewerten zugeordnet werden kann, reagieren soll.The uninformative training data represents situations in which input data does not exactly correspond to any class or output data or cannot be clearly assigned to a possible output value with a certain probability. This has the advantage that during training of the machine learning algorithm, it can also be trained how the machine learning algorithm should react in situations in which an input value cannot be clearly assigned to an output value with a certain probability and, in particular, can be assigned to several different output values with the same probability.
Insgesamt wird somit ein verbessertes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens 1 angegeben.Overall, an improved method for generating additional training data for training a machine learning algorithm 1 is provided.
Bei dem Algorithmus des maschinellen Lernens kann es sich dabei beispielsweise um ein künstliches neuronales Netz handeln. Dabei sind die uninformativen Trainingsdaten insbesondere Trainingsdaten, welche eine uniforme Gewichtung des Netzausgangs verstärken.The machine learning algorithm can, for example, be an artificial neural network. The uninformative training data is particularly training data that reinforces a uniform weighting of the network output.
Gemäß den Ausführungsformen der
Die Idee besteht dabei darin, nicht nur zwischen zwei bekannten Datenpunkten zu interpolieren beziehungsweise den Mittelpunkt zwischen den beiden Datenpunkten zu ermitteln, so dass eine Mischung der Klassen beziehungsweise Ausgangsdaten der beiden Datenpunkte entsteht, sondern die Interpolation über einen gänzlich uninformativen Punkt umzuleiten.The idea is not only to interpolate between two known data points or to determine the midpoint between the two data points, so that a mixture of the classes or output data of the two data points is created, but to redirect the interpolation via a completely uninformative point.
Das Auswählen der ersten und er zweiten gelabelten Trainingsdaten kann dabei ein zufälliges Auswählen von Trainingsdaten aus den erzeugten Trainingsdaten aufweisen.Selecting the first and second labeled training data may involve randomly selecting training data from the generated training data.
Bei dem Rauschsignal handelt es sich gemäß den Ausführungsformen der
Dabei kann der Zufallsvektor mit einer variablen Schrittweite beziehungsweise einer zufälligen Länge aufaddiert werden, wobei die Spitze des Zufallsvektors nach dem Aufaddieren auf einen gänzlich uninformativen Punkt zeigt beziehungsweise auf diesem liegt, welcher Eingangsdaten von entsprechenden uninformativen Trainingsdaten repräsentiert, wobei die Ausgangsdaten zu gleichen Teilen die Ausgangsdaten der ersten und der zweiten gelabelten Trainingsdaten repräsentieren und keinen von beiden eindeutig zugeordnet werden können.The random vector can be added with a variable step size or a random length, whereby the tip of the random vector after addition points to or lies on a completely uninformative point, which represents input data from corresponding uninformative training data, whereby the output data equally represents the output data of the first and the second labeled training data and neither of them can be clearly assigned.
Dabei können ferner mehrere derartige gänzlich uniformative Punkte gefunden werden, in dem der Zufallsvektor im hochdimensionalen Raum in unterschiedlichen, insbesondere zufällig ausgewählten Richtungen angelegt wird.Furthermore, several such completely uniform points can be found by applying the random vector in the high-dimensional space in different, in particular randomly selected directions.
Wie
Gemäß den Ausführungsformen der
Basierend auf den erzeugten Trainingsdaten und den erzeugten zusätzlichen, uninformativen Trainingsdaten kann anschließend ein Algorithmus des maschinellen Lernens trainiert werden.Based on the generated training data and the generated additional, uninformative training data, a machine learning algorithm can then be trained.
Beispielsweise kann dabei basierend auf entsprechenden gelabelten Trainingsdaten ein Algorithmus des maschinellen Lernens zum Steuern eines steuerbaren Systems trainiert werden.For example, a machine learning algorithm can be trained to control a controllable system based on corresponding labeled training data.
Bei dem steuerbaren System kann es sich dabei beispielsweise um eine Funktion eines autonom fahrenden Kraftfahrzeuges handeln, wobei, falls der trainierte Algorithmus des maschinellen Lernens Eingangsdaten einzelnen Ausgangsdaten nicht eindeutig zuordnen kann, das autonom fahrende Kraftfahrzeug in einen sicheren Modus überführt wird, beispielsweise in einen Modus, in welchem dieses nur noch mit einer maximalen Geschwindigkeit von 30 km/h fahren kann.The controllable system can, for example, be a function of an autonomously driving motor vehicle, whereby, if the trained machine learning algorithm cannot clearly assign input data to individual output data, the autonomously driving motor vehicle is transferred to a safe mode, for example to a mode in which it can only drive at a maximum speed of 30 km/h.
Wie
Bei der Erfassungseinheit kann es sich dabei insbesondere um einen Empfänger, welcher ausgebildet ist, entsprechende Daten, beispielsweise Sensordaten zu empfangen, handeln. Die erste und die zweite Erzeugungseinheit können ferner jeweils beispielsweise basierend auf einem in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden.The detection unit can in particular be a receiver which is designed to receive corresponding data, for example sensor data. The first and second generation units can also each be implemented, for example, based on a code stored in a memory and executable by a processor.
Wie
Die Auswahleinheit, die Ermittlungseinheit und die Verschiebungseinheit können dabei entsprechend wiederum jeweils basierend auf einem in einem Speicher hinterlegten und durch einen Prozessor ausführbaren Code realisiert werden.The selection unit, the determination unit and the displacement unit can each be implemented based on a code stored in a memory and executable by a processor.
Gemäß den Ausführungsformen der
Zudem ist die dargestellte Erzeugungseinheit 13 weiter ausgebildet, zusätzliche Trainingsdaten durch Interpolation zwischen uninformativen Trainingsdaten und bereitgestellten gelabelten Trainingsdaten zu erzeugen.In addition, the illustrated
Gemäß den Ausführungsformen der
Das dargestellte System 10 ist dabei insbesondere ausgebildet, ein obenstehend beschriebenes Verfahren zum Erzeugen von zusätzlichen Trainingsdaten zum Trainieren eines Algorithmus des maschinellen Lernens auszuführen.The illustrated
ZITATE ENTHALTEN IN DER BESCHREIBUNGQUOTES INCLUDED IN THE DESCRIPTION
Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.This list of documents listed by the applicant was generated automatically and is included solely for the better information of the reader. The list is not part of the German patent or utility model application. The DPMA accepts no liability for any errors or omissions.
Zitierte PatentliteraturCited patent literature
- DE 102019209560 A1 [0006]DE 102019209560 A1 [0006]
Claims (14)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102023201104.2A DE102023201104A1 (en) | 2023-02-10 | 2023-02-10 | Method for generating additional training data for training a machine learning algorithm |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102023201104.2A DE102023201104A1 (en) | 2023-02-10 | 2023-02-10 | Method for generating additional training data for training a machine learning algorithm |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102023201104A1 true DE102023201104A1 (en) | 2024-08-14 |
Family
ID=91962163
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102023201104.2A Pending DE102023201104A1 (en) | 2023-02-10 | 2023-02-10 | Method for generating additional training data for training a machine learning algorithm |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102023201104A1 (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102019209560A1 (en) | 2019-06-28 | 2020-12-31 | Robert Bosch Gmbh | Apparatus and method for training a neural network |
-
2023
- 2023-02-10 DE DE102023201104.2A patent/DE102023201104A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102019209560A1 (en) | 2019-06-28 | 2020-12-31 | Robert Bosch Gmbh | Apparatus and method for training a neural network |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3785177B1 (en) | Method and device for determining a network-configuration of a neural network | |
DE102018128289A1 (en) | METHOD AND DEVICE FOR AUTONOMOUS SYSTEM PERFORMANCE AND CLASSIFICATION | |
DE102019115356B4 (en) | PROCEDURE FOR VEHICLE FAULT ROOT CAUSE DIAGNOSIS | |
DE112017004847T5 (en) | Vehicle-mounted interface device, method of determination, program and storage medium | |
DE102019124018A1 (en) | Method for optimizing tests of control systems for automated vehicle dynamics systems | |
DE102019126195A1 (en) | Process for the efficient, simulative application of automated driving functions | |
DE102020120141A1 (en) | Procedure for optimizing tests of control systems for automated vehicle dynamics systems using probabilistically predicted system responses | |
EP3782081B1 (en) | Method for generating a test data set, method for testing, method for operating a system, device, control system, computer program product, computer readable medium, generation and use | |
DE102021207613A1 (en) | Process for quality assurance of a system | |
DE102019213061A1 (en) | Classification of AI modules | |
DE102023201104A1 (en) | Method for generating additional training data for training a machine learning algorithm | |
DE102020205962B3 (en) | Device and method for operating a test bench | |
DE102021133977A1 (en) | Method and system for classifying virtual test scenarios and training methods | |
DE102019130484A1 (en) | Method and device for training an ensemble of neural networks | |
DE102020203135A1 (en) | Procedure for quality assurance of an example-based system | |
DE102020205963B3 (en) | Device and computer-implemented method for operating a test bench | |
DE102022205715A1 (en) | Method for providing training data and test data for training a machine learning algorithm | |
DE102021212727A1 (en) | Method for generating training data for training a machine learning algorithm | |
DE102020205964B3 (en) | Device and method for operating a test bench | |
DE102021212728A1 (en) | Method for generating training data for training a machine learning algorithm | |
DE102022206892A1 (en) | Method for determining an optimal architecture of an artificial neural network | |
DE102023200400A1 (en) | Method for training an autoencoder | |
DE102021207275A1 (en) | Method for creating an artificial neural network | |
DE102022212902A1 (en) | Method for training an artificial neural network | |
DE102022204770A1 (en) | Method for controlling a robotic device |