DE202022101842U1 - Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz - Google Patents
Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz Download PDFInfo
- Publication number
- DE202022101842U1 DE202022101842U1 DE202022101842.1U DE202022101842U DE202022101842U1 DE 202022101842 U1 DE202022101842 U1 DE 202022101842U1 DE 202022101842 U DE202022101842 U DE 202022101842U DE 202022101842 U1 DE202022101842 U1 DE 202022101842U1
- Authority
- DE
- Germany
- Prior art keywords
- characters
- image
- features
- artificial intelligence
- handwritten text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 19
- 210000004556 brain Anatomy 0.000 title claims abstract description 14
- 238000013528 artificial neural network Methods 0.000 claims abstract description 11
- 230000011218 segmentation Effects 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 9
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 238000009499 grossing Methods 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 15
- 238000012935 Averaging Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013529 biological neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
Ein System zur Erkennung von handgeschriebenem Text, das System umfasst:
eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden;
eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln;
eine Segmentierungseinheit zur Erkennung von Zeichensegmenten durch neuronale Netze mit unterschiedlichen Netzparametern;
eine Merkmalsextraktionseinheit zum Extrahieren eines Satzes von Merkmalen aus jedem Zonenpixel durch Bewegen entlang der Diagonalen seiner jeweiligen Pixel; und
eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden;
eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln;
eine Segmentierungseinheit zur Erkennung von Zeichensegmenten durch neuronale Netze mit unterschiedlichen Netzparametern;
eine Merkmalsextraktionseinheit zum Extrahieren eines Satzes von Merkmalen aus jedem Zonenpixel durch Bewegen entlang der Diagonalen seiner jeweiligen Pixel; und
eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
Description
- BEREICH DER ERFINDUNG
- Die vorliegende Offenbarung bezieht sich auf ein System zur Erkennung von handgeschriebenem Text, genauer gesagt auf ein auf einem Gehirnnetz und künstlicher Intelligenz basierendes System zur Erkennung von handgeschriebenem Text.
- HINTERGRUND DER ERFINDUNG
- Die Erkennung von handschriftlichen Ziffern und Zeichen hat in der heutigen elektronischen Umgebung aufgrund ihres praktischen Nutzens für viele alltägliche Aufgaben an Bedeutung gewonnen. Dies zeigt sich daran, dass in den letzten Jahren mehrere Erkennungssysteme für die Anwendung in verschiedenen Bereichen, in denen eine hohe Kategorisierungseffizienz erforderlich ist, entwickelt oder vorgeschlagen wurden. Systeme, die handschriftliche Buchstaben, Zeichen und Ziffern erkennen, unterstützen den Menschen bei anspruchsvolleren Aufgaben, die sonst zeit- und kostenaufwändig wären. Ein hervorragendes Beispiel ist der Einsatz von automatisierten Verarbeitungssystemen in Banken zur Bearbeitung von Bankschecks. Ohne automatisierte Systeme zur Bearbeitung von Bankschecks müsste die Bank eine große Anzahl von Mitarbeitern einstellen, die möglicherweise nicht so effizient wären wie das computergestützte Bearbeitungssystem.
- Handschrifterkennungssysteme hingegen könnten sich an biologischen neuronalen Netzen orientieren, die Menschen und Tiere in die Lage versetzen, nichtlineare und komplizierte Zusammenhänge zu lernen und zu modellieren. Das heißt, sie können mit Hilfe eines künstlichen neuronalen Netzes erstellt werden. Die Gehirne der Menschen ermöglichen es ihnen, verschiedene Handschriften wie Ziffern, Buchstaben und Zeichen zu unterscheiden. Der Mensch hingegen ist voreingenommen, was bedeutet, dass er handgeschriebene Buchstaben und Ziffern möglicherweise anders wahrnimmt. Computergestützte Systeme hingegen sind unvoreingenommen und können extrem schwierige Aufgaben erledigen, für die Menschen sonst einen erheblichen Energie- und Zeitaufwand aufwenden müssten. Es ist notwendig zu verstehen, wie die von Menschen lesbare Unterschrift funktioniert.
- Wenn Menschen handschriftliche Zeichen, Buchstaben, Wörter oder Ziffern lesen, ist ihr visuelles System stark gefordert. Das Lesen von Handschriften scheint unkompliziert zu sein, aber es ist nicht so einfach, wie viele denken. Obwohl alles unbewusst abläuft, kann eine Person dem, was sie sieht, eine Bedeutung geben, je nachdem, was ihr Gehirn gelehrt wurde. Einem Menschen ist vielleicht nicht bewusst, wie schwierig es ist, Probleme mit der Handschrift zu überwinden. Die Schwierigkeit der visuellen Mustererkennung wird erst deutlich, wenn man versucht, ein Computersystem zu entwickeln, das Handschriften lesen kann. Die Technik der künstlichen neuronalen Netze wird oft als die effektivste Methode zur Entwicklung von Systemen zur Erkennung von Handschriften angesehen. Vereinfacht gesagt, simulieren neuronale Netze, wie das menschliche Gehirn beim Lesen von Handschriften arbeitet. Dadurch können Maschinen die menschlichen Fähigkeiten beim Lesen von Handschriften erreichen oder sogar übertreffen.
- In Anbetracht der vorangegangenen Diskussion wird deutlich, dass ein System zur Erkennung von handgeschriebenem Text erforderlich ist.
- ZUSAMMENFASSUNG DER ERFINDUNG
- Die vorliegende Offenlegung zielt darauf ab, ein System bereitzustellen, das die Erkennung von schriftunabhängigen Teilworteinheiten und Wörtern ermöglicht, indem die handschriftlichen Einzelstriche vor der Erkennung von Teilworteinheiten und Wörtern erkannt werden.
- In einer Ausführungsform wird ein System zur Erkennung von handgeschriebenem Text offenbart. Das System umfasst eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden. Das System umfasst ferner eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln. Das System enthält ferner eine Segmentierungseinheit zur Erkennung von Segmenten des Zeichens durch neuronale Netze mit unterschiedlichen Netzparametern. Das System umfasst ferner eine Merkmalsextraktionseinheit, um einen Satz von Merkmalen aus jedem Zonenpixel zu extrahieren, indem es sich entlang der Diagonalen seiner jeweiligen Pixel bewegt. Das System umfasst ferner eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
- In einer anderen Ausführungsform wird jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines künstlichen Intelligenzmodells bereitgestellt, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte künstliche Intelligenzmodell in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch ähnlich aussehende, aber unterschiedliche Zeichen unterschieden werden.
- In einer anderen Ausführungsform besteht die Vorverarbeitungseinheit aus einem Medianfilterprozess, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird.
- In einer anderen Ausführungsform umfasst die Glättung eine Normalisierung der Zeichengröße, um die Zeichengröße innerhalb des Bildes auf eine Standardgröße zu skalieren.
- In einer anderen Ausführungsform ist die Merkmalsextraktionseinheit so konfiguriert, dass sie: ein vorverarbeitetes Bild liest; jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt; Merkmale aus den Pixeln jeder Zone extrahiert, indem sie sich entlang der Diagonalen ihrer jeweiligen Pixel bewegt, wobei jede Zone eine Gruppe von diagonalen Linien aufweist und die entlang jeder diagonalen Linie vorhandenen Vordergrundpixel summiert werden, um ein einzelnes Teilmerkmal zu erhalten; Erhalten von Untermerkmalen aus jeder Zone; und Mittelwertbildung von Untermerkmalen, um einen einzelnen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung sequentiell für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren.
- In einer anderen Ausführungsform wird die BrainNet-Bibliothek verwendet, um das Modell der künstlichen Intelligenz für die Erkennung handschriftlicher Zeichen zu trainieren.
- In einer anderen Ausführungsform umfasst das System ein Netzwerk-Helfer-Objekt, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, so dass verschiedene Parameter akzeptiert werden können.
- Ein Ziel der vorliegenden Offenbarung ist die Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz.
- Ein weiteres Ziel der vorliegenden Offenbarung ist die Umwandlung von handgeschriebenem Text in einen computergestützten Text.
- Ein weiteres Ziel der vorliegenden Erfindung ist es, ein schnelles und kostengünstiges System zur Erkennung handgeschriebener Texte bereitzustellen.
- Um die Vorteile und Merkmale der vorliegenden Offenbarung weiter zu verdeutlichen, wird eine genauere Beschreibung der Erfindung durch Bezugnahme auf bestimmte Ausführungsformen davon, die in den beigefügten Figuren dargestellt ist. Es versteht sich, dass diese Figuren nur typische Ausführungsformen der Erfindung darstellen und daher nicht als Einschränkung ihres Umfangs zu betrachten sind. Die Erfindung wird mit zusätzlicher Spezifität und Detail mit den begleitenden Figuren beschrieben und erklärt werden.
- Figurenliste
- Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Offenbarung werden besser verstanden, wenn die folgende detaillierte Beschreibung mit Bezug auf die beigefügten Figuren gelesen wird, in denen gleiche Zeichen gleiche Teile in den Figuren darstellen, wobei:
-
1 ein Blockdiagramm eines Systems zur Erkennung von handgeschriebenem Text in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt. - Der Fachmann wird verstehen, dass die Elemente in den Figuren der Einfachheit halber dargestellt sind und nicht unbedingt maßstabsgetreu gezeichnet wurden. Die Flussdiagramme veranschaulichen beispielsweise das Verfahren anhand der wichtigsten Schritte, um das Verständnis der Aspekte der vorliegenden Offenbarung zu verbessern. Darüber hinaus kann es sein, dass ein oder mehrere Bauteile der Vorrichtung in den Figuren durch herkömmliche Symbole dargestellt sind, und dass die Figuren nur die spezifischen Details zeigen, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung relevant sind, um die Figuren nicht mit Details zu überfrachten, die für den Fachmann mit den hierin enthaltenen Beschreibungen leicht erkennbar sind.
- DETAILLIERTE BESCHREIBUNG
- Zum besseren Verständnis der Grundsätze der Erfindung wird nun auf die in den Figuren dargestellte Ausführungsform Bezug genommen und diese in einer speziellen Sprache beschrieben. Es versteht sich jedoch von selbst, dass damit keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, wobei solche Änderungen und weitere Modifikationen des dargestellten Systems und solche weiteren Anwendungen der darin dargestellten Prinzipien der Erfindung in Betracht gezogen werden, wie sie einem Fachmann auf dem Gebiet der Erfindung normalerweise einfallen würden.
- Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und nicht als einschränkend angesehen werden.
- Wenn in dieser Beschreibung von „einem Aspekt“, „einem anderen Aspekt“ oder ähnlichem die Rede ist, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, die im Zusammenhang mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Offenbarung enthalten ist. Daher können sich die Ausdrücke „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Ausdrücke in dieser Beschreibung alle auf dieselbe Ausführungsform beziehen, müssen es aber nicht.
- Die Ausdrücke „umfasst“, „enthaltend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, so dass ein Verfahren oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte einschließt, sondern auch andere Schritte enthalten kann, die nicht ausdrücklich aufgeführt sind oder zu einem solchen Verfahren oder einer solchen Methode gehören. Ebenso schließen eine oder mehrere Vorrichtungen oder Teilsysteme oder Elemente oder Strukturen oder Komponenten, die mit „umfasst...a“ eingeleitet werden, nicht ohne weitere Einschränkungen die Existenz anderer Vorrichtungen oder anderer Teilsysteme oder anderer Elemente oder anderer Strukturen oder anderer Komponenten oder zusätzlicher Vorrichtungen oder zusätzlicher Teilsysteme oder zusätzlicher Elemente oder zusätzlicher Strukturen oder zusätzlicher Komponenten aus.
- Sofern nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden wird. Das System, die Methoden und die Beispiele, die hier angegeben werden, dienen nur der Veranschaulichung und sind nicht als Einschränkung gedacht.
- Ausführungsformen der vorliegenden Offenbarung werden im Folgenden unter Bezugnahme auf die beigefügten Figuren im Detail beschrieben.
- In
1 ist ein Blockdiagramm eines Systems zur Erkennung von handgeschriebenem Text gemäß einer Ausführungsform der vorliegenden Offenbarung dargestellt. Das System 100 umfasst eine Bilderfassungseinheit 104, um mit einer Kamera 102 aufgenommene Bilder zu empfangen. Das aufgenommene Bild wird zur weiteren Verarbeitung in einer Datenbank gespeichert. - In einer Ausführungsform ist eine Vorverarbeitungseinheit 106 mit der Bilderfassungseinheit 104 verbunden, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten, um so Segmentraster unter Verwendung neuronaler Netze zu digitalisieren und in Binärwerte umzuwandeln.
- In einer Ausführungsform ist eine Segmentierungseinheit 108 mit der Vorverarbeitungseinheit 106 verbunden, um Segmente des Zeichens durch neuronale Netze mit unterschiedlichen Netzparametern zu erkennen. Die Segmentierung erfolgt auf der Grundlage der Kantenerkennung und des Abstands zwischen den verschiedenen Zeichen. Nach der Segmentierung werden die unterteilten Teile beschriftet und dann einzeln weiterverarbeitet. Diese Beschriftung wird vorgenommen, um die Anzahl der Zeichen im gesamten Bild zu ermitteln. Die Segmentierungspunkte werden auch auf die Einbeziehung von Fehlerpunkten überprüft, indem alle Punkte mit dem durchschnittlichen Abstand zwischen zwei Segmentierungspunkten verglichen werden unvollständiges Bild
- In einer Ausführungsform ist eine Merkmalsextraktionseinheit 110 mit der Segmentierungseinheit 108 verbunden, um einen Satz von Merkmalen aus jedem Zonenpixel zu extrahieren, indem sie sich entlang der Diagonalen der jeweiligen Pixel bewegt.
- In einer Ausführungsform ist eine Klassifizierungs- und Erkennungseinheit 112 mit der Merkmalsextraktionseinheit 110 verbunden, um ein Modell der künstlichen Intelligenz zur Erkennung von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek zu trainieren, wobei der handgeschriebene Text durch Vergleich des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
- In einer anderen Ausführungsform wird jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines künstlichen Intelligenzmodells bereitgestellt, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte künstliche Intelligenzmodell in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch ähnlich aussehende, aber unterschiedliche Zeichen unterschieden werden.
- In einer anderen Ausführungsform besteht die Vorverarbeitungseinheit 106 aus einem Medianfilterverfahren, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird.
- In einer anderen Ausführungsform umfasst die Glättung eine Normalisierung der Zeichengröße, um die Zeichengröße innerhalb des Bildes auf eine Standardgröße zu skalieren.
- In einer anderen Ausführungsform ist die Merkmalsextraktionseinheit 110 so konfiguriert, dass sie ein vorverarbeitetes Bild liest. Dann wird jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt. Extrahieren Sie dann Merkmale aus den Pixeln jeder Zone, indem Sie sich entlang der Diagonalen der jeweiligen Pixel bewegen, wobei jede Zone eine Gruppe von diagonalen Linien hat und die Vordergrundpixel, die entlang jeder diagonalen Linie vorhanden sind, summiert werden, um ein einzelnes Teilmerkmal zu erhalten. Dann werden Untermerkmale aus jeder Zone ermittelt. Danach werden die Werte der Untermerkmale gemittelt, um einen einzigen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung nacheinander für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren.
- In einer anderen Ausführungsform wird die BrainNet-Bibliothek verwendet, um das Modell der künstlichen Intelligenz für die Erkennung handschriftlicher Zeichen zu trainieren.
- In einer anderen Ausführungsform umfasst das System ein Netzwerk-Helfer-Objekt, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, so dass verschiedene Parameter akzeptiert werden können.
- Die Figuren und die vorangehende Beschreibung geben Beispiele für Ausführungsformen. Der Fachmann wird verstehen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ dazu können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente aus einer Ausführungsform können einer anderen Ausführungsform hinzugefügt werden. So kann beispielsweise die Reihenfolge der hier beschriebenen Prozesse geändert werden und ist nicht auf die hier beschriebene Weise beschränkt. Außerdem müssen die Handlungen eines Flussdiagramms nicht in der gezeigten Reihenfolge ausgeführt werden; auch müssen nicht unbedingt alle Handlungen durchgeführt werden. Auch können diejenigen Handlungen, die nicht von anderen Handlungen abhängig sind, parallel zu den anderen Handlungen ausgeführt werden. Der Umfang der Ausführungsformen ist durch diese spezifischen Beispiele keineswegs begrenzt. Zahlreiche Variationen sind möglich, unabhängig davon, ob sie in der Beschreibung explizit aufgeführt sind oder nicht, wie z. B. Unterschiede in der Struktur, den Abmessungen und der Verwendung von Materialien. Der Umfang der Ausführungsformen ist mindestens so groß wie in den folgenden Ansprüchen angegeben.
- Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf bestimmte Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und Komponenten, die dazu führen können, dass ein Vorteil, ein Nutzen oder eine Lösung auftritt oder ausgeprägter wird, sind jedoch nicht als kritisches, erforderliches oder wesentliches Merkmal oder Komponente eines oder aller Ansprüche zu verstehen.
- Bezugszeichenliste
-
- 100
- Ein System zur Erkennung von handgeschriebenem Text
- 102
- Kamera
- 104
- Bilderfassungseinheit
- 106
- Vorverarbeitungseinheit
- 108
- Segmentierungseinheit
- 110
- Einheit zur Merkmalsextraktion
- 112
- Einheit für Klassifizierung und Erkennung
Claims (7)
- Ein System zur Erkennung von handgeschriebenem Text, das System umfasst: eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden; eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln; eine Segmentierungseinheit zur Erkennung von Zeichensegmenten durch neuronale Netze mit unterschiedlichen Netzparametern; eine Merkmalsextraktionseinheit zum Extrahieren eines Satzes von Merkmalen aus jedem Zonenpixel durch Bewegen entlang der Diagonalen seiner jeweiligen Pixel; und eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
- System nach
Anspruch 1 , wobei jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines Modells der künstlichen Intelligenz bereitgestellt wird, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte Modell der künstlichen Intelligenz in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch Zeichen unterschieden werden, die ähnlich aussehen, aber unterschiedlich sind. - System nach
Anspruch 1 , wobei die Vorverarbeitungseinheit aus einem Medianfilterverfahren besteht, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird. - System nach
Anspruch 1 , wobei die Glättung eine Normalisierung der Zeichengröße zur Skalierung der Zeichengröße innerhalb des Bildes auf eine Standardgröße umfasst. - Das System nach
Anspruch 1 , wobei die Merkmalsextraktionseinheit so konfiguriert ist, dass sie: ein vorverarbeitetes Bild liest; jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt; Merkmale aus den Pixeln jeder Zone durch Bewegen entlang der Diagonalen ihrer jeweiligen Pixel extrahiert, wobei jede Zone eine Gruppe von diagonalen Linien hat und die entlang jeder diagonalen Linie vorhandenen Vordergrundpixel summiert werden, um ein einzelnes Untermerkmal zu erhalten; Teilmerkmale aus jeder Zone ermittelt; und den Durchschnitt der Werte der Untermerkmale bestimmt, um einen einzelnen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung nacheinander für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren. - System nach
Anspruch 1 , wobei die BrainNet-Bibliothek verwendet wird, um das Modell der künstlichen Intelligenz für die Durchführung von Funktionen zur Erkennung handschriftlicher Zeichen zu trainieren. - System nach
Anspruch 1 , wobei das System ein Netzwerk-Helfer-Objekt umfasst, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, um verschiedene Parameter akzeptieren zu können.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE202022101842.1U DE202022101842U1 (de) | 2022-04-06 | 2022-04-06 | Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE202022101842.1U DE202022101842U1 (de) | 2022-04-06 | 2022-04-06 | Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz |
Publications (1)
Publication Number | Publication Date |
---|---|
DE202022101842U1 true DE202022101842U1 (de) | 2022-05-04 |
Family
ID=81654485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE202022101842.1U Active DE202022101842U1 (de) | 2022-04-06 | 2022-04-06 | Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE202022101842U1 (de) |
-
2022
- 2022-04-06 DE DE202022101842.1U patent/DE202022101842U1/de active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3689416T2 (de) | Mustermerkmalextraktion. | |
DE69329380T2 (de) | Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung | |
DE102017220307B4 (de) | Vorrichtung und Verfahren zum Erkennen von Verkehrszeichen | |
EP0780002B1 (de) | Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen | |
DE60130742T2 (de) | Mustererkennung mit hierarchischen Netzen | |
DE102017220896A1 (de) | Verfahren und Vorrichtung zur Sicherheitskontrolle | |
DE19705757A1 (de) | Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems | |
DE202022101590U1 (de) | Ein System zur Klassifizierung von Fernerkundungsbildern unter Verwendung fusionierter Faltungsmerkmale mit maschinellem Lernen | |
EP2082357B1 (de) | Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild | |
DE60031502T2 (de) | Verfahren und Vorrichtung zur Typbestimmung eines Formblatts | |
DE69623564T2 (de) | Gerät zur Extraktion von Fingerabdruckmerkmalen | |
DE69529015T2 (de) | Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition | |
DE69324977T2 (de) | Bitmap-bildsegmentierung unter anwendung eines ladungsmodells fuer pixels | |
DE69427735T2 (de) | Zeichenerkennungsgerät | |
EP2622540A1 (de) | Verfahren zur klassifizierung von mustern in bilddatensätzen | |
DE102019207566A1 (de) | Verfahren zur Steuerung eines Sicherheitssystems einer Ladestation zum Aufladen von Elektrofahrzeugen | |
DE202022101842U1 (de) | Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz | |
EP4046049A1 (de) | Abwehrgenerator, verfahren zur verhinderung eines angriffs auf eine ki-einheit und computerlesbares-speichermedium | |
DE69431393T2 (de) | Anlage zur Bilderkennung alphanumerischen Zeichen | |
DE102005025220B4 (de) | Gerät, Verfahren und Programm zum Beseitigen von Poren | |
DE202022107266U1 (de) | Ein Gesichtserkennungssystem zur Unterscheidung zwischen ähnlichen Gesichtern | |
DE202022105962U1 (de) | Ein System zur Erkennung von Blattschäden auf der Grundlage der Form | |
DE19507059B9 (de) | Verfahren zur omnidirektionalen Erfassung von OCR-Klarschrift auf Etiketten oder ähnlichen Datenträgern durch zufallsgesteuerte Suche und Dekodierung mit einem neuronalen Netzwerk | |
DE202024104811U1 (de) | Ein System zur Klassifizierung von Reiskörnern auf der Grundlage eines neuronalen Netzes zur Auswahl von Merkmalen | |
EP4287066B1 (de) | Bestimmen der modulgrösse eines optischen codes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R207 | Utility model specification | ||
R082 | Change of representative |
Representative=s name: LIPPERT STACHOW PATENTANWAELTE RECHTSANWAELTE , DE |