[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE202022101842U1 - Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz - Google Patents

Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz Download PDF

Info

Publication number
DE202022101842U1
DE202022101842U1 DE202022101842.1U DE202022101842U DE202022101842U1 DE 202022101842 U1 DE202022101842 U1 DE 202022101842U1 DE 202022101842 U DE202022101842 U DE 202022101842U DE 202022101842 U1 DE202022101842 U1 DE 202022101842U1
Authority
DE
Germany
Prior art keywords
characters
image
features
artificial intelligence
handwritten text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
DE202022101842.1U
Other languages
English (en)
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE202022101842.1U priority Critical patent/DE202022101842U1/de
Publication of DE202022101842U1 publication Critical patent/DE202022101842U1/de
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

Ein System zur Erkennung von handgeschriebenem Text, das System umfasst:
eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden;
eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln;
eine Segmentierungseinheit zur Erkennung von Zeichensegmenten durch neuronale Netze mit unterschiedlichen Netzparametern;
eine Merkmalsextraktionseinheit zum Extrahieren eines Satzes von Merkmalen aus jedem Zonenpixel durch Bewegen entlang der Diagonalen seiner jeweiligen Pixel; und
eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.

Description

  • BEREICH DER ERFINDUNG
  • Die vorliegende Offenbarung bezieht sich auf ein System zur Erkennung von handgeschriebenem Text, genauer gesagt auf ein auf einem Gehirnnetz und künstlicher Intelligenz basierendes System zur Erkennung von handgeschriebenem Text.
  • HINTERGRUND DER ERFINDUNG
  • Die Erkennung von handschriftlichen Ziffern und Zeichen hat in der heutigen elektronischen Umgebung aufgrund ihres praktischen Nutzens für viele alltägliche Aufgaben an Bedeutung gewonnen. Dies zeigt sich daran, dass in den letzten Jahren mehrere Erkennungssysteme für die Anwendung in verschiedenen Bereichen, in denen eine hohe Kategorisierungseffizienz erforderlich ist, entwickelt oder vorgeschlagen wurden. Systeme, die handschriftliche Buchstaben, Zeichen und Ziffern erkennen, unterstützen den Menschen bei anspruchsvolleren Aufgaben, die sonst zeit- und kostenaufwändig wären. Ein hervorragendes Beispiel ist der Einsatz von automatisierten Verarbeitungssystemen in Banken zur Bearbeitung von Bankschecks. Ohne automatisierte Systeme zur Bearbeitung von Bankschecks müsste die Bank eine große Anzahl von Mitarbeitern einstellen, die möglicherweise nicht so effizient wären wie das computergestützte Bearbeitungssystem.
  • Handschrifterkennungssysteme hingegen könnten sich an biologischen neuronalen Netzen orientieren, die Menschen und Tiere in die Lage versetzen, nichtlineare und komplizierte Zusammenhänge zu lernen und zu modellieren. Das heißt, sie können mit Hilfe eines künstlichen neuronalen Netzes erstellt werden. Die Gehirne der Menschen ermöglichen es ihnen, verschiedene Handschriften wie Ziffern, Buchstaben und Zeichen zu unterscheiden. Der Mensch hingegen ist voreingenommen, was bedeutet, dass er handgeschriebene Buchstaben und Ziffern möglicherweise anders wahrnimmt. Computergestützte Systeme hingegen sind unvoreingenommen und können extrem schwierige Aufgaben erledigen, für die Menschen sonst einen erheblichen Energie- und Zeitaufwand aufwenden müssten. Es ist notwendig zu verstehen, wie die von Menschen lesbare Unterschrift funktioniert.
  • Wenn Menschen handschriftliche Zeichen, Buchstaben, Wörter oder Ziffern lesen, ist ihr visuelles System stark gefordert. Das Lesen von Handschriften scheint unkompliziert zu sein, aber es ist nicht so einfach, wie viele denken. Obwohl alles unbewusst abläuft, kann eine Person dem, was sie sieht, eine Bedeutung geben, je nachdem, was ihr Gehirn gelehrt wurde. Einem Menschen ist vielleicht nicht bewusst, wie schwierig es ist, Probleme mit der Handschrift zu überwinden. Die Schwierigkeit der visuellen Mustererkennung wird erst deutlich, wenn man versucht, ein Computersystem zu entwickeln, das Handschriften lesen kann. Die Technik der künstlichen neuronalen Netze wird oft als die effektivste Methode zur Entwicklung von Systemen zur Erkennung von Handschriften angesehen. Vereinfacht gesagt, simulieren neuronale Netze, wie das menschliche Gehirn beim Lesen von Handschriften arbeitet. Dadurch können Maschinen die menschlichen Fähigkeiten beim Lesen von Handschriften erreichen oder sogar übertreffen.
  • In Anbetracht der vorangegangenen Diskussion wird deutlich, dass ein System zur Erkennung von handgeschriebenem Text erforderlich ist.
  • ZUSAMMENFASSUNG DER ERFINDUNG
  • Die vorliegende Offenlegung zielt darauf ab, ein System bereitzustellen, das die Erkennung von schriftunabhängigen Teilworteinheiten und Wörtern ermöglicht, indem die handschriftlichen Einzelstriche vor der Erkennung von Teilworteinheiten und Wörtern erkannt werden.
  • In einer Ausführungsform wird ein System zur Erkennung von handgeschriebenem Text offenbart. Das System umfasst eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden. Das System umfasst ferner eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln. Das System enthält ferner eine Segmentierungseinheit zur Erkennung von Segmenten des Zeichens durch neuronale Netze mit unterschiedlichen Netzparametern. Das System umfasst ferner eine Merkmalsextraktionseinheit, um einen Satz von Merkmalen aus jedem Zonenpixel zu extrahieren, indem es sich entlang der Diagonalen seiner jeweiligen Pixel bewegt. Das System umfasst ferner eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
  • In einer anderen Ausführungsform wird jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines künstlichen Intelligenzmodells bereitgestellt, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte künstliche Intelligenzmodell in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch ähnlich aussehende, aber unterschiedliche Zeichen unterschieden werden.
  • In einer anderen Ausführungsform besteht die Vorverarbeitungseinheit aus einem Medianfilterprozess, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird.
  • In einer anderen Ausführungsform umfasst die Glättung eine Normalisierung der Zeichengröße, um die Zeichengröße innerhalb des Bildes auf eine Standardgröße zu skalieren.
  • In einer anderen Ausführungsform ist die Merkmalsextraktionseinheit so konfiguriert, dass sie: ein vorverarbeitetes Bild liest; jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt; Merkmale aus den Pixeln jeder Zone extrahiert, indem sie sich entlang der Diagonalen ihrer jeweiligen Pixel bewegt, wobei jede Zone eine Gruppe von diagonalen Linien aufweist und die entlang jeder diagonalen Linie vorhandenen Vordergrundpixel summiert werden, um ein einzelnes Teilmerkmal zu erhalten; Erhalten von Untermerkmalen aus jeder Zone; und Mittelwertbildung von Untermerkmalen, um einen einzelnen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung sequentiell für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren.
  • In einer anderen Ausführungsform wird die BrainNet-Bibliothek verwendet, um das Modell der künstlichen Intelligenz für die Erkennung handschriftlicher Zeichen zu trainieren.
  • In einer anderen Ausführungsform umfasst das System ein Netzwerk-Helfer-Objekt, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, so dass verschiedene Parameter akzeptiert werden können.
  • Ein Ziel der vorliegenden Offenbarung ist die Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz.
  • Ein weiteres Ziel der vorliegenden Offenbarung ist die Umwandlung von handgeschriebenem Text in einen computergestützten Text.
  • Ein weiteres Ziel der vorliegenden Erfindung ist es, ein schnelles und kostengünstiges System zur Erkennung handgeschriebener Texte bereitzustellen.
  • Um die Vorteile und Merkmale der vorliegenden Offenbarung weiter zu verdeutlichen, wird eine genauere Beschreibung der Erfindung durch Bezugnahme auf bestimmte Ausführungsformen davon, die in den beigefügten Figuren dargestellt ist. Es versteht sich, dass diese Figuren nur typische Ausführungsformen der Erfindung darstellen und daher nicht als Einschränkung ihres Umfangs zu betrachten sind. Die Erfindung wird mit zusätzlicher Spezifität und Detail mit den begleitenden Figuren beschrieben und erklärt werden.
  • Figurenliste
  • Diese und andere Merkmale, Aspekte und Vorteile der vorliegenden Offenbarung werden besser verstanden, wenn die folgende detaillierte Beschreibung mit Bezug auf die beigefügten Figuren gelesen wird, in denen gleiche Zeichen gleiche Teile in den Figuren darstellen, wobei:
    • 1 ein Blockdiagramm eines Systems zur Erkennung von handgeschriebenem Text in Übereinstimmung mit einer Ausführungsform der vorliegenden Offenbarung zeigt.
  • Der Fachmann wird verstehen, dass die Elemente in den Figuren der Einfachheit halber dargestellt sind und nicht unbedingt maßstabsgetreu gezeichnet wurden. Die Flussdiagramme veranschaulichen beispielsweise das Verfahren anhand der wichtigsten Schritte, um das Verständnis der Aspekte der vorliegenden Offenbarung zu verbessern. Darüber hinaus kann es sein, dass ein oder mehrere Bauteile der Vorrichtung in den Figuren durch herkömmliche Symbole dargestellt sind, und dass die Figuren nur die spezifischen Details zeigen, die für das Verständnis der Ausführungsformen der vorliegenden Offenbarung relevant sind, um die Figuren nicht mit Details zu überfrachten, die für den Fachmann mit den hierin enthaltenen Beschreibungen leicht erkennbar sind.
  • DETAILLIERTE BESCHREIBUNG
  • Zum besseren Verständnis der Grundsätze der Erfindung wird nun auf die in den Figuren dargestellte Ausführungsform Bezug genommen und diese in einer speziellen Sprache beschrieben. Es versteht sich jedoch von selbst, dass damit keine Einschränkung des Umfangs der Erfindung beabsichtigt ist, wobei solche Änderungen und weitere Modifikationen des dargestellten Systems und solche weiteren Anwendungen der darin dargestellten Prinzipien der Erfindung in Betracht gezogen werden, wie sie einem Fachmann auf dem Gebiet der Erfindung normalerweise einfallen würden.
  • Der Fachmann wird verstehen, dass die vorstehende allgemeine Beschreibung und die folgende detaillierte Beschreibung beispielhaft und erläuternd für die Erfindung sind und nicht als einschränkend angesehen werden.
  • Wenn in dieser Beschreibung von „einem Aspekt“, „einem anderen Aspekt“ oder ähnlichem die Rede ist, bedeutet dies, dass ein bestimmtes Merkmal, eine bestimmte Struktur oder eine bestimmte Eigenschaft, die im Zusammenhang mit der Ausführungsform beschrieben wird, in mindestens einer Ausführungsform der vorliegenden Offenbarung enthalten ist. Daher können sich die Ausdrücke „in einer Ausführungsform“, „in einer anderen Ausführungsform“ und ähnliche Ausdrücke in dieser Beschreibung alle auf dieselbe Ausführungsform beziehen, müssen es aber nicht.
  • Die Ausdrücke „umfasst“, „enthaltend“ oder andere Variationen davon sollen eine nicht ausschließliche Einbeziehung abdecken, so dass ein Verfahren oder eine Methode, die eine Liste von Schritten umfasst, nicht nur diese Schritte einschließt, sondern auch andere Schritte enthalten kann, die nicht ausdrücklich aufgeführt sind oder zu einem solchen Verfahren oder einer solchen Methode gehören. Ebenso schließen eine oder mehrere Vorrichtungen oder Teilsysteme oder Elemente oder Strukturen oder Komponenten, die mit „umfasst...a“ eingeleitet werden, nicht ohne weitere Einschränkungen die Existenz anderer Vorrichtungen oder anderer Teilsysteme oder anderer Elemente oder anderer Strukturen oder anderer Komponenten oder zusätzlicher Vorrichtungen oder zusätzlicher Teilsysteme oder zusätzlicher Elemente oder zusätzlicher Strukturen oder zusätzlicher Komponenten aus.
  • Sofern nicht anders definiert, haben alle hierin verwendeten technischen und wissenschaftlichen Begriffe die gleiche Bedeutung, wie sie von einem Fachmann auf dem Gebiet, zu dem diese Erfindung gehört, allgemein verstanden wird. Das System, die Methoden und die Beispiele, die hier angegeben werden, dienen nur der Veranschaulichung und sind nicht als Einschränkung gedacht.
  • Ausführungsformen der vorliegenden Offenbarung werden im Folgenden unter Bezugnahme auf die beigefügten Figuren im Detail beschrieben.
  • In 1 ist ein Blockdiagramm eines Systems zur Erkennung von handgeschriebenem Text gemäß einer Ausführungsform der vorliegenden Offenbarung dargestellt. Das System 100 umfasst eine Bilderfassungseinheit 104, um mit einer Kamera 102 aufgenommene Bilder zu empfangen. Das aufgenommene Bild wird zur weiteren Verarbeitung in einer Datenbank gespeichert.
  • In einer Ausführungsform ist eine Vorverarbeitungseinheit 106 mit der Bilderfassungseinheit 104 verbunden, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten, um so Segmentraster unter Verwendung neuronaler Netze zu digitalisieren und in Binärwerte umzuwandeln.
  • In einer Ausführungsform ist eine Segmentierungseinheit 108 mit der Vorverarbeitungseinheit 106 verbunden, um Segmente des Zeichens durch neuronale Netze mit unterschiedlichen Netzparametern zu erkennen. Die Segmentierung erfolgt auf der Grundlage der Kantenerkennung und des Abstands zwischen den verschiedenen Zeichen. Nach der Segmentierung werden die unterteilten Teile beschriftet und dann einzeln weiterverarbeitet. Diese Beschriftung wird vorgenommen, um die Anzahl der Zeichen im gesamten Bild zu ermitteln. Die Segmentierungspunkte werden auch auf die Einbeziehung von Fehlerpunkten überprüft, indem alle Punkte mit dem durchschnittlichen Abstand zwischen zwei Segmentierungspunkten verglichen werden unvollständiges Bild
  • In einer Ausführungsform ist eine Merkmalsextraktionseinheit 110 mit der Segmentierungseinheit 108 verbunden, um einen Satz von Merkmalen aus jedem Zonenpixel zu extrahieren, indem sie sich entlang der Diagonalen der jeweiligen Pixel bewegt.
  • In einer Ausführungsform ist eine Klassifizierungs- und Erkennungseinheit 112 mit der Merkmalsextraktionseinheit 110 verbunden, um ein Modell der künstlichen Intelligenz zur Erkennung von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek zu trainieren, wobei der handgeschriebene Text durch Vergleich des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
  • In einer anderen Ausführungsform wird jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines künstlichen Intelligenzmodells bereitgestellt, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte künstliche Intelligenzmodell in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch ähnlich aussehende, aber unterschiedliche Zeichen unterschieden werden.
  • In einer anderen Ausführungsform besteht die Vorverarbeitungseinheit 106 aus einem Medianfilterverfahren, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird.
  • In einer anderen Ausführungsform umfasst die Glättung eine Normalisierung der Zeichengröße, um die Zeichengröße innerhalb des Bildes auf eine Standardgröße zu skalieren.
  • In einer anderen Ausführungsform ist die Merkmalsextraktionseinheit 110 so konfiguriert, dass sie ein vorverarbeitetes Bild liest. Dann wird jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt. Extrahieren Sie dann Merkmale aus den Pixeln jeder Zone, indem Sie sich entlang der Diagonalen der jeweiligen Pixel bewegen, wobei jede Zone eine Gruppe von diagonalen Linien hat und die Vordergrundpixel, die entlang jeder diagonalen Linie vorhanden sind, summiert werden, um ein einzelnes Teilmerkmal zu erhalten. Dann werden Untermerkmale aus jeder Zone ermittelt. Danach werden die Werte der Untermerkmale gemittelt, um einen einzigen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung nacheinander für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren.
  • In einer anderen Ausführungsform wird die BrainNet-Bibliothek verwendet, um das Modell der künstlichen Intelligenz für die Erkennung handschriftlicher Zeichen zu trainieren.
  • In einer anderen Ausführungsform umfasst das System ein Netzwerk-Helfer-Objekt, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, so dass verschiedene Parameter akzeptiert werden können.
  • Die Figuren und die vorangehende Beschreibung geben Beispiele für Ausführungsformen. Der Fachmann wird verstehen, dass eines oder mehrere der beschriebenen Elemente durchaus zu einem einzigen Funktionselement kombiniert werden können. Alternativ dazu können bestimmte Elemente in mehrere Funktionselemente aufgeteilt werden. Elemente aus einer Ausführungsform können einer anderen Ausführungsform hinzugefügt werden. So kann beispielsweise die Reihenfolge der hier beschriebenen Prozesse geändert werden und ist nicht auf die hier beschriebene Weise beschränkt. Außerdem müssen die Handlungen eines Flussdiagramms nicht in der gezeigten Reihenfolge ausgeführt werden; auch müssen nicht unbedingt alle Handlungen durchgeführt werden. Auch können diejenigen Handlungen, die nicht von anderen Handlungen abhängig sind, parallel zu den anderen Handlungen ausgeführt werden. Der Umfang der Ausführungsformen ist durch diese spezifischen Beispiele keineswegs begrenzt. Zahlreiche Variationen sind möglich, unabhängig davon, ob sie in der Beschreibung explizit aufgeführt sind oder nicht, wie z. B. Unterschiede in der Struktur, den Abmessungen und der Verwendung von Materialien. Der Umfang der Ausführungsformen ist mindestens so groß wie in den folgenden Ansprüchen angegeben.
  • Vorteile, andere Vorzüge und Problemlösungen wurden oben im Hinblick auf bestimmte Ausführungsformen beschrieben. Die Vorteile, Vorzüge, Problemlösungen und Komponenten, die dazu führen können, dass ein Vorteil, ein Nutzen oder eine Lösung auftritt oder ausgeprägter wird, sind jedoch nicht als kritisches, erforderliches oder wesentliches Merkmal oder Komponente eines oder aller Ansprüche zu verstehen.
  • Bezugszeichenliste
  • 100
    Ein System zur Erkennung von handgeschriebenem Text
    102
    Kamera
    104
    Bilderfassungseinheit
    106
    Vorverarbeitungseinheit
    108
    Segmentierungseinheit
    110
    Einheit zur Merkmalsextraktion
    112
    Einheit für Klassifizierung und Erkennung

Claims (7)

  1. Ein System zur Erkennung von handgeschriebenem Text, das System umfasst: eine Bilderfassungseinheit zum Empfang von Bildern, die mit einer Kamera aufgenommen wurden; eine Vorverarbeitungseinheit, um Zeichen oder Teile von Zeichen aus dem Bild zu extrahieren und dabei die extrahierten Zeichen oder Teile von Zeichen zu filtern und zu glätten und dabei Segmentraster unter Verwendung neuronaler Netze zu digitalisieren, um sie in Binärwerte umzuwandeln; eine Segmentierungseinheit zur Erkennung von Zeichensegmenten durch neuronale Netze mit unterschiedlichen Netzparametern; eine Merkmalsextraktionseinheit zum Extrahieren eines Satzes von Merkmalen aus jedem Zonenpixel durch Bewegen entlang der Diagonalen seiner jeweiligen Pixel; und eine Klassifizierungs- und Erkennungseinheit zum Trainieren eines Modells der künstlichen Intelligenz zum Erkennen von handgeschriebenem Text unter Verwendung einer Gehirnnetzbibliothek, wobei der handgeschriebene Text durch Vergleichen des extrahierten Satzes von Merkmalen mit den in der Gehirnnetzbibliothek verfügbaren Schwellenmerkmalen erkannt wird.
  2. System nach Anspruch 1, wobei jedes der digitalisierten Segmente als Eingabe für jeden Knoten eines Modells der künstlichen Intelligenz bereitgestellt wird, das speziell für das Training des Segments entwickelt wurde, wobei das für die Segmente trainierte Modell der künstlichen Intelligenz in der Lage ist, sie zu erkennen, wobei zu diesem Zeitpunkt auch Zeichen unterschieden werden, die ähnlich aussehen, aber unterschiedlich sind.
  3. System nach Anspruch 1, wobei die Vorverarbeitungseinheit aus einem Medianfilterverfahren besteht, bei dem jedes Pixel im Bild betrachtet und die benachbarten Pixel auf der Grundlage ihrer Intensitäten in eine Reihenfolge gebracht werden, wodurch der ursprüngliche Wert des Pixels durch den Medianwert aus der Liste ersetzt wird.
  4. System nach Anspruch 1, wobei die Glättung eine Normalisierung der Zeichengröße zur Skalierung der Zeichengröße innerhalb des Bildes auf eine Standardgröße umfasst.
  5. Das System nach Anspruch 1, wobei die Merkmalsextraktionseinheit so konfiguriert ist, dass sie: ein vorverarbeitetes Bild liest; jedes Zeichenbild aus Pixeln in 4 gleiche Zonen unterteilt; Merkmale aus den Pixeln jeder Zone durch Bewegen entlang der Diagonalen ihrer jeweiligen Pixel extrahiert, wobei jede Zone eine Gruppe von diagonalen Linien hat und die entlang jeder diagonalen Linie vorhandenen Vordergrundpixel summiert werden, um ein einzelnes Untermerkmal zu erhalten; Teilmerkmale aus jeder Zone ermittelt; und den Durchschnitt der Werte der Untermerkmale bestimmt, um einen einzelnen Merkmalswert zu bilden und in der entsprechenden Zone zu platzieren, wobei die Mittelwertbildung nacheinander für alle Zonen des Bildes wiederholt wird, um einen Satz von Merkmalen für jedes Bild zu extrahieren.
  6. System nach Anspruch 1, wobei die BrainNet-Bibliothek verwendet wird, um das Modell der künstlichen Intelligenz für die Durchführung von Funktionen zur Erkennung handschriftlicher Zeichen zu trainieren.
  7. System nach Anspruch 1, wobei das System ein Netzwerk-Helfer-Objekt umfasst, um das Modell der künstlichen Intelligenz zu trainieren, indem Bilder und die entsprechenden ASCII-Codes direkt hinzugefügt werden, wobei die Methode zum Hinzufügen von Trainingsdaten der Netzwerk-Helfer-Klasse überladen ist, um verschiedene Parameter akzeptieren zu können.
DE202022101842.1U 2022-04-06 2022-04-06 Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz Active DE202022101842U1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE202022101842.1U DE202022101842U1 (de) 2022-04-06 2022-04-06 Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE202022101842.1U DE202022101842U1 (de) 2022-04-06 2022-04-06 Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz

Publications (1)

Publication Number Publication Date
DE202022101842U1 true DE202022101842U1 (de) 2022-05-04

Family

ID=81654485

Family Applications (1)

Application Number Title Priority Date Filing Date
DE202022101842.1U Active DE202022101842U1 (de) 2022-04-06 2022-04-06 Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz

Country Status (1)

Country Link
DE (1) DE202022101842U1 (de)

Similar Documents

Publication Publication Date Title
DE3689416T2 (de) Mustermerkmalextraktion.
DE69329380T2 (de) Verfahren zum Segmentieren von Bildern und Klassifizieren von Bildelementen zur Dokumentverarbeitung
DE102017220307B4 (de) Vorrichtung und Verfahren zum Erkennen von Verkehrszeichen
EP0780002B1 (de) Verfahren und vorrichtung zur rekonstruktion von in rasterform vorliegenden linienstrukturen
DE60130742T2 (de) Mustererkennung mit hierarchischen Netzen
DE102017220896A1 (de) Verfahren und Vorrichtung zur Sicherheitskontrolle
DE19705757A1 (de) Verfahren und Gerät für das Design eines hoch-zuverlässigen Mustererkennungs-Systems
DE202022101590U1 (de) Ein System zur Klassifizierung von Fernerkundungsbildern unter Verwendung fusionierter Faltungsmerkmale mit maschinellem Lernen
EP2082357B1 (de) Vorrichtung, verfahren und computerprogramm zur erkennung von schriftzeichen in einem bild
DE60031502T2 (de) Verfahren und Vorrichtung zur Typbestimmung eines Formblatts
DE69623564T2 (de) Gerät zur Extraktion von Fingerabdruckmerkmalen
DE69529015T2 (de) Schnelligkeits- und Erkennungsverbesserung für OCR mittels normalisierter Höhen-/Breitenposition
DE69324977T2 (de) Bitmap-bildsegmentierung unter anwendung eines ladungsmodells fuer pixels
DE69427735T2 (de) Zeichenerkennungsgerät
EP2622540A1 (de) Verfahren zur klassifizierung von mustern in bilddatensätzen
DE102019207566A1 (de) Verfahren zur Steuerung eines Sicherheitssystems einer Ladestation zum Aufladen von Elektrofahrzeugen
DE202022101842U1 (de) Ein System zur Erkennung von handgeschriebenem Text mit Hilfe von Brain Net und künstlicher Intelligenz
EP4046049A1 (de) Abwehrgenerator, verfahren zur verhinderung eines angriffs auf eine ki-einheit und computerlesbares-speichermedium
DE69431393T2 (de) Anlage zur Bilderkennung alphanumerischen Zeichen
DE102005025220B4 (de) Gerät, Verfahren und Programm zum Beseitigen von Poren
DE202022107266U1 (de) Ein Gesichtserkennungssystem zur Unterscheidung zwischen ähnlichen Gesichtern
DE202022105962U1 (de) Ein System zur Erkennung von Blattschäden auf der Grundlage der Form
DE19507059B9 (de) Verfahren zur omnidirektionalen Erfassung von OCR-Klarschrift auf Etiketten oder ähnlichen Datenträgern durch zufallsgesteuerte Suche und Dekodierung mit einem neuronalen Netzwerk
DE202024104811U1 (de) Ein System zur Klassifizierung von Reiskörnern auf der Grundlage eines neuronalen Netzes zur Auswahl von Merkmalen
EP4287066B1 (de) Bestimmen der modulgrösse eines optischen codes

Legal Events

Date Code Title Description
R207 Utility model specification
R082 Change of representative

Representative=s name: LIPPERT STACHOW PATENTANWAELTE RECHTSANWAELTE , DE