DE1549930B2 - Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen - Google Patents
Einrichtung zum Erkennen vorzugsweise handgeschriebener SchriftzeichenInfo
- Publication number
- DE1549930B2 DE1549930B2 DE1549930A DET0035145A DE1549930B2 DE 1549930 B2 DE1549930 B2 DE 1549930B2 DE 1549930 A DE1549930 A DE 1549930A DE T0035145 A DET0035145 A DE T0035145A DE 1549930 B2 DE1549930 B2 DE 1549930B2
- Authority
- DE
- Germany
- Prior art keywords
- zone
- form elements
- submatrices
- characters
- zones
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/166—Normalisation of pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/168—Smoothing or thinning of the pattern; Skeletonisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
- G06V30/18019—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Description
Die Erfindung betrifft eine Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der
ein Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert
und verdünnt sowie auf das Vorliegen vorbestimmter Formelemente untersucht wird, und bei der die
ermittelten Formelemente untersucht wird, und bei der die ermittelten Formelemente mit vorgezeichneten
Standardmustern verglichen werden, wobei bei ausreichender Übereinstimmung ein dem Schriftzeichen
entsprechendes Ausgabezeichen bewirkt wird.
Aus der Siemens-Zeitschrift, April 1963, Seiten 213 bis
215 ist es bekannt, Größe und gegenseitigen Abstand einzelner Linien von Schriftzeichen zu deren Erkennung
auszuwerten. Das Erfordernis weitgehender Übereinstimmung erschwert bereits die Abtastung und setzt die
Benutzung einer vorgegebenen Schriftart voraus. Sollten dagegen unterschiedliche Schriftarten insbesondere
aber auch handgeschriebene Schriftzeichen, gelesen werden können, so werden gemäß der
angegebenen Zeitschrift zweckmäßig die Schriftzeichen in Formelemente aufgelöst, deren Beschreibung mit der
vorgegebener Muster verglichen wird. Werden hierbei an Stelle absoluter Maße relative Maße eingeführt, so
wird eine gewisse Unabhängigkeit von der jeweiligen Schriftgröße erzielt, und es ist möglich, an sich bekannte,
wirkungsvolle statische Methoden der Störverminderung wie die Digitalisierung und die Verdünnung
einzusetzen, ohne die Erkennbarkeit der Zeichen hierdurch wesentlich zu beeinträchtigen.
Die US-PS 32 68 864 empfiehlt, eine Vielzahl von Merkmalen von Formelementen zu ermitteln, aufgrund
deren das dargestellte Zeichen erkennbar ist Die Vielzahl solcher Merkmale kompliziert nicht nur den
Aufbau der zum Erkennen von Schriftzeichen vorgesehenen Einrichtung, auch die zum Vergleich beigegebenen
Standardmuster werden vielfältig und umfangreich, so daß auch in diesem Falle die zugehörigen
Vorrichtungen komplex, umfangreich und aufwendig werden, und die bei handgeschriebenen Schriftzeichen
vielfach auftretenden Abweichungen erschweren das Erkennen und geben eine relativ hohe Quote nicht
identifizierbarer Schriftzeichen.
Die Erfindung geht von der Aufgabe aus, eine Einrichtung der beschriebenen Gattung zu schaffen, die
bei relativ geringem Aufwand auch bei stark aufweichenden Größen und Formen von Schriftzeichen durch
Berücksichtigen der Kontinuität des Schriftzeichens sowie der Lage der Anbindungsstelle eines abwärts
führenden Schriftzuges auf einem über diesem am Zeichenanfang befindlichen Horizontalstrich eine hohe
Identifizierungsquote ergibt Gelöst wird diese Aufgabe mit der im Patentanspruch 1 angegebenen Merkmalskombination.
Eine vorteilhafte Weiterbildung der Erfindung ist im Unteranspruch aufgeführt
Im einzelnen werden die Merkmale der Erfindung anhand der folgenden Beschreibung eines Ausführungsbeispiels in Verbindung mit dieses darstellenden
Zeichnungen erläutert Es zeigen hierbei
F i g. 1 im stark vereinfachten Blockschaltbild eine Einrichtung zum maschinellen Lesen handgeschriebener
Schriftzeichen,
F i g. 2 ein Diagramm zur Erläuterung der matrixartigen Aufteilung eines Schriftzeichens durch den Abtastzeilenraster
und dessen Unterteilung,
F i g. 3 ausführlicher dargestellt zum Erkennen einfacher Formelemente vorgesehene Vorrichtungen der
Fig. 1,
Fig.4 eine Aufstellung einfacher Formelemente sowie deren Verschlüsselung,
Fig.5 eine Aufstellung mit der Einrichtung nach
F i g. 1 ermittelbarer komplexer Formelemente sowie
deren Verschlüsselung,
Fig.6 eine Vorrichtung zur Ermittlung einer Verbindungen benachbarter Kodezeichen kennzeichnenden
Zusatzmarkierung,
Fig.7 und 9 die Raster zweier handgeschriebener
Schriftzeichen,
Fig.8 und 10 tabellenartig die Verschlüsselung der
Formelemente der Schriftzeichen nach F i g. 7 und 9, und
F i g. 11 nebeneinandergestellt die Matrix eines Schriftzeichens und die Kodebezeichnungen der in den
einzelnen Zonen ermittelten Formelemente.
In F i g. 1 ist eine Einrichtung zum maschinellen Lesen von handgeschriebenen Schriftzeichen im stark vereinfachten
Blockschaltbild dargestellt Auf dem Aufzeichnungsträger 1 ist als Beispiel eines zu lesenden
Schriftzeichens die Ziffer »8« dargestellt Dieses Schriftzeichen wird mittels eines optischen Systems 2
auf dem Schirm einer Fernsehkamera 3 abgebildet, welche die Abbildung des Schriftzeichens rasterförmig
abtastet und die erhaltene Signalfolge dem Triggerverstärker 4 zuführt, der die Signalfolge digitalisiert, d. h., in
eine Signalfolge wandelt, die zwischen zwei Pegeln wechselt.
Die digitalisierte Signalfolge wird dem Eingangskreis 5 zugeführt, in dem die Signalfolge gespeichert wird,
wobei gleichzeitig die anschließende Auswertung erleichternde bzw. sichernde Vorgänge durchgeführ:
werden: So wird die Lage der durch die Abtastung erhaltenen Bildmatrix ermittelt und gegebenenfalls
korrigiert, die Bildmatrix durch Vergrößern oder Verkleinern der Kapazität der zum Lesen benutzten
Speicher angeglichen und in an sich bekannter Weise wird die Bildmatrix des Schriftzeichens verdünnt
Mittels der Zonenwahlvorrichtung 6 werden aus der Matrix des in einen Speicher eingelesenen Schriftzeichens
einzelne parallele Zonen ausgeblendet und einem Detektorkreis 7 für einfache Formelemente zugeführt
der im Vergleich mit dem Speicher 8 festgehaltenen Normal-Formelementen Submatrizes der Zonen auf
einfache Formelemente untersucht. Die Symbole der aufgefundenen Formelemente werden dem Detektor 9
für komplexe Formelemente zugeführt, der aufgrund der Verknüpfung von durch Submatrizes jeweils einer
Zone ermittelten einfachen Formelemente und im Vergleich mit im Speicher 10 enthaltenen Zonenkennzeichen
zonenweise komplexe Formelemente analysiert und aufgrund deren Kodierung das abgetastete Zeichen
ermittelt und dem Ausgabekreis 11 zur Auslösung des Ausgabezeichens überstellt.
Im Ausführungsbeispiel ist gemäß der Darstellung in Fig.2 eine Abtastung des Aufzeichnungsträgers in
achtundzwanzig Abtastzeilen zu je dreißig Bildpunkten vorgesehen. In der Figur ist dies angedeutet indem vor
und hinter jeder Zeile der die Signale 12 des abgetasteten und zu lesenden Schriftzeichens aufweisenden
Bildmatrix 13 ein kleiner Kreis 14 dargestellt ist, und über der Matrix sind entsprechende Kreise 15
gezeigt welche die Anzahl der Bildpunkte bzw. Bits innerhalb einer Zeile darstellen. Die im Ausführungsbeispiel
eine Kapazität von 28 χ 30 Bits aufweisende Bildmatrix 13 ist in dreizehn horizontale, vertikal
übereinander liegende Zonen 16 unterteilt die jeweils durch die Zonenwahlvorrichtung 6 der F i g. 1 ausblendbar
sind, und die jeweils drei Abtastzeilen umfassen, wobei einander benachbarte Zonen 16 sich um jeweils
eine Abtastzeile überlappen. Im Verlaufe der weiteren Bearbeitung der Signale im Detektor 9 der F i g. 1
werden die Zonen in Zeilenrichtung in achtundzwanzig Submatrizes 17 unterteilt die im Ausführungsbeispiel
jeweils 3x3 Bits umfaßen.
Im einzelnen soll der Auswertungsvorgang nunmehr anhand detaillierter Blockschaltbilder erläutert werden.
Vom Triggerverstärker 4 der F i g. 1 aus werden die durch die Abtastung des Aufzeichnungsträgers 1
gewonnenen Signalfolgen dem Eingangskreis 5 zugeführt und in diesem, wie oben beschrieben, aufbereitet,
ίο insbesondere verdünnt und in einer Speichervorrichtung
500 der F i g. 3 gespeichert Die Kapazität dieses Digitalspeichers 500 entspricht einem Schriftzeichen
bzw. der gesamten Bildmatrix 13 und beträgt im Ausführungsbeispiel 28 χ 30 Bits.
Die Aufteilung der einer Bildmatrix zugehörigen Signalfolgen in die einzelnen Zonen und damit das
Arbeiten der Zonenwahlvorrichtung 6 der F i g. 1 wird anhand der Fig.3 erläutert Die die überarbeitete
Bildmatrix enthaltende Speichervorrichtung 500 wird mittels der Abfragestufe 60 zeilenweise abgefragt, und
die ermittelten Signale werden dem eine Kapazität von drei Zeilen aufweisenden und durch den Taktgeber 62
geschalteten Zonenregister 61 zugeführt Nach Einbringen der drei Zeilen entsprechenden Signalfolgen
werden die Signale im Zonenregister 61 taktweise nach rechts verschoben, und die jeweils in den letzten neun
Zellen anstehenden, eine Submatrix darstellenden Signale werden zur Ermittlung der durch sie dargestellten
einfachen Formelemente einem Detektorkreis 70 zugeführt. Nach dreißigfacher Verschiebung ist die erste
Zone 16 der F i g. 2 untersucht und die mittlere sowie die untere, jeweils einer Zeile entsprechende Abteilung
des Zonenregisters 61 sind geleert, doch ist gleichzeitig der Inhalt der die untere Zeile repräsentierenden
Speicherzellen in die Speicherzellen der oberen Zeile übertragen worden. Zur Auswertung der nächsten Zone
überträgt daher die Abfragestufe 60 die Signalfolgen der folgenden beiden Zeilen aus der Speichervorrichtung
500 in die mittlere und untere Abteilung des Zonenregisters 61. So werden nacheinander die
dreizehn Zonen untersucht, wobei innerhalb der Zone jeweils aufeinanderfolgende einander überlappende
Submatrizes dem Detektorkreis 70 zur Auswertung übermittelt werden.
Aufgabe des Detektorkreises 70 ist es, die ihm aufeinanderfolgend zugeführten Submatrizes auf das
Vorliegen einfacher Formelemente zu untersuchen. Gemäß Fig.4 werden hierbei sieben Ergebnisse
unterschieden, die mit Ziffern 0 bis 6 bezeichnet sind,
so und denen die Auswertung erleichternde Symbole
zugeordnet sind. Hierbei wird unterschieden zwischen 0: »Submatrix ohne Formelement«, 1: »vertikaler
Strich«, 2: »steigender Schrägstrich«, 3: »fallender Schrägstrich«, 4: »oberer horizontaler Strich«, 5:
»unterer horizontaler Strich«, und 6: »andere und mit den vorhergehenden nicht identifizierbaren Zeichen«.
Der Detektorkreis 70 gibt die Auswertergebnisse jeder untersuchten Submatrix kodiert über seinen
Ausgang 63 ab. Ist eine Auswertung nicht möglich, weil die Verdünnung oder aber die Verkleinerung als
Anpassung an das vorgegebene Matrixfeld nicht weit genug getrieben wurden, so wird über den Ausgang 64
ein Signal abgegeben, das anzeigt, daß die Identifizierung
unmöglich ist Daraufhin findet eine weitere Aufbereitung des Zeichens, gegebenenfalls unter erneuter
Abtastung, statt
Eine sichere Erkennung handgeschriebener Schriftzeichen, insbesondere, wenn sie sich nicht nur auf
Ziffern beschränken, ist allein aufgrund der durch den Detektorkreis 70 ermittelten einfachen Formelemente
und ihrer Lage innerhalb der Bildmatrix sowohl umständlich als auch aufwendig und unsicher, wenn
übliche Vergleichsmethoden eingesetzt werden. Es wird daher der Ausgang 63 des Detektorkreises 70 gemäß
F i g. 1 mit dem Detektor 9 verbunden, der in der Lage ist, auch kompliziertere Formelemente zu ermitteln.
Erläutert wird dies anhand der F i g. 5. Werden, wie dies bei den ersten fünf Beispielen gezeigt ist, bei
Hinzuziehen der Auswertergebnisse der benachbarten Submatrizes keine weiteren Einzelheiten entdeckt, so
werden die aus Fig.4 bekannten einfachen Formelemente
durch einen Kode bezeichnet. Wird dagegen ermittelt, daß einfache Formelemente zu Bogen oder
geschwungenen Kurven verbunden sind, mehrfach parallel angeordnet sind oder sich verzweigen, so
werden zur weiteren Auswertung nunmehr diese komplexen, beim Vergleich von in einer Zone
aufeinanderfolgenden Submatrizes gewonnenen Formelemente durch Kodebezeichnungen fixiert.
Vorgesehen sind gemäß Fig.5 die Formelemente:
»kein Formelement«, »vertikaler Strich«, »steigender Schrägstrich«, »fallender Schrägstrich«, »Horizontalstrich«,
»nach oben geöffnete konvexe Kurve«, »nach unten geöffnete konvexe Kurve«, »zwei parallele
vertikale Striche«, »Sinuskurve, bei der eine Halbperiode auch flach ausgebildet sein kann«, »Spiegelkurve zur
vorhergehenden» drei vertikale Striche«, »ein Vertikalstrich mit nachgeordneter, nach unten geöffneter
konvexer Kurve«, »nach unten konvexe Kurve mit folgendem Vertikalstrich«, »Vertikalstrich, gefolgt von
Horizontalstrich«, »Horizontalstrich, gefolgt von Vertikalstrich«, und »verzweigte Kurve in Form eines
liegenden F oder E«. Auch hier kann ein weiters Zeichen vorgesehen sein, das die Nichtauswertbarkeit
anzeigt und durch Auslösung einer Änderung des Erfassungsfeldes, der Verdünnung und/oder Verkleinerung
die Erkennbarkeit des untersuchten Schriftzeichens verbessert.
Parallel zur Ermittlung der Kodezeichen für komplexe Formelemente werden die Verbindungsverhältnisse
benachbarter Submatrizes aufeinanderfolgender Zonen der Matrix untersucht und gegebenenfalls eine Zusatzmarkierung
ausgelöst, wenn an eine vorbestimmte der Hälften eines am Zeichenanfang stehenden Horizontalstriches
sich ein abwärts weisender Vertikalstrich anschließt und im übrigen ein Zusammenhang zwischen
benachbarten Formelementen aufeinanderfolgender Zonen besteht Die Ableitung einer solchen Zusatzmarkierung
wird an Hand der Fig.6 erläutert, wobei
Verbindungen zwischen komplexen Formelementen am Zeichenanfang nur dann zur Auslösung von Zusatzmarkierungen
führen, wenn ein abwärts weisendes Formelement mittig oder linksseitig an einen Horizontalstrich
anschließt
Das in F i g. 6 dargestellte dreißgstellige Register 800
übernimmt die Kodezeichen für primäre Formelemente vom Ausgang des Detektorkreises 70 und gibt sie an
eine Schlüsselstufe 801 weiter, die für den Kodewert »0« der F i g. 4, d. h. für eine Submatrix ohne Formelement,
auch am Ausgang einen Binärwert »0« liefert, während für die in F i g. 4 mit 1 bis 6 bezeichneten Formelemente
der binäre Ausgangswert »1« abgegeben wird. Dem Ausgang der Schlüsselstufe 802 sowie eine Schaltstufe
803 nachgeordnet Vor Beginn der Auswertung einer Matrix wird die Schaltstufe 803 gesperrt so daß sie die
ihr von der Schlüsselstufe 801 zugeführten Signale nicht an die ihr nachgeschalteten und in Serie betriebenen
Schieberegister 804 und 806 weiterzugeben vermag. Die zunächst von der Schlüsselstufe 801 abgegebenen
Binärwerte »0« vermögen auch die vor Beginn der Auswertung in den Ausgangszustand zurückgeschaltete
Zählstufe 802 nicht zu beeinflussen. Vom Auftreten des ersten Binärwertes »1« am Ausgange der Schlüsselstufe
801 an jedoch zählt die dreiwertige Zählstufe 801 die von dieser abgegebenen Signale und gibt nach
Eintreffen des dritten Signales ein Ausgangssignal ab, das der Schaltstufe 803 zugeführt wird und diese öffnet.
Über diese Schaltstufe 803 werden damit die nunmehr am Ausgang der Schlüsselstufe 801 auftretenden
Ausgangssignale nacheinander in das Schieberegister 804 synchron mit der Ermittlung der Symbole für
einfache Formelemente übertragen, und nach Füllung des Schieberegisters 804 werden dessen überlaufende
Impulse dem Schieberegister 806 übermittelt, dessen Kapazität der Anzahl der Submatrizes je Zone
angepaßt ist Die drei letzten Speicherzellen des Schieberegisters 804 sind mit drei Eingängen einer
Oder-Stufe 805 verbunden, deren Ausgang zur Und-Stufe 807 führt. Der zweite Eingang der Und-Stufe 807
steht mit der vorletzten Speicherzelle des Schieberegisters 806 in Verbindung. Damit tritt am Ausgange der
Und-Stufe 807 stets dann ein Signal auf, das zur Auslösung der Zusatzmarkierung dient bzw. als diese
selbst gilt, wenn in mindestens einer der drei letzten Speicherzellen des Schieberegisters 804 und der
vorletzten Speicherzelle des Schieberegisters 806 eine »1« auftreten. Dieses ist stets dann der Fall, wenn in
einer Submatrix einer Zone mindestens in einer der orthogonal oder diagonal unter dieser stehenden
Submatrizes gleichzeitig Binärwerte »1« auftreten, wobei jedoch infolge der durch das Zusammenwirken
der Schaltstufe 803 mit der Zählstufe 802 der erste Binärwert »1« sowie die beiden folgenden Binärwerte
unterdrückt werden, so daß die Anbindung an ein den unterdrückten Binärwerten am Zeichenanfang entsprechendes
Formelement bei der Bildung der Zusatzmarkerung nicht berücksichtigt wird.
Die Vorteile einer solchen Zusatzmarkierung und deren Aussagemöglichkeiten werden anhand der F i g. 7
bis 10 erläutert. Die Fig.7 bzw. 9 zeigen den Belegungszustand einer Speichermatrix, der beim
Abtasten von Schriftzeichen »3« bzw. »5« des Aufzeichnungsträgers 1 erhalten wird. Die F i g. 8 bzw.
10 zeigen die sich in den einzelnen Zonen der Matrizes
der F i g. 7 und 9 für die Formelemente sich ergebenden Symbole sowie ggf. die als Stern dargestellte Zusatzmarkierung.
Wie der Vergleich der F i g. 8 und 10 zeigt, sind die Symbole der Formelemente der beiden zu
erkennenden Ziffern gleich. Der wesentliche Unterschied zwischen den Ziffern liegt darin, daß die
steigenden Linien (Symbol: INC) im Falle der F i g. 7 an das rechte Ende des Horizontalstriches (Symbol: BAR)
anschließen, während die entsprechend geneigte Linie bei der »5« der F i g. 9 am linken Ende anschließt. In der
obersten der ein Symbol aufweisenden Zonen fehlt die Zusatzmarkierung in beiden Fällen, da eine weitere
Verbindung in eine höhere Zone nicht besteht sondern das Zeichen hier endet In der folgenden niedrigeren
Zone fehlt wegen des Rechtsanschlusses des Schrägstriches in Fig.7 die Zusatzmarkierung in Fig.8. Wegen
der Linksanbindung des Schrägstriches in Fig.9 ist diese Zusatzmarkierung in Fig. 10 vorhanden, so daß
die Kodierungen beider Ziffern sich im wesentlichen durch das Fehlen bzw. Vorhandensein dieser Zusatz-
markierung unterscheiden. Die vollständige Auswertung innerhalb einer Zone, im folgenden als »Zonenkennwert«
bezeichnet, umfaßt also den Kode des Formkennwertes in Verbindung mit der Zusatzmarkierung.
Die Behandlung der Zonenkennwerte erfolgt, durch eine Zonensteuervorrichtung bestimmt, zonenweise
nacheinander in der Reihenfolge der Ordnungsnummern der Zonen. Hierbei wird einem Koinzidenzkreis
vom Speicher 10 für komplexe Formelemente des Detektors 9 deren Symbol zugeführt, während die
Und-Stufe 807 der F i g. 6 dem Koinzidenzkreis die zugehörige Zusatzmarkierung zuführt, so daß die
kompletten Zonenkennwerte am Koinzidenzkreis anliegen.
Die Anzal der möglichen Zonenkennwerte beträgt im erläuterten Beispiel also 16 χ 2 = 32, so daß die
Kodierung auf diese Anzahl abzustellen ist. Sind so durch den Detektor 9 der F i g. 1 für alle Zonen
nacheinander die Zonenkennwerte bestimmt, so können sie mit im Speicher 10 vorgespeicherten Zonenkennwerten
verglichen werden, und im Falle der Übereinstimmung wird der Kode des identifizierten Schriftzeichens
vom Ausgangskreis 11 abgegeben.
Praktisch erläutert wird das Lesen eines handgeschriebenen Schriftsatzes nunmehr anhand der beispielhaft
gewählten Ziffer »7« in Verbindung mit F i g. 11. Im linken Teil dieser Figur ist, angedeutet durch die
daneben und darüber dargestellten Kreise 14 und 15, eine Matrix dargestellt, in die das Bild des Schriftzeichens
»7« nach elektrooptischer Ablesung des handgeschriebenen Schriftzeichens vom Aufzeichnungsträger
1 und Digitalisierung, Größenanpassung sowie Verdünnung des Abtastergebnisses eingespeichert ist. Dieses
Speicherergebnis wird nunmehr nacheinander in einander überlappenden Zonen 1 bis 13 untersucht, deren
Ordnungsnummern in der vorletzten Spalte für die jeweils oberen beiden der drei Abtastzeilen einer Zone
angegeben sind. Die Abtastergebnisse innerhalb der im Ausführungsbeispiel 3 χ 3 Bit großen Submatrizes sind
in der breiten mittleren Spalte der F i g. 11 im einzelnen
aufgeführt, die beim Vergleich aufeinanderfolgender Submatrizes einer Zone ermittelten Bezeichnungen für
komplexe Formelemente sind durch Buchstaben in der rechts stehenden Spalte angezeigt, und die folgende, als
Stern dargestellte Zusatzmarkierung gibt die Verbindungsverhältnisse an, die beim Vergleich übereinander
liegender Submatrizes ermittelt werden, so daß diese Spalte die Folge der Zonenkennwerte und damit die
Ausgangskodierung für die durch Vergleich bewirkte Identififzierung enthält.
Zunächst werden innerhalb der Zonen jeweils drei in Zonenrichtung aufeinander folgende Speicherzellen
untersucht. In den ersten beiden Zonen beträgt die Breite des Zeichens »0«, und infolge fehlender
Einspeicherungen werden auch weder einfache noch komplexe Formelemente festgestellt.
In der dritten Zone, die sich bis zur siebenden Abtastzeile erstreckt, wird das einfache Formelement
horizontaler Strich« mit der Bezeichnung 5 bzw. das Symbol L der F i g. 4 dreifach ermittelt, und der in der
rechten Spalte der Figur dargestellte Zonenkennwert wird daher mit BAR gemäß Fi g. 5 angegeben; da eine
Verbindung zur darüber liegenden Zone fehlt, enthält der Zonenkennwert keine Zusatzmarkierung. Entsprechend
weitergeführt werden auch die Submatrizes der folgenden Zonen nacheinander untersucht und deren
Zonenkennwerte ermittelt.
Im Ausführungsbeispiel sind Speicher oft als Verschieberegister beschrieben, ohne daß die Erfindung auf
deren Einsatz beschränkt wäre. Ebenso sind Matrizes der Größen 28 χ 30 und 8x8 dargestellt worden, und
als Submatrizes zur Formerkennung wurden 3x3 Bit-Bereiche benutzt. Auch die Größe dieser Submatrizes
sowie die der zur Verkleinerung genutzten Quadrate kann ebenso wie die Anzahl der Zonen unterschiedlich
gewählt werden, und schließlich läßt sich auch die Zonenkennzeichnung abändern; es hat sich jedoch
gezeigt, daß bei der dargelegten Kodierung mit zweiundreißig Kombinationen entsprechend jeweils
5 Bits sich Unterscheidungen treffen lassen, welche es gestatten, auch bei relativ unterschiedlichen Handschriften
nicht nur Ziffern, sondern auch Buchstaben mit hoher Identifizierungsquote identifizieren zu können,
ohne daß es des hierzu üblichen hohen Aufwandes bedarf.
Hierzu 8 Blatt Zeichnungen 809 585/3
Claims (2)
1. Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der ein
Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert
und verdünnt sowie auf das Vorliegen vorbestimmter Formelemente untersucht wird, und
bei der die ermittelten Formelemente mit vorgezeichneten Standardmustern verglichen werden,
wobei bei ausreichender Übereinstimmung ein dem Schriftzeichen entsprechendes Ausgabezeichen bewirkt
wird, dadurch gekennzeichnet, daß die abgetastete Signalfolge in einer matrixartigen
Speichervorrichtung (13) gespeichert wird, der eine Zonenwahlvorrichtung (6) nachgeordnet ist, welche
jeweils mehrere nebeneinanderliegende Abtastzeilen aufweisende, sich mindestens um eine Abtastzeile
überlappende Zonen (16) aus der Speichervorrichtung (13) abruft und einem Detektorkreis (7, 70)
zuführt, welcher nacheinander sich über die jeweilige Zone (16) erstreckende und in Zeilenrichtung sich
über mehrere Bits erstreckende und gegeneinander um jeweils ein Bit versetzte Submatrizes (17) auf das
Vorliegen einfacher, jeweils Lage und Richtung einer Linie umfaßender Formelemente untersucht,
daß Vorrichtungen (9,10) die für die innerhalb einer Zone (16) angeordneten Submatrizes (17) anfallenden
Symbole zu komplexen Formelementen entsprechenden Kodezeichen zusammenfassen, daß zur
Untersuchung der Verbindung zwischen Formelementen von Submatrizes und denen der benachbarten
Submatrix der folgenden Zone einem die Symbole für einfache Formelemente aufweisenden
Register (800) eine Schlüsselstufe (801) nachgeordnet ist, welche die Symbole für keine Formelemente
aufweisende Submatrizes (17) mit »0« und die Symbole für Formelemente aufweisende Submatrizes
mit »1« bewertet, daß die sich ergebenden Binärziffern einer eine vorgegebene geringe Kapazität
aufweisenden Zählstufe (802) zugeführt werden, und daß vom Erreichen von dessen Kapazität
ab die Schlüsselsignale zwei in Serie betriebenen Schieberegistern (804,806) zugeführt werden, wobei
mittels einer Und-Stufe (807) die logische Summe des über eine Oder-Stufe (805) abgegriffenen
Speicherstandes der drei letzten Zellen des ersten Schieberegisters und des der vorletzten des zweiten
gebildet und als die Verbindung zweier aufeinanderfolgender Zonen kennzeichnende Zusatzmarkierung
gespeichert wird, und daß in einem Koinzidenzkreis die aus Kodezeichen und Zusatzmarkierungen
bestehenden Zonen-Kennzeichen zonenweise nacheinander mit den Standardmustern verglichen
werden.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Zonenwahlvorrichtung (6) jeweils
drei Abtastzeilen umfaßende Zonen auswählt und die Submatrizes (17) in Abtastzeilenrichtung eine
Länge von drei Bits aufweisen.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7151666 | 1966-10-31 | ||
JP7161366 | 1966-10-31 | ||
JP7151766 | 1966-10-31 |
Publications (3)
Publication Number | Publication Date |
---|---|
DE1549930A1 DE1549930A1 (de) | 1971-05-13 |
DE1549930B2 true DE1549930B2 (de) | 1979-02-01 |
DE1549930C3 DE1549930C3 (de) | 1979-10-04 |
Family
ID=27300667
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1549930A Expired DE1549930C3 (de) | 1966-10-31 | 1967-10-30 | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen |
Country Status (4)
Country | Link |
---|---|
US (1) | US3541511A (de) |
DE (1) | DE1549930C3 (de) |
FR (1) | FR1547790A (de) |
GB (1) | GB1180290A (de) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2822458A1 (de) * | 1977-05-23 | 1979-01-25 | Sharp Kk | Optisches zeichenlesegeraet und verfahren zur optischen zeichenerkennung |
DE3236336A1 (de) * | 1982-09-30 | 1984-04-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung |
DE3804450A1 (de) * | 1987-02-20 | 1988-09-01 | Hitachi Ltd | Verfahren zur konturabtastung und anordnung dafuer |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1944073C3 (de) * | 1969-08-29 | 1974-05-16 | Standard Elektrik Lorenz Ag, 7000 Stuttgart | Einrichtung zur maschinellen Zeichenerkennung |
FR2073822A5 (de) * | 1969-12-31 | 1971-10-01 | Ibm | |
NL7016539A (de) * | 1970-11-12 | 1972-05-16 | ||
US3766520A (en) * | 1971-11-10 | 1973-10-16 | Regonition Equipment Inc | Character reader with handprint capability |
JPS48102926A (de) * | 1972-04-07 | 1973-12-24 | ||
JPS604505B2 (ja) * | 1972-07-10 | 1985-02-04 | スキヤン − オプテイクス インコ−ポレ−テツド | マルチ・フオント光学式文字認識装置 |
US3889234A (en) * | 1972-10-06 | 1975-06-10 | Hitachi Ltd | Feature extractor of character and figure |
US3930231A (en) * | 1974-06-10 | 1975-12-30 | Xicon Data Entry Corp | Method and system for optical character recognition |
US3992697A (en) * | 1974-12-27 | 1976-11-16 | Scan-Data Corporation | Character recognition system utilizing feature extraction |
FR2301051A1 (fr) * | 1975-02-14 | 1976-09-10 | Anvar | Procede et dispositifs de reconnaissance de formes |
JPS5215235A (en) * | 1975-07-26 | 1977-02-04 | Fujitsu Ltd | Character recognition unit |
JPS5242028A (en) * | 1975-09-29 | 1977-04-01 | Fujitsu Ltd | Letter recognition system |
US4020463A (en) * | 1976-02-27 | 1977-04-26 | Recognition Equipment Incorporated | Apparatus and a method for storage and retrieval of image patterns |
US4048615A (en) * | 1976-06-04 | 1977-09-13 | Recognition Equipment Incorporated | Automated character recognition system |
GB1587613A (en) * | 1976-11-04 | 1981-04-08 | Norprint Ltd | Character identification |
US4124871A (en) * | 1977-08-31 | 1978-11-07 | International Business Machines Corporation | Image data resolution change apparatus and process utilizing boundary compression coding of objects |
US4162482A (en) * | 1977-12-07 | 1979-07-24 | Burroughs Corporation | Pre-processing and feature extraction system for character recognition |
JPS596421B2 (ja) * | 1978-08-28 | 1984-02-10 | 肇産業株式会社 | パタ−ン情報処理方法 |
JPS5915381B2 (ja) * | 1978-10-16 | 1984-04-09 | 日本電信電話株式会社 | パタ−ン検査法 |
US4679951A (en) * | 1979-11-06 | 1987-07-14 | Cornell Research Foundation, Inc. | Electronic keyboard system and method for reproducing selected symbolic language characters |
JPS56103773A (en) * | 1980-01-21 | 1981-08-19 | Agency Of Ind Science & Technol | Feature extracing system of binary pattern |
JPS605037B2 (ja) * | 1980-01-28 | 1985-02-07 | 株式会社東芝 | 図面読取装置 |
JPS57105088A (en) * | 1980-12-22 | 1982-06-30 | Toshiba Corp | Character reader |
JPS57178578A (en) * | 1981-04-27 | 1982-11-02 | Toshiba Corp | Pattern recognition system |
US4544276A (en) * | 1983-03-21 | 1985-10-01 | Cornell Research Foundation, Inc. | Method and apparatus for typing Japanese text using multiple systems |
US4628532A (en) * | 1983-07-14 | 1986-12-09 | Scan Optics, Inc. | Alphanumeric handprint recognition |
JPH0754549B2 (ja) * | 1984-09-19 | 1995-06-07 | 株式会社日立製作所 | パターンマッチング用標準パターンの作成方法 |
US4876728A (en) * | 1985-06-04 | 1989-10-24 | Adept Technology, Inc. | Vision system for distinguishing touching parts |
US4891750A (en) * | 1986-10-29 | 1990-01-02 | Pitney Bowes Inc. | Optical character recognition by forming and detecting matrices of geo features |
JPH01183793A (ja) * | 1988-01-18 | 1989-07-21 | Toshiba Corp | 文字認識装置 |
US5574803A (en) * | 1991-08-02 | 1996-11-12 | Eastman Kodak Company | Character thinning using emergent behavior of populations of competitive locally independent processes |
ITUD20050203A1 (it) * | 2005-11-29 | 2007-05-30 | Isomorph S R L | Dispositivo e procedimento per il riconoscimento di un oggetto in un'immagine |
US20070230789A1 (en) * | 2006-04-03 | 2007-10-04 | Inventec Appliances Corp. | Method of controlling an electronic device by handwriting |
WO2015141260A1 (ja) * | 2014-03-17 | 2015-09-24 | 株式会社河合楽器製作所 | 手書き音楽記号認識装置およびプログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL265383A (de) * | 1960-05-31 | |||
US3293604A (en) * | 1963-01-25 | 1966-12-20 | Rca Corp | Character recognition system utilizing asynchronous zoning of characters |
US3268864A (en) * | 1963-03-18 | 1966-08-23 | Apparatus for feature recognition of symbols |
-
1967
- 1967-10-26 GB GB48752/67A patent/GB1180290A/en not_active Expired
- 1967-10-26 US US678427A patent/US3541511A/en not_active Expired - Lifetime
- 1967-10-30 DE DE1549930A patent/DE1549930C3/de not_active Expired
- 1967-10-31 FR FR126611A patent/FR1547790A/fr not_active Expired
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2822458A1 (de) * | 1977-05-23 | 1979-01-25 | Sharp Kk | Optisches zeichenlesegeraet und verfahren zur optischen zeichenerkennung |
DE3236336A1 (de) * | 1982-09-30 | 1984-04-05 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung |
DE3804450A1 (de) * | 1987-02-20 | 1988-09-01 | Hitachi Ltd | Verfahren zur konturabtastung und anordnung dafuer |
Also Published As
Publication number | Publication date |
---|---|
DE1549930A1 (de) | 1971-05-13 |
FR1547790A (fr) | 1968-11-29 |
US3541511A (en) | 1970-11-17 |
GB1180290A (en) | 1970-02-04 |
DE1549930C3 (de) | 1979-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE3633743C2 (de) | ||
DE2801536C2 (de) | Zeichenformkodiervorrichtung | |
DE2431451C3 (de) | Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens | |
DE2247942A1 (de) | Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen | |
DE1225426B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Zeichen | |
DE2612971A1 (de) | Bildmuster-erkennungssystem | |
DE2432129A1 (de) | Verfahren und vorrichtung zum erkennen von schriftzeichen, namentlich von ziffern | |
DE2909153A1 (de) | Einrichtung zur elektronischen verarbeitung von bild- und/oder zeichenmustern | |
DE2509353A1 (de) | Verfahren und vorrichtung zur gewinnung einer einem muster entsprechenden information | |
DE2703158A1 (de) | Einrichtung zum erkennen einer zeichenposition | |
DE1124750B (de) | Anordnung zur Identifizierung von Zeichen | |
DE2540101A1 (de) | Automatisches zeichenerkennungs- system | |
DE2234109A1 (de) | Leseapparat | |
DE69421487T2 (de) | Verfahren zum Vergleichen von Mustern basierend auf der Verwendung von Bildelementmatritzen und Bildelementvektoren | |
DE2629590C2 (de) | Schaltungsanordnung zur Trennung benachbarter Muster in einer Zeichenerkennungseinrichtung | |
DE3854216T2 (de) | Bildverarbeitungsgerät und -verfahren. | |
DE1264118B (de) | Einrichtung zum maschinellen Erkennen von Zeichen | |
DE1138571B (de) | Zeichen-Erkennungsvorrichtung | |
DE1212758B (de) | Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen | |
DE2064469A1 (de) | Mustererkennungseinrichtung | |
DE1151139B (de) | Vorrichtung zur Abtastung von Zeichen, die in ein- oder mehrspaltiger Kodierung oder n beiden Kodierungsarten auf einem Aufzeichnungstraeger aufgezeichnet sind | |
DE953474C (de) | Verfahren zum lichtelektrischen Ablesen von Schriftzeichen | |
DE1205743B (de) | Verfahren und Vorrichtung zur maschinellen Zeichenerkennung | |
DE1197656B (de) | Verfahren zur maschinellen Zeichenerkennung |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C3 | Grant after two publication steps (3rd publication) |