[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE1549930B2 - Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen - Google Patents

Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen

Info

Publication number
DE1549930B2
DE1549930B2 DE1549930A DET0035145A DE1549930B2 DE 1549930 B2 DE1549930 B2 DE 1549930B2 DE 1549930 A DE1549930 A DE 1549930A DE T0035145 A DET0035145 A DE T0035145A DE 1549930 B2 DE1549930 B2 DE 1549930B2
Authority
DE
Germany
Prior art keywords
zone
form elements
submatrices
characters
zones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE1549930A
Other languages
English (en)
Other versions
DE1549930A1 (de
DE1549930C3 (de
Inventor
Hiroshi Genchi
Sumio Yokohama Katsuragi
Kenichi Yokohama Mori
Sadakazu Watanabe
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Publication of DE1549930A1 publication Critical patent/DE1549930A1/de
Publication of DE1549930B2 publication Critical patent/DE1549930B2/de
Application granted granted Critical
Publication of DE1549930C3 publication Critical patent/DE1549930C3/de
Expired legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18019Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by matching or filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

Die Erfindung betrifft eine Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der ein Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert und verdünnt sowie auf das Vorliegen vorbestimmter Formelemente untersucht wird, und bei der die ermittelten Formelemente untersucht wird, und bei der die ermittelten Formelemente mit vorgezeichneten Standardmustern verglichen werden, wobei bei ausreichender Übereinstimmung ein dem Schriftzeichen entsprechendes Ausgabezeichen bewirkt wird.
Aus der Siemens-Zeitschrift, April 1963, Seiten 213 bis 215 ist es bekannt, Größe und gegenseitigen Abstand einzelner Linien von Schriftzeichen zu deren Erkennung auszuwerten. Das Erfordernis weitgehender Übereinstimmung erschwert bereits die Abtastung und setzt die Benutzung einer vorgegebenen Schriftart voraus. Sollten dagegen unterschiedliche Schriftarten insbesondere aber auch handgeschriebene Schriftzeichen, gelesen werden können, so werden gemäß der angegebenen Zeitschrift zweckmäßig die Schriftzeichen in Formelemente aufgelöst, deren Beschreibung mit der vorgegebener Muster verglichen wird. Werden hierbei an Stelle absoluter Maße relative Maße eingeführt, so wird eine gewisse Unabhängigkeit von der jeweiligen Schriftgröße erzielt, und es ist möglich, an sich bekannte, wirkungsvolle statische Methoden der Störverminderung wie die Digitalisierung und die Verdünnung einzusetzen, ohne die Erkennbarkeit der Zeichen hierdurch wesentlich zu beeinträchtigen.
Die US-PS 32 68 864 empfiehlt, eine Vielzahl von Merkmalen von Formelementen zu ermitteln, aufgrund deren das dargestellte Zeichen erkennbar ist Die Vielzahl solcher Merkmale kompliziert nicht nur den Aufbau der zum Erkennen von Schriftzeichen vorgesehenen Einrichtung, auch die zum Vergleich beigegebenen Standardmuster werden vielfältig und umfangreich, so daß auch in diesem Falle die zugehörigen Vorrichtungen komplex, umfangreich und aufwendig werden, und die bei handgeschriebenen Schriftzeichen vielfach auftretenden Abweichungen erschweren das Erkennen und geben eine relativ hohe Quote nicht identifizierbarer Schriftzeichen.
Die Erfindung geht von der Aufgabe aus, eine Einrichtung der beschriebenen Gattung zu schaffen, die bei relativ geringem Aufwand auch bei stark aufweichenden Größen und Formen von Schriftzeichen durch Berücksichtigen der Kontinuität des Schriftzeichens sowie der Lage der Anbindungsstelle eines abwärts führenden Schriftzuges auf einem über diesem am Zeichenanfang befindlichen Horizontalstrich eine hohe Identifizierungsquote ergibt Gelöst wird diese Aufgabe mit der im Patentanspruch 1 angegebenen Merkmalskombination. Eine vorteilhafte Weiterbildung der Erfindung ist im Unteranspruch aufgeführt
Im einzelnen werden die Merkmale der Erfindung anhand der folgenden Beschreibung eines Ausführungsbeispiels in Verbindung mit dieses darstellenden Zeichnungen erläutert Es zeigen hierbei
F i g. 1 im stark vereinfachten Blockschaltbild eine Einrichtung zum maschinellen Lesen handgeschriebener Schriftzeichen,
F i g. 2 ein Diagramm zur Erläuterung der matrixartigen Aufteilung eines Schriftzeichens durch den Abtastzeilenraster und dessen Unterteilung,
F i g. 3 ausführlicher dargestellt zum Erkennen einfacher Formelemente vorgesehene Vorrichtungen der Fig. 1,
Fig.4 eine Aufstellung einfacher Formelemente sowie deren Verschlüsselung,
Fig.5 eine Aufstellung mit der Einrichtung nach F i g. 1 ermittelbarer komplexer Formelemente sowie
deren Verschlüsselung,
Fig.6 eine Vorrichtung zur Ermittlung einer Verbindungen benachbarter Kodezeichen kennzeichnenden Zusatzmarkierung,
Fig.7 und 9 die Raster zweier handgeschriebener Schriftzeichen,
Fig.8 und 10 tabellenartig die Verschlüsselung der Formelemente der Schriftzeichen nach F i g. 7 und 9, und
F i g. 11 nebeneinandergestellt die Matrix eines Schriftzeichens und die Kodebezeichnungen der in den einzelnen Zonen ermittelten Formelemente.
In F i g. 1 ist eine Einrichtung zum maschinellen Lesen von handgeschriebenen Schriftzeichen im stark vereinfachten Blockschaltbild dargestellt Auf dem Aufzeichnungsträger 1 ist als Beispiel eines zu lesenden Schriftzeichens die Ziffer »8« dargestellt Dieses Schriftzeichen wird mittels eines optischen Systems 2 auf dem Schirm einer Fernsehkamera 3 abgebildet, welche die Abbildung des Schriftzeichens rasterförmig abtastet und die erhaltene Signalfolge dem Triggerverstärker 4 zuführt, der die Signalfolge digitalisiert, d. h., in eine Signalfolge wandelt, die zwischen zwei Pegeln wechselt.
Die digitalisierte Signalfolge wird dem Eingangskreis 5 zugeführt, in dem die Signalfolge gespeichert wird, wobei gleichzeitig die anschließende Auswertung erleichternde bzw. sichernde Vorgänge durchgeführ: werden: So wird die Lage der durch die Abtastung erhaltenen Bildmatrix ermittelt und gegebenenfalls korrigiert, die Bildmatrix durch Vergrößern oder Verkleinern der Kapazität der zum Lesen benutzten Speicher angeglichen und in an sich bekannter Weise wird die Bildmatrix des Schriftzeichens verdünnt Mittels der Zonenwahlvorrichtung 6 werden aus der Matrix des in einen Speicher eingelesenen Schriftzeichens einzelne parallele Zonen ausgeblendet und einem Detektorkreis 7 für einfache Formelemente zugeführt der im Vergleich mit dem Speicher 8 festgehaltenen Normal-Formelementen Submatrizes der Zonen auf einfache Formelemente untersucht. Die Symbole der aufgefundenen Formelemente werden dem Detektor 9 für komplexe Formelemente zugeführt, der aufgrund der Verknüpfung von durch Submatrizes jeweils einer Zone ermittelten einfachen Formelemente und im Vergleich mit im Speicher 10 enthaltenen Zonenkennzeichen zonenweise komplexe Formelemente analysiert und aufgrund deren Kodierung das abgetastete Zeichen ermittelt und dem Ausgabekreis 11 zur Auslösung des Ausgabezeichens überstellt.
Im Ausführungsbeispiel ist gemäß der Darstellung in Fig.2 eine Abtastung des Aufzeichnungsträgers in achtundzwanzig Abtastzeilen zu je dreißig Bildpunkten vorgesehen. In der Figur ist dies angedeutet indem vor und hinter jeder Zeile der die Signale 12 des abgetasteten und zu lesenden Schriftzeichens aufweisenden Bildmatrix 13 ein kleiner Kreis 14 dargestellt ist, und über der Matrix sind entsprechende Kreise 15 gezeigt welche die Anzahl der Bildpunkte bzw. Bits innerhalb einer Zeile darstellen. Die im Ausführungsbeispiel eine Kapazität von 28 χ 30 Bits aufweisende Bildmatrix 13 ist in dreizehn horizontale, vertikal übereinander liegende Zonen 16 unterteilt die jeweils durch die Zonenwahlvorrichtung 6 der F i g. 1 ausblendbar sind, und die jeweils drei Abtastzeilen umfassen, wobei einander benachbarte Zonen 16 sich um jeweils eine Abtastzeile überlappen. Im Verlaufe der weiteren Bearbeitung der Signale im Detektor 9 der F i g. 1 werden die Zonen in Zeilenrichtung in achtundzwanzig Submatrizes 17 unterteilt die im Ausführungsbeispiel jeweils 3x3 Bits umfaßen.
Im einzelnen soll der Auswertungsvorgang nunmehr anhand detaillierter Blockschaltbilder erläutert werden. Vom Triggerverstärker 4 der F i g. 1 aus werden die durch die Abtastung des Aufzeichnungsträgers 1 gewonnenen Signalfolgen dem Eingangskreis 5 zugeführt und in diesem, wie oben beschrieben, aufbereitet,
ίο insbesondere verdünnt und in einer Speichervorrichtung 500 der F i g. 3 gespeichert Die Kapazität dieses Digitalspeichers 500 entspricht einem Schriftzeichen bzw. der gesamten Bildmatrix 13 und beträgt im Ausführungsbeispiel 28 χ 30 Bits.
Die Aufteilung der einer Bildmatrix zugehörigen Signalfolgen in die einzelnen Zonen und damit das Arbeiten der Zonenwahlvorrichtung 6 der F i g. 1 wird anhand der Fig.3 erläutert Die die überarbeitete Bildmatrix enthaltende Speichervorrichtung 500 wird mittels der Abfragestufe 60 zeilenweise abgefragt, und die ermittelten Signale werden dem eine Kapazität von drei Zeilen aufweisenden und durch den Taktgeber 62 geschalteten Zonenregister 61 zugeführt Nach Einbringen der drei Zeilen entsprechenden Signalfolgen werden die Signale im Zonenregister 61 taktweise nach rechts verschoben, und die jeweils in den letzten neun Zellen anstehenden, eine Submatrix darstellenden Signale werden zur Ermittlung der durch sie dargestellten einfachen Formelemente einem Detektorkreis 70 zugeführt. Nach dreißigfacher Verschiebung ist die erste Zone 16 der F i g. 2 untersucht und die mittlere sowie die untere, jeweils einer Zeile entsprechende Abteilung des Zonenregisters 61 sind geleert, doch ist gleichzeitig der Inhalt der die untere Zeile repräsentierenden Speicherzellen in die Speicherzellen der oberen Zeile übertragen worden. Zur Auswertung der nächsten Zone überträgt daher die Abfragestufe 60 die Signalfolgen der folgenden beiden Zeilen aus der Speichervorrichtung 500 in die mittlere und untere Abteilung des Zonenregisters 61. So werden nacheinander die dreizehn Zonen untersucht, wobei innerhalb der Zone jeweils aufeinanderfolgende einander überlappende Submatrizes dem Detektorkreis 70 zur Auswertung übermittelt werden.
Aufgabe des Detektorkreises 70 ist es, die ihm aufeinanderfolgend zugeführten Submatrizes auf das Vorliegen einfacher Formelemente zu untersuchen. Gemäß Fig.4 werden hierbei sieben Ergebnisse unterschieden, die mit Ziffern 0 bis 6 bezeichnet sind,
so und denen die Auswertung erleichternde Symbole zugeordnet sind. Hierbei wird unterschieden zwischen 0: »Submatrix ohne Formelement«, 1: »vertikaler Strich«, 2: »steigender Schrägstrich«, 3: »fallender Schrägstrich«, 4: »oberer horizontaler Strich«, 5:
»unterer horizontaler Strich«, und 6: »andere und mit den vorhergehenden nicht identifizierbaren Zeichen«.
Der Detektorkreis 70 gibt die Auswertergebnisse jeder untersuchten Submatrix kodiert über seinen Ausgang 63 ab. Ist eine Auswertung nicht möglich, weil die Verdünnung oder aber die Verkleinerung als Anpassung an das vorgegebene Matrixfeld nicht weit genug getrieben wurden, so wird über den Ausgang 64 ein Signal abgegeben, das anzeigt, daß die Identifizierung unmöglich ist Daraufhin findet eine weitere Aufbereitung des Zeichens, gegebenenfalls unter erneuter Abtastung, statt
Eine sichere Erkennung handgeschriebener Schriftzeichen, insbesondere, wenn sie sich nicht nur auf
Ziffern beschränken, ist allein aufgrund der durch den Detektorkreis 70 ermittelten einfachen Formelemente und ihrer Lage innerhalb der Bildmatrix sowohl umständlich als auch aufwendig und unsicher, wenn übliche Vergleichsmethoden eingesetzt werden. Es wird daher der Ausgang 63 des Detektorkreises 70 gemäß F i g. 1 mit dem Detektor 9 verbunden, der in der Lage ist, auch kompliziertere Formelemente zu ermitteln. Erläutert wird dies anhand der F i g. 5. Werden, wie dies bei den ersten fünf Beispielen gezeigt ist, bei Hinzuziehen der Auswertergebnisse der benachbarten Submatrizes keine weiteren Einzelheiten entdeckt, so werden die aus Fig.4 bekannten einfachen Formelemente durch einen Kode bezeichnet. Wird dagegen ermittelt, daß einfache Formelemente zu Bogen oder geschwungenen Kurven verbunden sind, mehrfach parallel angeordnet sind oder sich verzweigen, so werden zur weiteren Auswertung nunmehr diese komplexen, beim Vergleich von in einer Zone aufeinanderfolgenden Submatrizes gewonnenen Formelemente durch Kodebezeichnungen fixiert.
Vorgesehen sind gemäß Fig.5 die Formelemente: »kein Formelement«, »vertikaler Strich«, »steigender Schrägstrich«, »fallender Schrägstrich«, »Horizontalstrich«, »nach oben geöffnete konvexe Kurve«, »nach unten geöffnete konvexe Kurve«, »zwei parallele vertikale Striche«, »Sinuskurve, bei der eine Halbperiode auch flach ausgebildet sein kann«, »Spiegelkurve zur vorhergehenden» drei vertikale Striche«, »ein Vertikalstrich mit nachgeordneter, nach unten geöffneter konvexer Kurve«, »nach unten konvexe Kurve mit folgendem Vertikalstrich«, »Vertikalstrich, gefolgt von Horizontalstrich«, »Horizontalstrich, gefolgt von Vertikalstrich«, und »verzweigte Kurve in Form eines liegenden F oder E«. Auch hier kann ein weiters Zeichen vorgesehen sein, das die Nichtauswertbarkeit anzeigt und durch Auslösung einer Änderung des Erfassungsfeldes, der Verdünnung und/oder Verkleinerung die Erkennbarkeit des untersuchten Schriftzeichens verbessert.
Parallel zur Ermittlung der Kodezeichen für komplexe Formelemente werden die Verbindungsverhältnisse benachbarter Submatrizes aufeinanderfolgender Zonen der Matrix untersucht und gegebenenfalls eine Zusatzmarkierung ausgelöst, wenn an eine vorbestimmte der Hälften eines am Zeichenanfang stehenden Horizontalstriches sich ein abwärts weisender Vertikalstrich anschließt und im übrigen ein Zusammenhang zwischen benachbarten Formelementen aufeinanderfolgender Zonen besteht Die Ableitung einer solchen Zusatzmarkierung wird an Hand der Fig.6 erläutert, wobei Verbindungen zwischen komplexen Formelementen am Zeichenanfang nur dann zur Auslösung von Zusatzmarkierungen führen, wenn ein abwärts weisendes Formelement mittig oder linksseitig an einen Horizontalstrich anschließt
Das in F i g. 6 dargestellte dreißgstellige Register 800 übernimmt die Kodezeichen für primäre Formelemente vom Ausgang des Detektorkreises 70 und gibt sie an eine Schlüsselstufe 801 weiter, die für den Kodewert »0« der F i g. 4, d. h. für eine Submatrix ohne Formelement, auch am Ausgang einen Binärwert »0« liefert, während für die in F i g. 4 mit 1 bis 6 bezeichneten Formelemente der binäre Ausgangswert »1« abgegeben wird. Dem Ausgang der Schlüsselstufe 802 sowie eine Schaltstufe 803 nachgeordnet Vor Beginn der Auswertung einer Matrix wird die Schaltstufe 803 gesperrt so daß sie die ihr von der Schlüsselstufe 801 zugeführten Signale nicht an die ihr nachgeschalteten und in Serie betriebenen Schieberegister 804 und 806 weiterzugeben vermag. Die zunächst von der Schlüsselstufe 801 abgegebenen Binärwerte »0« vermögen auch die vor Beginn der Auswertung in den Ausgangszustand zurückgeschaltete Zählstufe 802 nicht zu beeinflussen. Vom Auftreten des ersten Binärwertes »1« am Ausgange der Schlüsselstufe 801 an jedoch zählt die dreiwertige Zählstufe 801 die von dieser abgegebenen Signale und gibt nach Eintreffen des dritten Signales ein Ausgangssignal ab, das der Schaltstufe 803 zugeführt wird und diese öffnet. Über diese Schaltstufe 803 werden damit die nunmehr am Ausgang der Schlüsselstufe 801 auftretenden Ausgangssignale nacheinander in das Schieberegister 804 synchron mit der Ermittlung der Symbole für einfache Formelemente übertragen, und nach Füllung des Schieberegisters 804 werden dessen überlaufende Impulse dem Schieberegister 806 übermittelt, dessen Kapazität der Anzahl der Submatrizes je Zone angepaßt ist Die drei letzten Speicherzellen des Schieberegisters 804 sind mit drei Eingängen einer Oder-Stufe 805 verbunden, deren Ausgang zur Und-Stufe 807 führt. Der zweite Eingang der Und-Stufe 807 steht mit der vorletzten Speicherzelle des Schieberegisters 806 in Verbindung. Damit tritt am Ausgange der Und-Stufe 807 stets dann ein Signal auf, das zur Auslösung der Zusatzmarkierung dient bzw. als diese selbst gilt, wenn in mindestens einer der drei letzten Speicherzellen des Schieberegisters 804 und der vorletzten Speicherzelle des Schieberegisters 806 eine »1« auftreten. Dieses ist stets dann der Fall, wenn in einer Submatrix einer Zone mindestens in einer der orthogonal oder diagonal unter dieser stehenden Submatrizes gleichzeitig Binärwerte »1« auftreten, wobei jedoch infolge der durch das Zusammenwirken der Schaltstufe 803 mit der Zählstufe 802 der erste Binärwert »1« sowie die beiden folgenden Binärwerte unterdrückt werden, so daß die Anbindung an ein den unterdrückten Binärwerten am Zeichenanfang entsprechendes Formelement bei der Bildung der Zusatzmarkerung nicht berücksichtigt wird.
Die Vorteile einer solchen Zusatzmarkierung und deren Aussagemöglichkeiten werden anhand der F i g. 7 bis 10 erläutert. Die Fig.7 bzw. 9 zeigen den Belegungszustand einer Speichermatrix, der beim Abtasten von Schriftzeichen »3« bzw. »5« des Aufzeichnungsträgers 1 erhalten wird. Die F i g. 8 bzw. 10 zeigen die sich in den einzelnen Zonen der Matrizes der F i g. 7 und 9 für die Formelemente sich ergebenden Symbole sowie ggf. die als Stern dargestellte Zusatzmarkierung. Wie der Vergleich der F i g. 8 und 10 zeigt, sind die Symbole der Formelemente der beiden zu erkennenden Ziffern gleich. Der wesentliche Unterschied zwischen den Ziffern liegt darin, daß die steigenden Linien (Symbol: INC) im Falle der F i g. 7 an das rechte Ende des Horizontalstriches (Symbol: BAR) anschließen, während die entsprechend geneigte Linie bei der »5« der F i g. 9 am linken Ende anschließt. In der obersten der ein Symbol aufweisenden Zonen fehlt die Zusatzmarkierung in beiden Fällen, da eine weitere Verbindung in eine höhere Zone nicht besteht sondern das Zeichen hier endet In der folgenden niedrigeren Zone fehlt wegen des Rechtsanschlusses des Schrägstriches in Fig.7 die Zusatzmarkierung in Fig.8. Wegen der Linksanbindung des Schrägstriches in Fig.9 ist diese Zusatzmarkierung in Fig. 10 vorhanden, so daß die Kodierungen beider Ziffern sich im wesentlichen durch das Fehlen bzw. Vorhandensein dieser Zusatz-
markierung unterscheiden. Die vollständige Auswertung innerhalb einer Zone, im folgenden als »Zonenkennwert« bezeichnet, umfaßt also den Kode des Formkennwertes in Verbindung mit der Zusatzmarkierung. Die Behandlung der Zonenkennwerte erfolgt, durch eine Zonensteuervorrichtung bestimmt, zonenweise nacheinander in der Reihenfolge der Ordnungsnummern der Zonen. Hierbei wird einem Koinzidenzkreis vom Speicher 10 für komplexe Formelemente des Detektors 9 deren Symbol zugeführt, während die Und-Stufe 807 der F i g. 6 dem Koinzidenzkreis die zugehörige Zusatzmarkierung zuführt, so daß die kompletten Zonenkennwerte am Koinzidenzkreis anliegen.
Die Anzal der möglichen Zonenkennwerte beträgt im erläuterten Beispiel also 16 χ 2 = 32, so daß die Kodierung auf diese Anzahl abzustellen ist. Sind so durch den Detektor 9 der F i g. 1 für alle Zonen nacheinander die Zonenkennwerte bestimmt, so können sie mit im Speicher 10 vorgespeicherten Zonenkennwerten verglichen werden, und im Falle der Übereinstimmung wird der Kode des identifizierten Schriftzeichens vom Ausgangskreis 11 abgegeben.
Praktisch erläutert wird das Lesen eines handgeschriebenen Schriftsatzes nunmehr anhand der beispielhaft gewählten Ziffer »7« in Verbindung mit F i g. 11. Im linken Teil dieser Figur ist, angedeutet durch die daneben und darüber dargestellten Kreise 14 und 15, eine Matrix dargestellt, in die das Bild des Schriftzeichens »7« nach elektrooptischer Ablesung des handgeschriebenen Schriftzeichens vom Aufzeichnungsträger 1 und Digitalisierung, Größenanpassung sowie Verdünnung des Abtastergebnisses eingespeichert ist. Dieses Speicherergebnis wird nunmehr nacheinander in einander überlappenden Zonen 1 bis 13 untersucht, deren Ordnungsnummern in der vorletzten Spalte für die jeweils oberen beiden der drei Abtastzeilen einer Zone angegeben sind. Die Abtastergebnisse innerhalb der im Ausführungsbeispiel 3 χ 3 Bit großen Submatrizes sind in der breiten mittleren Spalte der F i g. 11 im einzelnen aufgeführt, die beim Vergleich aufeinanderfolgender Submatrizes einer Zone ermittelten Bezeichnungen für komplexe Formelemente sind durch Buchstaben in der rechts stehenden Spalte angezeigt, und die folgende, als Stern dargestellte Zusatzmarkierung gibt die Verbindungsverhältnisse an, die beim Vergleich übereinander liegender Submatrizes ermittelt werden, so daß diese Spalte die Folge der Zonenkennwerte und damit die Ausgangskodierung für die durch Vergleich bewirkte Identififzierung enthält.
Zunächst werden innerhalb der Zonen jeweils drei in Zonenrichtung aufeinander folgende Speicherzellen untersucht. In den ersten beiden Zonen beträgt die Breite des Zeichens »0«, und infolge fehlender Einspeicherungen werden auch weder einfache noch komplexe Formelemente festgestellt.
In der dritten Zone, die sich bis zur siebenden Abtastzeile erstreckt, wird das einfache Formelement horizontaler Strich« mit der Bezeichnung 5 bzw. das Symbol L der F i g. 4 dreifach ermittelt, und der in der rechten Spalte der Figur dargestellte Zonenkennwert wird daher mit BAR gemäß Fi g. 5 angegeben; da eine Verbindung zur darüber liegenden Zone fehlt, enthält der Zonenkennwert keine Zusatzmarkierung. Entsprechend weitergeführt werden auch die Submatrizes der folgenden Zonen nacheinander untersucht und deren Zonenkennwerte ermittelt.
Im Ausführungsbeispiel sind Speicher oft als Verschieberegister beschrieben, ohne daß die Erfindung auf deren Einsatz beschränkt wäre. Ebenso sind Matrizes der Größen 28 χ 30 und 8x8 dargestellt worden, und als Submatrizes zur Formerkennung wurden 3x3 Bit-Bereiche benutzt. Auch die Größe dieser Submatrizes sowie die der zur Verkleinerung genutzten Quadrate kann ebenso wie die Anzahl der Zonen unterschiedlich gewählt werden, und schließlich läßt sich auch die Zonenkennzeichnung abändern; es hat sich jedoch gezeigt, daß bei der dargelegten Kodierung mit zweiundreißig Kombinationen entsprechend jeweils 5 Bits sich Unterscheidungen treffen lassen, welche es gestatten, auch bei relativ unterschiedlichen Handschriften nicht nur Ziffern, sondern auch Buchstaben mit hoher Identifizierungsquote identifizieren zu können, ohne daß es des hierzu üblichen hohen Aufwandes bedarf.
Hierzu 8 Blatt Zeichnungen 809 585/3

Claims (2)

Patentansprüche:
1. Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen, bei der ein Schriftzeichen aufweisendes Bildfeld zeilenrasterartig abgetastet wird und das Abtastergebnis digitalisiert und verdünnt sowie auf das Vorliegen vorbestimmter Formelemente untersucht wird, und bei der die ermittelten Formelemente mit vorgezeichneten Standardmustern verglichen werden, wobei bei ausreichender Übereinstimmung ein dem Schriftzeichen entsprechendes Ausgabezeichen bewirkt wird, dadurch gekennzeichnet, daß die abgetastete Signalfolge in einer matrixartigen Speichervorrichtung (13) gespeichert wird, der eine Zonenwahlvorrichtung (6) nachgeordnet ist, welche jeweils mehrere nebeneinanderliegende Abtastzeilen aufweisende, sich mindestens um eine Abtastzeile überlappende Zonen (16) aus der Speichervorrichtung (13) abruft und einem Detektorkreis (7, 70) zuführt, welcher nacheinander sich über die jeweilige Zone (16) erstreckende und in Zeilenrichtung sich über mehrere Bits erstreckende und gegeneinander um jeweils ein Bit versetzte Submatrizes (17) auf das Vorliegen einfacher, jeweils Lage und Richtung einer Linie umfaßender Formelemente untersucht, daß Vorrichtungen (9,10) die für die innerhalb einer Zone (16) angeordneten Submatrizes (17) anfallenden Symbole zu komplexen Formelementen entsprechenden Kodezeichen zusammenfassen, daß zur Untersuchung der Verbindung zwischen Formelementen von Submatrizes und denen der benachbarten Submatrix der folgenden Zone einem die Symbole für einfache Formelemente aufweisenden Register (800) eine Schlüsselstufe (801) nachgeordnet ist, welche die Symbole für keine Formelemente aufweisende Submatrizes (17) mit »0« und die Symbole für Formelemente aufweisende Submatrizes mit »1« bewertet, daß die sich ergebenden Binärziffern einer eine vorgegebene geringe Kapazität aufweisenden Zählstufe (802) zugeführt werden, und daß vom Erreichen von dessen Kapazität ab die Schlüsselsignale zwei in Serie betriebenen Schieberegistern (804,806) zugeführt werden, wobei mittels einer Und-Stufe (807) die logische Summe des über eine Oder-Stufe (805) abgegriffenen Speicherstandes der drei letzten Zellen des ersten Schieberegisters und des der vorletzten des zweiten gebildet und als die Verbindung zweier aufeinanderfolgender Zonen kennzeichnende Zusatzmarkierung gespeichert wird, und daß in einem Koinzidenzkreis die aus Kodezeichen und Zusatzmarkierungen bestehenden Zonen-Kennzeichen zonenweise nacheinander mit den Standardmustern verglichen werden.
2. Einrichtung nach Anspruch 1, dadurch gekennzeichnet, daß die Zonenwahlvorrichtung (6) jeweils drei Abtastzeilen umfaßende Zonen auswählt und die Submatrizes (17) in Abtastzeilenrichtung eine Länge von drei Bits aufweisen.
DE1549930A 1966-10-31 1967-10-30 Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen Expired DE1549930C3 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7151666 1966-10-31
JP7161366 1966-10-31
JP7151766 1966-10-31

Publications (3)

Publication Number Publication Date
DE1549930A1 DE1549930A1 (de) 1971-05-13
DE1549930B2 true DE1549930B2 (de) 1979-02-01
DE1549930C3 DE1549930C3 (de) 1979-10-04

Family

ID=27300667

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1549930A Expired DE1549930C3 (de) 1966-10-31 1967-10-30 Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen

Country Status (4)

Country Link
US (1) US3541511A (de)
DE (1) DE1549930C3 (de)
FR (1) FR1547790A (de)
GB (1) GB1180290A (de)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2822458A1 (de) * 1977-05-23 1979-01-25 Sharp Kk Optisches zeichenlesegeraet und verfahren zur optischen zeichenerkennung
DE3236336A1 (de) * 1982-09-30 1984-04-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung
DE3804450A1 (de) * 1987-02-20 1988-09-01 Hitachi Ltd Verfahren zur konturabtastung und anordnung dafuer

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1944073C3 (de) * 1969-08-29 1974-05-16 Standard Elektrik Lorenz Ag, 7000 Stuttgart Einrichtung zur maschinellen Zeichenerkennung
FR2073822A5 (de) * 1969-12-31 1971-10-01 Ibm
NL7016539A (de) * 1970-11-12 1972-05-16
US3766520A (en) * 1971-11-10 1973-10-16 Regonition Equipment Inc Character reader with handprint capability
JPS48102926A (de) * 1972-04-07 1973-12-24
JPS604505B2 (ja) * 1972-07-10 1985-02-04 スキヤン − オプテイクス インコ−ポレ−テツド マルチ・フオント光学式文字認識装置
US3889234A (en) * 1972-10-06 1975-06-10 Hitachi Ltd Feature extractor of character and figure
US3930231A (en) * 1974-06-10 1975-12-30 Xicon Data Entry Corp Method and system for optical character recognition
US3992697A (en) * 1974-12-27 1976-11-16 Scan-Data Corporation Character recognition system utilizing feature extraction
FR2301051A1 (fr) * 1975-02-14 1976-09-10 Anvar Procede et dispositifs de reconnaissance de formes
JPS5215235A (en) * 1975-07-26 1977-02-04 Fujitsu Ltd Character recognition unit
JPS5242028A (en) * 1975-09-29 1977-04-01 Fujitsu Ltd Letter recognition system
US4020463A (en) * 1976-02-27 1977-04-26 Recognition Equipment Incorporated Apparatus and a method for storage and retrieval of image patterns
US4048615A (en) * 1976-06-04 1977-09-13 Recognition Equipment Incorporated Automated character recognition system
GB1587613A (en) * 1976-11-04 1981-04-08 Norprint Ltd Character identification
US4124871A (en) * 1977-08-31 1978-11-07 International Business Machines Corporation Image data resolution change apparatus and process utilizing boundary compression coding of objects
US4162482A (en) * 1977-12-07 1979-07-24 Burroughs Corporation Pre-processing and feature extraction system for character recognition
JPS596421B2 (ja) * 1978-08-28 1984-02-10 肇産業株式会社 パタ−ン情報処理方法
JPS5915381B2 (ja) * 1978-10-16 1984-04-09 日本電信電話株式会社 パタ−ン検査法
US4679951A (en) * 1979-11-06 1987-07-14 Cornell Research Foundation, Inc. Electronic keyboard system and method for reproducing selected symbolic language characters
JPS56103773A (en) * 1980-01-21 1981-08-19 Agency Of Ind Science & Technol Feature extracing system of binary pattern
JPS605037B2 (ja) * 1980-01-28 1985-02-07 株式会社東芝 図面読取装置
JPS57105088A (en) * 1980-12-22 1982-06-30 Toshiba Corp Character reader
JPS57178578A (en) * 1981-04-27 1982-11-02 Toshiba Corp Pattern recognition system
US4544276A (en) * 1983-03-21 1985-10-01 Cornell Research Foundation, Inc. Method and apparatus for typing Japanese text using multiple systems
US4628532A (en) * 1983-07-14 1986-12-09 Scan Optics, Inc. Alphanumeric handprint recognition
JPH0754549B2 (ja) * 1984-09-19 1995-06-07 株式会社日立製作所 パターンマッチング用標準パターンの作成方法
US4876728A (en) * 1985-06-04 1989-10-24 Adept Technology, Inc. Vision system for distinguishing touching parts
US4891750A (en) * 1986-10-29 1990-01-02 Pitney Bowes Inc. Optical character recognition by forming and detecting matrices of geo features
JPH01183793A (ja) * 1988-01-18 1989-07-21 Toshiba Corp 文字認識装置
US5574803A (en) * 1991-08-02 1996-11-12 Eastman Kodak Company Character thinning using emergent behavior of populations of competitive locally independent processes
ITUD20050203A1 (it) * 2005-11-29 2007-05-30 Isomorph S R L Dispositivo e procedimento per il riconoscimento di un oggetto in un'immagine
US20070230789A1 (en) * 2006-04-03 2007-10-04 Inventec Appliances Corp. Method of controlling an electronic device by handwriting
WO2015141260A1 (ja) * 2014-03-17 2015-09-24 株式会社河合楽器製作所 手書き音楽記号認識装置およびプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL265383A (de) * 1960-05-31
US3293604A (en) * 1963-01-25 1966-12-20 Rca Corp Character recognition system utilizing asynchronous zoning of characters
US3268864A (en) * 1963-03-18 1966-08-23 Apparatus for feature recognition of symbols

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2822458A1 (de) * 1977-05-23 1979-01-25 Sharp Kk Optisches zeichenlesegeraet und verfahren zur optischen zeichenerkennung
DE3236336A1 (de) * 1982-09-30 1984-04-05 Siemens AG, 1000 Berlin und 8000 München Verfahren zur darstellung von druckvorlagen in form von groessen- und drehlagenunabhaengigen bogenstrukturen zum zwecke einer dokumentenanalyse, insbesondere zur schriftzeichenerkennung
DE3804450A1 (de) * 1987-02-20 1988-09-01 Hitachi Ltd Verfahren zur konturabtastung und anordnung dafuer

Also Published As

Publication number Publication date
DE1549930A1 (de) 1971-05-13
FR1547790A (fr) 1968-11-29
US3541511A (en) 1970-11-17
GB1180290A (en) 1970-02-04
DE1549930C3 (de) 1979-10-04

Similar Documents

Publication Publication Date Title
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE3633743C2 (de)
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE2431451C3 (de) Verfahren zur Normierung der Strichstärke von abgetasteten Schriftzeichen sowie Einrichtung zur Durchführung des Verfahrens
DE2247942A1 (de) Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen
DE1225426B (de) Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Zeichen
DE2612971A1 (de) Bildmuster-erkennungssystem
DE2432129A1 (de) Verfahren und vorrichtung zum erkennen von schriftzeichen, namentlich von ziffern
DE2909153A1 (de) Einrichtung zur elektronischen verarbeitung von bild- und/oder zeichenmustern
DE2509353A1 (de) Verfahren und vorrichtung zur gewinnung einer einem muster entsprechenden information
DE2703158A1 (de) Einrichtung zum erkennen einer zeichenposition
DE1124750B (de) Anordnung zur Identifizierung von Zeichen
DE2540101A1 (de) Automatisches zeichenerkennungs- system
DE2234109A1 (de) Leseapparat
DE69421487T2 (de) Verfahren zum Vergleichen von Mustern basierend auf der Verwendung von Bildelementmatritzen und Bildelementvektoren
DE2629590C2 (de) Schaltungsanordnung zur Trennung benachbarter Muster in einer Zeichenerkennungseinrichtung
DE3854216T2 (de) Bildverarbeitungsgerät und -verfahren.
DE1264118B (de) Einrichtung zum maschinellen Erkennen von Zeichen
DE1138571B (de) Zeichen-Erkennungsvorrichtung
DE1212758B (de) Verfahren und Schaltungsanordnung zur maschinellen Erkennung von Schriftzeichen
DE2064469A1 (de) Mustererkennungseinrichtung
DE1151139B (de) Vorrichtung zur Abtastung von Zeichen, die in ein- oder mehrspaltiger Kodierung oder n beiden Kodierungsarten auf einem Aufzeichnungstraeger aufgezeichnet sind
DE953474C (de) Verfahren zum lichtelektrischen Ablesen von Schriftzeichen
DE1205743B (de) Verfahren und Vorrichtung zur maschinellen Zeichenerkennung
DE1197656B (de) Verfahren zur maschinellen Zeichenerkennung

Legal Events

Date Code Title Description
C3 Grant after two publication steps (3rd publication)