[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

DE3523042A1 - Bildverarbeitungssystem - Google Patents

Bildverarbeitungssystem

Info

Publication number
DE3523042A1
DE3523042A1 DE19853523042 DE3523042A DE3523042A1 DE 3523042 A1 DE3523042 A1 DE 3523042A1 DE 19853523042 DE19853523042 DE 19853523042 DE 3523042 A DE3523042 A DE 3523042A DE 3523042 A1 DE3523042 A1 DE 3523042A1
Authority
DE
Germany
Prior art keywords
image
processing system
information
line
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19853523042
Other languages
English (en)
Other versions
DE3523042C2 (de
Inventor
Yoshinori Tokio/Tokyo Kato
Yuzuru Sapporo Hokkaido Tanaka
Hiroshi Tanioka
Eisaku Yokohama Kanagawa Tatsumi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP59133913A external-priority patent/JPS6113377A/ja
Priority claimed from JP59133912A external-priority patent/JPS6113376A/ja
Priority claimed from JP59133911A external-priority patent/JPS6113375A/ja
Priority claimed from JP59133914A external-priority patent/JPH0654495B2/ja
Application filed by Canon Inc filed Critical Canon Inc
Publication of DE3523042A1 publication Critical patent/DE3523042A1/de
Application granted granted Critical
Publication of DE3523042C2 publication Critical patent/DE3523042C2/de
Granted legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/43Editing text-bitmaps, e.g. alignment, spacing; Semantic analysis of bitmaps of text without OCR

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

TtEDTKE - BüHLING - KlNNE - GrUPE.. .. Ä55SÄS
Ä55SÄS*
Γ> r* O ■ ' . : . .' Dipt-lng H Tiedtke f
ReLLMANN - ÜRAMS - OTRUIF .-■ " --Uip-Chem. G. Buhling
-5- · Dipl.-Ing. R. Kinne
OCOO-/ O Dipl.-Ing. R Grupe
O O L O 1J k ι. Dipl.-Ing. B. Pellmann
Dipl.-Ing. K Grams Dipl.-Chem. Dr. B. Struif
Bavariaring 4, Postfach 202403 8000 München 2
Tel.: 089-539653 Telex: 5-24 845 tipat Telecopier: 0 89-537377 cable: Germaniapatent München
27. Juni 1985 DE 4969
Canon Kabushiki Kaisha Tokio, Japan
Bildverarbeitungssystem
Die Erfindung bezieht sich auf ein Bildverarbeitungssystem mit Bildaufbereitungsfunktion und insbesondere auf ein Bildverarbeitungssystem, in welchem in einem Bild (eines Schriftstücks) Worte und Zeilen erkannt werden, Wortzwischenabstände, Stellen von Zeichen und dergleichen ermittelt werden und ferner ein Umschreiben, eine Ausgabeaufbereitung, ein Wiederabruf oder dergleichen an Schriftstücken ausführbar ist.
Bildverarbeitungssysteme wie beispielsweise Textverarbeitungssysteme haben gegenwärtig verschiedenartige Aufbereitungsfähigkeiten und sind zur Erstellung und Aufbereitung von Schriftstücken unerläßlich. Als Vorrichtung für die Eingabe eines Schriftsatzes wird hauptsächlich eine Tastatur, ein optischer Klarschriftleser oder dergleichen benutzt. Im allgemeinen werden eingegebene Zeichen in Codedaten entsprechend internen Codes (ASCII, EBCDIC, JI und dergleichen) des verwendeten Systems umgesetzt und danach der Verarbeitung wie der Speicherung, dem Umschreiben, dem Abrufen, der Ausgabeaufbereitung und dergleichen unterzogen.
ORIGINAL INSPECTED
i KIo ?86'C6C P;s's:*e:'a"" iWu-c''<'>] K!; 67D-43-834
^523042
-6- DH 496ί
Schriftstücke enthalten gewöhnlich außer den Zeichen eine Tabelle, eine grafische Darstellung, eine Zeichnung, eine Fotografie oder dergleichen. Es wurde auch eine Textverarbeitungseinrichtung für das Herstellen und Aufbereiten von Schriftstücken durch Zusammensetzen solcher Grafikdaten und Zeichensätze vorgeschlagen. In diesem Fall werden die Zeichen, die Tabellen, die grafischen Darstellungen, die Zeichnungen, die Fotografien und dergleichen
-.Q in jeweils voneinander verschiedenen Datenformaten gespeichert. Beispielsweise werden die Zeichen als Zeichencodes, die Tabellen und grafischen Darstellungen als zu deren Beschreibung bzw. Darstellung geeignete Daten, die Zeichnungen als Grafikdaten oder Bilddaten, die Fotogra-
1(- fien als Bilddaten und dergleichen gespeichert.
Abgesehen von der Herstellung neuer Schriftstücke ist insbesondere in dem Fall, daß eine große Menge schon geschriebener Schriftstücke eingegeben und als Datengrundlage verwendet wird, die Eingabe von Primärinformationen über die Tastatur zeitraubend und umständlich.
Andererseits sind als andere Bürogeräte für die Eingabe oder Ausgabe von Schriftstücken Kopiergeräte oder Faksi-„_ milegeräte bekannt. Obwohl Informationen mit hoher Geschwindigkeit in Kopiergeräte eingegeben werden können, geben diese die eingegebenen Schriftsätze lediglich unverändert oder nach einer Vergrößerung oder Verkleinerung aus, wobei aber die Kopiergeräte nicht zur Verarbeitung
der eingegebenen Schriftstücke wie zur Textverarbeitung 30
oder zum Speichern bzw. Wiederabrufen der Schriftstücke ausgebildet sind.
In Anbetracht dessen liegt der Erfindung die Aufgabe
zugrunde, zum Ausschalten der vorangehend genannten 35
Mängel ein Bildverarbeitungssystem zu schaffen, mit dem
ORIGINAL INSPECTED
-7- DE 49frÖ3^0U4Z
verschiedenartige Informationen wie Schriftstücke, Zeichnungen, Tabellen oder dergleichen ohne Unterscheidung derselben verarbeitet werden können und auf einfache Weise eine Ausgabeaufbereitung dieser Informationen wie ein Streichen, Hinzusetzen oder dergleichen ausgeführt werden kann.
Ferner soll mit der Erfindung ein Bildverarbeitungssystem ,Q geschaffen werden, bei dem schon geschriebene Schriftstücke leicht eingegeben werden können und auch diese Schriftstücke auf gleichartige Weise verarbeitet werden können wie über eine Tastatur eingegebene Codedaten.
Λ r- Weiterhin soll mit der Erfindung ein Bildverarbeitungssystem geschaffen werden, bei dem Eingabedaten aus einer Tastatur und Bilddaten aus einem Leser gleichwertig verarbeitet werden können.
9n Ferner soll mit der Erfindung ein Bildverarbeitungssystem für Kopiergeräte, Faksimilegeräte oder dergleichen geschaffen werden, bei dem das Kopiergerät oder Faksimilegerät Funktionen für höhere Leistung erhält und dadurch die Aufbereitung von Eingabeinformationen ermöglicht ist.
Weiterhin sollen bei dem erfindungsgemäßen Bildverarbeitungssystem Zeilen in einem Bild erkennbar sein, wobei die Zeilen aus einem Histogramm bzw. einer Häufigkeitsverteilung von Schwarzpunkten für jeweilige Bildelementezeilen ermittelt werden.
Ferner soll bei dem erfindungsgemäßen Bildverarbeitungssystem eine Grundlinie einer jeweiligen Zeichenzeile aus einem Mittelwert und einer Standardabweichung der Häufigkeit oder aus einer Differenz zwischen Häufigkeiten er-35
mittelt werden.
ORIGINAL INSPECTED
-8- DE 49635230 A
Weiterhin sollen bei dem erfindungsgemäßen Bildverarbeitungssystem bei der Ermittlung einer jeweiligen Zeichenzeile Störsignale ausgeschieden werden.
Ferner soll das erfindungsgemäße Bildverarbeitungssystem für das Herausziehen von Abständen zwischen Zeichen und Abständen zwischen Worten ausgebildet sein.
,Q Dabei soll in dem Fall, daß in einer einzelnen Zeile drei oder mehr Zwischenabstände mit einer jeweiligen Breite über einem Schwellenwert aufeinanderfolgend auftreten, der zweite Zwischenabstand nicht als Wortabstand betrachtet werden.
Mit dem erfindungsgemäßen Bildverarbeitungssystem soll
eine Ausgabeaufbereitung wie das Einfügen, Streichen oder dergleichen von Zeichen eines Textes aus einer Zeichencodetabelle oder einer Schriftzeichentabelle ausgeführt __ werden können.
Weiterhin soll das erfindungsgemäße Bildverarbeitungssystem zum Ermitteln eines Absatzes, Erkennen eines Bindestrichs, Ändern der Länge einer Zeile und Erkennen der Lage eines Worts dienen.
Die Erfindung wird nachstehend anhand von Ausführungsbeispielen unter Bezugnahme auf die Zeichnung näher erläutert.
Fig. 1 zeigt den Aufbau eines Bildverarbeitungssystems.
Fig. 2 ist eine Blockdarstellung eines Bildverarbeitungssystems gemäß einem Ausführungsbeispiel.
Fig. 3-1 zeigt ein Beispiel für ein Vorlagenbild.
Original inspected
-9- DE 4969
Fig. 3-2 zeigt ein Beispiel für einen Zeichensatz als
Vorlagenbild.
κ Fig. 4 zeigt ein Histogramm für Schwarzpunkte auf jeweiligen eingegebenen Bildelementezeilen.
Fig. 5 ist ein Ablaufdiagramm für die Ermittlung eines Zeilenoberrands LTOP und eines Zeilenunterrands LBTM.
Fig. 6 ist ein Ablaufdiagramm für das Entfernen von Staubpunkten.
, _ Fig. 7 ist eine Darstellung, die das Ermitteln einer 15
Grundlinie BSLN veranschaulicht.
Fig. 8 ist ein Ablaufdiagramm zur Erläuterung der Ermittlung der Grundlinie nach einem Verfahren
Fig. 9 ist ein Ablaufdiagramm zur Erläuterung der Ermittlung der Grundlinie nach einem Verfahren
Fig. 10-1 ist eine Darstellung zur Erläuterung von Parametern bei dem Auszug eines Worts.
Fig. 10-2A und 10-2B sind Darstellungen zur Erläuterung von Abständen zwischen Worten und Abständen zwischen Zeichen.
Fig. 10-3 ist eine Darstellung, die ein Projizieren eines
Bilds auf eine X-Achse veranschaulicht.
Fig. 11-1 ist ein Ablaufdiagramm eines Schritts (T) bei dem Auszug eines Zeichenzwischenabstands.
-10- DE 4
£§23042
Fig. 11-2 ist ein Ablaufdiagramm eines Schritts (T) bei dem Auszug des Zeichenzwischenabstands.
Fig. 12 zeigt ein Beispiel für ein Vorlagenschriftstück.
Fig. 13-1 und 13-2 zeigen Ergebnisse des Auszugs von Zeichenzwischenabständen bei dem in Fig. 12 gezeigten Vorlagenschriftstück.
Fig. 13-3 zeigt das Ergebnis einer Glättung einer Häufigkeitsverteilung durch Mittelwerte in drei Gruppen.
1(- Fig. 14 ist ein Ablaufdiagramm der Berechnung für den Auszug des Abstands zwischen Worten.
Fig. 15-1 zeigt die Ergebnisse bei dem Auszug der Worte.
Fig. 15-2 zeigt das Ergebnis der Aufteilung des Vorlagt)
genschriftstücks nach Fig. 12 in Worte.
Fig. 16 zeigt Darstellungen zur Erläuterung des Umschreibens von Zeichen in einem Bildtext.
Fig. 17 zeigt ein Textmuster.
Fig. 18A bis 18D zeigen Ausgangsergebnisse bei dem Umschreiben des Textmusters.
Fig. 19 zeigt ein Beispiel für ein Vorlagenbild.
Fig. 20-1 und 20-2 sind Ablaufdiagramme für die Ermittlung eines Absatzes.
Fig. 21 ist eine Darstellung, die eine Wortliste zeigt.
ORIGINAL INSPECTED
-11- DE 4969
Fig. 22 ist eine Darstellung zum Erläutern eines Verfahrens zum Erkennen von Bindestrichen in einem Zeichenraster.
Fig. 23-1 und 23-2 sind Ablaufdiagramme zum Erläutern
eines Algorithmus für das Ermitteln der Lagen von Worten nach einer Änderung der Zeilenlänge .
Fig. 24 ist eine Darstellung zur Erläuterung der Berechnung einer Summenlänge LEN1.
Fig. 25 ist eine Darstellung zur Erläuterung der Berechne nung einer Summen Länge LEN2.
Fig. 26 ist eine Darstellung von Abständen zwischen jeweiligen Worten in dem Fall, daß keine Ausrichtung auf den rechten Rand erforderlich ist.
Fig. 27 zeigt Änderungen der Summenlängen LENT und LEN2.
Fig. 28 ist eine Darstellung zur Erläuterung eines Kopiervorgangs bei einem Wort, das einen Binde-„_. strich enthält.
Fig. 29-1 zeigt ein Beispiel für ein Vorlagenbild.
Fig. 29-2 zeigt das Ergebnis der Zeilenlängenänderung
bei dem in Fig. 29-1 gezeigten Vorlagenbild. 30
Bei dem erfindungsgemäßen Bildverarbeitungssystem enthält ein "Bild" auch Zeicheninformationen, wobei die Ausgabeaufbereitung ohne Unterscheidung von Zeichen und
einem Musterbild ausgeführt wird. Ferner beinhaltet das 35
erfindungsgemäße "Bildverarbeitungssystem" eine einfache
-12- ΠΓ; 4969
Einrichtung, mit der die Bildverarbeitung ausgeführt wird.
Die Fig. 1 zeigt den Aufbau einer Bildverarbeitungsanlage mit einem Leser und einem Drucker als Ausführungsbeispiel des erfindungsgemäßen Bildverarbeitungssystems. Die Fig. 1 zeigt eine Lesereinheit bzw. einen Leser zum Lesen von Bildinformationen einer Vorlage und zum Verarbeiten ,Q dieser Informationen, eine Vorlagenabdeckung 2 für das Andrücken einer Vorlage, eine Auflageplatte 3, auf die eine Vorlage aufgelegt wird, eine Beleuchtungslampe 4 zum Beleuchten der Vorlage, Spiegel 5 bis 7 zum Umlenken eines optischen Wegs, ein Abbildungsobjektiv 8 zum Ab-
,. bilden der Vorlage, eine Fotosensorvorrichtung bzw. einen Zeilensensor (CCD) 9 zum digitalen Lesen der Bildinformationen und eine Bildverarbeitungseinheit 10 zum Ausführen der erfindungsgemäßen Bildverarbeitungen oder dergleichen an den mittels des Zeilensensors 9 gelesenen Informationen. Mit 11 ist ein Ausgabegerät bzw. ein Drucker für die Ausgabe der in dem Leser 1 erzeugten Bildinformationen bezeichnet, wobei bei diesem Ausführungsbeispiel ein Laserstrahldrucker eingesetzt wird. Die Fig. 1 zeigt eine Laser-Abtastvorrichtung 12 zum Umsetzen von aus dem Leser 1 ausgelesenen Bildinformationen in Laserstrahlen, einen Spiegel 13 zum Reflektierten der Laserstrahlen und zum Umlenken derselben auf eine Trommel 14 mit fotoempfindlichem Material, eine Entwicklungsvorrichtung 15 für das Entwickeln von Ladungsbildern an der Trommel 14, ein Förderband 17 zum Befördern von Papier aus einer von Papiervorratskassetten 16 und eine Papieraustragswalze 18 für den Ausstoß des Papiers.
Bei der vorstehend beschriebenen Anordnung wird die Vorlagenabdeckung 2 angehoben, auf die durchsichtige Aufla-35
geplatte 3 eine Vorlage aufgelegt und mittels der Elemen-
te 4 bis 9 als optisches System eine Abtastung der Vorlage ausgeführt, wobei mittels des Zeilensensors 9 als Fotosensorvorrichtung die Bildinformationen aufeinanderfolgend gelesen werden. Die gelesenen Bildinformationen werden in der Bildverarbeitungseinheit 10 Verarbeitungen unterzogen, die nachfolgend erläutert werden. In dem Drucker 11 werden durch die Laser-Abtastvorrichtung 12 die Laserstrahlen entsprechend Signalen aus der Bildver-
,Q arbeitungseinheit 10 moduliert und abgelenkt, wodurch die Laserstrahlen das gleichförmig geladene fotoempfindliche Material an der Trommel 14 belichten, so daß an dieser ein Bild erzeugt wird. Danach werden Betriebsvorgänge wie das Entwickeln, die Kopieübertragung und dergleichen aus-
,f. geführt, wonach das Kopiebild ausgegeben wird. Hinsichtlich der Bildverarbeitungsanlage besteht keine Einschränkung auf die vorstehend beschriebene Gestaltung; vielmehr kann irgendeine andere Anordnung mit einem Bildleser, einem Drucker wie einem Thermodrucker oder dergleichen verwendet werden, die der Anordnung einer Textverarbeitungseinrichtung ähnlich ist.
Fig. 2 ist eine Blockdarstellung eines Beispiels des Bildverarbeitungssystems mit der gemäß der vorstehenden Beschreibung gestalteten Bildverarbeitungsanlage. Der Leser 1 liest das Vorlagenbild und gibt serielle Daten ab. Da diese Bilddaten mit hoher Geschwindigkeit abgegeben werden, die höher als die Geschwindigkeit bei dem Zugriff an einem Bildspeicher 20 ist, werden die Daten
mittels eines Seriell/Parallel-Umsetzers 21 auf bei-30
spielsweise 16 Bits aufgeweitet bzw. aufgefächert. Dann werden diese Bilddaten in den Bildspeicher 20 unter Berücksichtigung des Wiederholungszyklus des Bildspeichers 20 über einen FIFO-Puffer bzw. Schiebepuffer 22 (mit gleicher Aufeinanderfolge bei der Eingabe und der
Ausgabe) eingespeichert.
Die Bilddaten werden weiterhin mittels eines Verarbeitungsprozessors 23 in eine elektronische Datei, einen Mikrofilm, einen Magnetbandspeicher 24 oder dergleichen g eingespeichert. Die Bilddaten werden an einem Sichtgerät 25 angezeigt. Durch eine Eingabe über eine Tastatur 26 ist es möglich, in einen ausschließlich hierzu vorgesehenen bzw. besonderen Prozessor 27 Befehle für eine Verarbeitung wie beispielsweise für das Einfügen einer neuen
^q Zeile zwischen Zeilen oder dergleichen einzugeben. Entsprechend diesen Befehlen führt der besondere Prozessor 27 eine Bilderkennung und eine Bildverarbeitung aus. Die verarbeiteten Bilddaten werden mittels des Druckers 11 über einen Schiebepuffer 28 und einen Parallel/Seriell-
,p- Umsetzer 29 aufgezeichnet, welche zur Bilddateneingabe entgegengesetzt wirken. Die Eingabedaten bzw. Codedaten aus der Tastatur 26 werden in dem Verarbeitungsprozessor in Bilddaten für die Anzeige umgesetzt und mittels des Sichtgeräts 25 ausgegeben; die Eingabedaten können jedoch auch mit den Bilddaten des Lesers 1 aus dem Bildspeicher 20 zusammengesetzt werden. In diesem Fall können die Stellen bzw. Lagen mittels der Tastatur 26 oder mittels einer Schreibtafel 200 gewählt werden.
„c Gemäß der vorstehenden Beschreibung können auch die ersten Bildinformationen aus der Tastatur und die zweiten Bildinformationen aus dem Bildleser in die Bilddaten (Bildelementedaten) umgesetzt werden. Bei den zweiten Bildinformationen können jedoch alle Teile, die infolge
des Ergebnisses der Erkennung in Codeinformationen umge-30
setzt werden können, entsprechend den Informationen als Codeinformationen verarbeitet werden.
Ferner können die Bildinformationen über eine Übertragungsleitung zu einem entfernt aufgestellten Endgerät 35
gesendet werden. Die Tastatureinheit kann durch eine
Handschrift-Zeicheneingabe-Einheit mit einer Tafel und einem Eingabestift ersetzt werden.
Das Bildverarbeitungssystem mit der vorstehend beschriebenen Gestaltung wird nachstehend ausführlich erläutert.
Die Fig. 3-1 zeigt ein Beispiel für ein Vorlagenbild (einer einzelnen Zeile). In dieser Figur ist mit LTOP als ,Q Zeilenoberrand die y-Koordinate von Bildpunkten in dem oberen Teil bei den Schwarzbildpunkten bzw. Schwarzpunkten einer einzelnen Zeile bezeichnet. Als Schwarzpunkte wird nachstehend in dem binär digitalisierten Bildsignal ein Satz von Bildelementen bezeichnet, welche als
,c "Schwarz" ermittelt werden. Mit LBTM ist als Zeilenunter-Ib
rand die y-Koordinate der Bildpunkte im unteren Teil der Schwarzpunkte einer einzelnen Zeile bezeichnet. Als BSLN ist eine Grundlinie dargestellt, die mit der y-Koordinate an dem Unterrand von Großbuchstaben des Alphabets übereinstimmt. Von diesen Linien bzw. Rändern wird die Grundlinie BSLN als Bezugslinie für die Verstellung bei der Bewegung von Zeichen herangezogen.
(T) Ermitteln von LTOP und LBTM (Schritt A)
Es wird nun die Ermittlung des Zeilenoberrands LTOP und des Zeilenunterrands LBTM erläutert. Es sei angenommen, daß das Eingabebild der in Fig. 3-2 gezeigte Zeichensatz ist. Zuerst wird die Häufigkeitssunme von Schwarzpunkten in jeweils eingegebenen Bildelementzeilen ermittelt. Die Fig. 4 zeigt ein dabei erzeugtes Histogramm bzw. Häufigkeitsdiagramm. Aus der Fig. 4 ist ersichtlich, daß sechs Blöcke mit hohen Häufigkeiten vorliegen. Diese Blöcke entsprechen den Bereichen, in denen Zeichen vorhanden
sind, so daß diese Bereiche die Schriftzeilen darstellen. 35
Die Anzahl dieser Blöcke stimmt mit der Anzahl der Zeilen
BAD ORIGINAL
Il I Il H 1 Il
des in Fig. 3-2 gezeigten Eingabebilds überein. Der
Algorithmus besteht aus zwei Hauptteilen:
SCHRITT A: Ermitteln der Ränder LTOP und LBTM aus den Beg reichen vorliegender Häufigkeiten.
SCHRITT B: Beseitigen falscher Punkte bei den im SCHRITT A abgeleiteten Rändern LTOP und LBTM.
Der Verarbeitungsalgorithmus bei dem SCHRITT A wird nun ,Q anhand des in Fig. 5 gezeigten Ablaufdiagramms für die Ermittlung der Ränder LTOP und LBTM erläutert. Bei Schritten 1 und 2 werden Anfangsvorbereitungen ausgeführt. Bei einem Schritt 5 wird ermittelt, ob eine Summe LD(I) von Schwarzpunkten in einer jeweiligen eingegebenen ,- I-ten Bildelemente- bzw. Punktezeile nach Fig. 3-2 gleich "1" oder größer ist. Es sei nun angenommen, daß FL eine Kennung ist, die "0" ist, wenn LD(I-I) = 0 gilt, und "1
ist, wenn LD(I-I) ^O gilt. Falls die Summe LD(I) "1
oder größer ist und auch bei einem Schritt 6 die Kennung
"0" ist, nämlich die Summe für die vorangehende (I-1)-te AU
Punktezeile "0" ist, kann damit die I-te Punktezeile als Anfangszeile der Zeichenzeilen bestimmt werden. Bei einem nächsten Schritt 7 wird eine Zeilennummer J für das eingegebene Bild um "1" erhöht. Bei einem Schritt 8 wird die nr- Punktezeilennummer I als Oberrand LTOP(J) für die Zeichenfolge auf der J-ten Zeichenzeile gespeichert. Kenn bei dem Schritt 6 die Kennung FL nicht "0" ist, nämlich schon in der vorangehenden Punktezeile mindestens ein Schwarzpunkt vorhanden war, ist die I-te Punktezeile nicht die Anfangszeile, so daß die Schritte 7 und 8 nicht ausgeführt werden. Gleichermaßen wird dann, wenn für die verarbeitete Punktezeile bei dem Schritt 5 nicht die Bedingung LD(I) 2 1 erfüllt ist, nämlich kein Schwarzpunkt vorhanden ist, die Verarbeitungsroutine zu einem
Schritt 9 abgezweigt, bei dem die Kennung FL überprüft 35
wird. D.h., falls in der vorangehenden Punktezeile
-17- DE 4969
mindestens ein Schwarzpunkt vorhanden ist, wird diese Zeile als letzte Punktezeile bestimmt, so daß bei einem Schritt 10 als LBTM(J), nämlich als Unterrand LBTM der J-ten Zeichenzeile (1-1) gespeichert wird.
Der vorstehend beschriebene Prozess wird für alle eingegebenen Punktezeilen unter zeilenweisem Fortschalten der Punktezeilen bei einem Schritt 11 ausgeführt. Wenn bei jQ einem Schritt 3 das Ende dieses Prozesses ermittelt wird, zweigt die Verarbeitungsroutine zu einem Schritt 4 ab, bei dem die End-Zeilennummer J des eingegebenen Bilds als Zeilenanzahl GYOSU gespeichert wird.
Auf diese Weise werden für eine jede Zeichenzeile die Ränder LTOP und LBTM abgeleitet.
D.h., bei dem vorstehend beschriebenen SCHRITT A werden alle Bereiche herausgezogen, in denen bei dem in Fig. 4 __ gezeigten Histogramm Häufigkeiten vorhanden sind, und die beiden Ränder eines jeweiligen Bereichs als Ränder LTOP und LBTM eingesetzt. Die Ergebnisse dieser Verarbeitung an dem in Fig. 3-2 gezeigten Eingabebild sind in dem Teil A der nachstehenden Tabelle 1 aufgeführt.
-18-Tabelle 1
DE 4969
GYOSU = 8 LTOP LBTM
Zeile Nr. 6- 7
1 12- 41
2 54- 84
3 96- 126
4 138- 168
5 180- 21 1
6 218- 218
7 223- 252
8
GYOSU = 6 LTOP LBTM
Zeile Nr. 12- 41
1 54- 84
2 96- 126
3 138- 168
4 180- 21 1
5 223- 252
6
30 31 31 31 32
1 30
30
31
31
31
32
30
In der Tabelle 1 ist jeweils als H der Maximalwert H = LBTM - LTOP + 1 der Höhen der Zeichen in einer einzelnen Zeile angeführt.
Es wird nun der SCHRITT B erläutert. Gemäß Teil A der Tabelle 1 ist die maximale Zeichenhöhe bei den Zeilen Nr. 1 und 7 gleich 2 bzw. 1, so daß daraus geschlossen werden kann, daß diese Ergebnisse durch irgendwelche Staubteilchen bzw. Staubpunkte in den Bereichen zwischen Zeichenzeilen verursacht sind. Daher werden bei dem SCHRITT B
35230A2 _19_ DE1969
die Staubpunkte ausgeschieden, um eine durch Staubteilchen verursachte fehlerhafte Bestimmung der Ränder LTOP und LBTM zu verhindern. Das Vorhandensein oder Fehlen von g Staubpunkten wird danach ermittelt, ob die Maximalhöhe H für eine jeweilige Zeile beispielsweise unterhalb der Hälfte des Mittelwerts der Höhen H aller Zeilen liegt oder nicht. Auf diese Weise werden gemäß der Darstellung im Teil B der Tabelle 1 diejenigen Zeichenzeilen ausge- -^q schieden, die durch die Staubpunkte ermittelt wurden.
Die Fig. 6 ist ein Ablaufdiagramm für das vorangehend erläuterte Ausscheiden von Staubpunkten zwischen Zeichenzeilen. Die Maximalhöhe H der Zeichen in einer jeweiligen ,j- Zeile wird aus den Daten gemäß (T) in dem Ablaufdiagramm in Fig. 5 abgeleitet. Danach wird bei einem Schritt 1 eine Summe SUM der Höhen H der Zeichen in den jeweiligen Zeichenzeilen ermittelt. Bei einem Schritt 2 wird ein Mittelwert AVR der Höhen der Zeichen berechnet.
Bei einem Schritt 6 wird die Maximalhöhe H der Zeichen in einer jeweiligen Zeile auf binäre Weise mit dem Wert 0,5* AVR digitalisiert; wenn H über 0,5 AVR liegt, zweigt die Verarbeitungsroutine zu einem Schritt 3 ab, bei dem die _._ Zeichenzeile ersetzt wird. D.h., es werden bei diesem Schritt die gemäß Teil A der Tabelle 1 fälschlich erkannten Zeichenzeilen mit den Nummern 1 und 7 ausgeschieden, so daß die verbleibenden Zeilen auf genaue Weise als Zeilen Nr. 1 bis 6 gemäß der Darstellung in Teil B der Tabelle 1 erkannt werden.
Z Ermittlung der Grundlinie BSLN
Im allgemeinen ist es selten der Fall, daß die meisten
der Zeichen in einer einzelnen Zeile Zeichen sind, bei 35
denen ein Teil des Zeichens unterhalb der Grundlinie er-
scheint, wie beispielsweise bei den Buchstaben g, j, p, q, y oder dergleichen in einem englischen Zeichensatz. Daher ist bei der Aufteilung der Zeichenzeile in drei Bereiche I, II und III gemäß Fig. 3-1 anzunehmen, daß bei einem englischen Zeichensatz die Summenfrequenzen der Schwarzpunkte in den jeweiligen Punktezeilen insbesondere in der Aufeinanderfolge der Bereiche II, I und III geringer wird. Infolgedessen kann die Grundlinie dadurch ermittelt werden, daß die Stelle gefunden wird, an der bei dem Durchlaufen der Häufigkeit von dem Unterrand LBTM zum Oberrand LTOP einer jeweiligen Zeichenzeile die Häufigkeit plötzlich zunimmt. Im Falle einer Zeichenzeile, bei der im Bereich III keine Schwarzpunkte vorhanden sind, stimmt die Grundlinie BSLN mit dem Unterrand LBTM über-
ein.
Als Verfahren zum Ermitteln der Grundlinie BSLN werden folgende zwei Verfahren vorgeschlagen:
Verfahren 1: Es werden der Mittelwert und die Standardabweichung der Häufigkeiten herangezogen.
Verfahren 2: Es werden Häufigkeitsdifferenzen herangezogen.
__. Verfahren 1
Bei dem Verfahren 1 werden aufeinanderfolgend von dem Unterrand LBTM zu dem Oberrand LTOP der Mittelwert und die Standardabweichung der Häufigkeiten ermittelt, wobei
als Grundlinie BSLN diejenige Stelle festgelegt wird, an 30
der die Häufigkeit den Wert
(Mittelwert AVR) + (Standardabweichung SD) χ m-
übersteigt, m- ist ein Parameter, der empirisch bestimmt wird.
Bei dem Verfahren wird von dem Unterrand LBTM bis zu dem Oberrand LTOP die Differenz zwischen den Häufigkeiten ermittelt und als Grundlinie BSLN diejenige Stelle festgelegt, an der der Differenzwert einen Schwellenwert übersteigt, der durch (Bezugswert) χ nu bestimmt ist. Als Bezugswert wird die maximale Häufigkeit in dieser Zeile herangezogen. m2 ist ein Parameter, der experimentell bestimmt wird.
In der nachstehenden Tabelle 2 sind Werte für die Grundlinien BSLN angeführt, die sich dann ergeben, wenn m.. zu "5" gewählt wird bzw. nu zu "0,3" gewählt wird.
Tabelle 2 BSLN Verfahren 2
Zeichenzeile 36
Nr. Verfahren 1 78
1 36 120
2 78 161 '
3 120 204
4 161 246
5 205
6 247
Gemäß der Darstellung in der Tabelle 2 sind die nach den vorstehend genannten beiden Verfahren abgeleiteten Werte für die Grundlinie BSLN nahezu gleich. Wenn die Grundlinien in das in Fig. 3-2 gezeigte Eingabebild gemäß dem
_ nach dem Verfahren 1 abgeleiteten Grundlinien BSLN einge-30
schrieben werden, ergibt sich die Darstellung gemäß Fig. 7. Es kann daher ausgesagt werden, daß die richtigen Grundlinien eingeschrieben werden.
Als weiteres Beispiel kann abhängig von einem eingegebe-35
nen Bild der Fall angenommen werden, daß der Unterrand
-22- DE 4969
LBTM und die Grundlinie BSLN miteinander übereinstimmen. Betrachtet man einen solchen Fall bei dem Verfahren 1, so wird die Grundlinie BSLN auf die Stelle des Unterrands g LBTM festgelegt, falls die Grundlinie BSLN selbst dann nicht ermittelt wird, wenn die verarbeitete Punktezeile während der Abfrage der Häufigkeit zu der Stelle gelangt, die nur der Hälfte der Zeichenzeilenhöhe oberhalb des Unterrands LBTM entspricht. Obgleich die Hälfte der auf
,Q richtige Weise ermittelte Wert ist, muß dieser Wert mindestens über einem Drittel liegen. Dies ist deshalb der Fall, weil gemäß Fig. 3-2 trotz der Aufteilung der Zeichenzeile in die Bereiche I, II und III die Abmessungen in der Richtung der Y-Achse in einen jeden Bereich
.p. als nahezu gleich anzusehen sind.
Verfahren 2
Bei dem Verfahren 2 wird zusätzlich zu dem Differenzwert ein Schwellenwert (Bezugswert) χ m, der Häufigkeit gebildet; wenn die Häufigkeit diesen Schwellenwert übersteigt, wird die hierbei erfaßte Punktelinie als Grundlinie BSLN bestimmt, nu ist ein Parameter, der bei diesem Ausführungsbeispiels so gewählt wird, daß nu = m2 gilt.
Als nächstes werden die Verarbeitungen gemäß den vorstehend beschriebenen Verfahren 1 und 2 unter Bezugnahme auf die Ablaufdiagramme in den Fig. 8 und 9 erläutert.
Die Fig. 8 ist ein Ablaufdiagramm für das Verfahren 1. Bei diesem Verfahrensablauf wird aufeinanderfolgend von der (LBTM-i)-ten Punktezeile an ermittelt, ob die jeweilige Punktezeile in der Zeichenzeile die Grundlinie BSLN ist oder nicht, und zwar durch Wiederholen einer Programmschleife mit Schritten 1 bis 5.
35
35230A2 -23- DE 4969
Zuerst wird bei dem Schritt 1 ein Wert, bei dem dem Häufigkeits-Mittelwert AVR die auf das m.-fache bzw. gemäß dem Ablaufdiagramm auf das NL -fache erhöhte Standardabweichung SD addiert ist, mit der Häufigkeit für die I-te Punktezeile verglichen; wenn die Häufigkeit gleich oder größer als dieser Wert ist, zweigt das Programm zu einem Schritt 7 ab, bei dem die I-te Zeile als Grundlinie BSLN(J) gespeichert wird. Wenn dies nicht der
IQ Fall ist, wird bei einem Schritt 2 der Mittelwert AVR ermittelt und bei einem Schritt 3 die Standardabweichung SD abgeleitet; diese Werte werden für die Erkennung der nächsten (I-1)-ten Zeile vorbereitet. Danach wird bei einem Schritt 4 ermittelt, ob die Verarbeitung bis zu einer Höhenlinie ausgeführt wurde, die der Hälfte der Zeichenhöhe (LBTM - LTOP + 1) entspricht. Falls bei dem Schritt 4 die Antwort "NEIN" ist, bedeutet dies, daß kein Zeichen vorhanden ist, welches teilweise unterhalb der Grundlinie erscheint; daher wird in diesem Fall bei einem Schritt 6 die Grundlinie BSLN für diese Zeile dem Unterrand LBTM gleichgesetzt.
Der Ablauf der Verarbeitung nach dem Verfahren 2 wird nun anhand der Fig. 9 erläutert. Bei einem Schritt 1 wird
__ ausgehend von der LBTM(J)-ten Zeile die Häufigkeitsdifferenz DF zwischen dieser Zeile und der jeweils vorangehenden Zeile aufeinanderfolgend ermittelt. Falls bei einem Schritt 2 die Häuf igkeitssuinme der gerade verarbeiteten Punktezeile größer als ein Wert ist, der gleich einer mit
• der Zahl m7 (bzw. M9) multiplizierten maximalen Frequenzsumme MAXLD in der Zeichenzeile ist, wird diese Punktezeile unbedingt bei einem Schritt 5 als Grundlinie BSLN festgelegt.
Falls andererseits bei dem Schritt 2 das Programm zu 35
einem Schritt 3 abzweigt, wird bei diesem die Häufig-
BAD ORIGINAL
keitsdifferenz DF mit dem Wert M, χ MAXLD verglichen; wenn die Differenz DF größer ist, zweigt die Routine zu dem Schritt 5 ab, so daß diese Zeile als Grundlinie BSLN eingesetzt wird. Die vorstehend beschriebenen Vorgänge werden aufeinanderfolgend für eine jede Punktezeile ausgeführt. Gemäß der vorstehenden ausführlichen Erläuterung können bei dem erfindungsgemäßen Bildverarbeitungssystem die Zeilen des Vorlagenbilds erkannt werden. Daher kann
jQ ein hochwertiges Textverarbeitungssystem geschaffen werden. Falls zusätzlich das System derart gestaltet ist, daß sowohl die Zeilen als auch Abständen zwischen Worten, Wortlängen und Absätze erkannt werden, kann eine nachfolgend beschriebene Bildverarbeitung mit noch höherer
,c Leistungsfähigkeit ausgeführt werden.
Da auf diese Weise die Zeilen des eingegebenen Schriftbilds erkannt werden können, ist es möglich, nur einen Teil des Schriftbilds herauszuziehen und ein neues Schriftstück zu erzeugen. Ferner können durch das binäre Digitalisieren des ausgelesenen Schriftbilds und durch das Heranziehen der Häufigkeitsverteilung der Schwarzpunkte auf jeweiligen Punktezeilen die Lagen der Zeilen in dem Schriftsatz auf genaue Weise erkannt werden.
Die Zeilen können in ihrer Aufeinanderfolge umgeordnet werden. Zwischen die Zeilen können neue Zeilen eingefügt werden. Unnötige Zeilen können weggelassen werden.
Gemäß der vorstehenden ausführlichen Beschreibung kann im 30
Vergleich zu den üblichen Textverarbeitungseinrichtungen oder Kopiergeräten durch das Erkennen der Zeilen während der Eingabe eines Schriftstücks als Bild ein Umschreiben, Aufbereiten, Wiederabrufen und dergleichen mit außerordentlich hoher Fortschrittlichkeit unter hohem Arbeits-35
wirkungsgrad ausgeführt werden.
Als nächstes wird als weitere Funktion der Auszug eines Worts bei der Bildverarbeitung erläutert.
Beispielsweise erfolgt bei einem Vorlagenbild gemäß Fig. 10-1 der Auszug eines Worts dadurch, daß der linke Rand LEFT und der rechte Rand RIGHT ermittelt werden oder die Länge LENGTH des Worts ermittelt wird und dann die Lage an der Grundlinie BSLN angegeben wird. Die Grundlinie 1q BSLN stimmt beispielsweise mit der y-Koordinate des Unterrands eines Großbuchstaben des Alphabets überein und wird als Bezugslinie für die Verstellungslage bei der Bewegung von Zeichen herangezogen.
Ein Wort wird dadurch erkannt, daß die vorstehend genannten drei Werte ermittelt und gespeichert werden. Zur Bestimmung der Grundlinie können zwar verschiedenerlei Verfahren in Betracht gezogen werden, jedoch kann die Grundlinie z.B. auf die Weise ermittelt werden, daß das Histogramm bzw. die Häufigkeitsverteilung für die Anzahl von Schwarzpunkten in einer jeweiligen Punktezeile ermittelt wird und dann der Mittelwert und die Standardabweichung der Häufigkeiten oder aber die Häufigkeitsdifferenz abgeleitet wird. Einzelheiten der Ermittlung sind p. hier weggelassen.
Als nächstes wird ein Verfahren zum Ermitteln der genannten Ränder LEFT und RIGHT unter Benutzung der Grundlinie und damit zum Auszug eines Worts in folgenden Schritten erläutert:
SCHRITT (T) Auszug eines Abstands zwischen Zeichen.
SCHRITT © Erstellung einer Häufigkeitsverteilung für
die Ab stands längen.
SCHRITT © Glättung der Häufigkeiten.
SCHRITT Qu Bestimmung von Schwellenwerten für die Längen 35
von Wortzwischenabständen und die Längen von
-26- DE 4969
Abständen von Zeichen in dem Wort.
SCHRITT (D Auszug des Abstands zwischen Worten.
SCHRITT (6) Ermittlung der Ränder LEFT und RIGHT des
Worts.
Fig. 10-2 ist eine Darstellung zur Erläuterung der Längen von Wortzwischenabständen und Zeichenzwischenabständen. Die Längen von Wortzwischenabständen Nr. 1, 4 und 7 sind -,Q offensichtlich größer als die Längen von Abständen 2, 3, 5 und 6 zwischen den Zeichen in den Worten. Daher kann durch die Entnahme von verhältnismäßig langen Abständen aus den herausgezogenen Abständen ein Wort herausgezogen werden.
Zuerst werden bei dem SCHRITT (T) linke Ränder B, rechte Ränder E und Breiten SPW aller Zwischenabstände ermittelt (Fig. 10-2B).
Die Fig. 10-3 ist eine Darstellung, die eine Projektion 20
eines Bilds auf eine x-Achse veranschaulicht. Die bei dieser Darstellung benutzten Bezeichnungen sind folgende: LTOP (Zeilenoberrand) : y-Koordinate der im oberen Teil der Schwarzpunkte in einer einzelnen Zeile vorhandenen Schwarzpunkte (in der Form eines Satzes von Bildelemen-
ten, die in dem binär digitalisierten Bildsignal als "Schwarz" bestimmt sind).
LBTM (Zeilenunterrand): y-Koordinate der Schwarzpunkte im unteren Teil der Schwarzpunkte in einer einzelnen Zeile.
PRX (X-Achsen-Projektion): Projektion des Bilds auf die 30
x-Achse.
Auszug eines Zeichenzwischenabstands
Es wird nun die Ermittlung der Werte B, E und SPW gemäß 35
den vorstehenden Definitionen erläutert.
DE 4969
Die Werte B, E und SPW werden dadurch bestimmt, daß zuerst die Abständen zwischen Zeichen herausgezogen werden. Ein Verfahren für diese Ermittlung ist hauptsächlich in die folgenden beiden Schritte aufgeteilt: SCHRITT (T): Es wird die Projektion der Schwarzpunkte im Bereich von dem Zeilenoberrand LTOP bis zum Zeilenunterrand LBTM auf die x-Achse gebildet. Falls bei den Bildpunkten von y = LTOP bis y = LBTM bei einer bestimmten x-Koordinate mindestens ein Schwarzpunkt vorhanden ist, wird PRX auf "1" eingestellt (PRX =1). Falls im Gegensatz dazu kein Schwarzpunkt vorliegt, gilt PRX = 0.
SCHRITT ©: Aus den bei dem SCHRITT © abgeleiteten
Werten PRX wird derjenige Bereich entnommen, an dem zusammenhängend PRX = 0 gilt; die x-Koordinate für den linken Rand dieses Bereichs wird als B. eingesetzt, während die x-Koordinate für den rechten Rand des Bereichs als E. eingesetzt wird. Die Abstandsbreite SPW wird aus der Gleichung SPW. = E. - B- + 1 ermittelt, wobei i jeweils eine Nummer ist, mit der der jeweilige Zwischenabstand bezeichnet ist.
Die vorstehend beschriebenen Verarbeitungen bei SCHRITT (T) und SCHRITT (z) werden nachstehend anhand von Ab laufdiagrammen erläutert. Die Fig. 11-1 ist das Ablaufdiagramm für den SCHRITT (T) . Bei Schritten 1 und 2 wird das Programm wiederholt, bis der Wert J gleich der maximalen Zeilennummer wird. Bei Schritten 3 und 4 wird der Prozess von X = 1 bis zur Bildbreite WIDTH wiederholt. Falls bei einem Schritt 5 mindestens ein Bereich vorliegt in dem der Bildelementewert "1" ist, wird bei einem Schritt 6 PR(J, X) = 1 eingestellt. Ober einen Schritt 7
wird das Bild von Y = LTOP bis Y = LBTM abgetastet. Wenn während der Abtastung des Bilds in der Y-Richtung alle Werte der Punktelemente "0" sind, wird bei einem Schritt 8 der Wert PR(J, X) auf "0" eingestellt. Dieser Vorgang wird gemäß der vorstehenden Beschreibung der Schritte 1, 2 und 4 wiederholt, bis X jeweils von 1 bis zur Bildbreite durchlaufen ist und bis die Zeilennummer J gleich der maximalen Zeilennummer wird. Für den Fall, daß bei dem Schritt 8 der Projektionswert PR(J, X) zu "0" wird, wird nachstehend der genannte SCHRITT (2) beschrieben.
Die Fig. 11-2 ist das Ablaufdiagramm eines Prozesses bei dem SCHRITT (f) . Bei einem Schritt 1 wird der Prozess wie
, r- auf die vorstehend beschriebene Weise bis zu einer vorbe-JLo
stimmten Zeilennummer bzw. der maximalen Zeilennummer wiederholt. Bei einem Schritt 2 wird der Prozess gleichfalls wie auf die vorstehend beschriebene Weise bis zu der Bildbreite wiederholt. Wenn bei einem Schritt 3 PR(J, X) = 0 gilt und bei einem Schritt 4 für die vorangehende
X-Koordinate PR(J, X-1) = 1 gilt, wird daraus bei einem Schritt 5 der linke Rand B(J, K) des Zwischenabstands bestimmt. Wenn im Gegensatz dazu bei dem Schritt 3 PR(J, X) = 1 gilt und bei einem Schritt 6 PR(J, X-I) =0 gilt, wird daraus bei einem Schritt 7 der rechte Rand E(J, K) des Zwischenabstands bestimmt. Aus den Ergebnissen bei den Schritten 5 und 7 wird bei einem Schritt 8 die Breite SPW des Zwischenabstands aus der Gleichung SPW(J, K)
E(J,K)-B(J, K) + 1 berechnet. Wenn schließlich bei dem Schritt 2 der Wert X die Bildbreite übersteigt, wird diese X-Koordinate bei einem Schritt 9 als rechter Rand des Zwischenabstands erfaßt. Danach wird bei einem Schritt 10 die Breite des Zwischenabstands berechnet. Bei der vorstehenden Erläuterung bzw. in dem entsprechenden
Ablaufdiagramm ist mit M(Y, X) die Bildpunktanzahl an den 35'
Koordinaten (Y, X) bezeichnet, mit K die Nummer des Zwi-
schenabstands bezeichnet, mit FL der Wert von PR(X-I) bezeichnet, mit B(J, K) der linke Rand des K-ten Zwischenabstands auf der J-ten Zeile bezeichnet, mit E(J, K) g der rechte Rand des K-ten Zwischenabstands auf der J-ten Zeile bezeichnet und mit SPW(J, K) die Breite des K-ten Zwischenabstands auf der J-ten Zeile bezeichnet.
Aufstellung der Häufigkeitsverteilung und Glättung der ^q Häufigkeiten
Die Fig. 13-1 zeigt die Ergebnisse in dem Fall, daß die vorstehend beschriebenen Verarbeitungsvorgänge an einem in Fig. 12 gezeigten Vorlagentext ausgeführt werden. Die 1(- Fig. 13-2 zeigt die Häufigkeitsverteilung der bei dem SCHRITT (D erhaltenen Werte für die Breiten SPW nach Fig. 13-1. In dieser Darstellung entspricht die Häufigkeit "11" der Breite SPW jeweils dem Zwischenabstand neben einem kleinen Zeichen wie einem Komma oder dergleichen mit geringer Zeichenbreite; infolgedessen wird dieser Zwischenabstand als Abstand zwischen Zeichen in einem Wort betrachtet und das Zeichen nicht als ein einzelnes Wort abgesondert. Wenn beispielsweise gemäß der vorangehenden Beschreibung des SCHRITTES © die Glättung durch die dreistufige Mittelwertbildung bzw. die Mittelwertbildung in drei Gruppen vorgenommen wird, ergibt sich eine Häufigkeitsverteilung gemäß der Darstellung in Fig. 13-3. Auf diese Weise ist es gemäß der vorstehenden Beschreibung des SCHRITTES (5) möglich, auf einfache Weise
einen Schwellenwert für das Absondern der Abstände 30
zwischen Zeichen in einem Wort von Abständen zwischen Worten zu bestimmen.
Bestimmung der Schwellenwerte
Bei der Bestimmung der Schwellenwerte werden die Häufigem keiten der Abständen zwischen Zeichen in einem Kort beachtet, bei denen sich geringe Schwankungen hinsichtlich der Häufigkeitsverteilung ergeben; die Änderungen der Häufigkeiten werden aufeinanderfolgend von der Abstandsbreite "1" bis zu einer großen Abstandsbreite untersucht,
,Q wobei Senkenpunkte ermittelt werden, an denen die Häufigkeit nach einem Abfall zunimmt. Falls in dem Bereich von einem Häufigkeitsabfall bis zu einem Häufigkeitsanstieg ein flacher Teil vorliegt, wird der Mittelwert in diesem Bereich als Schwellenwert festgelegt. Auf diese Weise
1(- wird nach Fig. 13-3 der Schwellenwert zu "14" bestimmt. Beispielsweise ist jedoch die Breite des Abstands zwischen den Ziffern "1" der Zahl "11" verhältnismäßig groß, so daß dieser Abstand häufig als Abstand zwischen Worten angesehen wird. Daher wird zum Vermeiden einer
Trennung der Ziffern "1" als zwei verschiedene Worte die 20
folgende Bedingung hinzugenommen und der Wortzwischenabstand dementsprechend herausgezogen.
Bedingung: Falls aufeinanderfolgend in einer einzelnen
Zeile drei Zwischenräume mit einer jeweiligen
Breite über dem Schwellenwert auftreten, wird
der zweite Abstand nicht als Abstand zwischen
Worten betrachtet.
Diese Bedingung beruht darauf, daß in einem englischen
Schriftbild niemals aufeinanderfolgend zwei oder mehr 30
Worte aus jeweils einem einzigen Buchstaben auftreten.
Auszug von Abständen zwischen Worten
Die Verarbeitungsvorgänge für den Auszug der Abstände 35
zwischen Worten aus den auf die vorstehend beschriebene
Weise ermittelten Abständen wird nun anhand des Ablaufdiagramms in Fig. 14 erläutert.
g Wenn bei einem Schritt 3 die Abstandsbreite SPW größer als der Schwellenwert TH ist, besteht die hohe Wahrscheinlichkeit, daß dieser Abstand der Abstand zwischen Worten ist. Infolge der vorstehend genannten Bedingung ist jedoch aus drei aufeinanderfolgenden Abständen über
IQ dem Schwellenwert der zweite Abstand ein Abstand innerhalb eines Worts. In diesem Fall ist daher bei einem Schritt 4 die Antwort "JA", so daß bei einem Schritt 5 der Abstand als Zwischenabstand innerhalb eines Worts behandelt wird. In diesem Ablaufdiagramm ist mit CO die Anzahl von aufeinanderfolgend auftretenden Zwischenabständen bezeichnet. In den anderen Fällen wird der Abstand als Abstand zwischen Worten behandelt. Dieser Verarbeitungsvorgang wird bei einem Schritt 2 hinsichtlich der Anzahl von Zwischenabständen in der Zeile sowie
auch bei einem Schritt 1 hinsichtlich der Anzahl der Au
Zeilen ausgeführt. Auf diese Weise werden die Abstände zwischen den Worten herausgezogen.
Ermittlung der Ränder LEFT und RIGHT eines Worts
Bei dem vorangehend genannten SCHRITT (6) werden für den Abstand zwischen Worten die nachfolgenden Verarbeitungsvorgänge ausgeführt und damit die Ränder LEFT und RIGHT der jeweiligen Worte ermittelt.
(T) Die nachstehenden Vorgänge (2) und (S) werden wieder-30
holt, bis die Zeilennummer i gleich der Anzahl der Zeilen des Textes wird.
(D Der nachstehende Vorgang (3) wird wiederholt, bis die Wortabstandnummer j zu (Anzahl der Wortabstände in
der i-ten Zeile)-1 wird.
35
Q) Es wird angesetzt: LEFTk -*- RW(i,j)
RIGHTk ^- LW(i,j+1)
K —- K+1
g (LW: Linker Rand des Abstands zwi
schen Worten)
(RW: Rechter Rand des Abstands
zwischen Worten).
Gemäß der vorstehenden Beschreibung werden aus dem in Fig. 12 gezeigten Text die in Fig. 10-1 gezeigten Konstanten LEFT, RIGHT und BSLN erhalten. Das Ergebnis ist in Fig. 15-1 gezeigt. Die Fig. 15-2 zeigt das Ergebnis der Aufteilung der Vorlage nach Fig. 12 in die Worte gemäß dem in Fig. 15-1 gezeigten Ergebnis. Mit dem erfindungsgemäßen Bildverarbeitungssystem können die Werte auf die vorstehend ausführlich beschriebene Weise erkannt werden. Bei der Eingabe des Vorlagenbilds kann eine Verarbeitungseinheit zum Korrigieren der Gradation oder
on dergleichen der Vorlage in der Eingabeeinheit vorgesehen 20
werden.
Gemäß der vorstehenden ausführlichen Erläuterung können in dem erfindungsgemäßen Bildverarbeitungssystem an dem
als Bild eingegebenen Schriftsatz als Informationen die 25
Worte sowie Kommata, Punkte und dergleichen erkannt werden, so daß nur ein Teil des Schriftsatzes herausgezogen wird und ein neuer Schriftsatz bzw. ein neues Schriftbild erzeugt werden kann. Ferner ist es möglich, über die Tastatur oder dergleichen Worte in der Aufeinanderfolge umzuordnen, Worte umzuschreiben oder zwischen Worte neue Worte einzusetzen, was nachfolgend erläutert wird. Es können überflüssige Worte und Zeichen gestrichen bzw. weggelassen werden oder dergleichen. Durch das Erkennen der Worte während der Eingabe eines Schriftsatzes 35
als Bild ist im Vergleich zu einer gewöhnlichen Textver-
arbeitungseinrichtung oder einem Kopiergerät ein außerordentlich fortschrittliches Umschreiben, Aufbereiten, Wiederabrufen und dergleichen mit hohem Arbeitswirkungsgrad ermöglicht.
Als nächstes wird der Fall beschrieben, daß die mittels der vorangehend erläuterten Verarbeitungsvorgänge erkannten Zeichen umgeschrieben bzw. neu geschrieben werden.
jQ Für das mit dem Umschreiben von Zeichen in einem Text mit codierten Zeichen gleichzeitige Umschreiben von Zeichen in einem Bildtext muß als ein Bild eine Musterseite hergestellt werden, auf der die Schriftbilder aller benutzten Zeichen ausgedruckt sind. Diese Musterseite wird als Schriftbildtabelle bezeichnet. An dieser Schriftbildtabelle werden Verarbeitungsvorgänge ausgeführt, die denjenigen für den Auszug der Zeichen des Bildtextes gleichartig sind, so daß dadurch Informationen (über die Grundlinie, den linken Rand, den rechten Rand und dergleichen)
on für den Bereich aufgenommen werden, in dem sich ein jeweiliges Schriftzeichen befindet. Ferner wird zusätzlich zu der Schriftbildtabelle eine Zeichencode-Tabelle hergestellt, während den Zeichen in der Schriftbildtabelle jeweilige Tasten der Tastatur zugeordnet werden. Die
of- Zeichen in der Zeichencodetabelle sind alle codierte Zeichen, wobei ein jeweiliges Zeichen an der gleichen Stelle wie das entsprechende Zeichen in der Schriftbildtabelle angeordnet wird. Die Zeichen in der Schriftbildtabelle können durch Koordinaten bestimmt werden, die die Stelle des Zeichens in der Zeichencodetabelle angeben.
Die Fig. 16 zeigt ein Beispiel für das Umschreiben von
Zeichen in einem Bildtext, wobei ein Verfahren für das
Einfügen eines Zeichens bzw. Buchstabens "b" in den Text dargestellt wird.
Zuerst wird mit der Tastatur der Buchstabe "b" gewählt. Als Ergebnis der Suche des internen Codes für "b" in der Zeichencodetabelle werden gemäß Fig. 16A die Koordinaten (2,1) für "b" ermittelt. Gemäß den Fig. 16B und 16C wird aus der Schriftbildtabelle das Zeichen an der Koordinatenstelle (2, 1) herausgezogen, wonach die Bilddaten für das Zeichen zu der gewählten Stelle in dem Text übertragen werden, wodurch das Einfügen des Zeichens abgeschlos- -,Q sen ist.
Als praktisches Beispiel wurden ein Mustertext gemäß Fig. 17 und die Schriftbildtabelle gemäß Fig. 16C unter Verwendung einer Schreibmaschine hergestellt und es wurde eine Umschreibe-Aufbereitung der Zeichen vorgenommen; die ausgegebenen Ergebnisse sind in Fig. 18 gezeigt. Die Fig. 18A zeigt die Ausgabe nach der Vornahme einer Rechtsausrichtung an dem Zeichensatz des Bildtextes gemäß Fig. 17. Das Umschreiben der Zeichen wird in drei Arten eingeteilt nämlich das Streichen, das Neueinschreiben und das Einfügen (Fig. 18B, 18C bzw. 18D). Bei dem Streichen gemäß Fig. 18B wurde aus "VLSI" der Buchstabe "V" gestrichen. Bei dem Neueinschreiben gemäß Fig. 18C wurde in "VLSI" der Buchstabe "V" in "U" geändert. Bei dem Einfügen gemäß Fig. 18D wurde in "(48)" die Ziffer "0" eingefügt, um "(408)" zu bilden.
Bei dem vorstehend beschriebenen Ausführungsbeispiel wurde zwar die Erkennung und Umschreibung bzw. Änderung von hauptsächlich alphabetischen Zeichen beschrieben, jedoch können gleichartige Erkennungsvorgänge auch an japanischen Schriftzeichen ausgeführt werden.
Da es das erfindungsgemäße Bildverarbeitungssystem ermöglicht, die Zeichen des als Bild eingegebenen Schrift-35
satzes zu erkennen, kann beispielsweise nur ein Teil des
Schriftsatzes herausgezogen und ein neuer Schriftsatz hergestellt werden. Es ist ferner möglich, die Aufeinanderfolge von Zeichen umzuordnen, neue Zeichen zwischen die Zeichen einzufügen und unnötige bzw. überflüssige Zeichen zu streichen bzw. zu löschen. Die Zeichen können auch umgeschrieben werden. Ferner ermöglicht durch das bei dem erfindungsgemäßen Bildverarbeitungssystem vorgenommene Erkennen der Zeichen während der Eingabe des
■■η Schriftsatzes als Bild eine Textverarbeitung an dem bestehenden Druckzeichensatz, so daß ein außerordentlich fortschrittliches Umschreiben, Aufbereiten, Wiederabrufen und dergleichen mit hohem Arbeitswirkungsgrad vorgenommen werden kann. Darüberhinaus wird beispielsweise ein über
,p. die Tastatur eingegebener Buchstabe "b" in dem Text aus den eingegebenen Zeicheninformationen herausgesucht, wonach das Umschreiben, Einfügen und Streichen des Zeichens auf automatische Weise oder durch eine Eingabe mittels einer Ausführungstaste ausgeführt wird, welche die Zustimmung des Benutzers meldet. In diesem Fall können diese Betriebsvorgänge unter Verwendung des Sichtgeräts 25 ausgeführt werden. Dieser Grundgedanke entspricht der Anwendung eines Rückholens oder Rückstellens bei einer Schreibmaschine oder dergleichen.
Als nächstes wird die Erkennung von Absätzen und Bindestrichen in einem Bild als weitere Funktionen des erfindungsgemäßen Bildverarbeitungssystems beschrieben. Der Ablauf der Verarbeitungsvorgänge ist auf Absatzauszug,
Bindestricherkennung, Berechnung der Wortlagen nach einer 3Ü
Zeilenlängenänderung und Erstellung eines neuen Textes durch Datenkopie unterteilt.
λ) Absatzauszug
Der Absatzauszug umfaßt zwei SCHRITTE Uy und \2) .
BAD ORIGINAL
-36- DH 4969
Bei dem SCHRITT Φ wird ein Linksrand LF: des Bildtextes ermittelt.
Bei dem SCHRITT (2) wird ein erstes Wort in einem Absatz aus dem Abstand von dem Linksrand ermittelt. Da zu Beginn des Absatzes ein Leerbereich vorliegt, ist bei dem Vergleich der Abstände zwischen dem Linksrand LE und dem linken Rand LEFT des jeweils ersten Worts in der jeweili-
■jo gen Zeile der Abstand bei dem ersten Wort des Absatzes größer als die anderen Abstände. Durch das Einstellen eines Schwellenwerts für den Abstand und das Ermitteln der Differenz zwischen dem Abstand und dem Schwellenwert kann der Absatz herausgezogen werden. Dieser Auszugsvor-
.p- gang wird nun anhand eines in Fig. 19 gezeigten Vorlagenbilds erläutert. In dieser Figur ist mit LE als Linksrand die x-Koordinate des Schwarzpunkts bezeichnet, der in dem Bild am weitesten links angeordnet ist, mit PRG die Nummer des ersten Worts des Absatzes bezeichnet und mit PRSP die Länge des Leerbereichs am Anfang des Absatzes bezeichnet (wobei der Leerbereich gewöhnlich so lang wie ein einzelnes Wort ist). Die Fig. 20-1 und 20-2 sind Ablaufdiagramme von Verarbeitungsvorgängen, mit denen diese Werte für den Absatzauszug erhalten werden. In diesen
Ablaufdiagrammen werden folgende Bezeichnungen benutzt: I 25
= Nummer der gerade verarbeiteten Zeile, WIDTH = Bildbreite, LFW(I) = linker Rand des ersten Worts der I-ten Zeile, J = Variable, NW(I) = Anzahl der Worte der I-ten Zeile, LSP = Mittelwert der Breiten der Abstände zwischen
den Worten, PRG(J) = Nummer des ersten Worts des Absatzes 30
und PRSP(J) = Länge des Leerbereichs am Anfang des Absatzes .
Zuerst wird ein SCHRITT 0 gemäß Fig. 20-1 beschrieben.
Wenn bei einem Schritt 2 der Linksrand LE in der Zeile 35
größer als der linke Rand des ersten Worts der I-ten
BAD ORIGINAL
-37- DE 4969
Zeile ist, wird bei einem Schritt 3 der linke Rand für diese Zeile als Linksrand LE eingesetzt. Dieser Vorgang wird fortgesetzt, bis bei einem Schritt 1 die Zeilennummer I von "1" beginnend die Zeilenanzahl erreicht. Abschließend wird LE gleich dem Linksrand des Bilds.
Es wird nun ein SCHRITT (2) gemäß Fig. 20-2 erläutert. Falls bei einem Schritt 5 der Abstand von dem Linksrand LE zu dem ersten Wort den Mittelwert LSP der Breiten der Wortabstände übersteigt, der als Schwellenwert herangezogen wird, wird der Anfang dieser Zeile als Anfang des Absatzes bestimmt. Dann werden bei einem Schritt 6 die Nummer PRG des ersten Worts des Absatzes und die Länge des Leerbereichs am Anfang ermittelt. Dieser Vorgang wird wiederholt, bis bei einem Schritt 4 die Zeilennummer I von "1" beginnend gleich der Zeilenanzahl wird. Die Nummer des Absatzes wird durch J-I ausgedrückt.
_n 2) Bindestricherkennung
Obgleich verschiedenartige Verfahren für den Auszug von Worten in Betracht gezogen sind, können die Lagen der Wortabstände aus dem Histogramm der Weißpunkte-Lauflängen bzw. -Folgelängen in den jeweiligen Punktezeilen erkannt werden. Es sei hier angenommen, daß diese Stellen bzw. Lagen schon herausgezogen sind. Falls ein solcher Auszug vorgenommen wird, wird in einer Wortliste für den in Fig. 21 gezeigten Text das Wort "Sections" in der dritten und
vierten Zeile als zwei verschiedene Worte herausgezogen. 30
Falls beispielsweise an einem solchen Wort eine Zeilenlängenänderung vorgenommen wird, ist zu berücksichtigen, daß dieses den Bindestrich enthaltende Wort danach an einer anderen Stelle als an der letzten Stelle der Zeile
auftritt. Da "See-" und "tions" eigentlich ein einziges 35
Wort sind, muß der Bindestrich vor der Zeilenlängenände-
DE 4969
rung erkannt und bei der Änderung entfernt werden.
10 15
Obzwar verschiedenartige Erkennungsverfahren in Betracht gezogen werden können, kann wegen der einfachen Form des Bindestrichs dieser durch die Bedingung ermittelt werden, daß an einer geeigneten Stelle für das letzte Zeichen einer jeweiligen Zeile in dem Text ein imaginäres Rechteck geeigneter Größe gebildet wird und in dem (in Fig. 22 strichliert dargestellten) Bereich außerhalb des Rechteckrahmens kein Schwarzpunkt vorhanden ist. Dieser Rahmen wird in der Darstellung an die Stelle von Teilungen eingesetzt, bei denen der Bereich von dem Zeilenoberrand LTOP bis zu der Grundlinie in acht gleiche Teile aufgeteilt ist. Es werden nun die in Fig. 22 verwendeten Bezeichnungen erläutert:
LTOP (Zeilenoberrand): Die y-Koordinate der im oberen
Teil vorhandenen Schwarzpunkte aus den Schwarzpunkten in einer einzelnen Zeile (wobei hier als Schwarzpunkte ein Satz von Bildelementen bezeichnet ist, die durch das binär digitalisierte Bildsignal als "Schwarz" festgelegt sind).
LBTM (Zeilenunterrand) : Die y-Koordinate der im unteren
Teil vorhandenen Schwarzpunkte
aus den Schwarzpunkten in einer
einzelnen Zeile.
BSLN (Grundlinie): Die Grundlinie, die mit der y-
Koordinate des unteren Teils der Großbuchstaben des Alphabets übereinstimmt.
20 25 30 35
3J Ermittlung der Lagen der Worte
-39- DE 4969
Die Zeilenlängenänderung ist ein Vorgang, bei dem auf beliebige Weise eine Querbreite für den Text gewählt wird und die Worte derart umgeordnet werden, daß sie nicht aus dem Bereich der Querbreite heraustreten. Die Fig. 23-1 und 23-2 veranschaulichen Algorithmen für das Berechnen und Ermitteln der Lagen der Worte nach der Umsetzung bzw. Änderung. In diesen Ablaufdiagrammen werden folgende Bezeichnungen benutzt: WIDTH = Zeilenlänge des Bilds, I und
IQ J = Wortnunmern, N = Anzahl der Worte, die in die Zeile eingesetzt werden können, GYO = Zeilennummer, NGYO = Zeilenanzahl nach der Zeilenlängenänderung, AI.N'W = Anzahl aller Worte, PNO = Absatznummer, HNO = Bindestrichnummer (entsprechend der Aufeinanderfolge des Auftretens), HW(HNO) = Nummer des Worts mit dem Bindestrich, CH = Anzahl der ausgeschiedenen Bindestriche, DS = Abstand zwischen den Grundlinien, NW(GYO) = Anzahl der Worte in einer Zeile, LEN1 = Summenlänge aus jeweils den Wortbreiten und Abstandsbreiten SP, LEN2 = Summenlänge aus je- _ weils den Wortbreiten, den Abstandsbreiten SP sowie Werten ADDSP und RSTSP, ADDSP = Länge, die bestimmt einer jeden Wortabstandsbreite SP hinzugefügt werden kann, RSTSP = Länge, die einigen der Wortabstandsbreiten SP hinzugefügt werden kann, DLW(J) = Linksrand eines jeweiligen Worts, DRW(J) = Rechtsrand eines jeweiligen Worts, DBL(J) = Grundlinie eines jeweiligen Worts, und W = Textbreite (Zeilenlänge), die zu Beginn eines Absatzes gleich WIDTH - PRSP ist und andernfalls WIDTH ist.
Die Textbreite wird auf WIDTH eingestellt und eine neue Lage des Worts an der Stelle ermittelt, an der der Linksrand DLW ist, der Rechtsrand DRW ist und die Grundlinie DBL ist. Grundlegend werden die folgenden Verarbeitungsvorgänge ausgeführt:
(a) Berechnung von LEN1 (siehe Fig. 24)
Bei diesem Vorgang wird bezüglich einer jeden Zeile berechnet, wieviele Worte in dem Bereich der neu eingestellten Textbreite eingefügt werden können.
Die Abstandsbreite SP mit einer Länge, die als Mindestlänge für den Zwischenraum zwischen Worten angesehen wird (wobei als SP in dem Programm eine Länge eingesetzt wird, die dreimal so groß ist wie die mittlere Breite der Ab-2Q stände zwischen Zeichen in dem Wort), wird zu der Länge eines jeweiligen Worts addiert und es wird die Summe der Längen aller Abstandsbreiten SP in die Summenlänge LEN1 eingesetzt. In Fig. 24 ist mit N die Anzahl der Worte bezeichnet.
LEN1 -*■ LENI + (Wortlänge) + SP
Wenn die Summenlänge LENl die gewählte Textbreite W übersteigt, wird das zum Schluß hinzugefügte Wort entfernt on (nämlich in der Fig. 24 das (N+i)-te Wort). Der Wert W ist zwar mit Ausnahme der ersten Zeile des Absatzes gleich der Breite WIDTH, jedoch ist für die erste Zeile des Absatzes am Anfang der Leerbereich vorzusehen; daher wird die Textbreite auf WIDTH - PRSP eingestellt. PRSP ist die Länge des Leerbereichs am Anfang des Absatzes.
(b) Berechnung von ADDSP und RSTSP
Falls ermittelt wird, daß in die Zeile N Worte eingefügt werden können, wird ein Abstand r von dem rechten Rand des N-ten Worts bis zu der Textbreite W berechnet. Durch das Aufteilen des Abstands r auf die Abstände zwischen den jeweiligen Worten wird die Rechsausrichtung des Schriftbilds vorgenommen.
OO ZoU 4 -41- DE 4969
ADDSP ist diejenige Länge, die einer jeden Wortabstandsbreite SP bestimmt hinzugefügt wird. RSTSP ist die Summe der Längen, die einigen der Wortabstandsbreiten SP hinzugefügt werden. Der Zusammenhang zwischen r, ADDSP und RSTSP ist folgender:
r = ADDSP χ (N-1) + RSTSP
(c) Berechnung von LEN2 (siehe Fig. 25)
Zwischen die Worte werden die Abstände gesetzt, die durch SP, ADDSP und RSTSP bestimmt sind, und es wird für jedes Wort jeweils die neue Lage ermittelt. Von dem ersten Wort bis zu dem N-ten Wort der Zeile werden die nachstehenden Berechnungen ausgeführt, durch die die jeweiligen Ränder DLW und DRW bestimmt werden:
(i) DLW(k+n-1 ) ->- LEN2 + 1
(ii) LEN2 — LEN2 + (Länge des (k+n-i)-ten Worts) (iii) DRW(k+n-1) — LEN2
(iv) Falls RSTSP i O,
LEN2 — LEN2 + SP + ADDSP + 1
Falls RSTSP = 0,
LEN2 — LEN2 +■ SP + ADDSP
(v) Falls RSTSP i 0,: RSTSP — RSTSP - 1
Der Anfangswert von LEN2 ist bei der ersten Zeile des Absatzes PRSP und bei den anderen Zeilen "0".
Die vorstehend bei (a) beschriebene Berechnung von LENI
wird nun anhand der Fig. 25-1 beschrieben. Falls bei 30
Schritten 1 und 2 die Nummer I des gerade verarbeiteten Worts die erste Wortnummer PRG(PNO) des Absatzes ist, wird die Textbreite W auf einen Wert eingestellt, bei dem von der gewählten Bildbreite die Länge PRSP des Leerbereichs am Anfang des Absatzes subtrahiert ist. Falls bei 35
nächsten Schritten 3, 4 und 5 das gerade verarbeitete
Wort ein dem Bindestrich folgendes Wort ist, wird die Breite des Bindestrichs aus dem Rechenergebnis für LEN1 ausgeschieden. Wenn dann bei einem Schritt 6 LEN1 kleiner als der gewählte Wert ist, folgt ein Schritt 7. Falls der Bindestrich vorliegt, wird bei einem Schritt 8 die Bindestrichnummer erhöht.
Die vorstehend als (b) beschriebenen Berechnungen von ADDSP und RSTSP werden nun anhand der Fig. 23-2 erläutert.
Wenn bei dem Schritt 6 nach Fig. 23-1 die Antwort "NEIN" ist, springt die Verarbeitungsroutine zu dem Ablaufdiagramm in Fig. 23-2 über. Bei einem Schritt 11 werden die nachfolgenden Vorgänge wiederholt, bis das Wort das letzte Wort in der Zeile wird. Bei Schritten 12 und 13 werden jeweils der linke bzw. rechte Rand des Worts ermittelt. Bei einem Schritt 14 wird ermittelt, ob eine Länge RSTSP hinzuzufügen ist oder nicht. Falls die zusätzliche Länge vorliegt ("JA" bei dem Schritt 14), ist
das Ergebnis bei einem Schritt 15 um "1" größer als das Ergebnis bei einem Schritt 16. Daraufhin wird der Wert RSTSP um "1" vermindert. Bei einem Schritt 17 wird dem jeweiligen Wort die Grundlinie der Zeile zugeteilt. Falls die Verarbeitungsroutine durch Wiederholen der vorstehend beschriebenen Vorgänge von dem Schritt 11 weg einen Sprung ausführt (nämlich bei dem Schritt 11 die Antwort "NEIN" ist), wird erneut die Anfangsvorbereitung ausgeführt, wonach die Verarbeitungsroutine zu einem Punkt (T.' fortschreitet.
Bei den vorstehend angeführten Berechnungen (a) und (b) bestehen geringfügige Unterschiede zwischen der letzten Zeile eines Absatzes und einer Zeile, in der das Folgewort des den Bindestrich enthaltenden Worts auftritt 35
(entsprechend "tions" in Fig. 21). Da für die letzte
Zeile des Absatzes keine Rechtsausrichtung erforderlich
ist, wird gemäß Fig. 26 zwischen die jeweiligen Worte nur der Wortabstand mit der Breite SP gesetzt. Es ist daher nicht erforderlich, die Berechnungen von ADDSP und RSTSP gemäß (b) auszuführen. Bei der Berechnung von LEN2 gemäß (c) wird ferner der Schritt 16 in Fig. 23-2 zu LEN2 — LEN2 + SP.
^q In der Zeile, in der das Folgewort des den Bindestrich enthaltenden Worts auftritt, wird zum nahtlosen Zusammensetzen dieser beiden Worte zu einem einzelnen Wort, aus dem bei der Ausgabe der Bindestrich entfernt ist, eine Berücksichtigung insofern vorgenommen, als der rechte
,c Rand RIGHT des den Bindestrich enthaltenden Worts vor dem Bindestrich gelegen ist und zugleich nach dem den Bindestrich enthaltenden Wort kein Zwischenabstand hinzugefügt wird. Daher ergeben sich die durch Pfeile in Fig. 27 dargestellten Änderungen von LENI und LEN2.
4) Erstellung des Bildtextes nach der Zeilenlängenände-
rung
Die Bilddaten für die Worte im ursprünglichen Text werden ρ- an den neuen Stellen im Text kopiert. Die Lage eines jeweiligen Worts im ursprünglichen Bereich ist durch die Werte LEFT, BSLN und LENGTH bestimmt. Die Lage in dem Bereich, in dem das Bild kopiert wird, ist durch die Werte DLW, DRW und DBL bestimmt (siehe Fig. 28). Die Wortlänge LENGTH wird nach der Gleichung LENGTH = DRW DLW + 1 ermittelt. Wenn die Wortlänge LENGTH aus den Lagen der beiden Ränder des Worts bei dem Kopieren des Bilds bestimmt wird, wird im Falle eines den Bindestrich enthaltenden Worts dieser Bindestrich nicht kopiert.
Gemäß der vorstehenden Beschreibung wird an dem in Fig.
BAD
-44- DE 4969
21 gezeigten Vorlagenbild eine genaue Zeilenlängenänderung bzw. -anpassung vorgenommen, wie es beispielsweise in den Fig. 29-1 und 29-2 gezeigt ist.
Mit dem erfindungsgemäßen Bildverarbeitungssystem können Absätze des Schriftsatzes erkannt werden. Daher ist es beispielsweise möglich, nur einen Teil des Schriftsatzes herauszuziehen und damit einen neuen Schriftsatz herzu-,0 stellen, die Reihenfolge der Absätze umzuordnen oder zwischen Absätze einen neuen Absatz einzufügen. Überflüssige Absätze können gelöscht werden. Ferner können Schriftsätze in ungleichmäßigen Formaten wie solche in Zeitungen oder dergleichen umgeordnet werden.
Weiterhin wird mit dem erfindungsgemäßen Bildverarbeitungssystem durch das Erkennen der Absätze während der Eingabe des Schriftsatzes als Bild im Vergleich zu einer gewöhnlichen Textverarbeitungseinrichtung die Textverarbeitung eines bestehenden Druckschriftsatzes ermöglicht, so daß ein außerordentlich fortschrittliches Umschreiben, Aufbereiten, Wiederabrufen oder dergleichen mit hohem Arbeitswirkungsgrad ausführbar wird.
n_ Weiterhin kann damit ein Bildverarbeitungssystem mit 25
hoher Leistungsfähigkeit hinsichtlich der Ausgabeaufbereitung oder Zusammenstellung geschaffen werden, bei dem die ersten Bildinformationen aus der Tastatur und die zweiten Bildinformationen aus dem Bildleser auf dem gleichen Niveau, nämlich beispielsweise als Bilddaten bzw. Bildelementedaten oder als Codedaten verarbeitet werden können.
Es wird ein Bildverarbeitungssystem mit Bildverarbeitungsfunktion für den Einsatz insbesondere in einer 35
Textverarbeitungseinrichtung, einem Kopiergerät oder
3523042 -45- DE'4969
einem Faksimilegerät angegeben. Dieses System enthält einen Bildleser zum Lesen und Eingeben von Bildinformationen, eine Tastatur zum Eingeben von Zeicheninformationen, eine Erkennungseinheit für das Erkennen der Zeicheninformationen in den mittels des Bildlesers eingegebenen Bildinformationen und einen Bildprozessor zur Ausgabeaufbereitung der Zeichen gemäß dem Ergebnis aus der Erkennungseinheit. Zu den Zeicheninformationen zählen Zeilen von Zeichenfolgen, Absätze in Schriftsatzinformationen, Abstände zwischen Worten, Abstände zwischen Zeichen, Bindestriche oder Wortlagen. Der Bildprozessor führt an den mittels der Erkennungseinheit erkannten Zeicheninformationen die Bildaufbereitungs-Verarbeitungen wie eine Rechtsausrichtung, eine Löschung, ein Umschreiben, eine Einfügung, eine Suche und dergleichen aus. Mit diesem System können über die Tastatur eingegebene Zeichendaten und von dem Bildleser gelesene Bilddaten auf dem gleichen Niveau verarbeitet werden, so daß auf beliebige Weise neue Schriftsätze erstellt werden können.
-Hb-
- Leerseite

Claims (17)

TedTKE - BüHLING - KlNNE - GrUPE ΠΓ* O- ■■.:"- Oipl.-lng. H.Tiedtke I HtLLMANN - URAMS - OTRUIF . Dipl.-Chem. G. Bühiing ο tr ο ο η / ο Dipl.-lng. R. Kinne O O L O U k /L Dipl.-lng. R Grupe Dipl.-lng. B. Pellmann Dipl.-lng. K. Grams Dipl.-Chem. Dr. B. Struif Bavaria ring 4, Postfach 202403 8000 München 2 Tel.: 089-5396 53 Telex: 5-24 845 tipat Telecopier: O 89-537377 cable: Germaniapatent München 27. Juni 1985 DE 4969 Patentansprüche
1. Bildverarbeitungssystem, gekennzeichnet durch eine Eingabevorrichtung (1, 26) für die Eingabe von Bildinformationen, eine Erkennungseinrichtung (27) für das Erkennen von Zeicheninformationen in den mittels der Eingabevorrichtung eingegebenen Bildinformationen . und eine Bildverarbeitungseinrichtung (27) für eine Ausgabeaufbereitung wie ein Umschreiben oder dergleichen der Zeichen gemäß den Ergebnissen der Erkennungseinrichtung.
2. Bildverarbeitungssystem nach Anspruch 1, dadurch gekennzeichnet, daß die Eingabevorrichtung ein Leser (1) zum Lesen von Bildinformationen ist.
3. Bildverarbeitungssystem nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Zeicheninformationen Informationen über eine Zeile aus einer Folge von Zeichen enthalten.
4. Bildverarbeitungssystem nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß die Zeicheninformationen eine Information über einen Absatz bei den eingegebenen Bildinformationen enthalten.
5. Bildverarbeitungssystem nach einem der Ansprüche
BAD ORIGINAL
-2- DE 4969
1 bis 4, dadurch gekennzeichnet, daß die Zeicheninformationen Informationen über Abstände zwischen Worten enthalten.
6. Bildverarbeitungssystem nach einem der Ansprüche
1 bis 5, dadurch gekennzeichnet, daß die Zeicheninformationen Informationen über Abstände zwischen Zeichen enthalten.
7. Bildverarbeitungssystem nach einem der Ansprüche
1 bis 6, dadurch gekennzeichnet, daß die Zeicheninformationen Informationen über einen Bindestrich enthalten.
. p.
8. Bildverarbeitungssystem nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß die Zeicheninformationen Informationen über die Lage eines Worts enthalten.
9. Bildverarbeitungssystem nach einem der Ansprüche on 1 bis 8, dadurch gekennzeichnet, daß die Bildverarbeitungseinrichtung (27) eine Bild-Ausgabeaufbereitung wie eine· Rechtsausrichtung, eine Streichung, eine Neubeschriftung, eine Einfügung oder dergleichen hinsichtlich der mittels der Erkennungseinrichtung (27) erkannten
oc Zeicheninformationen ausführt.
Zb
10. Bildinformations-Verarbeitungssystem, gekennzeichnet durch eine Eingabevorrichtung (1, 26) für die Eingabe von Bildinformationen, eine Recheneinrichtung
(27) zum Erzeugen von Histogramm-Informationen bezüglich 30
der Anzahl von Schwarzpunkten in den mittels der Eingabevorrichtung eingegebenen Bildinformationen, eine Unterscheidungseinrichtung (27) zum Unterscheiden einer Zeile der Bildinformationen gemäß den Informationen aus der
Recheneinrichtung und eine Ermittlungseinrichtung (27) 35
zum Ermitteln einer Grundlinie für eine Zeichenfolge in
BAD
bezug auf die mittels der Unterscheidungseinrichtung unterschiedenen Zeile.
c
11. Verarbeitungssystem nach Anspruch 10, dadurch gekennzeichnet, daß die Eingabevorrichtung ein Bildleser (1) für das Lesen von Bildinformationen ist.
12. Verarbeitungssystem nach Anspruch 10 oder 11, _ dadurch gekennzeichnet, daß die Recheneinrichtung (27) in der Richtung einer jeweiligen Zeile der Bildinformationen die Summe aus den Anzahlen der Schwarzpunkte für eine jeweilige Bildelementereihe berechnet.
13. Verarbeitungssystem nach einem der Ansprüche 10 15
bis 12, dadurch gekennzeichnet, daß die Unterscheidungseinrichtung (27) die Zeile gemäß den Informationen aus der Recheneinrichtung (27) mittels eines Schwellenwertes unterscheidet.
14. Verarbeitungssystem nach einem der Ansprüche 10
bis 13, dadurch gekennzeichnet, daß die Ermittlungseinrichtung (27) die Grundlinie der Zeichenfolge aus einem Mittelwert und einer Standardabweichung der Häufigkeit
ermittelt.
25
15. Verarbeitungssystem nach einem der Ansprüche 10 bis 13, dadurch gekennzeichnet, daß die Ermittlungseinrichtung (27) die Grundlinie der Zeichenfolge aus einer Häufigkeitsdifferenz ermittelt.
16. Verarbeitungssystem nach einem der Ansprüche 10 bis 15, dadurch gekennzeichnet, daß die Grundlinie als Bezugslinie für eine Lageversetzung eines Zeichens dient.
17. Bildverarbeitungssystem, gekennzeichnet durch
ORIGINAL INSPECTED
eine Tastatur (26) zur Eingabe erster Bildinformationen, einen Bildleser (1) zur Eingabe zweiter Bildinformationen eine Speichereinrichtung (20) zum jeweiligen Speichern ι- der. ersten und zweiten Bildinformationen, eine Verarbeitungseinrichtung (27) zur Ausgabeaufbereitung der in der Speichereinrichtung gespeicherten Bildinformationen und eine Ausgabevorrichtung (11, 25) für die Ausgabe der Bildinformationen aus der Verarbeitungseinrichtung.
18. Bildverarbeitungssystem nach Anspruch 17, dadurch
gekennzeichnet, daß die über die Tastatur (26) eingegebenen ersten Bildinformationen Codedaten sind und daß eine Umsetzeinrichtung zum Umsetzen der Codedaten in Bildin-
_,. formationen der gleichen Art wie die aus dem Bildleser 15
(1) eingegebenen zweiten Bildinformationen vorgesehen ist.
19. Bildverarbeitungssystem nach Anspruch 17 oder 18,
gekennzeichnet durch eine Lagebestimmungseinrichtung für 20
das gemeinsame Einspeichern der ersten und der zweiten Bildinformationen in die Speichereinrichtung (20).
20. Bildverarbeitungssystem nach einem der Ansprüche
17 bis 19, dadurch gekennzeichnet, daß die Ausgabevor-25
richtung ein Drucker (11), ein Sichtgerät (25) oder dergleichen ist.
ORIGINAL INSPECTED
DE19853523042 1984-06-28 1985-06-27 Bildverarbeitungssystem Granted DE3523042A1 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP59133913A JPS6113377A (ja) 1984-06-28 1984-06-28 画像処理システム
JP59133912A JPS6113376A (ja) 1984-06-28 1984-06-28 画像処理システム
JP59133911A JPS6113375A (ja) 1984-06-28 1984-06-28 画像処理システム
JP59133914A JPH0654495B2 (ja) 1984-06-28 1984-06-28 画像処理方法

Publications (2)

Publication Number Publication Date
DE3523042A1 true DE3523042A1 (de) 1986-01-02
DE3523042C2 DE3523042C2 (de) 1991-07-25

Family

ID=27471788

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19853523042 Granted DE3523042A1 (de) 1984-06-28 1985-06-27 Bildverarbeitungssystem

Country Status (3)

Country Link
US (1) US5003614A (de)
DE (1) DE3523042A1 (de)
GB (1) GB2162350B (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0464467A2 (de) * 1990-07-03 1992-01-08 FROESSL, Horst Datenverarbeitung durch Bildmanipulation
DE19611409A1 (de) * 1996-03-22 1997-10-16 Oce Printing Systems Gmbh Verfahren und Schaltungsanordnung zum Ändern von Bilddaten

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2027253C (en) * 1989-12-29 1997-12-16 Steven C. Bagley Editing text in an image
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
JPH0787587B2 (ja) * 1990-02-16 1995-09-20 松下電器産業株式会社 階調補正装置
JP2862626B2 (ja) * 1990-03-22 1999-03-03 株式会社東芝 電子辞書及び情報検索方法
EP0461760B1 (de) * 1990-05-15 1999-08-04 Canon Kabushiki Kaisha Bildverarbeitungs-Gerät und Verfahren
KR940010471B1 (ko) * 1991-06-04 1994-10-22 주식회사 금성사 팩시밀리의 발신원 등록방법 및 회로
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
US5488719A (en) * 1991-12-30 1996-01-30 Xerox Corporation System for categorizing character strings using acceptability and category information contained in ending substrings
JP2971688B2 (ja) * 1992-12-11 1999-11-08 シャープ株式会社 複写機
ATE203604T1 (de) * 1993-02-23 2001-08-15 Xerox Corp Kategorisierende zeichenketten in der zeichenerkennung.
US6411972B1 (en) 1993-04-08 2002-06-25 International Business Machines Corporation Method and apparatus for filling in forms by segments using a scanner and a printer
US5734761A (en) * 1994-06-30 1998-03-31 Xerox Corporation Editing scanned document images using simple interpretations
DE69525401T2 (de) * 1994-09-12 2002-11-21 Adobe Systems, Inc. Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind
CA2154952A1 (en) * 1994-09-12 1996-03-13 Robert M. Ayers Method and apparatus for identifying words described in a page description language file
CA2178959C (en) * 1994-11-14 2000-05-16 Kenneth J. Guzik Method of splitting handwritten input
US5737443A (en) * 1994-11-14 1998-04-07 Motorola, Inc. Method of joining handwritten input
US6005680A (en) * 1995-04-04 1999-12-21 Canon Information Systems, Inc. Method for capturing a document image, a scanner using the method and a document image management system using the scanner
US5991439A (en) * 1995-05-15 1999-11-23 Sanyo Electric Co., Ltd Hand-written character recognition apparatus and facsimile apparatus
US7349892B1 (en) 1996-05-10 2008-03-25 Aol Llc System and method for automatically organizing and classifying businesses on the World-Wide Web
US20070292026A1 (en) * 2006-05-31 2007-12-20 Leon Reznik Electronic magnification device
US20110182471A1 (en) * 2009-11-30 2011-07-28 Abisee, Inc. Handling information flow in printed text processing
KR102240279B1 (ko) 2014-04-21 2021-04-14 삼성전자주식회사 컨텐트 처리 방법 및 그 전자 장치
WO2016119913A1 (en) * 2015-01-29 2016-08-04 Hewlett-Packard Development Company L.P. Text formatting
JP2017058442A (ja) 2015-09-15 2017-03-23 キヤノン株式会社 光源装置、走査光学装置、及び画像形成装置
JP6679258B2 (ja) 2015-09-24 2020-04-15 キヤノン株式会社 光源装置、走査光学装置、及び画像形成装置
US9854120B2 (en) 2015-11-18 2017-12-26 Canon Kabushiki Kaisha Optical scanning device and image forming apparatus

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
EP0083989A2 (de) * 1982-01-08 1983-07-20 Kabushiki Kaisha Toshiba Bildaufbereitungsgerät
EP0098959A2 (de) * 1982-07-13 1984-01-25 International Business Machines Corporation Verfahren zur Erzeugung von auf dem rechten Rand justierten Textdaten in einem Textverarbeitungssystem
EP0107083A2 (de) * 1982-09-29 1984-05-02 Computer Gesellschaft Konstanz Mbh Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4069511A (en) * 1976-06-01 1978-01-17 Raytheon Company Digital bit image memory system
EP0044297B1 (de) * 1980-01-15 1987-04-08 Datacopy Corporation Selektives kopiergerät
AU544563B2 (en) * 1980-05-29 1985-06-06 Sony Corporation Image/word processor
US4493108A (en) * 1982-12-30 1985-01-08 International Business Machines Corporation Video image field cut processing
US4741045A (en) * 1983-09-23 1988-04-26 Dest Corporation Optical character isolation system, apparatus and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4377803A (en) * 1980-07-02 1983-03-22 International Business Machines Corporation Algorithm for the segmentation of printed fixed pitch documents
EP0083989A2 (de) * 1982-01-08 1983-07-20 Kabushiki Kaisha Toshiba Bildaufbereitungsgerät
EP0098959A2 (de) * 1982-07-13 1984-01-25 International Business Machines Corporation Verfahren zur Erzeugung von auf dem rechten Rand justierten Textdaten in einem Textverarbeitungssystem
EP0107083A2 (de) * 1982-09-29 1984-05-02 Computer Gesellschaft Konstanz Mbh Belegverarbeitungseinrichtung mit Korrekturschaltung und Datensichtgerät

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0464467A2 (de) * 1990-07-03 1992-01-08 FROESSL, Horst Datenverarbeitung durch Bildmanipulation
EP0464467A3 (en) * 1990-07-03 1993-01-13 Horst Froessl Data processing by image manipulation
DE19611409A1 (de) * 1996-03-22 1997-10-16 Oce Printing Systems Gmbh Verfahren und Schaltungsanordnung zum Ändern von Bilddaten
DE19611409C2 (de) * 1996-03-22 2001-01-04 Oce Printing Systems Gmbh Verfahren und Schaltungsanordnung zum Ändern von Bilddaten

Also Published As

Publication number Publication date
GB2162350A (en) 1986-01-29
US5003614A (en) 1991-03-26
GB2162350B (en) 1988-01-20
DE3523042C2 (de) 1991-07-25
GB8516458D0 (en) 1985-07-31

Similar Documents

Publication Publication Date Title
DE3523042A1 (de) Bildverarbeitungssystem
DE69421117T2 (de) Gerät zur Bildinformationsverarbeitung und -wiedergabe
DE69423254T2 (de) Verfahren und Gerät zur automatischen Spracherkennung von Dokumenten
DE3588192T2 (de) Bildverarbeitungssystem
DE69132206T2 (de) Verfahren und Gerät zur Bildverarbeitung
DE69428475T2 (de) Verfahren und Gerät zur automatischen Spracherkennung
DE69621992T2 (de) Anlage und verfahren zur automatischen seitenerfassung und detektion von formularen
DE69033042T2 (de) Datenverarbeitung
DE68922998T2 (de) Verfahren zur Digitalisierung von in Formblättern eingetragenen Informationen mittels Vergleich mit sehr grossen Symbolen.
DE69123083T2 (de) Dokumentverarbeitung
DE69432585T2 (de) Verfahren und Gerät zur Auswahl von Text und/oder Non-Text-Blöcken in einem gespeicherten Dokument
DE69523970T2 (de) Dokumentspeicher- und Wiederauffindungssystem
DE69516751T2 (de) Bildvorverarbeitung für Zeichenerkennungsanlage
DE69226609T2 (de) Verfahren und Gerät zur Dokumentbildverarbeitung
DE69228148T2 (de) Ermittlung der Farben von Bildpunkten
DE69230635T2 (de) Verfahren und Gerät zur Bild-/Handmarkierungsbestimmung
DE69226611T2 (de) Verfahren und Gerät zur Verarbeitung eines Dokumentbildes
DE69517564T2 (de) Verfahren und Gerät zur Erzeugung einer hybriden Datenstruktur zur Anzeige eines Rasterbildes
DE3650554T2 (de) Speicherungs- und Wiederauffindungsverfahren für Bilddaten
DE69414530T2 (de) Bildkompression von Dokumenten mit Aufgeben des Formblattes
DE69519323T2 (de) System zur Seitensegmentierung und Zeichenerkennung
DE69229537T2 (de) Verfahren und Gerät zur Dokumentverarbeitung
DE69730930T2 (de) Verfahren und Gerät zur Zeichenerkennung
DE69724755T2 (de) Auffinden von Titeln und Photos in abgetasteten Dokumentbildern
DE3883578T2 (de) Verfahren und Gerät zur Erkennung von gedruckten Zeichen auf einem Beleg.

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
D2 Grant after examination
8363 Opposition against the patent
8331 Complete revocation