DE69229095T2 - Elektronisches Wörterbuch mit einer Zeiger- und Wortkorrektionsdatei - Google Patents
Elektronisches Wörterbuch mit einer Zeiger- und WortkorrektionsdateiInfo
- Publication number
- DE69229095T2 DE69229095T2 DE69229095T DE69229095T DE69229095T2 DE 69229095 T2 DE69229095 T2 DE 69229095T2 DE 69229095 T DE69229095 T DE 69229095T DE 69229095 T DE69229095 T DE 69229095T DE 69229095 T2 DE69229095 T2 DE 69229095T2
- Authority
- DE
- Germany
- Prior art keywords
- word information
- pointer
- file
- word
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012937 correction Methods 0.000 title claims description 79
- 239000000843 powder Substances 0.000 description 17
- 238000013519 translation Methods 0.000 description 12
- 238000000034 method Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf ein elektronisches Wörterbuch und insbesondere auf ein elektronisches Wörterbuch, das in einem Wörterbuch für eine Übersetzung in einem mechanischen Übersetzungssystem verwendet werden kann.
- Fig. 5 ist ein Blockdiagramm, das eine Struktur eines herkömmlichen elektronischen Übersetzers zeigt.
- Die Struktur hiervon wird im folgenden anhand der Zeichnungen beschrieben.
- Ein Übersetzungsverarbeitungsgerät 31, das mit einer CPU und dergleichen ausgerüstet ist, ist mit einer Eingabevorrichtung 32 zum Eingeben eines zu übersetzenden Satzes, einer Speichervorrichtugn 33 zum Speichern eines erzeugten übersetzten Satzes bezüglich eines eingegebenen Satzes, einer Anzeigevorrichtung 34 zum Anzeigen eines eingegebenen Satzes und eines übersetzten Satzes, einer Druckvorrichtung 35 zum Ausdrucken einer Übersetzung und dergleichen, einer Übersetzungsregeldatei 36 zum Speichern von Syntaxregeln und dergleichen, die zum Erzeugen eines übersetzten Satzes erforderlich sind, und einer elektronischen Wörterbuchdatei 37 zum Speichern eines übersetzten Termes entsprechend einem in dem eingegebenen Satz enthaltenen Wort verbunden. Bezüglich der elektronischen Wörterbuchdatei 37 für verschiedene, in dem zu übersetzenden Satz enthaltenen Wörtern wird unterschiedliche Wortinformation abgeleitet, um einen Übersetzungsprozeß auszuführen.
- Ein in einem derartigen herkömmlichen mechanischen Übersetzungsystem oder einem Kana-Kanji-Übersetzer und dergleichen enthaltenes elektronisches Wörterbuch kann die Inhalte nicht korrigieren lassen, selbst wenn der Benutzer sein eigenes Wörterbuch wünscht, da die Inhalte hiervon nicht umgeschrieben werden können.
- Ein Wörterbuch, das eine Korrektion bzw. Korrektur erlaubt, verursacht erhöhte Kosten, da die gesamte Wortinformationsdatei mit einer aufwendigen umschreibbaren Speichervorrichtung ausgeführt werden muß. Auch liegt ein Problem der Zuverlässigkeit vor, da die Möglichkeit besteht, daß das gesamte Wörterbuchsystem zerstört wird, wenn die umschreibbare Speichervorrichtung fehlerhaft ist. Wenn weiterhin eine Wortinformation irrtümlich korrigiert wurde, ist es schwierig, diese wiederherzustellen, da die Information des ursprünglichen Wörterbuches nicht beibehalten wird.
- Wenn weiterhin eine Korrektion bzw. Korrektur des Wörterbuches durch zahlreiche Leute oder je Gebiet ausgeführt wird, muß das Wortinformationswörterbuch in einer umschreibbaren Speichervorrichtung von großer Kapazität für jede Person oder jedes Gebiet enthalten sein, was zu einer merklichen Kostensteigerung führt. Auch wenn die gesamte Wortinformationsdatei nicht in einer umschreibbaren Speichervorrichtung ausgeführt wird, muß die gesamte Wortinformationskorrektionsdatei abgetastet werden, um ein korrigiertes Wort zu suchen; was für eine Wiedergewinnung zeitaufwendig ist, so daß ein Problem im praktischen Gebrauch vorliegt, falls eine große Korrektionsmenge auszuführen ist.
- Das zum Stand der Technik zählende Dokument EP-A-0 369 829 offenbart ein Informationssuchgerät, das eine Speichervorrichtung, die eine Vielzahl von Bänken hat und eine Vielzahl von Typen von zu suchenden Informationsdaten enthält, die in einem Block angeordnet sind, eine Tabellenspeichervorrichtung, die in einer Tabelle die Bänke enthält, die als die Basis der zu suchenden Information, der Anzahl von veränderten Bänken und Adressdaten dienen, und eine Tabellenlesevorrichtung zum Lesen der Tabelleninformation aus der Tabellenspeichervorrichtung umfaßt. Dieses Informationssuchgerät ist derart angeordnet, daß es die zu suchende Zielinformation sucht, indem die Basisbankinformation aufgrund der Tabelleninformation von der Tabellenspeichervorrichtung erhalten wird und indem die Anzahl von veränderten Bänken und die Adressdaten der Basisbankinformation gewonnen wird. Weiterhin ist dieses Gerät so angeordnet, daß der Besucher Synonyme und Antonyme oder die übersetzten Terme, die phonetischen Symbole oder dergleichen von Indexwörtern in Wörterbuchdaten lernen kann. Derartige Daten können in einer kurzen Zeitdauer ohne komplizierte Operationen gesucht werden, um dadurch die Lernwirksamkeit zu verbessern.
- Es ist eine Aufgabe der vorliegenden Erfindung, die Brauchbarkeit in einem elektronischen Wörterbuch zu verbessern.
- Eine andere Aufgabe der vorliegenden Erfindung ist es, die Zuverlässigkeit in · einem elektronischen Wörterbuch zu verbessern.
- Eine weitere Aufgabe der vorliegenden Erfindung ist es, die Wirtschaftlichkeit in einem elektronischen Wörterbuch zu verbessern.
- Zur Lösung dieser Aufgaben sieht die vorliegende Erfindung ein elektronisches Wörterbuch vor, wie dieses in Patentanspruch 1 angegeben ist. Bevorzugte Ausführungsbeispiele dieses Wörterbuches sind in den Unteransprüchen beschrieben. Die vorstehenden und andere Aufgaben, Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden aus der folgenden Detailbeschreibung der vorliegenden Erfindung im Zusammenhang mit den begleitenden Zeichnungen besser verständlich.
- Fig. 1 zeigt eine Struktur einer Datei eines elektronischen Wörterbuches gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung.
- Fig. 2 zeigt eine Struktur einer Datei eines elektronischen Wörterbuches gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung.
- Fig. 3 zeigt eine Struktur einer Datei eines elektronischen Wörterbuches gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung.
- Fig. 4 zeigt eine Struktur einer Indexdatei zum Beschreiben einer Zweistufen-Indexmethode gemäß einem vierten Ausführungsbeispiel der vorliegenden Erfindung, um die Wiedergewinnungs geschwindigkeit einer Vorsatzdatei und dergleichen des ersten Ausführungsbeispiels zu steigern.
- Fig. 5 ist ein Blockdiagramm, das eine Struktur eines herkömmlichen elektronischen Übersetzers zeigt.
- Fig. 1 zeigt die Inhalte einer elektronischen Wörterbuchdatei gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung, wobei ein Teil der Innenstruktur der elektronischen Wörterbuchdatei 37 von Fig. 5, die als ein herkömmliches Beispiel gezeigt ist, angegeben ist. Die Struktur des elektronischen Übersetzers selbst ist identisch zu den Inhalten, die in dem herkömmlichen Beispiel gezeigt sind. Obwohl das vorliegende Ausführungsbeispiel den Vorsatz des elektronischen Wörterbuches in Englisch mit einem Teil der Sprache des Vorsatzes, der sich ändernden Musterinformation, der Bedeutungsinformation, einem übersetzten Wort, dem Teil der Sprache und einer Beugung eines übersetzten Wortes, der Priorität des übersetzten Wortes und dergleichen, gespeichert in der Wortinformationsdatei, was weiter unten näher erläutert werden wird, aufweist, kann die vorliegende Erfindung in gleicher Weise für Terme angewandt werden, in welchen der Vorsatz in einer anderen Sprache als Englisch abgefaßt ist.
- Eine Vorsatzdatei 1 weist einen englischen Vorsatz in alphabetischer Reihenfolge auf. In der Zeichnung sind englische Wörter von "pour" bis "practical" in typischer Weise angegeben. Das Verfahren der Speicherung kann in fester Länge oder variabler Länge erfolgen. In einem Zeigerspeicherteil 2b einer Zeigerdatei 2 ist ein Zeiger (ein Adresswert von dem Beginn einer Wortinformationsdatei) der Wortinformationsdatei entsprechend einem Vorsatz in der Reihenfolge der Vorsätze, die in der Vorsatzdatei gespeichert sind, gespeichert. Beispielsweise sind Zeigerwerte von (A) bzw. (B) für die Wörter "pour" bzw. "power" gespeichert, aufgezeichnet in der Vorsatzdatei, wobei jeder Zeigerwert die Position angibt, in welcher die Wortinformation entsprechend jedem Wort in der Wortinformationsdatei gespeichert ist.
- In dem Fall, in welchem der Benutzer wünscht, das Wort "powder" zu untersuchen, sucht das Übersetzungsverarbeitungsgerät 31 die Vorsatzdatei ab dem Beginn, um die Reihenfolge des Vorsatzes von "powder" in der Speichervorrichtung 33 zu speichern, wenn "powder" gefunden wurde. Unter der Annahme, daß der Vorsatz von "powder" der 30.000-ste Vorsatz ab dem Beginn ist, dann schaut das Übersetzungsverarbeitungsgerät 31 in die 30.000-ste Aufzeichnung in der Zeigerdatei 2. Da die Zeigerdatei 2 eine Datei fester Länge einschließlich eines Korrektionsflagge-Speicherteiles 2a und eines Zeigerspeicherteiles 2b ist, kann die 30.000-ste Adressposition sofort durch Berechnung erhalten werden.
- Nach Finden einer Aufzeichnung in der Zeigerdatei 2 entsprechend dem 30.000-sten Wort von "powder" wird bestätigt, daß eine Korrektion nicht ausgeführt ist, da "0" in dem Korrektionsflagge-Speicherteil 2a gespeichert ist. Das heißt, falls eine Korrektion ausgeführt ist, wird "1" in den Korrektionsflagge-Speicherteil 2a eingegeben. Wenn die Korrektionflagge durch "0" gegeben ist, wird eine Vorsatzadresse eines Bereiches entsprechend einer Wortinformationsdatei 3, die eine inhärente Wortinformation speichert, in dem Zeigerspeicherteil 2b gespeichert. Der Adresswert ist (B) in dem Fall von "powder". Daher können der englische Teil der Sprache, die sich ändernde Musterinformation, die Bedeutungsinformation, ein übersetzter Term, der Teil der Sprache und eine Beugung des übersetzten Termes, die Priorität eines übersetzten Termes bezüglich "powder" aus der Wortinformationsdatei 3 gewonnen werden.
- In ähnlicher Weise ist "power" das 30.001-ste Wort mit einer "1" in dem Korrektionsflagge-Speicherteil 2a der Zeigerdatei 2, was anzeigt, daß die Wortinformation korrigiert wurde. In diesem Fall zeigt der Zeigerwert (C') in dem Zeigerspeicherteil 2b den Adresszeiger zu der Wortinformations-Korrektionsdatei 4.
- Ein Speicherteil 4a des ursprünglichen Zeigers liegt an dem Kopf des Bereiches vor, der durch den Adresswert (C') der Wortinformations-Korrektionsdatei 4 beginnt. In dem Speicherteil 4a wird ein Adresswert (C) der Wortinformationsdatei 3 vor einer Korrektion bezüglich "power" gespeichert, was den Korrektionsflagge- Speicherteil 2a der Zeigerdatei 2 nach "0" in dem Fall eines nachträglichen Löschens der Korrektion ändert, wodurch die Korrektion durch Umschreiben des Wertes in dem Zeigerspeicherteil nach (C) erleichtert ist. In dem Bereich des Korrektionsinformationsspeicherteiles 4b, der dem ursprünglichen Zeigerspeicherteil 4a folgt, wird eine Wortinformation nach einer Korrektion bezüglich "power" gespeichert.
- Somit kann Wortinformation, die nicht korrigiert ist, aus der Wortinformations datei 3 abgeleitet werden, und Wortinformation, die korrigiert ist, kann aus der Wortinformationskorrektionsdatei 4 abgeleitet werden.
- Wenn die Wortinformationsdatei zu korrigieren ist, wird eine relevante Wortinformation von der Wortinformationsdatei durch eine allgemeine Methode kopiert, wodurch der ursprüngliche Zeiger und die Inhalte, die diese Kopie korrigieren, zu dem Ende oder Schwanz der Wortinformationskorrektionsdatei 4 beigefügt werden. Dann wird der Korrektionsflagge-Speicherteil 2a in der relevanten Zeigerdatei 4 zu einem korrigierten Zustand von "1" modifiziert, wodurch der Kopfadresswert des Teiles, der der Wortinformationskorrektionsdatei 4 beigefügt ist, in den Zeigerspeicherteil 2b eingegeben wird.
- Wenn eine Wortinformation, die bereits korrigiert ist, erneut zu korrigieren ist, werden der ursprüngliche Zeiger, der in der Wortinformationskorrektionsdatei 4 gespeichert ist, und die erneut korrigierten Inhalte weiter dem Ende oder Schwanz der Wortinformationskorrektionsdatei 4 beigefügt, wodurch der Adresswert des Teiles, der erneut korrigiert und beigefügt ist, in den Zeigerspeicherteil 2b der relevanten Zeigerdatei 2 eingegeben wird. Unabhängig davon, wie oft eine erneute Korrektion wiederholt ist, wird der ursprüngliche Zeiger zu der ursprünglichen Wortinformationsdatei 3 immer in dem ursprünglichen Zeigerspeicherteil des zuletzt korrigierten und beigefügten Teiles gespeichert. Daher wird in dem Fall des Löschens einer Korrektion der ursprüngliche Zeiger der zuletzt korrigierten Daten in der Wortinformationskorrektionsdatei 4, angezeigt durch den Zeiger, der in dem Zeigerspeicherteil 2b der Zeigerdatei 2 entsprechend dem relevanten Vorsatz gespeichert ist, zu dem entsprechenden Zeigerspeicherteil der Zeigerdatei 2 wiederhergestellt, und der Korrektionsflagge-Speicherteil 2a wird zu dem nichtkorrigierten Zustand von "0" verändert, so daß die ursprüngliche Information der Wortinformationsdatei 3 gerade durch eine Löschoperation verwendet werden kann. Wenn ein wiederholt korrigiertes Wort des gleichen Wortes zu jedem früheren korrigierten Zustand nacheinander wiederherzustellen ist, kann ein Flaggespeicherteil, der anzeigt, ob der Zeiger zu der Wortinformationsdatei 3 oder zu der Wortinformationskorrektionsdatei 4 ist, in den ursprünglichen Zeigerteil der Wortinformationskorrektionsdatei 4 eingeschlossen sein.
- Fig. 2 ist ein Diagramm, das eine Struktur der Inhalte einer elektronischen Wörterbuchdatei zeigt, um ein zweites Ausführungsbeispiel der vorliegenden Erfindung zu beschreiben, das anzeigt, daß die Wortinformation individuell unter einer Viel zahl von Benutzern korrigiert werden kann, indem eine Vielzahl von Zeigerdateien und Wortinformationskorrektionsdateien gehalten wird.
- In Fig. 2 sind die Zeigerdatei 5 und die Wortinformationskorrektionsdatei 7 Dateien für einen Benutzer A, die Zeigerdatei 6 und die Wortinformationskorrektionsdatei 8 sind Dateien für einen Benutzer B und die Vorsatzdatei 1 und die Wortinformationsdatei 3 werden gemeinsam durch die Benutzer A und B genutzt.
- Bei einer Benutzung durch den Benutzer A sind die Wortinformationsdatei 3 und die Wortinformationskorrektionsdatei 7 exklusiv auf den Benutzer A bezogen, wenn der Korrektionsflagge-Speicherteil 5a "0" bzw. "1" von der Vorsatzdatei 1 über die Zeigerdatei 5 ist.
- Bei einer Benutzung durch den Benutzer B sind die Wortinformationsdatei 3 oder die Wortinformationskorrektionsdatei 8 exklusiv auf den Benutzer B von der Vorsatzdatei 1 über die Zeigerdatei 6 bezogen. Die Korrektions- und Löschoperation der Information ist identisch zu dem Fall von einem Benutzer, der in dem Ausführungsbeispiel von Fig. 1 beschrieben ist.
- Fig. 3 zeigt die Inhalte einer elektronischen Wörterbuchdatei gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung. Im Vergleich mit dem oben beschriebenen zweiten Ausführungsbeispiel, bei dem die Kapazität der Zeigerdatei erhöht ist, wenn jeder Benutzer eine Zeigerdatei in dem Fall von zahlreichen Benutzern besitzt, zeigt das vorliegende Ausführungsbeispiel ein Verfahren zum Bewahren der Dateikapazität, indem eine Zeigerverwaltungsdatei vorgesehen wird.
- Wenn eine Wiedergewinnung einer Vorsatzdatei spezifiziert ist, sucht das Übersetzungsverarbeitungssystem die Vorsatzdatei 1 gemäß dem oben beschriebenen Verfahren, um den Vorsatz zu identifizieren. Demgemäß wird auf eine relevante Aufzeichnung in der Zeigerdatei Bezug genommen. Dies ist identisch zu dem Fall eines einzigen Benutzers des ersten in Fig. 1 gezeigten Ausführungsbeispiels.
- Der Korrektionsflagge-Speicherteil 9a der Zeigerdatei 9 speichert, ob das relevante Wort korrigiert ist oder nicht, indem eine Flagge von "0" verwendet wird, wenn keine Korrektion vorliegt. In diesem Fall wird ein Zeigerwert zu der Wortinformationsdatei 3, beispielsweise ein Zeigerwert von (A) für "pour" in dem Zeigerteil 9b gespeichert. Wenn eine Korrektion eines Wortes ausgeführt wird, zeigt der Korrektionsspeicherteil 9a eine "1", wodurch Zeigerwerte von (B') und (C') für "powder" bzw. "power" zu der Korrektionszeiger-Verwaltungsdatei 10 in dem Zeigerspeicherteil 9b gespeichert werden.
- Die Korrektionszeiger-Verwaltungsdatei 10 hat einen Block eines Korrektionszeigerblockes 15, der für einen Vorsatz vorgesehen ist, der eine korrigierte Wortinformation hat, wobei jeder Block "die Anzahl von Benutzer + 1" Aufzeichnungen umfaßt. Wenn beispielsweise zehn Benutzer vorliegen, werden elf Aufzeichnungen benötigt. In der Zeichnung sind die Inhalte von Aufzeichnungen (0 bis n) mit n Benutzern gezeigt. Die Kopfaufzeichnung (Aufzeichnung O) des Korrektionszeigerblockes 15 dient zum Speichern eines Zeigerwertes zu der ursprünglichen Wortinformationsdatei 3, und Aufzeichnungen 1 bis n liegen jeweils für Benutzer A, Benutzer B ... vor. Jede Aufzeichnung in dem Korrektionszeigerblock 15 umfaßt einen Korrektionsflagge-Speicherteil 10a und einen Zeigerspeicherteil 10b. Die Korrektionsflagge von "0" zeigt an, daß der relevante Benutzer nicht eine Korrektion der Wortinformation bezüglich des relevanten Vorsatzes ausgeführt hat, wodurch auf die Wortinformationsdatei 3 durch den Zeigerwert Bezug genommen ist, der in dem Zeigerspeicherteil der Kopfaufzeichnung (Aufzeichnung 0) gespeichert ist. Eine Korrektionsflagge von "1" zeigt an, daß der relevante Benutzer eine Korrektion der Wortinformation bezüglich des relevanten Vorsatzes ausgeführt hat, wodurch auf die Wortinformationskorrektionsdatei 11 oder die Wortinformationskorrektionsdatei 12 entsprechend dem relevanten Benutzer durch den Zeigerwert Bezug genommen ist, der in dem Zeigerspeicherteil der relevanten Aufzeichnung gespeichert ist.
- Ein Fall, in welchem der Benutzer A "powder" in dem Beispiel von Fig. 3 prüft, wird nunmehr beschrieben. In diesem Fall wird auf die Aufzeichnung 1 des Korrektionszeigerblockes, der ab der Adresse (B') der Korrektionszeiger-Verwaltungsdatei 10 beginnt, über die Zeigerdatei 9 Bezug genommen. Da die Korrektionsflagge den Wert "0" hat, kann die Wortinformation hinsichtlich "powder", die in der Wortinformationsdatei 3 gespeichert ist, durch den Adresszeigerwert (B) erhalten werden, der in dem Zeigerspeicherteil der Kopfaufzeichnung (Aufzeichnung 0) dieses Blockes gespeichert ist.
- Es wird ein Fall beschrieben, in welchem der Benutzer B versucht, den gleichen Vorsatz von "powder" zu prüfen. In diesem Fall wird auf die Aufzeichnung 2 des Korrektionszeigerblockes 15, der bei der Adresse (B') der Korrektionszeiger-Verwal tungsdatei 10 beginnt, über die Zeigerdatei 9 Bezug genommen. Da die Korrektionsflagge den Wert "1" hat, kann die korrigierte Wortinformation hinsichtlich "powder", die in der Wortinformationskorrektionsdatei 12 für den Benutzer B gespeichert ist, durch den Adresszeiger (B") erhalten werden, der in dem Zeigerspeicherteil 10b der gleichen Aufzeichnung gespeichert ist.
- Wenn das Suchen ab dem Beginn der Vorsatzdatei 1 in dem oben erwähnten ersten Ausführungsbeispiel und dergleichen zeitaufwendig ist, kann ein Zweistufenindex gemäß dem vierten Ausführungsbeispiel der vorliegenden Erfindung, das in Fig. 4 gezeigt ist, verwendet werden, um die Geschwindigkeit einer Wiedergewinnung zu steigern. In Fig. 4 umfaßt eine Zeigerindexdatei 13 einen Zeigerspeicherteil 13b, der die Kopfadresse eines. sekundären Index, beginnend von einem Zeichen für jedes Zeichen des Alphabeths a bis z, speichert, und einen Gesamtzahlspeicherteil 13a einer Gesamtwortzahl von Wörtern von Na, Nb, Nc, deren jedes in jedem Alphabeth-Zeichen enthalten ist. Beispielsweise ist in dem Aufzeichnungsgesamtzahlspeicherteil 13a entsprechend z. B. "p" die Gesamtzahl von Wörtern, beginnend von Zeichen "a" bis "o" gespeichert (29.779), und der Kopfadresswert (Ip), beginnend von "p" in dem sekundären Index 14, ist in dem Zeigerspeicherteil 13b gespeichert.
- In der sekundären Indexdatei 14 sind einige Zeichen des beginnenden Wortes von jedem Block, der durch jeweils zehn Vorsätze der Vorsatzdatei 1 unterteilt ist, in einem Indexspeicherteil 14a gespeichert, die Anzahl von Wörtern, die in jedem Block gespeichert sind, ist in dem Anzahlteil 14b gespeichert, und die Kopfadresse des Blockes der Vorsatzdatei entsprechend jedem Index ist in dem Zeigerspeicherteil 14c gespeichert.
- Beispielsweise wird beim Suchen von "powder" eine Aufzeichnung entsprechend dem Kopfalphabeth "p" aus der einen Zeichenindexdatei 13 gefunden. Da ein Speicher fester Länge für die eine Zeichenindexdatei verwendet wird, kann die Adresse der Aufzeichnung entsprechend zu "p" durch Berechnung erhalten werden, indem das Alphabethzeichen in Entsprechung zu dem ASCII-Code gebracht ist.
- Durch Berechnen der entsprechenden Aufzeichnung können eine Gesamtzahl von 29.779 und ein Zeigerwert von (Ip) erhalten werden. Durch diesen Zeigerwert kann die Kopfaufzeichnung (der Index von "pace"), beginnend mit "p", in dem sekundären Index 14 direkt gefunden werden. Durch Ausführen eines Suchens in an steigender Reihenfolge ab diesem Punkt in diesem Indexspeicherteil 14a, um bei "pre" anzukommen, kann identifiziert werden, daß "powder" in dem Indexblock von "pour" enthalten ist. Zu dieser Zeit wird die Anzahl in jedem Anzahlteil von "pace" bis "poach" sequentiell zu den oben erwähnten 29.779 addiert. Das heißt, es liegt die folgende Gleichung vor:
- 29.779 + 50 + 40 + 60 + 70 = 29.999
- wodurch der Wert von 29.999 erhalten ist.
- Der Adresswert (Mpour) der Vorsatzdatei 1 des Wortes beginnend von "pour" kann aus dem Zeigerspeicherteil 14c der sekundären Indexdatei abgeleitet werden. Das "pour" in der Vorsatzdatei 1 kann direkt durch diesen Adresswert gefunden werden. Durch Fortsetzen des Suchens in steigender Reihenfolge in der Vorsatzdatei 1 kann "powder" gefunden werden, wobei die abgetastete Anzahl des Vorsatzes von 1 ab "pour" bis zu "powder" zu den oben erwähnten 29.999 addiert wird. Das "powder" kann als der 30.000-ste Vorsatz ab dem Beginn der Vorsatzdatei identifiziert werden.
- Indem ein derartiger Zweistufenindex des vierten Ausführungsbeispiels verwendet wird, kann die Wiedergewinnung der Vorsatzdatei 1 und die Erfassung der Reihenfolge des Wortes von dem Beginn der Vorsatzdatei 1 mit hoher Geschwindigkeit ausgeführt werden. Eine Methode des Verwendens eines solchen Zweistufenindex ist wohl bekannt.
- Es ist auch wohl bekannt, eine Differentialstruktur mit dem früheren Wort in der Vorsatzdatei aufzubauen, um die Kapazität des Vorsatzindex zu bewahren.
- Obwohl die vorliegende Erfindung auf ein Übersetzungswörterbuch für ein mechanisches Übersetzungssystem in den oben beschriebenen Ausführungsbeispielen angewandt werden kann, ist die vorliegende Erfindung hierauf nicht begrenzt und kann auf ein Kana-Kanji-Umsetzungswörterbuch und auf ein elektronisches Wörterbuch von elektronischen Übersetzern angewandt werden.
- Wie in den obigen Ausführungsbeispielen beschrieben ist, ist es durch Ausführen von lediglich der Vorsatzdatei und der Wortinformationskorrektionsdatei mit der erneut schreibbaren Speichervorrichtung der ein Wörterbuchsystem bildenden Dateien möglich, eine wirtschaftliche Speichervorrichtung exklusiv zum Lesen von Vorsatzdateien und Wortinformationsdateien, die eine große Kapazität erfordern, zu verwenden, wodurch der Benutzer ein korrigierbares Wörterbuchsystem ausführen kann, ohne eine umschreibbare Speichervorrichtung von einer großen Kapazität zu benötigen.
- Da die Vorsatzdatei und die Wortinformationsdatei durch den Benutzer nicht erneut beschrieben bzw. umgeschrieben werden, besteht keine Möglichkeit, daß das gesamte Wörterbuchsystem zerstört wird, selbst wenn ein Benutzer eine ungewöhnliche Korrektion ausführt. Selbst wenn ein Benutzer eine fehlerhafte Korrektion ausführt, kann die Korrektion gelöscht werden, um die Inhalte zurück zu dem ursprünglichen Wörterbuch wiederherzustellen.
- Wie in dem vierten Ausführungsbeispiel beschrieben ist, kann die Wiedergewinnung des Vorsatzwortes mit einer hohen Geschwindigkeit unabhängig davon ausgeführt werden, ob die Wortinformation korrigiert ist oder nicht.
- Durch Steigern einer relativ kleinen Menge einer Datei, wie beispielsweise der Zeigerdatei und der Wortinformationskorrektionsdatei oder der Korrektionszeigerverwaltungsdatei kann eine Vielzahl von Benutzern eine Korrektion individuell für jeden Benutzer ausführen.
- Wenn die Wortinformation für den gleichen Vorsatz mehrmals ausgeführt wird, kann die Korrektion gerade durch eine Operation gelöscht werden, um zu der ursprünglichen Information oder nacheinander zu einer zuvor korrigierten Information wiederhergestellt zu werden.
- In dem Fall der Gewinnung einer Stütze der korrigierten Information ist eine Stütze des gesamten Wörterbuchsystems nicht erforderlich, und lediglich die Stütze der Datei, die die umschreibbare Speichervorrichtung ausführt, d. h. lediglich der Zeigerdatei, der Wortinformationskorrektionsdatei und der Korrektionszeigerverwaltungsdatei, ist erforderlich.
- Obwohl die vorliegende Erfindung in Einzelheiten beschrieben und veranschaulicht ist, ist klar zu verstehen, daß diese lediglich zur Veranschaulichung und als Beispiel vorliegen und nicht als Beschränkung zu nehmen sind, wobei der Bereich der vorliegenden Erfindung nur durch die Abfassung der beigefügten Patentansprüche begrenzt ist.
Claims (10)
1. Elektronisches Wörterbuch, umfassend:
eine Speichereinrichtung (1) zum Speichern wenigstens eines Wortes, das in
alphabethischer Reihenfolge bezüglich anderen Wörtern angeordnet ist, in der
Speichereinrichtung (1),
eine erste Wortinformationsspeichereinrichtung (3) zum Speichern von
Wortinformation entsprechend dem Wort,
eine zweite Wortinformationsspeichereinrichtung (4) zum Speichern einer
korrigierten Wortinformation, die bezüglich der gespeicherten Wortinformation
korrigiert ist,
eine Angabeeinrichtung (2a) zum Angeben, ob die Wortinformation bezüglich
des gespeicherten Wortes korrigiert ist oder nicht, und
eine Zeigereinrichtung (2b), die auf ein Ausgangssignal von der
Angabeeinrichtung (2a) anspricht, um eine Speichereinrichtung aus der ersten und der
zweiten Wortinformationsspeichereinrichtung (3, 4) abhängig von einer Tatsache
zu wählen, daß die Wortinformation korrigiert wurde oder nicht.
2. Elektronisches Wörterbuch nach Anspruch 1, bei dem:
eine Vielzahl der Angabeeinrichtungen (5a, 6a) und eine Vielzahl der zweiten
Wortinformationsspeichereinrichtungen (7, 8) vorgesehen sind, wobei die Anzahl
der Angabeeinrichtungen (5a, 6a) gleich zu der Anzahl der zweiten
Wortinformationsspeichereinrichtungen (7, 8) ist, und
die Zeigereinrichtungen (5b, 6b) auf ein Ausgangssignal ansprechen, das
anzeigt, daß Wortinformation in einer der Angabeeinrichtungen (5a, 6a) korrigiert
ist, um eine der zweiten Wortinformationsspeichereinrichtungen (7, 8)
entsprechend einer spezifischen Angabeeinrichtung zu wählen.
3. Elektronisches Wörterbuch nach Anspruch 1, bei dem:
die Angabeeinrichtung einen Korrektionsflagge-Speicherteil (2a) entsprechend
dem Wort umfaßt, wobei eine Flagge anzeigt, ob die Wortinformation richtig ist
oder nicht, und
die Zeigereinrichtung einen Zeigerspeicherteil (2b) umfaßt, um einen Zeiger
zu speichern, der den Adresswert einer entsprechenden Wortinformation anzeigt,
die in der ersten Wortinformationsspeichereinrichtung (3) oder in der zweiten
Wortinformationsspeichereinrichtung (4) gespeichert ist, welche abhängig von dem
Inhalt der Flagge zu wählen sind, wobei der Korrektionsflagge-Speicherteil (2a)
und
der Zeigerspeicherteil (2b) eine Zeigerdatei bilden.
4. Elektronisches Wörterbuch nach Anspruch 3, bei dem ein Adresswert der
zweiten Wortinformationsspeichereinrichtung (4) in einem entsprechenden
Zeigerspeicherteil (2b) gespeichert wird, wenn die Flagge anzeigt, daß die
Wortinformation korrigiert ist, und bei dem der Adresswert der ersten
Wortinformationsspeichereinrichtung (3) in einem entsprechenden Zeigerspeicherteil gespeichert
wird, wenn die Flagge anzeigt, daß die Wortinformation nicht korrigiert ist.
5. Elektronisches Wörterbuch nach Anspruch 1, bei dem die
Speichereinrichtung (1) und die erste Wortinformationsspeichereinrichtung (3) mit einer
Speichervorrichtung ausschließlich zum Lesen ausgeführt sind, und bei dem die zweite
Wortinformationsspeichereinrichtung (4) und die Angabeeinrichtung (2a) mit einer
umschreibbaren Speichervorrichtung ausgeführt sind.
6. Elektronisches Wörterbuch nach Anspruch 1, bei dem:
die Speichereinrichtung (1) eine Vielzahl von in alphabetischer Reihenfolge
angeordneten Wörtern speichert,
eine Vielzahl der zweiten Wortinformationsspeichereinrichtungen (4)
vorgesehen ist, deren jede korrigierte Wortinformation bezüglich der gespeicherten
Wortinformation speichert, und
die Angabeeinrichtung (2a) angibt, ob die Wortinformation korrigiert ist oder
nicht, ensprechend jeder zweiten Wortinformationsspeichereinrichtung (4) für
jedes der gespeicherten Wörter.
7. Elektronisches Wörterbuch nach Anspruch 6, bei dem die Angabeeinrichtung
und die Zeigereinrichtung eine Zeigerdatei (9) und eine
Korrektionszeiger-Verwaltungsdatei (10), gebildet aus einer Vielzahl von Blöcken, die in der Anzahl
äquivalent zu der Anzahl der Wörter sind, umfaßt, und bei dem die Zeigerdatei (9a)
einen ersten Korrektionsflagge-Speicherteil (9a), der abhängig von den Wörtern
vorgesehen ist, um eine Flagge zu speichern, die anzeigt, ob die Wortinformation
korrigiert ist oder nicht, und einen Zeigerspeicherteil (9b) zum Speichern eines
Adresswertes der ersten Wortinformationsspeichereinrichtung (3), die abhängig
von den Inhalten der Flagge oder einer Blockinformation, die einen bestimmten
Block der Korrektionszeiger-Verwaltungsdatei (10) spezifiziert, zu wählen ist,
umfaßt.
8. Elektronisches Wörterbuch nach Anspruch 7, bei dem jeder der Blöcke der
Korrektionszeiger-Verwaltungsdatei (10) Aufzeichnungen hat, die in der Anzahl
gleich zu der Anzahl der zweiten Wortinformationsspeichereinrichtungen (4) sind,
wobei jede der Aufzeichnungen eine Flagge, die angibt, ob die jeweilige
Wortinformation korrigiert ist oder nicht, und einen Zeiger, der den Adresswert der
jeweiligen Wortinformation angibt, die in der ersten
Wortinformationsspeichereinrichtung (3) oder der zweiten Wortinformationsspeichereinrichtung (4) gespeichert
ist, die abhängig von den Inhalten der Flagge zu wählen sind, speichert.
9. Elektronisches Wörterbuch nach Anspruch 8, bei dem jede der zweiten
Wortinformationsspeichereinrichtungen (4) und jede der
Korrektionszeiger-Verwaltungsdateiaufzeichnungen jedem einer Vielzahl von Benutzern entspricht.
10. Elektronisches Wörterbuch nach Anspruch 9, bei dem jeder der Blöcke
außerdem eine zusätzliche Aufzeichnung aufweist, in welcher der Adresswert der ersten
Wortinformationsspeichereinrichtung (3), der in einer entsprechenden
Wortinformation gespeichert ist, gespeichert ist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3285039A JP2875075B2 (ja) | 1991-10-30 | 1991-10-30 | 電子辞書 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69229095D1 DE69229095D1 (de) | 1999-06-10 |
DE69229095T2 true DE69229095T2 (de) | 1999-11-11 |
Family
ID=17686374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69229095T Expired - Fee Related DE69229095T2 (de) | 1991-10-30 | 1992-10-28 | Elektronisches Wörterbuch mit einer Zeiger- und Wortkorrektionsdatei |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0539965B1 (de) |
JP (1) | JP2875075B2 (de) |
DE (1) | DE69229095T2 (de) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2807773B2 (ja) * | 1992-02-20 | 1998-10-08 | キヤノン株式会社 | 電子辞書 |
US7490034B2 (en) * | 2002-04-30 | 2009-02-10 | Microsoft Corporation | Lexicon with sectionalized data and method of using the same |
US7421386B2 (en) | 2003-10-23 | 2008-09-02 | Microsoft Corporation | Full-form lexicon with tagged data and methods of constructing and using the same |
US7398210B2 (en) | 2003-10-23 | 2008-07-08 | Microsoft Corporation | System and method for performing analysis on word variants |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1593334A (en) * | 1977-11-14 | 1981-07-15 | Lowe D | Translating aid |
US4627019A (en) * | 1982-07-08 | 1986-12-02 | At&T Bell Laboratories | Database management system for controlling concurrent access to a database |
US5210853A (en) * | 1988-11-18 | 1993-05-11 | Sharp Kabushiki Kaisha | Electronic device/dictionary with improved information storage: memory capacity ratio |
JPH03268062A (ja) * | 1990-03-19 | 1991-11-28 | Fujitsu Ltd | 機械翻訳電子メール装置における私用単語の登録装置 |
-
1991
- 1991-10-30 JP JP3285039A patent/JP2875075B2/ja not_active Expired - Lifetime
-
1992
- 1992-10-28 DE DE69229095T patent/DE69229095T2/de not_active Expired - Fee Related
- 1992-10-28 EP EP92118458A patent/EP0539965B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
DE69229095D1 (de) | 1999-06-10 |
JP2875075B2 (ja) | 1999-03-24 |
EP0539965B1 (de) | 1999-05-06 |
EP0539965A2 (de) | 1993-05-05 |
JPH05120326A (ja) | 1993-05-18 |
EP0539965A3 (de) | 1994-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE3852341T2 (de) | Zeichenverarbeitungssystem mit Funktion zur Prüfung von Rechtschreibung. | |
DE69726339T2 (de) | Verfahren und Apparat zur Sprachübersetzung | |
DE69631457T2 (de) | Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung | |
DE3782447T2 (de) | Dokumentverarbeitungsapparat. | |
DE69419184T2 (de) | Verfahren und system zum formatieren von numerischer information | |
DE68926845T2 (de) | Maschinenübersetzungssystem | |
DE3486142T2 (de) | Datenstruktur in einem Dokumentenverarbeitungssystem. | |
DE3486224T2 (de) | Verfahren zum Speichern und Wiederauffinden von digitalen Informationen. | |
DE3650417T2 (de) | Informationsaufzeichnungs- und Wiederauffindungssystem. | |
DE3115318C2 (de) | Elektronisches Übersetzungsgerät | |
DE2630304A1 (de) | Einrichtung zur ueberpruefung der gueltigkeit von alphabetischen eingangszeichen | |
DE3650156T2 (de) | Auf regeln basiertes datenwiederauffindverfahren und anordnung. | |
DE69226106T2 (de) | Datenbankherstellungsverfahren und Gerät | |
DE4225200A1 (de) | Elektronisches woerterbuch | |
DE2905328A1 (de) | Verfahren und vorrichtung zur assoziativen informationswiedergewinnung | |
DE2809623A1 (de) | Verfahren und vorrichtung zur assoziativen informationswiedergewinnung | |
DE2264090A1 (de) | Datenverdichtungssystem | |
DE3788782T2 (de) | Verfahren zur Herstellung einer Meldungsdatei in einem Computer. | |
DE69615794T2 (de) | Indexierung einer Datenbank durch einen endlichen Automaten | |
DE60319586T2 (de) | Elektronisches wörterbuch mit beispielsätzen | |
DE69025091T2 (de) | Verfahren und Vorrichtung zur Übersetzung eines Satzes mit einem durch Trennung gebildeten, zusammengesetzten Wort | |
DE3689217T2 (de) | Datenverarbeitungseinrichtung mit einer Schaltung zur Prüfung der Adressgrenzen in einem virtuellen Speicher. | |
DE69227881T2 (de) | Textübersetzungssystem | |
DE69229095T2 (de) | Elektronisches Wörterbuch mit einer Zeiger- und Wortkorrektionsdatei | |
DE2458331A1 (de) | Datenverarbeitungssystem zur adressierung eines in einem sekundaerspeicher abgelegten datensatzes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |