DE69230814T2 - Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen - Google Patents
Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen TabellenInfo
- Publication number
- DE69230814T2 DE69230814T2 DE69230814T DE69230814T DE69230814T2 DE 69230814 T2 DE69230814 T2 DE 69230814T2 DE 69230814 T DE69230814 T DE 69230814T DE 69230814 T DE69230814 T DE 69230814T DE 69230814 T2 DE69230814 T2 DE 69230814T2
- Authority
- DE
- Germany
- Prior art keywords
- database
- retrieval
- question
- virtual
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000014509 gene expression Effects 0.000 claims description 45
- 238000004458 analytical method Methods 0.000 claims description 39
- 239000000470 constituent Substances 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 22
- 238000004364 calculation method Methods 0.000 description 20
- 238000000034 method Methods 0.000 description 14
- 244000299461 Theobroma cacao Species 0.000 description 10
- 235000019219 chocolate Nutrition 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 239000003550 marker Substances 0.000 description 9
- 239000002245 particle Substances 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 239000003607 modifier Substances 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 241000102542 Kara Species 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 101100020289 Xenopus laevis koza gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24522—Translation of natural language queries to structured queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
- G06F16/24526—Internal representations for queries
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
- Diese Erfindung bezieht sich auf ein Informationsauffindungssystem zum Wiederauffinden von Informationen aus einer Datenbank mit einer Analyseeinheit unter Verwendung eines Lexikons zur Analyse einer natursprachlichen Frage.
- Fig. 1 ist ein Diagramm, das ein herkömmliches Datenbank-Wiederauffindungssystem zum Wiederauffinden von Daten aus einer tabellenformatierten Datenbank in Abhängigkeit von einer natursprachlichen Frage illustriert. Eine natursprachliche Frage ist eine Anforderung von Daten, die in einer natürlichen Sprache wie englisch, japanisch, französisch usw. ausgedrückt ist. Das illustrierte Datenbank- Wiederauffindungssystem ist genauer beschrieben in "Kinukawa, A Natural Language Interface Processor Based on the Hierarchical-Tree Structure Model of Relation Table. Journal of Information Processing Society of Japan, Band 27, Nr. 5 (1986), Seiten 499-509". Dieses System ist so ausgebildet, daß es Anfragen in japanisch verarbeitet. Für die nachfolgend beschriebenen Beispiele sind die englischen Übersetzungen von japanischen Wörtern und Sätzen in Klammern vorgesehen.
- Das in Fig. 1 gezeigte Datenbank- Wiederauffindungssystem enthält eine Eingabeeinheit 2 wie eine Tastatur zum Eingeben einer natursprachlichen Frage 1. Das System enthält auch eine Kommunikationssteuervorrichtung 3, zur Weitergabe einer natursprachlichen Frage 1 zu einer Wiederauffindungs- Satzanalyseeinheit 5. Die Wiederauffindungs- Satzanalyseeinheit 5 verarbeitet die eingegebene Frage 1, um ein hierarchisches Modell der Frage zu erzeugen. Das System enthält zusätzlich ein Wortlexikon 4, das auf der Basis des Inhalts einer Datenbank 9 gebildet ist, und ein hierarchisches Tabellenmodell 6 für das hierarchische Ausdrücken des Inhalts der Datenbank. Das Lexikon 4 und das hierarchische Tabellenmodell 6 werden von der Wiederauffindungs- Satzanalyseeinheit 5 zur Analyse der natursprachlichen Frage 1 verwendet. Die Wiederauffindungs- Satzanalyseeinheit 5 führt sowohl eine vokabularische Analyse als auch eine syntaktische/semantische Analyse der natursprachlichen Frage 1 durch. Die Wiederauffindungs-Satzanalyseeinheit 5 erzeugt ein Wiederauffindungs-Satzanalyseergebnis 7 als Ausgangssignal, welches zu einer Wiederauffindungs-Verarbeitungseinheit 8 weitergegeben wird. Die Wiederauffindungs- Verarbeitungseinheit 8 verwendet das Wiederauffindungs-Satzanalyseergebnis 7, um die Daten aus der Datenbank 9 aufzufinden.
- Die Darstellung des in Fig. 1 gezeigten herkömmlichen Datenbank-Wiederauffindungssystems ist eine funktionelle Beschreibung, welche dazu dient, das Zusammen wirken der jeweiligen Komponenten des Systems zu zeigen. Die in Fig. 1 gezeigten Komponenten sind tatsächlich in einem Datenverarbeitungssystem 10 implementiert, wie dem in Fig. 2 gezeigten. Das Datenverarbeitungssystem 10 enthält eine zentrale Verarbeitungseinheit (CPU) 11, einen Speicher 12, die Kommunikationssteuervorrichtung 3, eine Ausgabevorrichtung 17 und die Eingabeeinheit 2. Jede dieser Komponenten ist mit einem Bus 13 gekoppelt. Die Wiederauffindungs-Satzanalyseeinheit 5 und die Wiederauffindungs- Verarbeitungseinheit 8 sind als Software implementiert, die von der CPU 11 (Fig. 2) ausgeführt wird. Die Software ist in dem Speicher 12 gespeichert. Das Wortlexikon 4 (Fig. 1), die hierarchische Modelltabelle 6 und die Datenbank 9 sind innerhalb des Speichers 12 (Fig. 2) gespeichert.
- Fig. 3a liefert eine detaillierte Darstellung eines Beispiels des Wortlexikons 4. Wie diese Figur zeigt, enthält das Lexikon eine Vielzahl von Eintragungen, und jede Eintragung enthält drei Felder. Das Vorsatzfeld identifiziert den Ausdruck oder Satz, der mit der Eintragung verbunden ist, während das Teilsprachefeld den Teil der Sprache des Ausdrucks oder des Satzes identifiziert. Zuletzt identifiziert das Typenfeld den Typ des Ausdrucks oder Satzes, der verwendet wird. Bei dem in Fig. 3a gezeigten Beispiel sind die Typen "Datenwortname" und "Datenausdruckswort".
- Fig. 3b liefert eine detailliertere Darstellung des hierarchischen Tabellenmodells 6. Dieses Modell 6 zeigt die hierarchische Beziehung zwischen den jeweiligen Tabellen. Jede Tabelle spezifiziert eine Anzahl von Attributen. Beispielsweise enthält die Tabelle 14 die Attribute "Daten", "Warencode", "Warengruppen code" und "Verkäufe". Das "Warencode"-Attribut ist auch ein Attribut in Tabelle 16, welche hierarchisch mit der Tabelle 14 verbunden ist. In gleicher Weise ist "uriage" (Verkäufe) ein Attribut-Datenwortname. Das Wortlexikon 4 zeigt an, daß diese beiden Ausdrücke Substantive sind. Das Lexikon 2 ist nicht für das zyoshi "ha" und "no" bezogen.
- Die syntaktische und semantische Analyse wird dann für die Frage durchgeführt. Insbesondere wird die syntaktische Analyse durchgeführt, um die Syntax oder die Frage zu verarbeiten damit die Rolle verstanden wird, die jeder Ausdruck in der Frage spielt. Die semantische Analyse wird andererseits durchgeführt, um zu verstehen, was durch die Frage angefordert wird.
- Nachfolgend wir die semantische Analyse durchgeführt, um die Bedeutung der Frage mit den Datenbankeintragungen in Beziehung zu setzen. Die semantische Analyse verläßt sich auf das hierarchische Tabellenmodell 6 (siehe Fig. 3b), um festzustellen, daß "chokoreeto rui" (Schokoladen und dergleichen) ein Attribut- Datenausdruckswort einer Warengruppe in Tabelle 18 (d. h. Tabelle C in Fig. 3c) und "uriage" (Verkäufe) ein Datenwortname in der Tabelle 14 (d. h. Tabelle A in Fig. 13c) sind. Darüber hinaus zeigt das hierarchische Tabellenmodell 6 (Fig. 3b) an, daß Tabelle 14 eine Tabelle höherer Ordnung als Tabelle 18 ist. Da das Attribut-Datenwort, das in der Tabelle niedriger Ordnung erscheint, ein Substantiv ist, und ein zyoshi "no" diesem hinzugefügt ist, wird erkannt, daß das Attribut "chokoreeto rui" in Tabelle 18 das Attribut "uriage" (Verkäufe) modifiziert, welches in der Tabelle 14 höherer Ordnung erscheint. Unter Verwendung dieser Ergebnisse wird eine Wiederauffindungsformel "Wiederauffindungsbedingung: (Warengruppenname gleich chokoreeto rui), Wiederauffindungsobjekt: "uriage" erhalten und von der Wiederauffindungs-Satzanalyseeinheit 5 ausgegeben. Nachfolgend wir die Wiederauffindung aus der Datenbank 9 durch die Wiederauffindungsverarbeitungseinheit 8 durchgeführt, um die gewünschten Daten zu erhalten.
- Die Fig. 4a, 4b und 4c zeigen Lexika, die in einem zweiten herkömmlichen Datenbank-Wiederauffindungssystem verwendet werden, wie in der japanischen Patent-Offenlegungsschrift Nr. 59-99539 offenbart ist. In diesen Lexika sind Informationen über Spaltennamen in einer Datei, Informationen über Datenwortnamen und Informationen über einen Dateinamen, der einen gemeinsamen Spaltennamen oder Datennamen besitzt, entsprechend Dateinamen einer Datei, die in einer Datenbank enthalten ist, gespeichert. Fig. 4a stellt ein Lexikon dar, in welchem eine der Datenbankdateien den Spaltennamen einer Datei enthält. Das Lexikon enthält auch Informationen betreffend die Reihenfolge, in welcher die Spalte in der Datei enthalten ist, und es enthält zusätzlich Informationen betreffend Synonyme des Spaltennamens (d. h. Dateinummern und Spaltenattributnummern von Spalten, die synonym mit der mit Namen versehenen Spalte sind). Fig. 4 zeigt ein analoges Lexikon, in welchem eine der Dateien einen Datenspaltennamen enthält, und das Lexikon speichert eine Position, an der die mit Namen versehene Spalte in der Datei enthalten ist. Zuletzt speichert das Lexikon Informationen betreffend Synonyme des Datenspaltennamens. Fig. 4c zeigt ein Lexikon, welches Informationen enthält betreffend semantisch identische Datenspalten, die als Synonyme verbunden sind.
- Fig. 5 ist das bezeichnete Format für eingegebene Fragen für das zweite herkömmliche System. Dieses Format erfordert, daß Fragen als eine Zahl von Eintragungen eingegeben werden, wobei jede Eintragung zwei Felder enthält; ein Substantiv fällt und ein Partikel- oder Hilfsfeld. Somit wäre für die beispielhafte Frage 1 (Fig. 1), die bei der Diskussion des ersten herkömmlichen Systems verwendet wird, die eingegebene Frage für das zweite herkömmliche System wie folgt. Das erste Substantivfeld würde als "chokoreeto rui" eingetragen und das entsprechende Partikelfeld würde als "no" eingetragen. Weiterhin würde das zweite Substantivfeld als "uriage" eingetragen und das Partikelfeld würde als "ha" eingetragen.
- Bei diesem zweiten herkömmlichen System können Fragen in einem natürlichen japanischen Format nicht analysiert werden. In gleicher Weise wird das Wiederauffindungsobjekt in Anbetracht der Beschränkung des in Fig. 5 gezeigten bezeichneten Formats bestimmt. Ein Zugriff zu einer relevanten Datendatei kann daher nur durch begrenzte Terminologie enthaltend in den Lexika aufgezeichnete Synonyme erfolgen.
- Bei dem vorbeschriebenen ersten herkömmlichen Formationsauffindungssystem ist es erforderlich, daß vorher ein hierarchisches Tabellenmodell konstruiert, wird. Da es jedoch im Allgemeinen nicht immer möglich ist, den Inhalt einer Datenbank in einer Hierarchie anzuordnen, können eingegebene Sätze, welche nicht unter die definierte hierarchische Struktur fallen, nicht verarbeitet werden. Weiterhin besteht keine Flexibilität bei der Aufnahme von Ausdrücken oder Wörtern in natürlicher Sprache, wie "sengetsu" (letzter Monat), welche nicht in der Datenbank sind. Das System ist nur auf die Ausdrücke beschränkt, die in der Datenbank enthalten sind. Weiterhin ist keine Information über "zyoshi" (Partikel) vorgesehen. Somit besteht auch das Problem, daß das Weglassen eines "zyoshi" nicht erfasst werden kann.
- Zusätzlich ist, wenn ein zweideutiges Wort (z. B. Zeitperioden oder Jahreszeiten) vorhanden ist, eine syntaktische Analyse nicht möglich, wenn nicht die Definition des zweideutigen Wortes im Einzelnen aufgezeichnet ist. In einigen Fällen muß jeder Fragesteller die Definition auf einer individuellen Basis entsprechend seiner Verwendung des zweideutigen Ausdrucks aufzeichnen.
- Die Informationsauffindung wird für jedes der in einer Datei aufgezeichneten Datenwörter durchgeführt. Somit kann eine Antwort nicht für eine Frage erhalten werden, bei welcher mehrere Dateien abgerufen werden als ein Ergebnis der Analyse des eingegebenen Satzes und bei welcher es erforderlich ist, ein derartiges Wiederauffindungsergebnis zu verarbeiten, um ein endgültiges Ergebnis zu erhalten.
- Die vorgenannten Probleme des Standes der Technik werden durch die vorliegende Erfindung eines Informationsauffindungssystems, wie es im Anspruch 1 definiert ist, überwunden. Das Informationsauffindungssystem zum Wiederauffinden von Informationen aus einer Datenbank mit einer Analyseeinheit unter Verwendung eines Lexikons zur Analyse einer natursprachlichen Frage gemäß der vorliegenden Erfindung ist aus diesem Grund dadurch gekennzeichnet, daß die Analyseeinheit ein Parser ist zum Parsen der natursprachlichen Frage in ihre Bestandteile zum Bestimmen eines syntaxanalysierenden Ergebnisses bezüglich des Aufbaus der Frage; wobei das Lexikon eine Spalte für semantisches ID hat, das die semantische Bedeutung von Ausdrücken der Bestandteile in einer Weise bestimmt, die von der Da tenbank verstanden werden kann; virtuelle Tabellen zum Identifizieren der Ausdrücke der Bestandteile in der Datenbank, wobei jeder Ausdruck mit einer oder mehreren virtuellen Tabellen verbunden ist und virtuelle Tabellen verantwortlich für Partikel, die die Bestandteile modifizieren, eine Kollationiereinheit zum Vorbereiten einer Datenbank-Wiederauffindungsformel auf dem Syntaxanalyseergebnis durch Auswahl einer virtuellen Tabelle, welche ein Ausdruck gemeinsam mit einem anderen Ausdruck der Frage hat, eine Wiederauffindungs-Durchführungseinheit zum Wiederauffinden von Daten aus der Datenbank auf der Grundlage der Datenbank-Wiederauffindungsformel.
- Das Informationsauffindungssystem kann auch eine zusätzliche Tabelle zum Umwandeln eines Ausdrucks mit unbestimmtem Wert in der natursprachlichen Fragen in einen Ausdruck mit bestimmtem Wert in der Datenbank auf der Grundlage des Syntaxanalyseergebnisses enthalten. Weiterhin kann das Informationsauffindungssystem ein Terminologielexikon enthalten für die Identifizierung von Eintragungen in der virtuellen Tabelle, die zur Umwandlung von Ausdrücken der natursprachlichen Frage zu verwenden sind. Das Lexikon enthält Wörter, die Zeiten darstellen, und das Lexikon wird durch den Parser verwendet zum Erhalten des Syntaxanalyseergebnisses. Wenn das Terminologielexikon verwendet wird, kann das System auch eine Zeitintervall-Definitionstabelle in der virtuellen Tabelle enthalten für die Definition von Zeitangaben entsprechend den die Zeit darstellenden Wörtern. Schließlich kann das System eine Datenbank-Auffindungsformel- Umwandlungseinheit enthalten zum Erzeugen einer Formel in einer Datenbank-Auffindungssprache aus der Datenbank-Auffindungsformel.
- Fig. 1 ist ein Blockschaltbild eines ersten herkömmlichen Datenbank-Wiederauffindungssystems, das die von dem System durchgeführte Verarbeitung illustriert;
- Fig. 2 ist ein Blockschaltbild eines Datenverarbeitungssystems, das für die Implementierung des ersten herkömmlichen Systems geeignet ist;
- Fig. 3a ist eine detaillierte Darstellung des Wortlexikons 4 in Fig. 1;
- Fig. 3b ist eine detaillierte Darstellung des hierarchischen Tabellenmodells 6 in Fig. 1;
- Fig. 3c ist eine detaillierte Darstellung der Datenbank 9 in Fig. 1;
- Fig. 4a bis 4c illustrieren Lexika in einem zweiten herkömmlichen Datenbank-Wiederauffindungssystem;
- Fig. 5 illustriert das Eingabeformat für Fragen bei dem zweiten herkömmlichen Datenbank- Wiederauffindungssystem;
- Fig. 6 ist ein Blockschaltbild eines Ausführungsbeispiels der vorliegenden Erfindung, das die von dem Ausführungsbeispiel durchgeführte Verarbeitung illustriert;
- Fig. 7 ist eine detaillierte Darstellung des Terminologielexikons 26 in Fig. 6;
- Fig. 8a bis 8c sind detaillierte Darstellungen von Tabellen, die in der virtuellen Tabelle 28 in Fig. 6 gehalten sind;
- Fig. 9 ist eine Illustration eines Syntaxbaumes, der durch den Parser 22 ausgegeben wird;
- Fig. 10 ist ein Flussdiagramm von Schritten, die von dem System durchgeführt werden und eine natursprachliche Frage verarbeiten;
- Fig. 11 ist eine detaillierte Darstellung einer Definitionstabelle in der virtuellen Tabelle 28;
- Fig. 12 ist eine Darstellung eines Beispiels einer natürlichen Sprache entsprechenden logischen Formel;
- Fig. 13 ist eine Darstellung der modifizierten Version der Formel in Fig. 12;
- Fig. 14 ist eine detaillierte Darstellung der Kollationiereinheit 30 in Fig. 6;
- Fig. 15 ist eine Darstellung einer Definitionstabelle A in der virtuellen Tabelle 28 in Fig. 6;
- Fig. 16a und 16b sind Diagramme, welche die Operation des Systems mit einer Frage, die die saisongemäße Zeitperiode verwendet, illustriert;
- Fig. 17a bis 17c illustrieren die Verarbeitung einer Da seinstabellen-Logikformel;
- Fig. 18 ist eine Darstellung einer Datenbank-Wiederauffindungswort-Grammatikdefinitionstabelle 155, die in der virtuellen Tabelle 28 in Fig. 6 enthalten ist;
- Fig. 19 ist ein Beispiel einer Datenbankwiederauffindungs-Formelverarbeitung für die Daseinstabellen-Logikformel nach Fig. 17a bis 17c;
- Fig. 20a und 20b illustrieren die Gruppierung in syntaktischen Bäumen von zwei komplexen Fragen; und
- Fig. 21a und 21b stellen zusätzliche virtuelle Tabellen dar, die bei der Verarbeitung der Fragen nach Fig. 20a und 20b verwendet werden.
- Ein bevorzugtes Ausführungsbeispiel der vorliegenden Erfindung wird nun mit Bezug auf die Zeichnungen beschrieben. Fig. 6 zeigt die Ausbildung und den Fluss der Verarbeitung eines ersten bevorzugten Ausführungsbeispiels der vorliegenden Erfindung, welche ein Datenbank-Wiederauffindungssystem vorsieht, das auf eine natursprachliche Frage 1 antwortet. Wie das erste herkömmliche System nach Fig. 1 kann das System durch ein Datenverarbeitungssystem, wie es in Fig. 2 gezeigt ist, implementiert werden. Dieses erste bevorzugte Ausführungsbeispiel enthält eine Eingabeeinheit 2, eine Konversationssteuereinheit 3 und eine Datenbank 9 wie die beim herkömmlichen System nach Fig. 1 verwendeten. Diese Komponenten werden in dem Datenverarbeitungssystem 2 implementiert, wie bei dem ersten herkömmlichen System diskutiert wurde. Das be vorzugte Ausführungsbeispiel unterscheidet sich jedoch von dem herkömmlichen System in verschiedener Hinsicht. Diese Unterschiede werden nachfolgend aufgezeigt.
- Das erste bevorzugte Ausführungsbeispiel enthält auch einen Parser 22 zum Parsen einer eingegebenen natursprachlichen Frage in ihre Bestandteile. Der Parser 22 verwendet eine Grammatiktabelle 24 und ein Terminologielexikon 26. Die Grammatiktabelle 24 enthält Informationen zum Regelnder Beziehung in einem japanischen Satz, und das Terminologielexikon 26 definiert den Teil der Sprache und die Bedeutung jedes Wortes in der Frage 22. Während das Terminologielexikon 26 ähnlich dem in Fig. 1 gezeigten herkömmlichen Wortlexikon 4 ist, unterscheidet sich das Terminologielexikon nach Fig. 6 dadurch, daß es eine Spalte für einen semantischen Markierer (siehe Fig. 7) enthält. Die Rolle des semantischen Markierers wird nachfolgend im Einzelnen beschrieben. Eine Spalte für ein semantisches ID (siehe Fig. 7) und eine Spalte für ein Korrespondenzdatenwort sind auch vorgesehen. Der Parser analysiert die eingegebene Frage 22, um den Gegenstand zu bestimmen, Prädikate und andere Teile der Sprache in der eingegebenen natursprachlichen Frage 22.
- Das System nach Fig. 6 unterscheidet sich hauptsächlich von dem herkömmlichen System nach Fig. 1 dadurch, daß das System nach Fig. 6 eine virtuelle Tabelle 28 enthält. Die virtuelle Tabelle ist eine im Speicher 12 (Fig. 2) gehaltene virtuelle Natursprachen-Umwandlungstabelle zum Bezeichnen, in welcher Tabelle in der Datenbank 9 zu suchen ist, um die in der Frage 22 angeforderten Daten zu finden.
- Im Allgemeinen gibt es zwei Typen von Daten in der Datenbank 9. Es gibt die festen Daten wie eine Stammdatei zum Definieren von "Objekt", und es gibt variable Daten, welche sich kontinuierlich ändern in Übereinstimmung mit "Ereignis". Variable Daten sind auch auf eine kumulative Datei bezogen. Feste Daten mit denselben Charakteristiken sind gruppiert, um eine virtuelle Tabelle zu bilden. Weiterhin ist eine virtuelle Tabelle gebildet durch Hinzufügen von variablen Daten zu derartigen festen Datenwörtern, welche stark hierauf bezogen sind.
- Die virtuelle Tabelle 28 ist aus einer Anzahl von Tabellen (d. h. Tabellen 1 bis 8) zusammengesetzt, wie in den Fig. 8a bis 8c gezeigt ist. Jede der Eintragungen in diesen Tabellen enthält ein Feld für eine "Oberflächenbeschränkung" (siehe Fig. 8a bis 8c) und ein Feld für ein "Korrespondenzattribut" ist für jede Eintragung enthalten. Das Oberflächenbeschränkungsfeld ist mit Daten nur für variable Daten gefüllt. Das Oberflächenbeschränkungsfeld wird zum Speichern von Partikeln verwendet, welche jedes Vorsatzwort der eingegebenen Natursprache modifiziert und welche den Wert des "Korrespondenzattributs" verbunden mit dem Vorsatzwort bestimmen. D. h. die Oberflächenbeschränkung ist ein Datenwort, welches vorgesehen ist für die Durchführung einer weiteren Auswahl, wenn mehrere Korrespondenzattribute für ein Vorsatzwort möglich sind.
- Das Korrespondenzattribut kann eine andere virtuelle Tabelle, eine Datenbank-Daseinstabelle oder eine Operations-Daseinstabelle bezeichnen. Die Bezeichnung einer anderen virtuellen Tabelle zeigt an, daß detaillierte Daten in der anderen Tabelle gespeichert sind. Weiterhin wird die Speicherung auf diese Weise verwendet in einem Algorithmus zur Auswahl einer virtuellen Tabelle. Insbesondere dann, wenn eine virtuelle Tabelle in einem Korrespondenzattributfeld bezeichnet ist, wird die bezeichnete virtuelle Tabelle mit Priorität ausgewählt.
- Das System nach Fig. 6 enthält auch eine Kollationiereinheit zum Wiederauffinden von Daten aus der Datenbank 9 durch Bezugnahme auf die virtuelle Tabelle 28 unter Verwendung des Analyseergebnisses, das von dem Parser 5 ausgegeben wird. Die Kollationiereinheit kann durch Software implementiert werden, die von der CPU 11 (Fig. 2) ausgeführt wird, und im Speicher 12 gespeichert sein.
- Das System enthält weiterhin eine Datenbankformel- Erzeugungseinheit 32 zum Umwandeln einer Daseinstabellen-Logikformel von der Kollationiereinheit in eine Datenbank-Wiederauffindungsformel. Die Datenbank- Wiederauffindungsformel wird durch eine Wiederauffindungseinheit verwendet, welche Daten aus der Datenbank 9 wieder auffindet.
- Ausdrücke wie "no" und "ha" in der eingegebenen natursprachlichen Frage 20 sind zyoshi. Im Japanischen dienen diese Ausdrücke zum Identifizieren der Rolle, welche die Wörter spielen, die diesen vorausgehen. Beispielsweise modifiziert bei dem Beispiel der in Fig. 6 gezeigten eingegebenen natursprachlichen Frage 20 das zyoshi "no" den Ausdruck "Chokoreeto rui" (Schokoladen und dergleichen), um anzuzeigen, daß "Chokoreeto rui" das Objekt eines Präpositionssatzes ist. In gleicher Weise folgt das zyoshi "no" dem Wort "sengetsu", um anzuzeigen, daß "sengetsu" das Objekt eines präpositionalen Ausdrucks ist. Schließlich modifiziert das zyoshi "ha" den Ausdruck "uriage" (Ver käufe), um anzuzeigen, daß "uriage" das Subjekt der Frage ist. Die zyoshi helfen, daß in Fig. 9 gezeigte hierarchische Modell zu konstruieren, welches von dem Parser 22 ausgegeben wird.
- Bevor die Operation dieses Systems im Einzelnen diskutiert wird, ist es hilfreich, eine Übersicht der Operation des Systems zu schaffen. Anfänglich wird die natursprachliche Frage 20 (Fig. 6) von der Eingabeeinheit 2 eingegeben und von der Kommunikationssteuervorrichtung 3 aufgenommen. Die Kommunikationssteuervorrichtung richtet die eingegebene Frage an den Parser 22. Die Grammatiktabelle 24 wird von dem Parser 22 verwendet, um grammatische Regeln zu prüfen, welche helfen, die Tabelle in einen geeigneten Syntaxbaum wie den in Fig. 9 gezeigten zu parsen. Der Parser 22 verwendet auch das Terminologielexikon 26, um zu bestimmen, welche der Tabellen in der virtuellen Tabelle 28 geprüft werden sollten. Insbesondere wird die in Fig. 7 gezeigte "Datenwort"-Spalte des Terminologielexikons geprüft.
- Die Kollationiereinheit 30 (Fig. 6) bestimmt dann, welche der Tabelle in der virtuellen Tabelle 28 genutzt wird. Für das Beispiel der natursprachlichen Frage 20 wird Tabelle 1 (siehe Fig. 8a) geprüft. Die Eintragungen für die entsprechenden Ausdrücke sind in der Tabelle geprüft. Das Korrespondenzattributfeld der Eintragungen spezifizieren die Tabelle in der Datenbank 9 (Fig. 6), und eine Eintragung, wo Informationen betreffend den interessierende Ausdruck gefunden werden können, eine andere Korrespondenztabelle oder eine Anzeige, daß die gewünschten Daten als eine mathematische Funktion berechnet sind. Die von der Kollationiereinheit 30 (d. h. der Daseinstabellen- Logikformel) aufgefundenen Informationen werden dann zu der Datenbankformel-Erzeugungseinheit 32 geführt, welche diese Informationen in eine Datenbank-Wiederauffindungsformel zum Wiederauffinden aus der Datenbank umwandelt. Die Datenbank-Wiederauffindungsformel wird von der Datenbankformel-Erzeugungseinheit 32 zu der Wiederauffindungseinheit 34 geführt, welche die geeigneten Daten aus der Datenbank 9 wieder auffindet. Die wieder aufgefundenen Daten werden dann zu der Ausgabevorrichtung 17 (Fig. 2) ausgegeben.
- Die Operation des Systems nach Fig. 1 wird nun im Einzelnen beschrieben. Anfänglich wird eine natursprachliche Frage 1 "Chokoreeto rui no sengetsu no uriage ha?" (Verkäufe von Schokoladen und dergleichen im letzten Monat?) unter Verwendung der Eingabeeinheit 2 eingegeben. Die Kommunikationssteuervorrichtung 3 gibt diese Frage zu dem Parser 22. Die Wiederauffindungsreihenfolge und die Operationsreihenfolge der Wiederauffindungssprache sind in der Kommunikationssteuervorrichtung 3 definiert. Der Parser 22 parsiert die Frage gemäß bekannten Strategien zum Parsen japanischer Fragen, um ein Syntaxanalyseergebnis (wie den in Fig. 9 gezeigten Syntaxbaum) zu erzeugen. Der Parser 5 verwendet die Grammatiktabelle 34 und das Terminologielexikon 26 bei der Durchführung des Parsens. Die Grammatiktabelle 24 ist ein Satz von erweiterten kontextfreien grammatischen Regeln wie sie in "Iwanami Koza, Zyoho Kagaku 23: Kazu to Shiki to Bun no Shori", Kapitel 5 'Kikai Honyaku', Iwanami Shoten" dargelegt sind.
- Das Terminologielexikon 26 hat auch ein Format, wie es in dem oben beschriebenen Artikel umrissen ist. Dieses Format ist in Fig. 7 gezeigt. Um Zweideutigkeiten in der Bedeutung eines Wortes zu eliminieren, wird jedem Wort ein semantisches ID gegeben. Das se mantische ID hilft, den eingegebenen Ausdruck oder Wörter mit einem Ausdruck oder Wörtern zu assoziieren, die für die Datenbank 9 (Fig. 6) verständlich sind. Da zum Beispiel kein Wiederauffindungsschlüssel für "shoohin" (Ware) vorhanden ist, wird "shoohin mei" (Warenname) als das semantische ID für "shoohin" bezeichnet. Die Datenbank 9 (Fig. 6) enthält Informationen betreffend den Warennamen. Analog wird, da keine Eintragung für "choko rui" (Schokoladen und dergleichen) in der Datenbank vorhanden ist, "chokoreeto rui" (Schokoladen und dergleichen) als dessen semantisches ID bezeichnet.
- Jede Eintragung in dem Terminologielexikon 26 (Fig. 7) enthält auch einen semantischen Markierer. Der semantische Markierer ist vorgesehen, um ein zweideutiges Wort (d. h. nicht direkt in der virtuellen Tabelle definiert) mit einem Korrespondenzattribut zu verbinden. Weiterhin dient der semantische Markierer dazu, Wörter zu kombinieren, welche unter der semantischen Beschränkung in der virtuellen Tabelle identisch sind. Da beispielsweise keine solchen Wiederauffindungsschlüssel für "sengetsu" (letzter Monat) in der virtuellen Tabelle 28 (Fig. 6) vorhanden sind, ist der semantische Markierer für diesen Ausdruck gleich Monat (Datum), so daß die Anzeige dieses Ausdrucks eine Anzeige des Datums auf einer monatlichen Basis ist. In gleicher Weise sind den Ausdrücken "Kyonen" (letztes Jahr), "hi" (Tag) und "toshi" (Jahr) ebenfalls semantische Markierer zugeordnet, welche anzeigen, daß die Ausdrücke sich auf ein Datum beziehen. Es können mehrere semantische Markierer für ein Wort zulässig sein (z. B. "uriage" in Fig. 7). In solchen Fällen wird das Datenwort in der virtuellen Tabelle 28 (Fig. 6), welches in der Lage ist, einem Auffindungsschlüssel der Datenbank 9 zu entsprechen, durch folgende semantische Beschränkung der durch den semantischen Markierer bezeichneten virtuellen Tabelle gesucht. Weiterhin ist in dem Terminologielexikon 26 eine Spalte für entsprechende Datenwörter (z. B. die "Datenwort"-Spalte in Fig. 7) vorgesehen für die Bezeichnung, auf welche der Tabellen der virtuellen Tabelle 28 (Fig. 6) Bezug genommen werden sollte.
- Weiterhin wird in dem Fall, in welchem der Ausdruck, für welchen eine Eintragung im Terminologielexikon gesucht wird, ein numerischer Wert ohne entsprechende Eintragung in der virtuellen Tabelle ist, ein Korrespondenzattribut bestimmt durch die modifizierende modifizierte Beziehung hiervon oder einen semantischen Markierer für Einheiten von numerischen Werten. Alternativ wird ein tatsächlicher Wert bestimmt gemäß der Definition einer Daseinstabelle.
- Als ein Ergebnis der durch den Parser 22 durchgeführten Analyse wird die Konstruktion der Frage identifiziert und das Objekt der Frage ist bekannt. Es ist erforderlich, das Objekt der Frage mit einem von der Datenbank besessenen Datenwort in Übereinstimmung zu bringen. Während mehrere Methoden für diesen Zweck verwendet werden können, ist die wirksamste Methode eine, bei der die virtuelle Tabelle vorgesehen ist, um ähnliche Bedeutungen zu assoziieren, auf welche als verschiedene Wörter in der Datenbank Bezug genommen ist. Durch Vorsehen einer virtuellen Tabelle wird eine Änderung und/oder Hinzufügung des Systems leicht verglichen mit einem Verfahren, bei welchem das Wiederauffindungsobjekt-Datenwort der Datenbank direkt in ein Terminologielexikon eingebracht ist. Weiterhin kann eine Verschiedenheit von unterschiedlichen natürlichen japanischen Fragen korrekt verarbeitet werden und die Fragen können verschiedene unterschiedli che Modifiziererdarstellungen verwenden.
- Der Parser 22 (Fig. 6) erzeugt somit einen hierarchischen Syntaxbaum wie den in Fig. 9 gezeigten. Dieses Ergebnis zeigt an, daß die Verkäufe (d. h. "uriage") das sind, was gesucht wird. Der Ausdruck "Chokoreeto rui" (Schokolade und dergleichen) spezifiziert die Warengruppe, für welche die Verkäufe gesucht sind, und der Ausdruck "sengetsu" (letzter Monat) zeigt den Zeitrahmen an, für welchen die Verkaufsdaten gesucht werden. Dieser Syntaxbaum wird zu der Kollationiereinheit als das Syntaxanalyseergebnis gegeben (siehe Schritt 40 in Fig. 10). Der Syntaxbaum wird nicht direkt in eine Datenbankwiederauffindungs- Logikformel umgewandelt, sondern wird in eine Zwischendarstellung umgewandelt, die als eine Logikformel für eine virtuelle Tabelle bekannt ist. Dann wird eine angemessene Tabelle in der virtuellen Tabelle 28 (Fig. 6) ausgewählt (Schritt 42 in Fig. 10).
- Für die beispielhafte Frage 20 in Fig. 6 wird auf das Terminologielexikon 26 (Fig. 7) Bezug genommen. Insbesondere wird das "Datenwort"-Feld für "sengetsu" (letzter Monat) geprüft. Das Datenwort-Feld zeigt zu Tabelle 5 in der virtuellen Tabelle 28 (Fig. 6). Somit wird Tabelle 5 (Fig. 8c) in der virtuellen Tabelle 28 (Fig. 6) geprüft. Die Eintragung für "sengetsu" hat ein Korrespondenzattribut, das zur Definitionstabelle B-21 zeigt. Demgemäß wird die Eintragung mit dem Argument 21 in der Definitionstabelle B geprüft (siehe Fig. 11a). Diese Tabelleneintragung bewirkt das Verfahren der Berechnung für "sengetsu". "sengetsu" (der letzte Monat) ist ein Wert, welcher sich entsprechend dem Zeitpunkt der Eingabe ändert und der daher berechnet werden muß.
- Um das Verfahren zu verstehen, ist es wichtig, zuerst das Format zu verstehen, in welchem das Datum gehalten wir. Das gegenwärtige Datum ist eine 8- Dezimalstellenzahl mit den Stellen 8-5, die das Jahr halten (z. B. "1992"), Stellen 4 und 3, die den Monat halten (z. B. "07" für Juli) und Stellen 2 und 1, die den Tag halten (z. B. "11"). Somit ist ein beispielhaftes Format für das Datum des 11. Juli 1992 gleich "19920711".
- Wenn der 11. Juli 1992 das gegenwärtige Datum ist, teilt die Definitionstabelle B dem System mit, wie der letzte Monat zu berechnen ist (d. h. Juni oder "06"). Zuerst wird eins von den Monatsstellen 4 und 3 subtrahiert. Daher wird ein Ergebnis von (07 - 1) oder 06 erhalten. Dann prüft das System, ob das Ergebnis gleich 00 ist. In diesem Fall ist das Ergebnis nicht null. Wenn das Ergebnis der Subtraktion gleich 00 ist, ist dies ein Anzeichen, daß der letzte Monat der Dezember des vorhergehenden Jahres war. Daher werden die Monatsstellen 4 und 3 durch die Stellen 12 für Dezember ersetzt und die Jahresstellen 8 - 5 (die Stellen höherer Ordnung) werden um eins verringert. Zuletzt werden die Tagesstellen 1 und 2 durch 00 ersetzt.
- Als Nächstes wird eine Tabelle in virtuellen Tabelle 28 (Fig. 6) für "sengetsu" (letzter Monat) ausgewählt. In dem Terminologielexikon 26 (Fig. 7) sind mehrere virtuelle Tabellen für "chokoreeto rui" (Schokoladen und dergleichen) bezeichnet. Insbesondere sind die Tabellen 1 und 3 bezeichnet. Eine Eintragung in dem Terminologielexikon 28 wird ebenfalls für den Ausdruck "uriage" (Verkäufe) geprüft. Die Eintragung von "uriage" (Verkäufe) bezeichnet Tabelle 1. Wenn angenommen wird, daß sowohl die Eintragung für "Chokoreeto rui" als auch die Eintragung für "uriage" die Tabelle 1 der virtuellen Tabelle 28 spezifizieren, wird die Tabelle 1 ausgewählt. Wenn die geeignete Tabelle in der virtuellen Tabelle 28 ausgewählt ist, wird eine Zwischendarstellung durch den Kollationierungsprozess gebildet (Schritt 44 in Fig. 10), der von der Kollationiereinheit 30 durchgeführt wird.
- Die Kollationiereinheit 30 (Fig. 14) weist intern auf: eine Auswahleinheit 60 für die virtuelle Tabelle, um eine Tabelle in der virtuellen Tabelle 28 (Fig. 6) auszuwählen; eine Berechnungs-/Kombinationseinheit 62 für einen tatsächlichen Wert (Fig. 14) zur Durchführung von Berechnungen und Kombinationen; und eine Fragestruktur-Bestimmungseinheit 64 zum Bestimmen der Struktur von Fragen, die zu der Datenbank- Formelerzeugungseinheit 32 geführt werden.
- Der Kollationierungsprozess bezieht die Aufnahme der Inhalte eines Lexikons, auf das durch die eingegebene natursprachliche Frage Bezug genommen ist, ein in die Tabelle der virtuellen Tabelle, die im Schritt 42 in Fig. 14 ausgewählt wurde, oder durch Durchführung einer Attributkopplung zwischen virtuellen Tabellen. In dem beispielhaften Fall wurden zwei virtuelle Tabellen ausgewählt: Tabelle 1 (durch die Eintragungen in dem Terminologielexikon für "uriage" und "Chokoreeto rui") und Tabelle 5 (durch die Eintragung für "sengetsu"). Eine Korrespondenzlogikformel 50 für eine natürliche Sprache wird erzeugt, wie in Fig. 12 gezeigt ist. Die Korrespondenzlogikformel 50 ist eine Tabelle, die anzeigt, welche Informationen aus der Frage bekannt sind und welche zusätzlichen Informationen benötigt werden, um die Frage zu vervollständigen. Insbesondere zeigt sie die relevanten Variablen und jeglichen Werte dieser Variablen an, welche bekannt sind.
- "Chokoreeto rui" wird in den "shoohin gun mei" (Warengruppenname) in der Formel 50 eingegeben, da "chokoreeto rui" (Schokoladen und dergleichen) ein Warengruppenname ist. Dies ist aus der ersten Tabelle in virtuellen Tabelle 28 (Fig. 6) bekannt. Weiterhin sind "URI" und "Datum" Variable, für welche die Werte noch nicht bestimmt sind. Diese durch dasselbe Wort dargestellten Variablen haben denselben Wert und stellen dieses selbe Attribut dar. Bei diesem Beispiel ist "URI" in der Frage und "URI" in "uriage hyo" sind einander identisch. Es ist festzustellen, daß die Werte für solche Datenwörter mit Ausnahme der notwendigen Datenwörter nicht benötigt werden. Eine Markierung "*" zeigt an, daß kein Wert aufgenommen wurde.
- Im Schritt 46 von Fig. 10 wird eine erforderliche virtuelle Tabelle hinzugefügt, um zu der Datenbank 9 (Fig. 6) zuzugreifen. Bei diesem Beispiel ist die Tabelle 3 (Fig. 8b) der virtuellen Tabelle 28 (Fig. 6) ausgewählt auf der Grundlage des Korrespondenzattributs von "shoohin gun mei" 7 (Warengruppenname) in Tabelle 1 (Fig. 8a), welches Tabelle 3-2 spezifiziert. Die Eintragung in Tabelle 3 richtet den Benutzer zu der Datenbanktabellen-Eintragung 3-2 (z. B. DB 3-2). Zusätzlich wird der tatsächliche Wert von "sengetsu" (letzter Monat) aus der Definitionstabelle B berechnet (wie vorstehend diskutiert wurde). Die so vorgesehene Tabelle wird durch 52 in Fig. 13 angezeigt. Die gezeigten Daten führen zu der Annahme, daß das gegenwärtige Datum im Mai 1990 liegt. Daher ist der letzte Monat April 1990 oder "19900400". Der Warengruppencode dient als das Attribut zum Verbinden der Tabelle 1 und der Warengruppen-Stammtabelle, und sie besitzt "Code" als eine unbestimmte Variable.
- Diese Tabelle 52 wird durch die Datenbank-Formelerzeugungseinheit 32 (Fig. 6) im Schritt 48 (Fig. 10) in eine Datenbank-Wiederauffindungsformel umgewandelt. Wiederauffindungen werden aufeinander folgend auf der Grundlage der Wiederauffindungsformel von der Wiederauffindungseinheit 34 (Fig. 6) durchgeführt, um die unbestimmten Variablen in der Tabelle 52 (Fig. 13) zu füllen. Zuerst wird die unbestimmte Variable "Code" von der Warengruppen-Stammtabelle 19 (d. h. Tabelle C in Fig. 3c) so bestimmt, daß sie 200 ist, was "chokoreeto rui" (Schokoladen und dergleichen) entspricht.
- Das System sieht dann nach dem Korrespondenzattribut für "uriage" (Verkäufe) (siehe Fig. 8a), welches "fun-sum (BB1-4)" ist. Das Symbol "fun" zeigt an, daß eine Art von Berechnung benötigt wird. Mit der Definitionstabelle B-21 wird, wenn z. B. der letzte Monat der April 1990 ist, der Wert für den letzten Monat aus dem Wert für das gegenwärtige Datum als ein Operationsergebnis "19900400" erhalten. In ähnlicher Weise ist fun-sum (DB1-4) eine Operation, um die Summe der numerischen Werte der Verkaufsspalte (Spalte 4) in Tabelle A der Datenbank (Fig. 3c) zu erhalten. Das System kann dann zur Tabelle A zugreifen, um alle Verkaufseintragungen in der Verkaufsspalte für die Warengruppencode 200-Datenwörter während des Monats April 1990 zu summieren.
- Auf diese Weise wird der Wert von URI gefüllt und die Datenbank-Wiederauffindungsverarbeitung wird beendet. Das Ergebnis wird dann in einem vorbestimmten Format ausgegeben.
- Die Frage muß in eine Frage, die in einer Datenbank- Wiederauffindungssprache ausgedrückt ist, umgewandelt werden, um Daten aus der Datenbank wieder aufzufinden. Um die Struktur der natursprachlichen japanischen Fragen durch Datenbank-Wiederauffindungsformeln zu ersetzen, ist es erforderlich, die Beschränkungen und die Grammatik, die durch die Datenbank-Wiederauffindungssprache in der Terminologiedefinitionstabelle 26 (Fig. 6) besessen werden, zusammenzutun. Die Konstruktion der Fragen in der Datenbank-Wiederauffindungssprache erfolgt durch Bezugnahme auf diese Terminologiedefinitionstabelle, wie vorstehend beschrieben ist. Weiterhin ergibt das Vorhandensein einer getrennten Grammatikdefinitionstabelle 24 den Vorteil, daß alle Änderungen der Datenbank-Wiederauffindungssprache durch die Grammatikdefinitionstabelle absorbiert werden können, selbst wenn die vorliegende Erfindung auf ein System angewendet wird, das eine unterschiedliche Datenbank-Wiederauffindungssprache verwendet.
- Wie vorstehend beschrieben ist, wird durch Verwendung des semantischen Markierers eines Terminologielexikons und der virtuellen Tabelle eine Datenbank bezeichnet und es erfolgt eine Umwandlung in eine Wiederauffindungs-Logikformel, welche geeignet ist, selbst wenn ein zweideutiges Wort in der Frage enthalten ist oder eine Weglassung in der eingegebenen Frage auftritt.
- Wie beschrieben ist, wird bei der vorliegenden Erfindung kein hierarchisches Tabellenmodell benötigt. Weiterhin ist keine Berücksichtigung der hierarchischen Beziehung der Datenbank erforderlich. Da die virtuellen Tabellen eine Konstruktion haben, welche direkt die hierarchische Beziehung der Datenbank re flektiert, sind die Konstruktion und die Änderung einfach. Da weiterhin die Oberflächenbeschränkung und die semantische Beschränkung in der virtuellen Tabelle enthalten sind, kann die Kollationiereinheit eine sehr wahrscheinliche Datenbankdatei bezeichnen durch Auswahl einer geeigneten virtuellen Tabelle selbst für eine eingegebene zweideutige Frage.
- Bei dem vorstehend beschriebenen Beispiel war der Ausdruck "sengetsu" (letzter Monat) in der natursprachlichen Frage enthalten. Dieser Ausdruck war ein unklares Wort in Bezug auf die Zeit. Das System hat auch die Fähigkeit, andere unklare Ausdrücke, die sich auf die Zeit beziehen, ordnungsgemäß zu analysieren. Es wird angenommen, daß der eingegebene japanische Satz "Kotoshi no haru no uriage ha" (Verkauf während des Frühjahrs in diesem Jahr?) lautet. Der Parser 22 (Fig. 6) zerlegt diesen Satz in seine Bestandteile "uriage" (Verkäufe) und "kotoshi no haru" (der Frühling in diesem Jahr). Weiterhin weiß der Parser 22, daß "kotoshi no haru" den Ausdruck "uriage" modifiziert. Der Parser 22 sieht nach dem Ausdruck "kotoshi no haru" in dem Terminologielexikon 26 und wird an eine geeignete Tabelle in der virtuellen Tabelle 28 verwiesen. Die Eintragung in der virtuellen Tabelle verweist den Benutzer zu der Eintragung 3 in der Definitionstabelle A, wie in Fig. 15 gezeigt ist. Diese Eintragung zeigt an, daß sich das Frühjahr von 03/01 bis 05/31 erstreckt. Auf diese Weise wird das Wort "kotoshi no haru" (Das Frühjahr in diesem Jahr), das in dem Syntaxanalyseergebnis enthalten ist, ersetzt durch "1990 nen 3 gatsu 1 nichi - 1990 nen 5 gatsu 31 nichi" (1. März 1990 - 31. Mai 1990).
- Bei diesem Beispiel muß jedoch jede zu verwendende Kombination von Zeitwörtern in einem Terminologiele xikon als ein einzelnes Wort aufgezeichnet sein. Wenn es z. B. gewünscht ist, daß "kotoshi" (diese Jahr) und "haru" (Frühjahr) zu "kotoshi no haru" (das Frühjahr in diesem Jahr) kombiniert werden, ist es erforderlich, vorher "kotoshi no haru" (das Frühjahr in diesem Jahr) in dem Terminologielexikon 26 (Fig. 6) aufzuzeichnen. Da weiterhin die Definition eines jahreszeitlichen Wortes oder dergleichen von Benutzer zu Benutzer unterschiedlich ist, muß ein Terminologielexikon für jeden Benutzer vorbereitet werden.
- Es kann ein alternatives Ausführungsbeispiel, wie in den Fig. 16a und 16b gezeigt ist, angewendet werden. Dieses alternative Ausführungsbeispiel unterscheidet sich von dem ersten Ausführungsbeispiel dadurch, daß es enthält: eine Zeitpunkt-Berechnungseinheit 70 zum Berechnen eines bestimmten Zeitpunktes aus dem gegenwärtigen Datum, eine Zeitintervall-Definitionstabellen-Bezugseinheit 80 und eine Kombinationseinheit 82 zum Addieren des Bezugsergebnisses der Zeitintervall- Definitionstabellen-Bezugseinheit 80 und des berechneten Ergebnisses eines Zeitpunktes. Weiterhin ist ein Systemzeitgeber 68 vorgesehen.
- Es wird angenommen, daß "sakunen no fuyu no uriage ha" (Verkäufe während des Winters des letzten Jahres?) über die Eingabeeinheit 2 als die eingegebene Frage 66 eingegeben wird (Fig. 16a). Der Parser 22 erzeugt ein Syntaxanalyseergebnis 72 (d. h. einen Syntaxbaum) durch Verwendung der Grammatiktabelle 24 und des Terminologielexikons 26. Das Syntaxanalyseergebnis enthält "sakunen" (letztes Jahr) und "fuyu" (Winter), welche Zeitwörter sind. Die Definition des Wortes "sakunen" (das letzte Jahr) wird durch Zeitberechnung erhalten, und die Definition des Wortes "fuyu" (Winter) wird bezeichnet als zu beschreiben in der Zeitintervall-Definitionstabelle 82 (Fig. 16b). Das Syntaxanalyseergebnis 72 wird zu der Kollationiereinheit 30 geführt, wo das Ergebnis von der Zeitpunkt-Berechnungseinheit 70 empfangen wird. In der Zeitpunkt-Berechnungseinheit 70 wird eine Zeitpunktberechnung durchgeführt mit Bezug auf das gegenwärtige Datum (z. B. "19901224"), das durch einen Systemzeitgeber 68 erhalten wird. Das durchgeführte tatsächliche Berechnungsverfahren wird aus der in der Definitionstabelle B in Fig. 11 vorgesehenen Definition ausgewählt. Die ausgewählte Definition hängt von dem Wert in der Argumentspalte in dem Terminologielexikon ab. Bei diesem Beispiel wird ein 8-stelliger ganzzahliger Wert, der das Jahr "sakunen" (letztes Jahr) anzeigt, "19890000", durch das Berechnungsverfahren erhalten, entsprechend dem Wert "11" in der Argumentspalte von "sakunen" (das letzte Jahr), welche feststellt "subtrahiere 1 von vier Stellen hoher Ordnung und ersetze die vier Stellen niedriger Ordnung durch "0000". Nachfolgend wird der berechnete ganzzahlige Wert in den Teil für "sakunen" (das letzte Jahr) in dem Syntaxanalyseergebnis 72 eingesetzt, um ein Zeitpunkt-Berechnungsergebnis 74 zu erhalten.
- Die Zeitintervall-Definitionsbezugseinheit 80 enthält die tatsächlichen Daten entsprechend "fuyu" (Winter). Sie erhält diese Daten durch Bezugnahme auf die Zeitintervall-Definitionstabelle 84. Daher wird, wie in Fig. 15 gezeigt ist, "fuyu" definiert als beginnend bei "00001201" (d. h. 1. Dezember) und endend bei "00010331" (d. h. 31. März des nächsten Jahres). Die Zeitintervall-Definitionstabellen-Bezugseinheit 80 ersetzt den wieder aufgefundenen Wert 86 für "fuyu" (Winter) in dem Zeitpunkt-Berechnungsergebnis 24, um ein Zeitintervall-Definitionstabellen-Bezugsergebnis 76 zu erhalten. Die Kombinationseinheit 82 kombiniert die tatsächlichen Daten entsprechen "sakunen" (das letzte Jahr) und "fuyu" (Winter) durch Addition, um einen vollständigen 8-Stellen-Bereich für Datumsangaben für das Intervall zu erhalten, wie in dem Kalkulationsergebnis 78 gezeigt ist. Insbesondere wird das Jahr "19890000" zu den Datumsangaben "fuyu" "00001201" - "00010331" hinzugefügt, um "19891201" - "19900331" zu erhalten. Das Berechnungsergebnis "19891201 - 19900331" bedeutet "vom ersten Dezember 1989 bis zum 31. März 1990". Das Berechnungsergebnis 78 wird dann verarbeitet, wie beim ersten Ausführungsbeispiel diskutiert ist.
- Durch Änderung der Definition jedes Zeitwortes, das in der Zeitintervall-Definitionstabelle 84 (Fig. 16b) beschrieben ist, kann der Benutzer ein Berechnungsergebnis in Übereinstimmung mit der Definition ohne Änderung des Terminologielexikons 26 (Fig. 16a) erhalten. D. h. es ist für Benutzer möglich, ein Terminologielexikon zu teilen und die Zeitintervall-Definitionstabelle individuell zu handhaben. Dieser Nutzen des Teilens eines Terminologielexikons wird offensichtlicher, wenn davon ausgegangen wird, daß ein Terminologielexikon einen großen Umfang hat und eine Änderung eines Terminologielexikons schwierig ist. Wenn darüber hinaus Wörter enthaltend viele Modifizierer zu definieren sind, sind die Speicheranforderungen groß. Daher ist das Vorsehen eines getrennten Terminologielexikons für jeden Benutzer mühsam.
- Die Beispiele für die eingegebenen natursprachlichen Fragen 1 (Fig. 6) und 66 (Fig. 16a) verlangten Verkaufsinformationen, welche leicht durch das System wiedergegeben werden konnten. Das System ist jedoch in der Lage, kompliziertere Fragen zu handhaben, die eine Schlußfolgerung erfordern. Es wird beispielswei se angenommen, daß die eingegebene japanische Frage der Satz ist: "Sengetsu no uriage yori kongetsu no uriage ga ooi tokuisaki ha" (Welcher Kunde hatte in diesem Monat mehr Verkäufe als Verkäufe im letzten Monat?). Für eine derartige eingegebene natursprachliche Frage erzeugt das System eine Wiederauffindungs-Logikformel, die auch bekannt ist als die Daseinstabellen-Logikformel 14, in der in Fig. 17a gezeigten Form 140. Die Formel 140 enthält eine Ergebnistabelle 142 zum Speichern der endgültige Ergebnisse der wieder aufgefundenen Daten. Die Ergebnistabelle 142 enthält einen Ort zum Speichern des Kundennamens und Tabellen zum Speichern der Gesamtverkäufe dieses Monats und der Gesamtverkäufe des letzten Monats. Zusätzlich enthält die Daseinstabellen-Logikformel 140 eine GT-Tabelle, welches eine Tabelle in der virtuellen Tabelle ist, die eine logische Operation mit Parametern durchführt, um zu bestimmen, ob ein Parameter (die linke Seite) größer als der andere (die rechte Seite).
- Die Gesamtverkäufe der Tabelle für den letzten Monat enthalten einen Zeiger, der zu einer Zwischenergebnistabelle 144 für den letzten Monat zeigt, die die Ergebnisse von Zwischenberechnungen hält, die erforderlich sind, um die Gesamtverkäufe des letzten Monats zu bestimmen. In gleicher Weise zeigt die Tabelle für die Gesamtverkäufe dieses Monats zu der Zwischenergebnistabelle 146 für diese Monat. Beide Zwischenergebnistabellen 144 und 146 suchen Informationen zu haben, die den Kundencode und die Gesamtverkäufe für ihre jeweiligen Monate betreffen. Um die Gesamtverkäufe des letzten Monats zu berechnen, ist es erforderlich, das Berechnungsobjekt zu bestimmen (d. h. welche Art von Information wird gesucht). Zusätzlich ist es erforderlich, die Menge von Bestellung zu be stimmen, welche während des Monats von diesem Kunden erhalten wurden, demgemäß gibt es eine zusätzliche Tabelle, die Zwischenergebnistabelle 148 für die Gesamtverkäufe des letzten Monats. Analog ist auch eine Zwischenergebnistabelle 151 für die Gesamtverkäufe in diesem Monat vorgesehen, welche ähnliche Informationen für den Verkauf dieses Monats sucht. Daher wird die Menge der empfangenen Bestellungen für diesen Monat und den letzten Monat für den bestimmten Kundencode angefordert und zu der Datenbank-Formelerzeugungseinheit 32 geführt, welche die Logikformel in eine Datenbank-Wiederauffindungsformel 157 umwandelt unter Verwendung der Datenbank-Wiederauffindungswort- Grammatikdefinitionstabelle 155. Die Ergebnistabelle und verschiedenen Zwischenergebnistabellen 144, 146, 148 und 151 werden zu der Datenbank-Formelerzeugungseinheit 32 geführt. Zusätzlich werden Gleichheitstabellen (bezeichnet als EQ-Tabellen) zu der Datenbank- Formelerzeugungseinheit 32 geführt. Insbesondere werden EQ-Tabellen 3 und 4, wie in Fig. 17b gezeigt ist, zu der Datenbank-Formelerzeugungseinheit 32 geführt. Die EQ-Tabelle 3 sucht zu bestimmen, ob das Datum der Datei für empfangene Bestellungen gleich dem Datum des letzten Monats ist, und die EQ-Tabelle 4 sucht zu bestimmen, ob das Datum der Datei für empfangene Bestellungen gleich dem heutigen Datum ist.
- Die Daseinstabellen-Logikformel 140 wird durch die Datenbank-Formelerzeugungseinheit 32 (Fig. 17c) verarbeitet, welche die Datenbank-Wiederauffindungswort- Grammatikdefinitionstabelle verwendet, um die Logikformel 140 zu verarbeiten. Die Datenbank-Wiederauffindungswort-Grammatikdefinitionstabelle wird durch die Datenbank-Formelerzeugungseinheit 32 mit Bezug auf die Wiederauffindungs-Logikformel 140 geprüft. Die Datenbank-Wiederauffindungswort-Definitionsta belle verarbeitet anfänglich die Ergebnistabelle, wie in Fig. 18 angezeigt ist. Insbesondere ist das System gerichtet auf die Auswahl von AUSWAHL (Datenwort) VON (Bezugstabelle) WO (Bedingung). Somit wird die Ergebnistabelle umgewandelt in eine Datenbank-Wiederauffindungsformel von < auf Frage 3> von Fig. 19. Die Wiederauffindungswort-Grammatikdefinitionstabelle 155 hat eine ähnliche Eintragung für die Zwischenergebnistabellen 144 und 146. Weiterhin untersucht die Datenbank-Formelerzeugungseinheit 32 die Ausführungsfolge der bestimmten Operationen mit Bezug zueinander. Da in diesem Fall die Ergebnistabelle 142 die Zwischenergebnistabelle 144 für den letzten Monat und die Zwischenergebnistabelle 146 für diesen Monat als "linke Seite > rechte Seite" in der GT-Tabelle bezeichnet, wird gelernt, daß die Operation der linken Seite und der rechten Seite durchgeführt werden muß, bevor die GT-Tabelle verarbeitet werden kann. Mit anderen Worten, es wird gesehen, daß die Bestimmung der Zwischenergebnistabellen zuerst durchgeführt werden muß.
- Auf diese Weise wird die Ausführungsfolge bestimmt als < Frage 1> , < Frage 2> (es besteht keine Beschränkung für die Ausführungsfolge dieser beiden), < Frage 3> .
- Das System schreitet fort, um jede der Fragen wie in Fig. 19 angezeigt zu verarbeiten. Insbesondere wird für die Frage 1, welche die Frage für die Zwischenergebnistabelle für den letzten Monat ist, die Kundentabelle in der Datenbank 9 (Fig. 17c) abgerufen unter Verwendung der Wiederauffindungseinheit 34, um die Kundencodeinformationen zu erhalten. Weiterhin sucht das System die Mengenfelder in der Datei für empfangene Bestellungen der Datenbank 9 zu summieren. Um diese Rechnung durchzuführen, summiert das System die Mengeneintragungen mit dem geeigneten Kundencode und welche den Datenbeschränkungen des letzten Monats genügen. Die EQ-Tabelle 3 wird verwendet, um sicherzustellen, daß die Datumsanforderungen erfüllt sind. Auf diese Weise wird die Zwischenergebnistabelle mit den relevanten Informationen gefüllt.
- Die Frage 2 betrifft die Verarbeitung für die Zwischenergebnistabelle für diesen Monat. Die Verarbeitung ist dieselbe wie bei Frage 1 mit der Ausnahme, daß unterschiedliche Datumsanforderungen verwendet werden. Insbesondere muß daß Datum den Beschränkungen für diesen Monat entsprechen. Auf diese Weise werden die Informationen für die Zwischenergebnistabelle für diesen Monat vervollständigt.
- Zuletzt wird die Frage 3 verarbeitet. Die Frage 3 ist die Frage für die Ergebnistabelle. Wie Fig. 19 anzeigt, werden die Kundentabelle in der Datenbank und der Kundenname ausgewählt sowie die Gesamtverkäufe der Tabelle dieses letzten Monats und der Gesamtverkäufe der Tabelle dieses Monats. Diese Informationen werden aus der Kundentabelle in der Datenbank 9 (Fig. 17), aus der Zwischenergebnistabelle 144 für den letzten Monat und der Zwischenergebnistabelle 146 für diesen Monat abgerufen. Damit der Kundenname ausgegeben wird, müssen die Verkäufe aus der Tabelle für diesen Monat größer sein als die Verkäufe aus der Tabelle für den letzten Monat und der Kundencode aus der Zwischenergebnistabelle für diesen Monat muß gleich der Kundentabelle und dem Code sein.
- Auf diese Weise ist eine automatische Erzeugung der Datenbank-Wiederauffindungsformel möglich. Operationen werden verbunden mittels eines Zeigers, und eine Logikeinheit zur Beurteilung der Ausführungsordnung ist in der Datenbank-Formelerzeugungseinheit 32 in Fig. 6 vorgesehen.
- Weiterhin ergibt diese Annäherung den zusätzlichen Vorteil, daß mehrere aufeinander folgende Datenwiedergaben mittels Zwischenergebnissen möglich sind. Das System ergibt auch den Vorteil, daß es möglich ist, eine einfache Anpassung an eine unterschiedliche Datenbank-Wiederauffindungssprache durch Änderung der Grammatikdefinitionstabelle durchzuführen.
- Insbesondere kann, wenn die Wiederauffindungssprache geändert wird, die Datenbank-Wiederauffindungsformel für eine neue Wiederauffindungssprache erzeugt werden und ein übermäßiges Neuschreiben von dieser ist nicht erforderlich. Vielmehr ist eine einfache Änderung in der Beschreibung von (Datenwort), (Bezugstabelle), (Bedingung) oder AUSWAHL, VON, WO des bezeichneten Datenwortes zu der Ergebnistabelle der Grammatikdefinitionstabelle alles was erforderlich ist.
- Für einige natürliche japanische Fragen muß eine komplizierte oder mehrfache Verarbeitung durchgeführt werden, um die Frage zu analysieren. Beispielsweise gibt es Fälle, bei denen Daten, die bestimmten Perioden von bestimmten Bedingungen entsprechen, miteinander addiert werden. Es ist oft wünschenswert, in der Lage zu sein, eine Vorverarbeitungsoperation bei der Kollationiereinheit durchzuführen für einen Vergleich oder eine Gruppierung. Daher kann eine derartige Vorverarbeitung in die vorliegende Erfindung einbezogen werden.
- Um eine derartige Vorverarbeitung zu erläutern, wird angenommen, daß die eingegebene Frage lautet: "Mitsu bishi shooten no uriage yori uriage ga ooi tokuisaki ha" (Welcher Kunde hat mehr Verkäufe als Mitsubishi shooten?) oder "(A-shooten no) kotoshi no haru kara aki made no uriage ha" (Wie groß waren die Verkäufe an das (Geschäft A) vom Frühjahr bis zum Herbst dieses Jahres?). Die Fig. 20a und 20b sind hilfreich bei der Erläuterung der Struktur eines Syntaxbaumes, der für eine eingegebene Frage erzeugt wird, die mehrere Gruppen logischer Formeln erfordert. Zuerst wird der eingegebene Satz durch den Parser 22 (Fig. 6) in Elemente in der Form einer Baumstruktur zerlegt (d. h. den Syntaxbaum) wie den Baum, der in Fig. 20a als "HIKAKU" (Vergleich) bezeichnet ist und den Baum, der in Fig. 20b als "KARA MADE" (von zu) bezeichnet ist. Fig. 20a zeigt den Syntaxbaum für die Frage des ersten Beispiels, und Fig. 20b zeigt den Syntaxbaum für die Frage des zweiten Beispiels. Partikel werden erfaßt und die Elemente werden zwangsweise in dem Parser 22 (Fig. 6) geteilt. In den Fig. 20a und 20b bezieht sich "ji" auf ein Wort, daß als ein Schlüssel dient, und "fu" ist ein Modifizierer. Der Modifizierer wird verwendet für die Bezugnahme auf die Oberflächenbeschränkung oder er wird betrachtet als ein besonderer Modifizierer bei der Suche der virtuellen Tabelle.
- Die Frage des ersten Beispiels, wie in Fig. 20a gezeigt ist, sucht die Verkäufe von zwei Personen zu vergleichen. Es sind daher zwei Tabellen auszuwählen. Wenn eine Tabelle so ausgewählt ist, daß ein Vergleich nicht durchgeführt werden kann. Zwei Tabellen können ausgewählt werden, indem der Syntaxbaum in Gruppen geteilt wird. Eine virtuelle Tabelle (siehe Fig. 21a) entsprechend einem Vergleichsausdruck wie "ooi hyo" in Fig. 20a ist vorgesehen, und eine Logikformel für eine virtuelle Tabelle für den Vergleich wird erzeugt durch Anzeige der Beziehung zwischen den beiden Tabellen mit der virtuellen Vergleichstabelle. Die virtuelle Vergleichstabelle kann verwendet werden für die Umwandlung eines Wortes, das eine Vergleichsbedeutung in jeder Sprache anzeigt, in einen Ausdruck wie [GT] (größer als). Die beiden Logikformeln für die virtuelle Tabelle werden gesetzt durch Gruppe (a) in Fig. 20a.
- In einer ähnlichen Weise werden, wie in Fig. 21b gezeigt ist, durch Verwendung der virtuellen Tabelle, die so ausgebildet ist, daß sie "kara made" (von ... zu), "yori made" (von ... zu)-Tabellen hat, die zwischen Logikformeln bestimmt durch Gruppe (b), wie n Fig. 20b gezeigt ist. Es ist in Fig. 21b bezeichnet, sich auf die Definitionsformel zu beziehen, und tatsächliche Datumsangaben werden durch die vorstehend diskutierte Operation bestimmt.
- Auch können Fragen in einigem Ausmaß behandelt werden, indem ein Datenwort für die Oberflächenbeschränkung in der virtuellen Tabelle vorgesehen ist und indem die Datenwörter relativ zu der Oberflächenbeschränkung untersucht werden. Beispielsweise ist es möglich mit Bezug auf einen eingegebenen Satz "Nani wo uttaka" (Was wurde verkauft?), da nur ein Warenname oder ein Warengruppenname unter solche mit der Oberflächenbeschränkung "wo" in "uru hyo" fällt, anzunehmen, daß "nani" (was) sich auf einen von diesen bezieht.
- Weiterhin ist es durch Vergleichen der Oberflächenbeschränkung möglich, Partikel zu prüfen und eine Fehlernachricht für einen eingegebenen Satz mit einem fehlerhaften Inhalt anzuzeigen. Z. B. wird mit Bezug auf einen Satz "Chokoreeto ga utta shoohin ha" (Wel che Ware durch Schokoladen verkauft?), da es kein "ga" in der Oberflächenbeschränkung von "shoohin" in "uru hyo" gibt, dies als ein Fehler beurteilt, und es ist möglich, eine Fehlernachricht "Zyoshi ga chigai masu" (Falsches "zyoshi" wird verwendet) anzuzeigen.
- In dem System nach Fig. 1, das als ein herkömmliches Beispiel beschrieben ist, ist zu jeder Zeit eine Antwort in demselben Format vorgesehen. D. h. bei der Beantwortung des Wiederauffindungsergebnisses erfolgt die Antwort in einem Tabellenformat und nicht in einem Satzformat. In einigen Fällen ist die Antwort in diesem Format schwierig zu betrachten. Um diesen Nachteil zu beseitigen, kann eine Antwortformat-Auswahleinheit in der Wiederauffindungseinheit vorgesehen sein. Diese Einheit sollte wenigstens zwei Typen von Formaten als Ausgabeformat vorsehen, d. h. ein Tabellenformat und ein Satzformat.
- Während die vorliegende Erfindung mit Bezug auf bevorzugte Ausführungsbeispiele hiervon gezeigt wurde, sind dem Fachmann andere alternative Ausführungsbeispiele bekannt, welche nicht von dem Gedanken und dem Umfang der Erfindung abweichen, wie sie in den angefügten Ansprüchen definiert ist. Z. B. kann das System so eingestellt sein, daß es mit natursprachlichen Fragen arbeitet, die in anderen Sprachen als Japanisch formuliert sind. Weiterhin kann das System durch ein anderes Datenverarbeitungssystem als das in Fig. 2 gezeigte implementiert werden.
Claims (4)
1. Informationsauffindungssystem zum
Wiederauffinden von Informationen aus einer Datenbank (9)
mit einer Analyseeinheit unter Verwendung eines
Lexikons zur Analyse einer natursprachlichen
Frage,
dadurch gekennzeichnet,
daß
- das Lexikon natursprachliche Ausdrücke mit
ihrer semantischen Bedeutung in Ausdrücken
assoziiert, welche von der Datenbank
verstanden werden können, und auch jeden dieser
Ausdrücke mit einer oder mehreren virtuellen
Tabellen (28) assoziiert;
- die virtuellen Tabellen sematische
Bedeutungen mit Datenbanktabellen assoziiert;
- die Analyseeinheit ein Parser (822) ist, der
das Lexikon für das Parsing der
natursprachlichen Frage in ihre Bestandteile verwendet,
um ein Syntaxanalyseergebnis bezüglich des
Aufbaus der Frage zu bestimmen;
- eine Kollationiereinheit (30) zum Vorbereiten
einer Datenbank-Auffindungsformel aus dem
Syntaxanalyseergebnis durch Auswahl der
Datenbanktabellen, wie durch die virtuellen
Tabellen angezeigt ist, wodurch für einen
Ausdruck, der mit mehr als einer virtuellen
Ta
belle assoziiert ist, die Kollationiereinheit
sich auf die virtuelle Tabelle stützt, welche
dieser Ausdruck gemeinsam mit einem anderen
Ausdruck der Frage hat, und
- eine Wiederauffindungs-Durchführungseinheit
(32, 24) zum Wiederauffinden von Daten aus
der Datenbank (9) auf der Grundlage der
Datenbank-Auffindungsformel.
2. Informationsauffindungssystem nach Anspruch 1,
welches weiterhin aufweist:
eine zusätzliche Tabelle zum Umwandeln eines
Satzes mit unbestimmtem Wert in der
natursprachlichen Frage in einem Satz mit bestimmtem Wert
in der Datenbank (9) auf der Grundlage des
Syntaxanalyseergebnisses.
3. Informationsauffindungssystem nach Anspruch 1
oder 2, welches weiterhin aufweist:
ein Terminologielexikon (26) zum Identifizieren
von Eintragungen in der virtuellen Tabelle, die
zur Identifizierung der Ausdrücke der
Bestandteile zu verwenden ist, wobei das Lexikon die
Zeit darstellende Wörter enthält, und das
Terminologielexikon von dem Parser (22) verwendet
wird beim Erhalten des Syntaxanalyseergebnisses;
und
eine Zeitintervall-Definitionstabelle (80) in
der virtuellen Tabelle zum Definieren von
Zeitangaben entsprechend den die Zeit darstellenden
Wörtern.
4. Informationsauffindungssystem nach einem der
Ansprüche 1 bis, welches weiterhin aufweist:
eine
Datenbank-Auffindungsformel-Umwandlungseinheit zum Erzeugen einer Formel in einer
Daten
bank-Auffindungssprache aus der
Datenbank-Auffindungsformel.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3171217A JP2596260B2 (ja) | 1990-07-18 | 1991-07-11 | 対応表使用データベース検索装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69230814D1 DE69230814D1 (de) | 2000-04-27 |
DE69230814T2 true DE69230814T2 (de) | 2000-11-02 |
Family
ID=15919214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69230814T Expired - Fee Related DE69230814T2 (de) | 1991-07-11 | 1992-07-10 | Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen |
Country Status (3)
Country | Link |
---|---|
US (1) | US5442780A (de) |
EP (1) | EP0522591B1 (de) |
DE (1) | DE69230814T2 (de) |
Families Citing this family (207)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434777A (en) * | 1992-05-27 | 1995-07-18 | Apple Computer, Inc. | Method and apparatus for processing natural language |
GB9217886D0 (en) * | 1992-08-21 | 1992-10-07 | Canon Res Ct Europe Ltd | Method and apparatus for parsing natural language |
US5495604A (en) * | 1993-08-25 | 1996-02-27 | Asymetrix Corporation | Method and apparatus for the modeling and query of database structures using natural language-like constructs |
JP3476237B2 (ja) * | 1993-12-28 | 2003-12-10 | 富士通株式会社 | 構文解析装置 |
US5748841A (en) * | 1994-02-25 | 1998-05-05 | Morin; Philippe | Supervised contextual language acquisition system |
US5748974A (en) * | 1994-12-13 | 1998-05-05 | International Business Machines Corporation | Multimodal natural language interface for cross-application tasks |
JP3571408B2 (ja) * | 1995-03-31 | 2004-09-29 | 株式会社日立製作所 | 文書加工方法および装置 |
US5887120A (en) | 1995-05-31 | 1999-03-23 | Oracle Corporation | Method and apparatus for determining theme for discourse |
US5694523A (en) * | 1995-05-31 | 1997-12-02 | Oracle Corporation | Content processing system for discourse |
US5899989A (en) * | 1996-05-14 | 1999-05-04 | Sharp Kabushiki Kaisha | On-demand interface device |
US5909677A (en) | 1996-06-18 | 1999-06-01 | Digital Equipment Corporation | Method for determining the resemblance of documents |
US5924089A (en) * | 1996-09-03 | 1999-07-13 | International Business Machines Corporation | Natural language translation of an SQL query |
US6085162A (en) * | 1996-10-18 | 2000-07-04 | Gedanken Corporation | Translation system and method in which words are translated by a specialized dictionary and then a general dictionary |
US5836771A (en) | 1996-12-02 | 1998-11-17 | Ho; Chi Fai | Learning method and system based on questioning |
WO1998048360A1 (en) * | 1997-04-22 | 1998-10-29 | Greg Hetherington | Method and apparatus for processing free-format data |
US6460034B1 (en) | 1997-05-21 | 2002-10-01 | Oracle Corporation | Document knowledge base research and retrieval system |
US5940821A (en) * | 1997-05-21 | 1999-08-17 | Oracle Corporation | Information presentation in a knowledge base search and retrieval system |
US6038560A (en) * | 1997-05-21 | 2000-03-14 | Oracle Corporation | Concept knowledge base search and retrieval system |
GB9713019D0 (en) | 1997-06-20 | 1997-08-27 | Xerox Corp | Linguistic search system |
US6230154B1 (en) * | 1997-07-15 | 2001-05-08 | Morphometrix Technologies Inc. | Database element retrieval by example |
US5895466A (en) * | 1997-08-19 | 1999-04-20 | At&T Corp | Automated natural language understanding customer service system |
US6119087A (en) * | 1998-03-13 | 2000-09-12 | Nuance Communications | System architecture for and method of voice processing |
JPH11327879A (ja) * | 1998-05-15 | 1999-11-30 | Fujitsu Ltd | 変数検索装置及び方法並びに変数検索プログラムを記録したコンピュータ読取り可能な記録媒体 |
US6219643B1 (en) | 1998-06-26 | 2001-04-17 | Nuance Communications, Inc. | Method of analyzing dialogs in a natural language speech recognition system |
AU5181099A (en) | 1998-07-30 | 2000-02-21 | British Telecommunications Public Limited Company | An index to a semi-structured database |
US7263489B2 (en) | 1998-12-01 | 2007-08-28 | Nuance Communications, Inc. | Detection of characteristics of human-machine interactions for dialog customization and analysis |
US7082397B2 (en) | 1998-12-01 | 2006-07-25 | Nuance Communications, Inc. | System for and method of creating and browsing a voice web |
US7801913B2 (en) * | 1998-12-07 | 2010-09-21 | Oracle International Corporation | System and method for querying data for implicit hierarchies |
US6748374B1 (en) * | 1998-12-07 | 2004-06-08 | Oracle International Corporation | Method for generating a relational database query statement using one or more templates corresponding to search conditions in an expression tree |
US6587856B1 (en) | 1998-12-07 | 2003-07-01 | Oracle International Corporation | Method and system for representing and accessing object-oriented data in a relational database system |
US6233556B1 (en) | 1998-12-16 | 2001-05-15 | Nuance Communications | Voice processing and verification system |
US6430531B1 (en) | 1999-02-04 | 2002-08-06 | Soliloquy, Inc. | Bilateral speech system |
US6513027B1 (en) * | 1999-03-16 | 2003-01-28 | Oracle Corporation | Automated category discovery for a terminological knowledge base |
US6584464B1 (en) | 1999-03-19 | 2003-06-24 | Ask Jeeves, Inc. | Grammar template query system |
US6311150B1 (en) * | 1999-09-03 | 2001-10-30 | International Business Machines Corporation | Method and system for hierarchical natural language understanding |
US7143042B1 (en) | 1999-10-04 | 2006-11-28 | Nuance Communications | Tool for graphically defining dialog flows and for establishing operational links between speech applications and hypermedia content in an interactive voice response environment |
US6665666B1 (en) * | 1999-10-26 | 2003-12-16 | International Business Machines Corporation | System, method and program product for answering questions using a search engine |
DE19952070A1 (de) * | 1999-10-28 | 2001-06-28 | Kiwi Interaktive Medien Gmbh | Verfahren zur Erweiterung einer Datenbank |
DE19952769B4 (de) | 1999-11-02 | 2008-07-17 | Sap Ag | Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache |
US6615223B1 (en) | 2000-02-29 | 2003-09-02 | Oracle International Corporation | Method and system for data replication |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
JP2001325252A (ja) * | 2000-05-12 | 2001-11-22 | Sony Corp | 携帯端末及びその情報入力方法、辞書検索装置及び方法、媒体 |
AU2001271940A1 (en) * | 2000-07-28 | 2002-02-13 | Easyask, Inc. | Distributed search system and method |
US20020152202A1 (en) * | 2000-08-30 | 2002-10-17 | Perro David J. | Method and system for retrieving information using natural language queries |
US6461166B1 (en) | 2000-10-17 | 2002-10-08 | Dennis Ray Berman | Learning system with learner-constructed response based testing methodology |
US7957986B1 (en) | 2001-04-09 | 2011-06-07 | Trover Solutions, Inc. | System and method for managing account processing |
US20030004706A1 (en) * | 2001-06-27 | 2003-01-02 | Yale Thomas W. | Natural language processing system and method for knowledge management |
US7191337B2 (en) * | 2001-06-30 | 2007-03-13 | International Business Machines Corporation | Apparatus for wildcarded security policy and method therefor |
US7074128B2 (en) | 2001-08-03 | 2006-07-11 | Drb Lit Ltd. | Method and system for enhancing memorization by using a mnemonic display |
JP2003271389A (ja) * | 2002-03-19 | 2003-09-26 | Shuichi Araki | 自然言語によるソフトウェア・オブジェクトの操作方法及びそのためのプログラム |
US7840422B1 (en) | 2002-04-09 | 2010-11-23 | Trover Solutions, Inc. | Systems and methods for managing insurance claims |
US7574427B2 (en) * | 2002-05-17 | 2009-08-11 | Delefevre Patrick Y | Neutral sales consultant |
US20040019478A1 (en) * | 2002-07-29 | 2004-01-29 | Electronic Data Systems Corporation | Interactive natural language query processing system and method |
US20040167875A1 (en) * | 2003-02-20 | 2004-08-26 | Eriks Sneiders | Information processing method and system |
US7357640B2 (en) * | 2003-07-02 | 2008-04-15 | Drb Lit Ltd. | Lock-In Training system |
TWM249950U (en) * | 2004-01-02 | 2004-11-11 | Cvc Technologies Inc | Cap tightening machine capable of controlling tightening torque |
JP2005242416A (ja) * | 2004-02-24 | 2005-09-08 | Shogakukan Inc | 自然言語文の検索方法および検索装置 |
US8020106B2 (en) * | 2004-03-15 | 2011-09-13 | Yahoo! Inc. | Integration of personalized portals with web content syndication |
US7364432B2 (en) * | 2004-03-31 | 2008-04-29 | Drb Lit Ltd. | Methods of selecting Lock-In Training courses and sessions |
US7246116B2 (en) * | 2004-04-22 | 2007-07-17 | International Business Machines Corporation | Method, system and article of manufacturing for converting data values quantified using a first measurement unit into equivalent data values when quantified using a second measurement unit in order to receive query results including data values measured using at least one of the first and second measurement units |
JP2005354893A (ja) | 2004-06-08 | 2005-12-22 | Friwo Geraetebau Gmbh | 一次側充電状態検出を有するバッテリ充電器 |
US7925658B2 (en) * | 2004-09-17 | 2011-04-12 | Actuate Corporation | Methods and apparatus for mapping a hierarchical data structure to a flat data structure for use in generating a report |
US9405800B1 (en) | 2004-12-13 | 2016-08-02 | Iqor Holdings Inc. | Apparatuses, methods and systems for a universal payment integrator |
US9390132B1 (en) | 2009-10-16 | 2016-07-12 | Iqor Holdings, Inc. | Apparatuses, methods and systems for a universal data librarian |
US7644021B2 (en) * | 2005-02-10 | 2010-01-05 | The Kroger Co. | Electronically assisted enterprise journal system |
US8046348B1 (en) | 2005-06-10 | 2011-10-25 | NetBase Solutions, Inc. | Method and apparatus for concept-based searching of natural language discourse |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070219982A1 (en) * | 2005-10-05 | 2007-09-20 | James Piper | Systems and methods for electronic searching of automotive parts database |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8745183B2 (en) * | 2006-10-26 | 2014-06-03 | Yahoo! Inc. | System and method for adaptively refreshing a web page |
US20080104502A1 (en) * | 2006-10-26 | 2008-05-01 | Yahoo! Inc. | System and method for providing a change profile of a web page |
US20080104257A1 (en) * | 2006-10-26 | 2008-05-01 | Yahoo! Inc. | System and method using a refresh policy for incremental updating of web pages |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8131740B2 (en) * | 2007-10-09 | 2012-03-06 | International Business Machines Corporation | User-specific search indexing within a virtual environment |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
JP5159375B2 (ja) | 2008-03-07 | 2013-03-06 | インターナショナル・ビジネス・マシーンズ・コーポレーション | メタバースにおけるオブジェクトの真贋判断システム、方法及びそのコンピュータ・プログラム |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US9959870B2 (en) | 2008-12-11 | 2018-05-01 | Apple Inc. | Speech recognition involving a mobile device |
US8095524B2 (en) * | 2009-03-18 | 2012-01-10 | International Business Machines Corporation | Method and system for integrating personal information search and interaction on web/desktop applications |
US10255566B2 (en) | 2011-06-03 | 2019-04-09 | Apple Inc. | Generating and processing task items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9672281B1 (en) | 2009-10-16 | 2017-06-06 | Iqor US. Inc. | Apparatuses, methods and systems for a call searcher |
US9063978B1 (en) | 2009-10-16 | 2015-06-23 | Igor US Inc. | Apparatuses, methods and systems for a financial transaction tagger |
US9043355B1 (en) | 2009-10-16 | 2015-05-26 | Iqor U.S. Inc. | Apparatuses, methods and systems for a journal entry automator |
US9454577B1 (en) | 2009-10-16 | 2016-09-27 | Iqor Holdings Inc, Iqor US Inc. | Apparatuses, methods and systems for an employee reimbursement evaluator |
US9454576B1 (en) | 2009-10-16 | 2016-09-27 | Iqor Holdings Inc., Iqor US Inc. | Apparatuses, methods and systems for an employee onboarding automator |
US9053146B1 (en) | 2009-10-16 | 2015-06-09 | Iqor U.S. Inc. | Apparatuses, methods and systems for a web access manager |
US9396232B1 (en) | 2009-10-16 | 2016-07-19 | Iqor Holdings, Inc. | Apparatuses, methods and systems for a rule-integrated virtual punch clock |
US8812482B1 (en) | 2009-10-16 | 2014-08-19 | Vikas Kapoor | Apparatuses, methods and systems for a data translator |
US9098509B1 (en) | 2009-10-16 | 2015-08-04 | Iqor Holding Inc., Igor U.S. Inc. | Apparatuses, methods and systems for a call restrictor |
US9405799B1 (en) | 2009-10-16 | 2016-08-02 | Iqor Holdings, Inc. | Apparatuses, methods and systems for an employee referral facilitator |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
CN106294796B (zh) | 2010-02-18 | 2020-02-28 | 株式会社尼康 | 信息处理装置、便携式装置以及信息处理系统 |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US8346775B2 (en) | 2010-08-31 | 2013-01-01 | International Business Machines Corporation | Managing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9280535B2 (en) | 2011-03-31 | 2016-03-08 | Infosys Limited | Natural language querying with cascaded conditional random fields |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US10430406B2 (en) * | 2012-08-13 | 2019-10-01 | Aria Solutions, Inc. | Enhanced high performance real-time relational database system and methods for using same |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US20140143254A1 (en) * | 2012-11-16 | 2014-05-22 | Ritendra Datta | Category and Attribute Specifications for Product Search Queries |
US10394816B2 (en) | 2012-12-27 | 2019-08-27 | Google Llc | Detecting product lines within product search queries |
CN113744733B (zh) | 2013-02-07 | 2022-10-25 | 苹果公司 | 数字助理的语音触发器 |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US9922642B2 (en) | 2013-03-15 | 2018-03-20 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
HK1223708A1 (zh) | 2013-06-09 | 2017-08-04 | Apple Inc. | 用於實現跨數字助理的兩個或更多個實例的會話持續性的設備、方法、和圖形用戶界面 |
EP3008964B1 (de) | 2013-06-13 | 2019-09-25 | Apple Inc. | System und verfahren für durch sprachsteuerung ausgelöste notrufe |
AU2014306221B2 (en) | 2013-08-06 | 2017-04-06 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US9606977B2 (en) * | 2014-01-22 | 2017-03-28 | Google Inc. | Identifying tasks in messages |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
CN106471570B (zh) | 2014-05-30 | 2019-10-01 | 苹果公司 | 多命令单一话语输入方法 |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9460075B2 (en) | 2014-06-17 | 2016-10-04 | International Business Machines Corporation | Solving and answering arithmetic and algebraic problems using natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US9514185B2 (en) * | 2014-08-07 | 2016-12-06 | International Business Machines Corporation | Answering time-sensitive questions |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US9430557B2 (en) * | 2014-09-17 | 2016-08-30 | International Business Machines Corporation | Automatic data interpretation and answering analytical questions with tables and charts |
US9606986B2 (en) | 2014-09-29 | 2017-03-28 | Apple Inc. | Integrated word N-gram and class M-gram language models |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
JP6070809B1 (ja) * | 2015-12-03 | 2017-02-01 | 国立大学法人静岡大学 | 自然言語処理装置及び自然言語処理方法 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
CN106021232B (zh) * | 2016-05-24 | 2019-06-28 | 北京工商大学 | 一种基于依存句法关系的微博马甲账号识别方法 |
US11025741B2 (en) | 2016-05-25 | 2021-06-01 | International Business Machines Corporation | Dynamic cognitive user interface |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
US10864443B2 (en) | 2017-12-22 | 2020-12-15 | Activision Publishing, Inc. | Video game content aggregation, normalization, and publication systems and methods |
US11106642B2 (en) | 2018-12-26 | 2021-08-31 | Io-Tahoe LLC. | Cataloging database metadata using a probabilistic signature matching process |
US11347813B2 (en) | 2018-12-26 | 2022-05-31 | Hitachi Vantara Llc | Cataloging database metadata using a signature matching process |
US11712627B2 (en) | 2019-11-08 | 2023-08-01 | Activision Publishing, Inc. | System and method for providing conditional access to virtual gaming items |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4688195A (en) * | 1983-01-28 | 1987-08-18 | Texas Instruments Incorporated | Natural-language interface generating system |
JPS6140672A (ja) * | 1984-07-31 | 1986-02-26 | Hitachi Ltd | 多品詞解消処理方式 |
US4887212A (en) * | 1986-10-29 | 1989-12-12 | International Business Machines Corporation | Parser for natural language text |
JP2664915B2 (ja) * | 1988-01-12 | 1997-10-22 | 株式会社日立製作所 | 情報検索システム |
US4994966A (en) * | 1988-03-31 | 1991-02-19 | Emerson & Stern Associates, Inc. | System and method for natural language parsing by initiating processing prior to entry of complete sentences |
US5197005A (en) * | 1989-05-01 | 1993-03-23 | Intelligent Business Systems | Database retrieval system having a natural language interface |
JPH03218570A (ja) * | 1989-11-07 | 1991-09-26 | Sharp Corp | 文字列検索装置 |
US5175814A (en) * | 1990-01-30 | 1992-12-29 | Digital Equipment Corporation | Direct manipulation interface for boolean information retrieval |
-
1992
- 1992-07-08 US US07/910,764 patent/US5442780A/en not_active Expired - Fee Related
- 1992-07-10 EP EP92111820A patent/EP0522591B1/de not_active Expired - Lifetime
- 1992-07-10 DE DE69230814T patent/DE69230814T2/de not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0522591A2 (de) | 1993-01-13 |
EP0522591A3 (en) | 1993-11-03 |
EP0522591B1 (de) | 2000-03-22 |
DE69230814D1 (de) | 2000-04-27 |
US5442780A (en) | 1995-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69230814T2 (de) | Datenbankauffindungssystem zur Beantwortung natursprachlicher Fragen mit dazugehörigen Tabellen | |
DE69032921T2 (de) | Direkte Manipulationsschnittstelle zum Abrufen von logischen Informationen | |
DE69331209T2 (de) | Umformung von verwandten Wortformen für Textindexierung und Wiederauffindung mittels endlicher Automaten | |
DE3650417T2 (de) | Informationsaufzeichnungs- und Wiederauffindungssystem. | |
DE69904588T2 (de) | Datenbankzugangswerkzeug | |
DE68928775T2 (de) | Verfahren und Vorrichtung zur Herstellung einer Zusammenfassung eines Dokumentes | |
DE19952769B4 (de) | Suchmaschine und Verfahren zum Abrufen von Informationen mit Abfragen in natürlicher Sprache | |
DE69022842T2 (de) | Verwendung von Befehlsähnlichkeiten in einem intelligenten Hilfssystem. | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
DE69429866T2 (de) | Verfahren und gerät zur modellierung und abfrage von datenbankenstrukturen mit natürlichen sprachartigen konstruktionen | |
DE69427848T2 (de) | Unterstützungssystem zur Herstellung von Wörterbüchern | |
DE60213409T2 (de) | Erstellung von strukturierten daten aus unformatiertem text | |
DE69514123T2 (de) | Datenbanksuchsystem | |
DE69932344T2 (de) | Zugriff zu hierarchischem datenspeicher via sql-eingabe | |
DE68928693T2 (de) | Verfahren zur Behandlung von digitalen Textdaten | |
DE3855696T2 (de) | Relationelles Datenbanksystem | |
DE69812162T2 (de) | Vorrichtung zur Verwendung bei der Identifizierung semantischer Mehrdeutigkeiten | |
DE60029845T2 (de) | System zum identifizieren der verhältnisse zwischen bestandteilen in aufgaben vom typ informations-wiederauffindung | |
DE69934371T2 (de) | Apparat und Verfahren zum Verarbeiten einer natürlichen Sprache | |
DE69030815T2 (de) | Apparat und verfahren zur erzeugung von dokumenten | |
DE3587009T2 (de) | Uebersetzungssystem. | |
DE69130246T2 (de) | System zur Bildung von Sätzen | |
DE69834386T2 (de) | Textverarbeitungsverfahren und rückholsystem und verfahren | |
DE69811066T2 (de) | Datenzusammenfassungsgerät. | |
DE69727421T2 (de) | Hypertext-Dokumentwiederauffindungssystem zum Wiederauffinden zusammengehöriger Hypertextdokumente |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition | ||
8339 | Ceased/non-payment of the annual fee |