-
Diese Erfindung bezieht sich auf ein Verfahren des Verwaltens
von Dokumenten in einem Informationsverarbeitungssystem und
insbesondere auf ein Verfahren des schnellen Kennzeichnens von
Dokumenten, welche dieselben Attribute in einer gemeinsam
benutzten Bibliothek aufweisen.
Vorgeschichte der Erfindung
-
Das elektronische Büro führte zum Zusammenfassen von Dokumenten
in Beziehungen, die dazu vorgesehen sind, das elektronische
Speichern, Suchen und Abfragen der Dokumente zu unterstützen.
Die Verwendung von Dokumentbibliotheken stellt eine Technik dar,
um dieses Bedürfnis zu erfüllen. Wie zur Zeit implementiert,
bieten diese Dokumentbibliotheken Funktionen, die dem manuellen
Ablegen und Abrufen von Papierdokumenten analog sind, jedoch auf
eine viel weniger beschwerliche Art. Eine Struktur des Standes
der Technik, die das Bedürfnis nach elektronischem Speichern,
Suchen und Abfragen von Dokumenten erfüllt, ist die
Dokumentaustauscharchitektur (Document Interchange Architecture, DIA), die
Teil eines Bürosystems ist, das durch International Business
Machines Corporation vertrieben wird. Die DIA-Dokumentstruktur
liefert einen Satz von Deskriptoren für jedes Dokument, das in
einer Bibliothek abgelegt ist. Diese Deskriptoren werden in
Dokumentprofilen angeordnet und mit den Dokumenten abgelegt. Die
Dokumentprofile enthalten Parameter, welche den Inhalt der
Dokumente kennzeichnen, wie z.B. den Namen, unter dem es abgelegt
ist, die Autoren, das Thema, das es umfaßt, und das Datum, an
dem es in der Dokumentbibliothek abgelegt wurde.
-
Die Dokumentprofile werden beim Suchen nach Dokumenten in der
Dokumentbibliothek verwendet. Zum Beispiel kann ein Anwender
alle Dokumente, welche die Bibliothek zwischen zwei Zeitpunkten
empfing, nach einem speziellen Thema von einem bestimmten Autor
abfragen. Zum Abschluß der Suche würde dem Anwender eine Liste
von Dokumenten gegeben, welche die Suchkriterien erfüllten. Ein
Anwender oder Endbenutzer kann eine Person, eine Einheit, ein
Programm oder ein Computersystem sein, das die Bibliothek zur
Datenverarbeitung und zum Informationsaustausch verwendet.
-
Zusätzlich zum Abfragen von Dokumenten basierend auf speziellen
Suchkriterien dient der DIA-Dokumentbibliotheksservice dem
Aufbau von Beziehungen zwischen Dokumenten. Diese
Dokumentbeziehungen wurden ursprünglich von M.G. Macphail erdacht und in der
anhängigen EPO-Anmeldung S.N. 89310909.0 offenbart.
-
Ein Beispiel einer solchen Dokumentbeziehung ist das Konzept der
Ordnerdokumente. Ein Ordnerdokument wird erzeugt, wenn ein
Anwender Dokumente zu einer linearen oder hierarchischen Struktur
zusammenfaßt. Dokumente nehmen eine lineare Struktur an, wenn
sie durch Anordnen eines Satzes von Dokumenten an einer
benutzerspezifizierten Position innerhalb eines speziellen Ordners
organisiert sind. Dokumente können eine hierarchische Struktur
annehmen, indem sie Dokumente, die Ordner sind, verschachteln,
oder einfacher, sie setzen ein Dokument, das selbst ein Ordner
ist, in ein anderes Dokument, das ein Ordner ist. Jedes Dokument
in einem Ordner hat ungeachtet seiner Beziehung zu anderen
Dokumenten getrennte Dokumentdefinitionen einschließlich
Deskriptoren, Zugriffssteuerung und Dokumentinhalt. Daher veranlaßt der
Zugriff auf ein Dokument, das innerhalb einer speziellen
Beziehung enthalten ist, nichts hinsichtlich des Zugriffs auf andere
Dokumente innerhalb derselben Beziehung. Alle Dokumente in der
DIA-Dokumentbibliothek haben ein ihnen zugeordnetes
Bibliothekmodellobjekt, genannt Dokumentbeziehungsobjekt, das die
Dokumentbeziehungen beschreibt. Daher muß, wenn es ein Bedürfnis
gibt, auf einen Ordner zuzugreifen, auf jedes
Dokumentbeziehungsobjekt für jedes Dokument in einem Ordner zugegriffen
werden, um die vollständige Beziehung zwischen den Dokumenten zu
bestimmen.
-
Ein anderes Beispiel einer Dokumentbeziehung, die in einer DIA-
Bibliothek gestattet ist, ist die Heftbeziehung. Die
Heftbeziehung gestattet einem Anwender, zwei Dokumente
zusammenzuschließen. Heftbeziehungen liefern eine eng verbundene, gesteuerte
Eins-zu-Eins-Dokumentbeziehung zwischen Dokumenten. Zusätzlich
können die gehefteten Dokumente innerhalb eines Ordnerdokumentes
angeordnet werden. Das Dokumentbeziehungsobjekt für jedes der
Dokumente, wie vorher für Ordnerdokumente beschrieben, muß die
Beziehung zwischen den gehefteten Dokumenten ebenso wie die
Beziehung zwischen den Ordnerdokumenten beschreiben. Somit enthält
jedes Dokument innerhalb der Beziehung seine eigenen speziellen
Attribute, wie z.B. Sprache, Dokumenttyp, Zeichensätze und
andere Profilinformationen, welche die Eigenschaften des Dokumentes
selbst beschreiben. Falls zum Beispiel alle Dokumente in einer
Beziehung in Französisch verfaßt wurden, würde jedes Dokument
Profilinformationen haben, die kennzeichnen, daß das Dokument in
Französisch war.
-
Jeder Anwender, der versucht, auf die Dokumente zuzugreifen, die
durch die Beziehung definiert sind, würde das Profil jedes
Dokumentes lesen und entschlüsseln müssen, um die Attribute aller
Dokumente innerhalb der Beziehung zu bestimmen. Was folglich
benötigt wird, ist ein Mittel, um die Attribute einmal anzugeben
und alle Dokumente innerhalb einer Beziehung zu kennzeichnen,
die diese speziellen Attribute enthalten.
-
Die Europäische Patentanmeldung EP-A-0 229 232 von Tektronix mit
dem Titel "File Management System" offenbart ein
Dateiverwaltungssystem, in dem ein Datenspeicher- und Abfrage-Hilfsprogramm
Datendateien integriert, die von unabhängigen
Datenverarbeitungsoperationen durch das Verbinden von Datendateien gemäß
anwenderdefinierbaren Beziehungen erzeugt werden. Anwender können
Datendateien und ihren Verbindungen Attribute zuordnen und damit
Gruppen von Dateien und Verbindungen mit ausgewählten Attributen
kennzeichnen.
-
Die US-Patentanmeldung US-A-4 817 036 von R.P. Millet mit dem
Titel "Computer System and Method for Data Base Indexing and
Informational Retrieval" offenbart einen Mechanismus und ein
Verfahren, um das Durchsuchen und Abfragen von Datensätzen auf
der Basis von Schlüsselworten zu unterstützen. Noch spezieller
untersucht Miliet ein Verfahren des Indizierens einzelner
Datensätze innerhalb einer Datenbank und des schnellen Suchens und
Abfragens ausgewählter Datensätze zu einem oder mehreren
Schlüsselworten. Jedoch kann der ursprüngliche Datensatz nicht direkt
abgefragt werden, um die Beziehung zu bestimmen.
-
Die US-Patentanmeldung US-A-4 803 614 von Hitachi mit dem Titel
"System for retrieving distributed information in a data base"
offenbart ein verteiltes Informationsabfragesystem, in dem der
zentrale Computer mit einer Vielzahl von Endeinrichtungen
verbunden ist und die Verwaltungsinformation einen Satz von
Abfrageschlüsseln umfaßt. Damit eine Einheit zum Abfragen einer
Abbilddatei einen Satz zugeordneter Dokumente extrahiert, werden
allgemeine Elemente, wie z.B. ein Titel und ein Schlüsselwort,
in jedes Dokument eingeschlossen, und die allgemeinen Elemente
werden als Abfrageschlüssel in der Steuerinformation für den
Satz zugeordneter Dokumente aufgezeichnet, wodurch sie die
Abfrage der Dokumente durch Verwendung der allgemeinen Elemente
gestatten.
-
Die US-Patentanmeldung US-A-4 811 199 von W.L. Kuechler mit dem
Titel "System for Storing and Manipulating Information in an
Information Base" offenbart, daß es zwei Verfahren zum
Kennzeichnen von Datensätzen gibt, die bestimmte Attribute haben.
Das erste ist das Ausführen eines erschöpfenden iterativen
Durchsuchens jedes Datensatzes der Datenbank. Das zweite ist das
Speichern duplizierter Werte ausgewählter Attribute (die einer
entsprechenden Datensatzadresse zugeordnet sind) für alle
Datensätze in einer spezialisierten Datenstruktur (Index), die für
den schnellen Zugriff auf Werte entworfen wurde.
ZUSAMMENFASSUNG DER ERFINDUNG
-
Diese Erfindung wird in Anspruch 1 definiert. Sie bezieht sich
auf ein Verfahren des Verringerns der Speicheranforderungen und
der Komplexität in einem Dokumentverwaltungssystem, wenn
Attribute gekennzeichnet werden, die mehrmals in einer Vielzahl von
Dokumenten auftreten. Dokumentverwaltungssysteme speichern
Attribute wie z.B. Sprache, Dokumenttyp und Zeichensätze mit dem
Dokumentinhalt. Wenn einzelne Dokumente mit anderen Dokumenten
kombiniert werden, um Beziehungen, wie z.B. Ordner oder
geheftete Dokumente zu erzeugen, muß jedes einzelne Dokument abgefragt
werden, um seine Attribute zu bestimmen. Diese Erfindung
offenbart ein vektorrelationales bezeichnendes Objekt, das erzeugt
wird, wenn eine Beziehung zwischen zwei oder mehr Dokumenten
definiert wird. Dieses vektorrelationale bezeichnende Objekt
umfaßt ein Feld, um ein spezielles Attribut für mindestens ein
Dokument in der Beziehung zu kennzeichnen. Das vektorrelationale
bezeichnende Objekt steht Dokumentzugriffsmechanismen zur
schnellen Bestimmung von Dokumentattributen zur Verfügung, ohne
daß das Bedürfnis nach Scannen jedes einzelnen Dokumentes in der
Beziehung nach seinen Attributen besteht.
Kurze Beschreibung der Zeichnungen
-
Figur 1 ist ein Blockdiagramm eines Dokumentverwaltungssystems,
in dem diese Erfindung angewendet werden könnte.
-
Figur 2 ist ein Basisdokumentmodell, das für jedes Dokument
erzeugt wird, das in der Bibliothek des in Figur 1 gezeigten
Systems abgelegt wird.
-
Figur 3 ist ein Blockdiagramm einer Dokumentbeziehung, welches
das Konzept der Ordnerdokumente darstellt.
-
Figur 4 ist ein Blockdiagramm einer Ordnerbeziehung, das einen
Ordner in einem anderen Ordner zeigt.
-
Figur 5 ist ein Blockdiagramm einer Heftbeziehung.
-
Figur 6 ist ein Blockdiagramm gehefteter Dokumente innerhalb
eines Ordners.
-
Figur 7 zeigt das Basisdokumentmodell von Figur 2 und außerdem
das vektorrelationale bezeichnende Objekt gemäß dem Verfahren
der Erfindung.
-
Figuren 8 und 9 sind Strukturen für ein Feld in dem
vektorrelationalen bezeichnenden Objekt.
-
Figur 10 ist ein Flußdiagramm, das zeigt, wie das
vektorrelationale bezeichnende Objekt innerhalb eines
Dokumentaustausch-Verwaltungssystems von Figur 1 verwendet werden kann.
Detaillierte Beschreibung
-
Figur 1 zeigt ein Dokumentverwaltungssystem zum Verwalten von
Dokumenten in einem Informationsverarbeitungssystem. Ein
Anwender 20 ist berechtigt, Dokumente zu speichern und von Bibliothek
28 abzufragen. Auf die Bibliothek 28 kann gleichzeitig von
anderen Anwendern zugegriffen werden und sie stellt daher eine
gemeinsam benutzte Bibliothek dar. Anders als die Bibliothek 28
werden persönliche oder private Dokumente eines Anwenders im
lokalen Dokumentspeicher 24 gespeichert. Dieser lokale
Dokumentspeicher 24 wird gewöhnlich nicht mit anderen Anwendern
gemeinsam benutzt. Ein Anwender 20 greift auf seinen lokalen
Dokumentspeicher 24 durch den Verwalter/Anforderer 22 zu. Der
Verwalter/Anforderer 22 ist auch mit dem Bibliotheksserver 26
verbunden, der den Zugriff des Nutzers auf die Bibliothek 28 steuert.
Wenn ein Anwender 20 ein Dokument in der Dokumentbibliothek 28
ablegt, muß der Bibliotheksserver 26 Parameter oder Deskriptoren
aufbauen, die den Inhalt der gerade in der Bibliothek
gespeicherten Information beschreiben.
-
Es wird auf Figur 2 Bezug genommen, dort wird ein
Basisdokumentmodell für Informationen gezeigt, die in der in Figur 1
gezeigten Bibliothek 28 gespeichert sind. Dieses Dokumentmodell wird
von dem Bibliotheksserver 26 erzeugt und mit jedem Dokument
gespeichert. Während es nicht notwendig ist, das
Basisdokumentmodell ausdrücklich so zu implementieren, daß die
DIA-Bibliothekdienstarchitektur unterstützt wird, gibt es die Anforderung, daß
ein Entwurf diesen Modellen oder einer Untergruppe von ihnen
zugeordnet wird.
-
Das Anwenderprofilobjekt 36 (User Profile Object, UPO) ist nicht
Teil des DIA-Dokumentmodells, sondern es ist stattdessen ein
Objekt, auf das sich das DIA-Dokumentmodell bezieht. Das
Anwenderprofilobjekt 36 wird erzeugt, wenn die Anwender, die es
darstellen, angemeldete Mitglieder eines Bürosystemnetzes sind. Es
kennzeichnet einen Anwender und enthält Informationen über den
Anwender, wie z.B. Alias-Namen, dem Anwender genehmigte Dienste,
Standardabrechnungsinformationen und andere anwenderspezifische
Informationen.
-
Das Dokumentmodellobjekt 30 ist das Herzstück des
DIA-Dokumentmodells und ist logisch das erste erzeugte Objekt, wenn ein
Dokument zum ersten Mal in einer Dokumentbibliothek abgelegt wird.
Es umfaßt Informationen bezüglich Eigentümer und Attributen
eines speziellen Dokumentes. Insbesondere umfaßt es
Dokumentexemplarattribute, wie z.B., ob das Dokument editierbar oder
nichteditierbar ist; die maximale Anzahl von Versionen; und die
auszuführende Aktion, falls der Anwender versucht hat, ein Dokument
zu editieren, das nicht editiert werden kann. Außerdem kann das
Dokumentmodellobjekt 30 irgendwelche der folgenden Informationen
beinhalten:
-
1) Dokumentstufen-Sperrinformationen, die den Nutzer anzeigen,
der ein Dokument zum Aktualisieren aus der Bibliothek entnommen
hat;
-
2) Anzeigen, daß ein Dokumentinhalt von der direkten Steuerung
des Bibliotheksservers entfernt wurde;
-
3> Anweisungen an einen Bibliotheksadministrator, um Teile eines
Dokumentes von der Bibliothekdienststeuerung zu entfernen oder
Teile wiederherstellen;
-
4) Zeit- und Datuminformationen, die der direkten Steuerung des
Bibliotheksservers entzogen wurden;
-
5) Position der Information, die der direkten Steuerung des
Bibliotheksservers entzogen wurde; und
-
6) Wahlfreie Informationen für Archivierungszwecke.
-
Das Zugriffssteuermodellobjekt 32 (Access Control Model Object,
ACMO) wird erzeugt, wenn ein Dokument zum erstenmal in eine DIA-
Bibliothek abgelegt wird. Der prinzipielle Zweck des
Zugriffssteuermodellobjektes 32 soll Informationen zusammenfassen, die
beim Bestimmen des Zugriffs durch einen Nicht-Eigentümer auf das
Dokument zu verwenden sind. Es beinhaltet
Zugriffssteuerinformationen, wie z.B., ob auf das Dokument von jedermann zugegriffen
werden kann (öffentlich), ob der Zugriff für eine begrenzte Zahl
ausdrücklich gekennzeichneter Anwender gestattet ist (privat)
oder ob die Informationen mit anderen gemeinsam benutzt werden.
Das Zugriffssteuermodellobjekt 32 beinhaltet auch Informationen,
welche das Aufbewahren und Vernichten des Dokumentes regeln.
-
Das Dokumentprotokollobjekt 34 (Document History Log Object,
DHLO) wird wahlfrei erzeugt, wenn ein Dokument in der Bibliothek
abgelegt wird und der Anwender verschiedene Aktivitäten in dem
Dokument aufzeichnen möchte. Zum Beispiel kann ein Anwender
aufzeichnen wollen, wievielmal und von wem das Dokument gelesen
wurde.
-
Das Dokumentbeziehungsobjekt 42 (Document Relation Object, DRO)
wird erzeugt, wenn ein Dokument erstmalig in der Bibliothek
abgelegt wird. Sein Zweck ist es, die logischen Beziehungen
zwischen einem Dokument und anderen verknüpften oder gruppierten
Dokumenten zu beschreiben. Zum Beispiel gestattet die
DIA-Architektur die Erzeugung von Ordnerdokumenten, die andere Dokumente
beinhalten. Wenn eine solche Beziehung existiert, dann hat jedes
Dokument, das innerhalb des Ordners enthalten ist, in dem
Dokumentbeziehungsobjekt 42 einen Zeigereintrag, der
Bibliothekzugeordneter Dokumentname (Library Assigned Document Name, LADN)
genannt wird.
-
Das Versionssteuerobjekt 40 (Version Control Object, VCO) wird
erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt
wird, und es enthält Informationen für mehrere Objekte, die eine
einzeln benannte Version eines Dokumentes umfassen können. Es
stellt Platz für Versionsbenennung, Versionsstufensperren und
andere versionsbezogene Stufenprozeßsteuerungen zur Verfügung.
-
Das Profilinhaltobjekt 44 (Profile Content Object, PCO) wird
erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt
wird und ein Nutzer Teilobjekte zur Ausführung oder aus anderen
Gründen erzeugen will. Das Profilinhaltobjekt 44 ist das
Repository für Profilinformationen bezüglich der Teilobjekte.
-
Das Dokumentinhaltobjekt 46 (Document Content Object, DCO) wird
erzeugt, wenn ein Dokument erstmalig in die Bibliothek abgelegt
wird, und liefert Speicherplatz für den Dokumentinhalt.
Zusätzlich liefert das Dokumentinhaltobjekt 46 Speicherplatz zum
Sichern von Informationen bezüglich der tatsächlichen Größe des
Dokumentes in verschiedenen Maßeinheiten.
-
Das Suchindexobjekt 48 (Search Index Object, SIO) enthält
Einträge, die beim Suchen innerhalb eines Dokumentes verwendet
werden. Die Einträge werden in dem SIO als ein Ergebnis der
nachstehenden Folge von Aktionen an anderen Objekten angeordnet. Das
Basisdokumentmodellobjekt 30 wird zuerst im Rahmen der
Verarbeitung eines FILE-Befehls erzeugt. Der Bibliotheksserver liest
dann das Profilinhaltobjekt 44, das Dokumentbeziehungsobjekt 42
und das Zugriffssteuermodellobjekt 32, um Ausdrücke zu finden,
die zur Unterstützung eines parametrischen SEARCH (Suchen) zu
verwenden sind. Wenn jeder Suchausdruck gekennzeichnet ist,
erfolgt ein Eintrag in das Suchindexobjekt 48, dessen Name den
Wert des parametrischen Suchausdrucks und die Semantik umfaßt.
Falls kein SIO 48 besteht, wenn der Bibliotheksserver die
obenerwähnten Objekte liest, wird eines erzeugt und die Einträge
werden darin angeordnet, als ob das Suchindexobjekt 48 schon
immer bestand.
-
Das Indexobjekt für umgekehrte Suche 38 (Reverse Search Index
Object, RSIO) besteht, um das Beseitigen von Einträgen des
Suchindexobjektes 48 zu unterstützen, wenn ein Dokument durch einen
Befehl DELETE (Löschen) aus der Bibliothek entfernt wird.
Einträge für parametrische Suchausdrücke werden zur selben Zeit in
dem RSIO 38 angeordnet, zu der sie in dem Suchindexobjekt 48
erfolgen.
-
Es wird Bezug auf Figur 3 genommen, dort wird eine
Dokumentbeziehung gezeigt, die einen Ordner darstellt. Dokument A (56) und
Dokument B (54) stellen einzelne Elemente dar, die im
Ordnerdokument 1 (50) enthalten sind. Dokument A (56) ist auch zusammen
mit Dokument C (58) im Ordnerdokument 2 (52) enthalten.
Ordnerdokument 1 (50) und Ordnerdokument 2 (52) könnten einzelne
Personalhüllen sein und Dokument A (56) könnte ein Dokument sein,
das eine persönliche Richtlinie erklärt. Es wird nur eine
gegenwärtige Kopie von Dokument A 56 benötigt und diese Kopie ist
stets durch die Personalhüllen konsistent. Die Beziehung
zwischen den Dokumenten und den Ordnern ist in dem
Dokumentbeziehungsobjekt (DRO) enthalten. Zugriff auf die Dokumente in jedem
Ordner erfordert den Zugriff des Bibliotheksservers auf das
Dokumentbeziehungsobjekt jedes Dokumentes, um die Beziehung zu
bestimmen.
-
Es wird sich Figur 4 zugewendet, dort wird eine Erweiterung des
Dokumentes in einem Ordnerkonzept gezeigt, um einen Ordner in
einem Ordner einzuschließen. Dokument A (56) und Dokument B (54)
sind Elemente im Ordnerdokument 2 (52). Das Ordnerdokument 2
(52) wird dann in das Ordnerdokument 1 (50) eingeordnet. Zum
Beispiel kann das Ordnerdokument 1 (50) ein
Firmenmeinungsumfragebericht sein, während Dokument 2 (52) der
Austin-Umfragebericht
sein kann. Dokument A (56) und Dokument B (54) können
Umfrageberichte von zwei verschiedenen Gebieten in Austin sein.
Wieder muß jedesmal, wenn der Bibliotheksserver auf die
Dokumente zugreift, die in dieser Beziehung gezeigt sind, das
Dokumentbeziehungsobjekt für jedes der Elemente geprüft werden.
-
Es wird auf Figur 5 Bezug genommen, dort wird eine andere
Dokumentbeziehung gezeigt, bei der ein Dokument an ein anderes
geheftet wird. Dokument 1 (60) wird an Dokument 2 (62) geheftet,
das an Dokument 3 (64) geheftet wird. Die Heftbeziehung
gestattet dem Anwender, auf zwei Dokumente zusammenzuschließen. Das
Dokumentbeziehungsobjekt (DRO) für jedes Dokument enthält den
aktuellen Zustand der Beziehung.
-
Weitere Beispiele verschiedener Kombinationen von Heft- und
Ordnerbeziehungen sind in Figur 6 gezeigt. Dokument 1 (60) und
Dokument 2 (62) können zusammengeheftet werden und im
Ordnerdokument 1 (50) zusammen mit Dokument 4 (66) angeordnet werden. Auf
die gleiche Art kann Dokument 3 (64) an Dokument 2 (62) geheftet
werden und im Ordnerdokument 2 (52) angeordnet werden. Ein
Dokument 5 (68) ist ebenfalls im Ordnerdokument 2 (52) enthalten.
Jedes Dokument innerhalb des Ordners enthält seine eigenen
speziellen Attribute, wie z.B. Sprache, Dokumenttyp, Zeichentyp,
Zeichensätze und andere Profilinformationen, welche die Merkmale
des Dokumentes selbst beschreiben. Um auf Dokumente innerhalb
des Ordners zuzugreifen, muß der Bibliotheksserver das Profil
jedes Dokumentes lesen und entschlüsseln, um die Attribute aller
Dokumente innerhalb der Beziehung zu bestimmen. Falls zum
Beispiel alle Dokumente in der Beziehung in Französisch verfaßt
wurden, würde jedes Dokument Profilinformationen haben, die
kennzeichnen, daß das Dokument in Französisch war. Diese
Erfindung beseitigt die Probleme der Notwendigkeit des Speicherns
dieser Attributinformation in jedem Dokument durch die Erzeugung
eines "vektorrelationalen bezeichnenden Objektes"
(Vector-Relational Characteristical Object, VRCO)
-
Es wird sich Figur 7 zugewendet, dort wird das
Basisdokumentmodell
für die DIA-Dokumentbibliotheksdienste mit dem
vektorrelationalen bezeichnenden Objekt 70 (VRCO) dieser Erfindung
gezeigt. Das VRCO 70 enthält Felder, um ein spezielles Attribut zu
kennzeichnen, das für mindestens eines der Dokumente in einer
Beziehung besteht. Die Felder werden von Bezeichnern gefolgt,
welche die Dokumente eindeutig kennzeichnen, welche die
speziellen Attribute besitzen.
-
Figuren 8 und 9 sind typische Beispiele dafür, wie die Felder in
dem VRCO 70 erscheinen. Es wird auf Figur 8 Bezug genommen,
falls die Dokumente 1, 2 und 3 alle Attribut X besitzen und die
Dokumente 1, 2 und 6 Attribut Y, würde das vektorrelationale
bezeichnende Objekt (VRCO) die Felder beinhalten, die in Figur 8
gezeigt sind. Es besteht keine Notwendigkeit, in dem Profil
jedes der Dokumente die Attribute X und Y zu kennzeichnen, da das
VRCO die Informationen bereits enthält. Das Auftreten eines
neuen Attributes zeigt das Ende aller Dokumente an, die das
vorherige Attribut besitzen. Diese Erfindung gestattet dem
Bibliotheksserver, schnell auf die Attribute von Dokumenten
zuzugreifen, die in Beziehungen zueinander stehen, wenn sie von einer
Anwendung durch Lesen des VRCO angefordert werden. Daher kann
die Beziehung der Dokumente zueinander schnell erreicht werden,
wenn solche Beziehungen in dem VRCO gespeichert sind. Das
Konzept des Anordnens von Attributen/Merkmalen, die schnellen
Zugriff in einem VRCO erfordern, wird in dem folgenden Beispiel
noch besser gezeigt. Es wird angenommen, daß eine Anwendung nur
in der Lage war, einen speziellen Zeichensatz für den Inhalt
eines Dokumentes zu verstehen. Die Anwendung könnte schnell das
VRCO überfliegen, wobei sie prüft, ob es Dokumente gibt, die den
speziellen Zeichensatz besitzen. Die Anwendung könnte dann dem
Anwender nur diese Dokumente zur Präsentation zeigen und
Dokumente, welche die Anwendung nicht unterstützt, ignorieren oder
löschen. Daher gestattet diese Erfindung, daß Anwendungen
schnell Ressourcen für Dokumente freigeben, die Merkmale
besitzen, welche die Anwendung nicht unterstützen kann.
-
Das vektorrelationale bezeichnende Objekt (VRCO) kann auch einen
Wert VECTOR-BASE (Vektor-Basis) enthalten, um zu kennzeichnen,
ob der Vektor außerhalb eines Attributes oder außerhalb des
Dokumentbezeichners angeordnet werden soll. Figur 9 stellt noch
besser dar, wie die Felder in dem VRCO erscheinen würden. Das
Feld VECTOR-BASE enthält einen Wert, um anzuzeigen, ob der
Vektor außerhalb der Dokumentbezeichner oder der Dokumentattribute
angeordnet wird. Dokument 1 hat die Attribute X, Y und Z, und
Dokument 2 hat das Attribut Y. Die Variabilität des Anordnens
des Vektors außerhalb des Dokumentes kann Speicherplatz sparen,
wenn die Zahl der Dokumente relativ groß ist, bezogen auf die
Zahl der definierten Attribute, wie in Figur 9 gezeigt.
-
Es wird auf Figur 19 Bezug genommen, dort wird ein Flußdiagramm
für die Nutzung des vektorrelationalen bezeichnenden Objektes
gezeigt. In Schritt 71 entscheidet ein Anwender, eine Beziehung
zwischen Dokument A und Dokument B zu erzeugen. Zuerst wird in
Schritt 72 bestimmt, ob Dokument A ein VRCO hat. Falls Dokument
A bereits ein VRCO hat, bestimmt man als nächstes in Schritt 74,
ob Dokument B ein VRCO besitzt. In Schritt 76 werden, falls
beide Dokumente schon ein vektorrelationales bezeichnendes Objekte
enthalten, alle Attribute in Dokument B gekennzeichnet, die
nicht in Dokument A sind. Die VRCO-Analyse wird durch das
Modifizieren des VRCO von Dokument A vervollständigt, Schritt 78, um
die neue Beziehung zwischen den Dokumenten widerzuspiegeln. Es
wird nur ein VRCO bestehen, um die Beziehung zwischen den
Dokumenten zu definieren.
-
Falls der Anwender nach der Entscheidung, eine Beziehung
zwischen Dokument A und Dokument B zu bilden, herausfindet, daß
kein VRCO für Dokument A existiert, erfordert Schritt 84 eine
Bestimmung, ob für Dokument B ein VRCO existiert. Wenn für
Dokument B herausgefunden wird, daß es ein VRCO hat, wird die
Profilinformation in Schritt 86 von Dokument A extrahiert und in
dem VRCO von Dokument B angeordnet. Attribute von Dokument A
werden ebenfalls in Schritt 88 gekennzeichnet und in dem VRCO
von Dokument B angeordnet. Schließlich wird das VRCO von
Dokument B in Schritt 90 modifiziert, um die Attribute in Dokument A
widerzuspiegeln. Dieses Verfahren liefert ein VRCO pro
Beziehung. Ungeachtet dessen, wie viele Dokumente in der Beziehung
erzeugt werden, besteht nur ein VRCO für die Beziehung. Dies
verringert die Menge des Speicherplatzes bedeutend, die
notwendig ist, um Attribute eines Dokumentes zu halten.
-
Auf die gleiche Art werden, falls ein VRCO für Dokument A
besteht und für Dokument B nicht besteht, Profilinformationen in
Schritt 82 von Dokument B extrahiert. Attribute werden in
Dokument B gekennzeichnet, Schritt 80, und das VRCO für Dokument A
wird modifiziert, um die neue Beziehung zwischen den Dokumenten
in Schritt 78 widerzuspiegeln.
-
Falls schließlich kein Dokument ein ihm zugeordnetes VRCO hat,
erfordert Schritt 73 die Erzeugung eines VRCO für Dokument A. In
Schritt 82 wird die Profilinformation von Dokument B extrahiert
und in dem VRCO angeordnet. In Schritt 80 werden Attribute für
Dokument B gekennzeichnet und in dem VRCO angeordnet. In Schritt
78 wird das VRCO für Dokument A modifiziert, um die neuen
Beziehungen zwischen Dokument A und Dokument B widerzuspiegeln.
-
Zusammenfassend offenbart diese Erfindung ein Verfahren des
Kennzeichnens von Dokumentattributen, wenn eine Mehrzahl von
Dokumenten in eindeutigen Dokumentbeziehungen kombiniert ist.
Diese Dokumentbeziehungen umfassen Ordner, Heftdokumente, ver
schiedene Kombinationen der Ordner- und Heftkonzepte oder
irgendeine Beziehung, bei der Dokumente innerhalb einer Beziehung
mindestens ein gleiches Attribut enthalten. Ein
vektorrelationales bezeichnendes Objekt (VRCO) wird dem Satz von Objekten
hinzugefügt, die das Basisdokumentmodell bilden, wie in der
Dokumentaustauscharchitektur (DIA) implementiert. Das
vektorrelationale bezeichnende Objekt steht Dokumentzugriffsmechanismen zur
Verfügung und enthält Felder, um die Attribute einmal für jedes
Dokument in einer Beziehung zu kennzeichnen. Das VRCO verringert
die Speicherplatzanforderungen, indem nur einmal Speicherplatz
für das Attribut bereitgestellt wird, wenn die
Dokumentbeziehungen erzeugt werden. Das VRCO enthält ein Feld, um ein spezielles
Attribut zu kennzeichnen, das für mindestens eines der Dokumente
in der Beziehung existiert. Das Feld wird dann von einem
Bezeichner gefolgt, der das Dokument eindeutig kennzeichnet,
welches das spezielle Attribut besitzt. Da das Attribut nur einmal
und in einem einzelnen Objekt gespeichert wird, kann man schnell
darauf zugreifen, um zu bestimmen, ob ein Attribut für ein
spezielles Dokument existiert.