JPH10232868A - Document processor - Google Patents
Document processorInfo
- Publication number
- JPH10232868A JPH10232868A JP9036418A JP3641897A JPH10232868A JP H10232868 A JPH10232868 A JP H10232868A JP 9036418 A JP9036418 A JP 9036418A JP 3641897 A JP3641897 A JP 3641897A JP H10232868 A JPH10232868 A JP H10232868A
- Authority
- JP
- Japan
- Prior art keywords
- document
- sgml
- dtd
- conversion
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、第1の文書構造を
有する文書を処理する処理部を有し、第2の文書構造を
有する文書を受け付けた際に、該文書を前記第1の文書
構造に構造変換し、構造変換後の文書を前記処理部を用
いて処理する文書処理装置に関し、特に、文書構造の欠
落を招くことなく効率良く文書構造変換及び文書管理を
行う文書処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention has a processing unit for processing a document having a first document structure, and when a document having a second document structure is received, converts the document to the first document. The present invention relates to a document processing apparatus that converts a structure into a structure and processes the document after the structure conversion by using the processing unit, and particularly relates to a document processing apparatus that performs document structure conversion and document management efficiently without causing a lack of a document structure.
【0002】[0002]
【従来の技術】従来、文書データからレイアウト情報等
を除外して、テキスト形式で文書内容を表現するSGM
L(Standard Generalized Markup Language)文書が知
られている。2. Description of the Related Art Conventionally, an SGM that expresses a document content in a text format by excluding layout information and the like from document data.
L (Standard Generalized Markup Language) documents are known.
【0003】このSGML文書は、文書に使われる文字
コードの種類等の各種基準を記述したSGML宣言と、
文書要素の相互関係すなわち文書構造を規定するDTD
(Document Type Definition)と、文書内容を示す文書
インスタンスとからなる。[0003] This SGML document has an SGML declaration that describes various standards such as the type of character code used in the document,
DTD that specifies the interrelationship of document elements, ie, document structure
(Document Type Definition) and a document instance indicating the content of the document.
【0004】そして、かかるDTDに基づいて文書イン
スタンスが作成されたならば、SGML文書を取り扱う
文書処理装置において、この文書インスタンスにスタイ
ルが適用される。When a document instance is created based on the DTD, a style is applied to the document instance in a document processing apparatus that handles an SGML document.
【0005】ところで、昨今の文書処理装置の状況を見
ると、あらゆるSGML文書に対応できる文書処理装置
だけでなく、特定のDTDのみに対応できる文書処理装
置が広く普及している。[0005] By the way, looking at the status of document processing apparatuses in recent years, not only document processing apparatuses that can handle all SGML documents but also document processing apparatuses that can support only a specific DTD are widely used.
【0006】例えば、富士ゼロックス社が開発した統合
文書処理システム”Akane”では、Akane固有
のDTDに基づいて作成された文書インスタンスを処理
対象とする。For example, in the integrated document processing system "Akane" developed by Fuji Xerox, a document instance created based on the Akane-specific DTD is to be processed.
【0007】このため、特定のDTDのみに対応できる
文書処理装置上で、あらかじめ設定されたDTD以外の
文書構造を持つ文書インスタンスを処理するためには、
DTD相互間の文書構造変換が必要となる。Therefore, in order to process a document instance having a document structure other than a preset DTD on a document processing apparatus which can support only a specific DTD,
Document structure conversion between DTDs is required.
【0008】このため、特開平7−105216号公報
には、ある文書を該文書とは異なる論理構造を備えた他
種の論理構造文書に変換するよう構成した文書論理構造
処理方法が開示されている。For this reason, Japanese Patent Laid-Open Publication No. Hei 7-105216 discloses a document logical structure processing method configured to convert a certain document into another kind of logical structure document having a different logical structure from the document. I have.
【0009】[0009]
【発明が解決しようとする課題】しかしながら、この従
来技術を用いて論理構造変換を行うと、元の文書が保有
する論理構造の一部を喪失する場合が生ずるために、一
旦論理構造変換を行った文書は、元の文書の論理構造に
必ずしも復元することができない。However, when the logical structure is converted using this conventional technique, a part of the logical structure held in the original document may be lost. The restored document cannot always be restored to the logical structure of the original document.
【0010】図5は、従来の論理構造変換の概念を示す
図である。ここでは、DTD−AをDTD−Bの論理構
造に変換する場合を示している。FIG. 5 is a diagram showing the concept of conventional logical structure conversion. Here, a case where DTD-A is converted into a logical structure of DTD-B is shown.
【0011】同図に示すように、このDTD−Aは、”
preface”と”chapter”のノードの下
に”sect1”のノードを持つDTDであり、また、
DTD−Bは、”nseg0”のノードの下に”nse
g1”のノードを持つDTDである。As shown in FIG. 1, the DTD-A
A DTD having a node of “sect1” under nodes of “preference” and “chapter”.
DTD-B has “nse0” under the “nseg0” node.
This is a DTD having a node of g1 ″.
【0012】そして、このDTD−A及びDTD−Bを
対比すると、要素名がそれぞれ異なるため、”sect
1”を”nseg1”にマッピングし、”prefac
e”を”nseg0”にマッピングし、”chapte
r”を”nseg0”にマッピングする論理構造変換を
行うことになる。When the DTD-A and the DTD-B are compared, the element names are different.
1 ”to“ nseg1 ”and“ prefac
e ”is mapped to“ nseg0 ”and“ chapte
Logical structure conversion for mapping “r” to “nseg0” is performed.
【0013】しかし、”sect1”を”nseg1”
にマッピングする際に、”preface”及び”ch
apter”がともに”nseg0”にマッピングされ
るため、DTD−BからDTD−Aに戻す場合を考える
と、”nseg0”を”preface”及び”cha
pter”のいずれに戻せばよいかが分からなくなる。However, "sect1" is changed to "nseg1".
When mapping to “ch”, “preference” and “ch”
Since both “after” and “after” are mapped to “nseg0”, considering the case of returning from DTD-B to DTD-A, “nseg0” is changed to “preference” and “chas”.
It is not known which of the two items to be returned.
【0014】このように、従来の文書構造変換技術で
は、文脈情報の喪失により元の文書構造に戻すことがで
きない場合が生ずるため、たとえ文書内容が同じであっ
ても、適用される論理構造ごとに文書を管理せねばなら
ない。As described above, in the conventional document structure conversion technology, there is a case where the original document structure cannot be restored due to the loss of context information. You must manage your documents.
【0015】その結果、文書管理が複雑化するととも
に、同一文書を重複して記憶せねばないことから、文書
を記憶するための大容量の記憶部が必要となるため、文
書構造変換時の文脈情報の欠落をいかに防ぐかが重要な
課題となっている。As a result, the document management becomes complicated and the same document must be stored in duplicate, so that a large-capacity storage unit for storing the document is required. How to prevent information loss is an important issue.
【0016】そこで、本発明では、上記課題を解決し
て、文書構造の欠落を招くことなく文書構造変換を行
い、もって効率良く文書管理を行うことができる文書処
理装置を提供することを目的とする。Accordingly, an object of the present invention is to solve the above-mentioned problems and to provide a document processing apparatus capable of performing document structure conversion without causing a loss of the document structure and thereby efficiently performing document management. I do.
【0017】[0017]
【課題を解決するための手段】上記目的を達成するた
め、第1の発明は、第1の文書構造を有する文書を処理
する処理部を有し、第2の文書構造を有する文書を受け
付けた際に、該文書を前記第1の文書構造に構造変換
し、構造変換後の文書を前記処理部を用いて処理する文
書処理装置において、前記第2の文書構造を前記第1の
文書構造に変換する際に欠落する文脈情報を構造変換後
の文書に属性情報として付加しつつ、前記文書を前記第
1の文書構造に構造変換する変換手段と、前記変換手段
が構造変換した文書に付加された属性情報に基づいて、
前記文書を前記第2の文書構造に復元する復元手段とを
具備することを特徴とする。In order to achieve the above object, a first invention has a processing unit for processing a document having a first document structure, and receives a document having a second document structure. At this time, in the document processing apparatus for converting the structure of the document into the first document structure and processing the converted document using the processing unit, the second document structure is converted to the first document structure. Converting means for converting the structure of the document into the first document structure while adding context information missing at the time of conversion as attribute information to the structure-converted document; and adding the converting means to the structure-converted document. Based on the attribute information
Restoring means for restoring the document to the second document structure.
【0018】また、第2の発明は、前記変換手段は、前
記第2の文書構造の複数の要素名が前記第1の文書構造
の所定の要素名に対応するならば、該所定の要素名を持
つ文書要素に対して構造変換前の要素名を属性情報とし
て付加することを特徴とする。According to a second aspect of the present invention, the conversion means, if the plurality of element names of the second document structure correspond to the predetermined element names of the first document structure, the predetermined element name The element name before the structure conversion is added as attribute information to the document element having.
【0019】また、第3の発明は、前記復元手段は、前
記変換手段が構造変換した文書の文書要素が属性情報を
有する場合には、この属性情報を復元された文書の文書
要素の要素名とすることを特徴とする。According to a third aspect of the present invention, when the document element of the document whose structure has been converted by the conversion means has attribute information, the restoring means includes an element name of the document element of the document whose attribute information has been restored. It is characterized by the following.
【0020】[0020]
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0021】図2は、本実施の形態で用いる文書処理装
置11の文書構造変換の概念を示す図である。なお、本
実施の形態においても図5と同様にDTD−AをDTD
−Bに変換する場合について説明する。FIG. 2 is a diagram showing the concept of document structure conversion of the document processing apparatus 11 used in the present embodiment. Note that, in the present embodiment, DTD-A is
The case of conversion to -B will be described.
【0022】図2に示すように、この文書処理装置11
では、文書構造を変換する際に、要素名のマッピングに
よる文脈情報の喪失を回避すべく、かかる文脈情報をノ
ードの属性値として保持することとしている。As shown in FIG. 2, this document processing device 11
In this document, when converting a document structure, in order to avoid loss of context information due to mapping of element names, the context information is stored as an attribute value of a node.
【0023】具体的には、”preface”を”ns
eg0”にマッピングする際には、対応するノードに属
性値”preface”を付与し、また”chapte
r”を”nseg0”にマッピングする際には、対応す
るノードに属性値”chapter”を付与する。Specifically, “preference” is changed to “ns”.
When mapping to “eg0”, an attribute value “preference” is added to the corresponding node, and “chapte” is assigned.
When mapping "r" to "nseg0", an attribute value "chapter" is assigned to the corresponding node.
【0024】すなわち、単に要素名のマッピングにより
構造変換を行おうとすると、文脈情報を喪失するノード
(以下「文脈喪失ノード」と言う。)が生ずるため、こ
こではかかる要素名を属性値として保持する。That is, if the structural conversion is simply performed by mapping the element names, a node that loses the context information (hereinafter referred to as a “context loss node”) occurs. Therefore, the element name is held here as an attribute value. .
【0025】そして、文書構造変換前のSGML文書が
必要である場合には、かかる属性値に基づいて文書構造
の逆変換を行うことにより、再度変換前のSGML文書
に復元する。If the SGML document before the document structure conversion is required, the document structure is inversely converted based on the attribute values, thereby restoring the SGML document before the conversion.
【0026】このように、この文書処理装置11は、構
造変換用の属性値という概念を導入して、文書構造の変
換及び逆変換を円滑に行うことができるようにしてい
る。As described above, the document processing apparatus 11 introduces the concept of attribute values for structure conversion so that the document structure can be smoothly converted and inversely converted.
【0027】次に、本発明に係わる文書処理装置10の
構成について具体的に説明する。Next, the configuration of the document processing apparatus 10 according to the present invention will be specifically described.
【0028】図1は、本実施の形態で用いる文書処理シ
ステムの全体構成と文書処理装置10の細部構成を示す
図である。FIG. 1 is a diagram showing an entire configuration of a document processing system used in the present embodiment and a detailed configuration of a document processing apparatus 10.
【0029】図1に示すように、この文書処理システム
は、SGML文書を作成する文書作成装置10a及び1
0bと、これらの文書作成装置が作成したSGML文書
を処理する文書処理装置11とを、LAN12を介して
接続した構成となる。As shown in FIG. 1, the document processing system includes document creation devices 10a and 10a for creating an SGML document.
0b and a document processing device 11 that processes the SGML documents created by these document creation devices are connected via a LAN 12.
【0030】文書作成装置10a及び10bは、DTD
−A又はDTD−Bに基づいてSGML文書を作成する
装置であり、作成したSGML文書をLAN12を介し
て文書処理装置11に出力する。The document creation apparatuses 10a and 10b are provided with a DTD
-A device that creates an SGML document based on A or DTD-B, and outputs the created SGML document to the document processing device 11 via the LAN 12.
【0031】なお、この文書作成装置10a及び10b
は、文書処理装置11に対して元のDTDを持つSGM
L文書を要求することもできる。例えば、DTD−Aの
SGML文書(以下「SGML文書A」と言う。)を文
書処理装置11に出力した場合には、該SGML文書A
を文書処理装置11に要求することができ、また、DT
D−BのSGML文書(以下「SGML文書B」と言
う。)を文書処理装置11に出力した場合には、該SG
ML文書Bを文書処理装置11に要求することができ
る。The document creation devices 10a and 10b
Is the SGM having the original DTD for the document processing device 11.
An L document can also be requested. For example, when a DTD-A SGML document (hereinafter, referred to as “SGML document A”) is output to the document processing apparatus 11, the SGML document A
Can be requested from the document processing apparatus 11, and DT
When a SGML document of DB (hereinafter referred to as “SGML document B”) is output to the document processing apparatus 11, the SGML document is output.
The ML document B can be requested from the document processing apparatus 11.
【0032】文書処理装置11は、DTD−Bの文書構
造を有するSGML文書のみを処理する処理装置であり
る。The document processing device 11 is a processing device that processes only an SGML document having a DTD-B document structure.
【0033】このため、この文書処理装置11では、S
GML文書Aを受け付けた際に、該SGML文書AをS
GML文書Bに構造変換した後、DTD−Bの文書構造
でSGML文書を処理する。For this reason, in the document processing apparatus 11, S
When the GML document A is received, the SGML document A is
After the structure conversion into the GML document B, the SGML document is processed with the DTD-B document structure.
【0034】ただし、この文書処理装置11は、LAN
12から受信したSGML文書を全てDTD−Bの文書
構造で一旦文書記憶部11gに記憶し、その後、必要の
都度適宜文書処理及び文書要求に対応するSGML文書
の返信を行う。However, this document processing device 11 is a LAN
All of the SGML documents received from the storage unit 12 are temporarily stored in the document storage unit 11g in a DTD-B document structure, and thereafter, the document processing and the return of the SGML document corresponding to the document request are performed whenever necessary.
【0035】この際、文書作成装置10a又は10bか
らDTD−Aの文書構造を持つSGML文書Aを要求さ
れた場合には、文書記憶部11g内には対応するSGM
L文書Bのみしか存在しないため、かかるSGML文書
BをSGML文書Aに変換した後に該SGML文書Aを
返信することになる。At this time, when the SGML document A having the DTD-A document structure is requested from the document creation device 10a or 10b, the corresponding SGM is stored in the document storage unit 11g.
Since only the L document B exists, the SGML document A is returned after the SGML document B is converted into the SGML document A.
【0036】なお、要求されたSGML文書Aに対応す
る上記SGML文書Bは、元々DTD−Aに対応する文
書構造を有するため、文書逆変換部11fを用いて元の
DTD−Aの文書構造に逆変換を行う。Since the SGML document B corresponding to the requested SGML document A originally has a document structure corresponding to the DTD-A, the original document structure of the DTD-A is converted to the original DTD-A using the document inversion unit 11f. Perform the inverse transformation.
【0037】このように、この文書処理装置11は、D
TD−Aの文書構造を持つSGML文書AをDTD−B
の文書構造を持つSGML文書Bに構造変換する機能
と、該構造変換後のSGML文書Bを再度SGML文書
Aに逆変換する機能とを有している。As described above, this document processing device 11
SGML document A having the document structure of TD-A is converted to DTD-B
And a function to convert the SGML document B after the structure conversion back into the SGML document A again.
【0038】なお、構造変換を行う際に文脈情報が欠落
すると、SGML文書の逆変換を行うことができなくな
るため、この文書処理装置11では、文脈喪失ノードの
要素名を属性値として変換後の対応ノードに付加するこ
ととしている。If context information is lost during the structural conversion, the reverse conversion of the SGML document cannot be performed. Therefore, the document processing apparatus 11 uses the element name of the context lost node as an attribute value after conversion. It is to be added to the corresponding node.
【0039】次に、この文書処理装置11の具体的な構
成について説明する。Next, a specific configuration of the document processing apparatus 11 will be described.
【0040】図1に示すように、この文書処理装置11
は、I/F部11aと、文書処理部11bと、表示部1
1cと、入力部11dと、文書変換部11eと、文書逆
変換部11fと、文書記憶部11gとからなる。As shown in FIG. 1, this document processing device 11
Are an I / F unit 11a, a document processing unit 11b, and a display unit 1.
1c, an input unit 11d, a document conversion unit 11e, a document reverse conversion unit 11f, and a document storage unit 11g.
【0041】I/F部11aは、LAN12を介したS
GML文書の送受信を司るインターフェース部であり、
具体的には、LAN12からSGML文書を受信したな
らば該SGML文書を文書処理部11bに出力し、また
文書処理部11bからSGML文書を受け付けたならば
該SGML文書をLAN12を介して宛先の文書作成装
置に送信する。The I / F unit 11a communicates with the S
An interface unit that controls transmission and reception of GML documents.
Specifically, if the SGML document is received from the LAN 12, the SGML document is output to the document processing unit 11b. If the SGML document is received from the document processing unit 11b, the SGML document is transmitted to the destination document via the LAN 12. Send to creation device.
【0042】文書処理部11bは、DTD−Bの文書構
造を持つSGML文書を処理する処理部であり、具体的
には、SGML文書に対するスタイル設定、表示、編集
及び印刷等を行う。The document processing section 11b is a processing section for processing an SGML document having a DTD-B document structure, and specifically, performs style setting, display, editing, printing, and the like for the SGML document.
【0043】また、この文書処理部11bは、DTD−
Aの文書構造を持つSGML文書を受け付けた場合に
は、文書変換部11eを用いて処理可能なDTD−Bの
文書構造に変換し、変換後のSGML文書を文書記憶部
11gに記憶する。Further, the document processing section 11b has a DTD-
When an SGML document having the document structure of A is received, the document is converted into a processable DTD-B document structure using the document conversion unit 11e, and the converted SGML document is stored in the document storage unit 11g.
【0044】さらに、文書作成装置10a又は10bか
らの文書要求を受け付けたならば、該当するSGML文
書を文書記憶部11gから取り出し、要求された文書構
造に変換した後I/F部11aに出力する。Further, when a document request from the document creation device 10a or 10b is received, the corresponding SGML document is retrieved from the document storage unit 11g, converted into the requested document structure, and then output to the I / F unit 11a. .
【0045】すなわち、要求されたSGML文書の文書
構造がDTD−Bである場合には、この要求に対応する
SGML文書を文書記憶部11gから取り出してそのま
まI/F部11aに出力する。That is, if the document structure of the requested SGML document is DTD-B, the SGML document corresponding to this request is extracted from the document storage unit 11g and output to the I / F unit 11a as it is.
【0046】これに対して、要求されたSGML文書の
文書構造がDTD−Aである場合には、この要求に対応
するDTD−Bの構造を持つSGML文書を文書記憶部
11gから取り出した後に、該SGML文書の文書構造
を文書逆変換部11fを用いてDTD−Aに逆変換し、
I/F部11aに出力する。On the other hand, if the document structure of the requested SGML document is DTD-A, after extracting the SGML document having the DTD-B structure corresponding to this request from the document storage unit 11g, The document structure of the SGML document is inversely transformed into DTD-A using the document inverse transformation unit 11f,
Output to the I / F section 11a.
【0047】表示部11cは、文書処理部11bがSG
ML文書へのスタイル適用及び文書編集等を行う際に用
いるディスプレイ等の表示デバイスであり、また、入力
部11dは、キーボード及びマウス等からなる入力デバ
イスである。The display unit 11c has a function that the document processing unit 11b
The input device 11d is an input device including a keyboard, a mouse, and the like, and is a display device such as a display used when performing style application to the ML document, document editing, and the like.
【0048】文書変換部11eは、文書処理部11bか
ら依頼されたDTD−Aの文書構造を持つSGML文書
をDTD−Bの文書構造に構造変換して、変換後のSG
ML文書を文書処理部11bに出力する処理部である。The document conversion unit 11e converts the structure of the SGML document having the DTD-A document structure requested by the document processing unit 11b into the DTD-B document structure,
A processing unit that outputs the ML document to the document processing unit 11b.
【0049】具体的には、この文書変換部11eでは、
要素名のマッピングによる文脈情報の喪失を防ぐため
に、文脈喪失ノードの要素名を変換後の対応ノードの属
性値として付加する処理を行っている。More specifically, in the document conversion unit 11e,
In order to prevent the context information from being lost due to the mapping of the element name, a process of adding the element name of the context lost node as an attribute value of the converted corresponding node is performed.
【0050】例えば、DTD−Aの”preface”
及び”chapter”が、ともにDTD−Bの”ns
eg0”に対応する場合には、要素名のマッピングを行
う際に、該当するノードに属性値”preface”又
は”chapter”を付与する。For example, "preference" of DTD-A
And “chapter” are both “ns” of DTD-B.
In the case of “eg0”, the attribute value “preference” or “chapter” is added to the corresponding node when mapping the element name.
【0051】文書逆変換部11fは、文書処理部11b
から依頼されたDTD−Bの文書構造を持つSGML文
書をDTD−Aの文書構造に構造変換して、変換後のS
GML文書を文書処理部11bに出力する処理部であ
る。The document reverse conversion unit 11f includes a document processing unit 11b
Converts the SGML document having the DTD-B document structure requested by
A processing unit that outputs a GML document to the document processing unit 11b.
【0052】具体的には、この文書逆変換部11fで
は、属性値を有しないノードについてはそのまま要素名
のマッピングを行い、また属性値を有するノードについ
ては該属性値を利用して、対応するノード間のマッピン
グを行っている。More specifically, in the document reverse conversion unit 11f, the element name is mapped as it is for a node having no attribute value, and a corresponding node is used for a node having an attribute value by using the attribute value. Mapping between nodes is performed.
【0053】例えば、DTD−Bの”nseg0”が、
DTD−Aの”preface”及び”chapte
r”に対応する場合には、属性値”preface”又
は”chapter”を用いて元の文書構造に戻す。For example, "nseg0" of DTD-B is
“Preference” and “chapte” of DTD-A
In the case of “r”, the original document structure is restored using the attribute value “preference” or “chapter”.
【0054】このように、この文書逆変換部11fで
は、文書変換部11eが付加した属性値を利用して文書
構造の逆変換を行っている。As described above, the document reverse conversion unit 11f performs the reverse conversion of the document structure using the attribute value added by the document conversion unit 11e.
【0055】文書記憶部11gは、DTD−Bの文書構
造を持つSGML文書のみを記憶する記憶部であり、こ
こにはDTD−Aの文書構造を持つSGML文書は格納
されない。The document storage section 11g is a storage section for storing only an SGML document having a DTD-B document structure, and does not store an SGML document having a DTD-A document structure.
【0056】上記構成を有する文書処理装置11を用い
ることにより、異なる文書構造を持つSGML文書を円
滑に処理又は管理することができる。By using the document processing apparatus 11 having the above configuration, SGML documents having different document structures can be processed or managed smoothly.
【0057】次に、図1に示す文書変換部11eの処理
手順について説明する。Next, the processing procedure of the document conversion unit 11e shown in FIG. 1 will be described.
【0058】図3は、図1に示す文書変換部11eの処
理手順を示すフローチャートである。FIG. 3 is a flowchart showing a processing procedure of the document conversion unit 11e shown in FIG.
【0059】図3に示すように、この文書変換部11e
では、まず最初に、ノード番号を示す変数iに対して’
1’を代入する初期化を行う(ステップ301)。As shown in FIG. 3, this document conversion unit 11e
First, for the variable i indicating the node number,
Initialization for substituting 1 'is performed (step 301).
【0060】そして、この第iノードが文脈喪失ノード
であるか否かを調べ(ステップ302〜303)、文脈
喪失ノードでない場合にはステップ305に移行し、文
脈喪失ノードの場合には、該ノードの要素名を変換後の
ノードの属性値として付加する(ステップ304)。Then, it is determined whether or not the i-th node is a context lost node (steps 302 to 303). If the i-th node is not a context lost node, the process proceeds to step 305; Is added as the attribute value of the converted node (step 304).
【0061】その後、このDTD−Aの第iノードの要
素名のDTD−Bの第iノードの要素名にマッピングし
た後(ステップ305)、変数iをインクリメントする
(ステップ306)。Then, after mapping the element name of the i-th node of DTD-A to the element name of the i-th node of DTD-B (step 305), the variable i is incremented (step 306).
【0062】かかる処理を未処理ノードがなくなるまで
繰り返し(ステップ307)、全てのノードの処理を終
えたならば終了する。This processing is repeated until there is no unprocessed node (step 307). When the processing of all the nodes is completed, the processing ends.
【0063】上記一連の処理を行うことにより、文脈喪
失ノードの要素名を変換後の対応ノードの属性値として
付加することができる。By performing the above series of processing, the element name of the context lost node can be added as the attribute value of the converted corresponding node.
【0064】次に、図1に示す文書逆変換部11fの処
理手順について説明する。Next, the processing procedure of the document reverse conversion unit 11f shown in FIG. 1 will be described.
【0065】図4は、図1に示す文書逆変換部11fの
処理手順を示すフローチャートである。FIG. 4 is a flowchart showing a processing procedure of the document reverse conversion unit 11f shown in FIG.
【0066】図4に示すように、この文書逆変換部11
fでは、まず最初に、ノード番号を示す変数iに対し
て’1’を代入する初期化を行う(ステップ401)。As shown in FIG. 4, the document reverse conversion unit 11
In f, first, initialization for substituting '1' into a variable i indicating a node number is performed (step 401).
【0067】そして、この第iノードが属性値を有する
か否かを調べ(ステップ402〜403)、属性値を有
しない場合には要素名間のマッピングを行い(ステップ
404)、属性値を有する場合には該属性値を変換後の
ノードの要素名とする(ステップ405)。Then, it is checked whether or not the i-th node has an attribute value (steps 402 to 403). If the i-th node does not have an attribute value, mapping is performed between element names (step 404). In this case, the attribute value is used as the element name of the converted node (step 405).
【0068】その後、変数iをインクリメントした後
(ステップ407)、未処理ノードがなくなるまでステ
ップ402〜407の処理を繰り返す(ステップ40
8)。Thereafter, after incrementing the variable i (step 407), the processing of steps 402 to 407 is repeated until there is no unprocessed node (step 40).
8).
【0069】上記一連の処理を行うことにより、要素名
及び属性値を用いた文書構造の逆変換を行うことができ
る。By performing the above-described series of processing, reverse conversion of the document structure using element names and attribute values can be performed.
【0070】上述してきたように、本実施の形態では、
文書処理装置11が、DTD−Aの文書構造を持つSG
ML文書を受け付けたならば、文書変換部11eが要素
名のマッピングにより文脈情報が喪失する文脈喪失ノー
ドの要素名を属性値として付加しつつ、該SGML文書
をDTD−Bの文書形式に構造変換して文書記憶部11
gに記憶し、文書作成装置10a又は10bから該SG
ML文書の文書要求を受けたならば、文書逆変換部11
fが要素名のマッピングと属性値に基づく変換により該
SGML文書をDTD−Aの文書構造に復元するよう構
成したので、下記に示す効果が得られる。As described above, in the present embodiment,
When the document processing device 11 has an SG having a DTD-A document structure
When the ML document is received, the document conversion unit 11e converts the structure of the SGML document into the DTD-B document format while adding, as an attribute value, the element name of the context lost node whose context information is lost by mapping the element name. Document storage unit 11
g from the document creation device 10a or 10b.
When a document request for an ML document is received, the document reverse conversion unit 11
Since f is configured to restore the SGML document to the DTD-A document structure by the mapping based on the element name and the attribute value, the following effects can be obtained.
【0071】1)SGML文書の構造変換に伴う文脈情
報の喪失を防止することができる。1) It is possible to prevent the loss of context information due to the structure conversion of the SGML document.
【0072】2)SGML文書の構造変換及び逆変換を
円滑に行うことができる。2) The structure conversion and the inverse conversion of the SGML document can be smoothly performed.
【0073】3)統一した文書構造でSGML文書を管
理することができる。3) SGML documents can be managed with a unified document structure.
【0074】4)SGML文書を記憶する記憶容量を低
減することができる。4) The storage capacity for storing SGML documents can be reduced.
【0075】なお、本実施の形態では、DTD−A及び
DTD−Bという2種類の文書構造間の構造変換を行う
場合を示したが、本発明はこれに限定されるものではな
く、3種類以上の文書構造相互間の構造変換に適用する
ことも可能である。In the present embodiment, the case where the structure conversion between the two types of document structures, DTD-A and DTD-B, has been described, but the present invention is not limited to this. It is also possible to apply the above-described structure conversion between document structures.
【0076】[0076]
【発明の効果】以上詳細に説明したように、本発明は、
第2の文書構造を第1の文書構造に変換する際に欠落す
る文脈情報を構造変換後の文書に属性情報として付加し
つつ、文書を第1の文書構造に構造変換し、また、構造
変換した文書に付加された属性情報に基づいて、文書を
第2の文書構造に復元するよう構成したので、下記に示
す効果が得られる。As described in detail above, the present invention provides
While adding context information missing when converting the second document structure to the first document structure as attribute information to the structure-converted document, the document is converted to the first document structure, and the structure conversion is performed. Since the document is restored to the second document structure based on the attribute information added to the extracted document, the following effects can be obtained.
【0077】1)SGML文書の構造変換に伴う文脈情
報の喪失を防止することが可能となる。1) It is possible to prevent the context information from being lost due to the structure conversion of the SGML document.
【0078】2)SGML文書の構造変換及び逆変換を
円滑に行うことが可能となる。2) The structure conversion and the inverse conversion of the SGML document can be smoothly performed.
【0079】3)統一した文書構造でSGML文書を管
理することが可能となる。3) SGML documents can be managed with a unified document structure.
【0080】4)SGML文書を記憶する記憶容量を低
減することが可能となる。4) The storage capacity for storing SGML documents can be reduced.
【図1】本実施の形態で用いる文書処理システムの全体
構成と文書処理装置の細部構成を示す図。FIG. 1 is a diagram showing an entire configuration of a document processing system used in an embodiment and a detailed configuration of a document processing apparatus.
【図2】図1に示す文書処理装置の文書構造変換の概念
を示す図。FIG. 2 is a view showing the concept of document structure conversion of the document processing apparatus shown in FIG. 1;
【図3】図1に示す文書変換部の処理手順を示すフロー
チャート。FIG. 3 is a flowchart showing a processing procedure of a document conversion unit shown in FIG. 1;
【図4】図1に示す文書逆変換部の処理手順を示すフロ
ーチャート。FIG. 4 is a flowchart showing a processing procedure of a document reverse conversion unit shown in FIG. 1;
【図5】従来の論理構造変換の概念を示す図。FIG. 5 is a diagram showing the concept of conventional logical structure conversion.
10a,10b…文書作成装置、 11…文書処理装
置、11a…I/F部、 11b…文書処理部、 11
c…表示部、11d…入力部、 11e…文書変換部、
11f…文書逆変換部、11g…文書記憶部、 12
…LAN10a, 10b: Document creation device, 11: Document processing device, 11a: I / F unit, 11b: Document processing unit, 11
c: display unit, 11d: input unit, 11e: document conversion unit,
11f: Document reverse conversion unit, 11g: Document storage unit, 12
… LAN
Claims (3)
処理部を有し、第2の文書構造を有する文書を受け付け
た際に、該文書を前記第1の文書構造に構造変換し、構
造変換後の文書を前記処理部を用いて処理する文書処理
装置において、 前記第2の文書構造を前記第1の文書構造に変換する際
に欠落する文脈情報を構造変換後の文書に属性情報とし
て付加しつつ、前記文書を前記第1の文書構造に構造変
換する変換手段と、 前記変換手段が構造変換した文書に付加された属性情報
に基づいて、前記文書を前記第2の文書構造に復元する
復元手段とを具備することを特徴とする文書処理装置。A processing unit that processes a document having a first document structure, and when receiving a document having a second document structure, converts the structure of the document into the first document structure; In a document processing apparatus for processing a document after a structure conversion using the processing unit, the context information missing when converting the second document structure into the first document structure is converted into attribute information in the document after the structure conversion. Converting means for converting the structure of the document into the first document structure, and converting the document into the second document structure based on attribute information added to the document whose structure has been converted by the converting means. A document processing apparatus comprising: a restoration unit for restoring.
造の所定の要素名に対応するならば、該所定の要素名を
持つ文書要素に対して構造変換前の要素名を属性情報と
して付加することを特徴とする請求項1記載の文書処理
装置。2. If the plurality of element names of the second document structure correspond to predetermined element names of the first document structure, the conversion unit may convert a plurality of element names of the second document structure into document elements having the predetermined element name. 2. The document processing apparatus according to claim 1, wherein the element name before the structure conversion is added as attribute information.
を有する場合には、この属性情報を復元された文書の文
書要素の要素名とすることを特徴とする請求項2記載の
文書処理装置。3. The method according to claim 1, wherein, when the document element of the document whose structure has been converted by the conversion means has attribute information, the restoring means uses the attribute information as an element name of the document element of the restored document. 3. The document processing apparatus according to claim 2, wherein
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9036418A JPH10232868A (en) | 1997-02-20 | 1997-02-20 | Document processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9036418A JPH10232868A (en) | 1997-02-20 | 1997-02-20 | Document processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10232868A true JPH10232868A (en) | 1998-09-02 |
Family
ID=12469288
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9036418A Pending JPH10232868A (en) | 1997-02-20 | 1997-02-20 | Document processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10232868A (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125831A (en) * | 1999-09-30 | 2001-05-11 | Nec Corp | Data scramble method, data distributing device, data scrambler and recording medium |
US7073120B2 (en) | 2001-05-21 | 2006-07-04 | Kabushiki Kaisha Toshiba | Structured document transformation method, structured document transformation apparatus, and program product |
WO2006103777A1 (en) * | 2005-03-30 | 2006-10-05 | Fujitsu Limited | Structured data conversion method |
JP2010250585A (en) * | 2009-04-16 | 2010-11-04 | Access Co Ltd | Markup language document conversion device, program and method |
-
1997
- 1997-02-20 JP JP9036418A patent/JPH10232868A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125831A (en) * | 1999-09-30 | 2001-05-11 | Nec Corp | Data scramble method, data distributing device, data scrambler and recording medium |
US7073120B2 (en) | 2001-05-21 | 2006-07-04 | Kabushiki Kaisha Toshiba | Structured document transformation method, structured document transformation apparatus, and program product |
US7228498B2 (en) | 2001-05-21 | 2007-06-05 | Kabushiki Kaisha Toshiba | Structured document transformation apparatus for managing document information transfers between a server and a client |
WO2006103777A1 (en) * | 2005-03-30 | 2006-10-05 | Fujitsu Limited | Structured data conversion method |
JP2010250585A (en) * | 2009-04-16 | 2010-11-04 | Access Co Ltd | Markup language document conversion device, program and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7194678B1 (en) | Dynamic web page generation method and system | |
US7533110B2 (en) | File conversion | |
US8589388B2 (en) | Method, system, and software for transmission of information | |
US7406682B2 (en) | Translator-compiler for converting legacy management software | |
US7509577B2 (en) | Method and system for implementing a clipboard | |
US20020087596A1 (en) | Compact tree representation of markup languages | |
US20030034989A1 (en) | Application editing apparatus and data processing method and program | |
KR19980018172A (en) | How to run interactive applications, client-server dialog systems, and terminal devices | |
JP2004178602A (en) | Method for importing and exporting hierarchized data, and computer-readable medium | |
EP2211277A1 (en) | Method and apparatus for generating an integrated view of multiple databases | |
GB2341462A (en) | Updating applications incrementally | |
US20030226116A1 (en) | Method and system for implementing a historical buffer | |
US20040148612A1 (en) | System and method for generating an application programming interface from a schema | |
US7681175B2 (en) | Methods and systems for displaying multiple unique dynamic messages on a user interface | |
US6519598B1 (en) | Active memory and memory control method, and heterogeneous data integration use system using the memory and method | |
US7451390B2 (en) | Structured document processing system, method, program and recording medium | |
JPH10232868A (en) | Document processor | |
US20030220914A1 (en) | Method for managing data in a network | |
US20120047231A1 (en) | Tiered xml services in a content management system | |
JP2001159993A (en) | Method and device for storing data for referring to optional time state | |
US7120663B2 (en) | Method and apparatus for updating XML data | |
US20060075331A1 (en) | Structured document processing method and apparatus, and storage medium | |
US20040205591A1 (en) | Method and program for XML data conversion | |
JP2001331408A (en) | Method and system for specifying required device attribute to be buried in worldwide web document request | |
US20050182772A1 (en) | Method of streaming conversion from a first data structure to a second data structure |