[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2010122829A - Document shaping device and document shaping method - Google Patents

Document shaping device and document shaping method Download PDF

Info

Publication number
JP2010122829A
JP2010122829A JP2008294857A JP2008294857A JP2010122829A JP 2010122829 A JP2010122829 A JP 2010122829A JP 2008294857 A JP2008294857 A JP 2008294857A JP 2008294857 A JP2008294857 A JP 2008294857A JP 2010122829 A JP2010122829 A JP 2010122829A
Authority
JP
Japan
Prior art keywords
document
text
solid
model
shaping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008294857A
Other languages
Japanese (ja)
Other versions
JP4474670B2 (en
Inventor
Terumi Ishizawa
輝美 石澤
Kazuo Yamamoto
和男 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LOVAL COMMUNICATIONS Inc
Original Assignee
LOVAL COMMUNICATIONS Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LOVAL COMMUNICATIONS Inc filed Critical LOVAL COMMUNICATIONS Inc
Priority to JP2008294857A priority Critical patent/JP4474670B2/en
Publication of JP2010122829A publication Critical patent/JP2010122829A/en
Application granted granted Critical
Publication of JP4474670B2 publication Critical patent/JP4474670B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

【課題】入力される文書データが目的とする特定されている整形文書構造に近似している場合に、この近似を生かし、当該整形文書を指定しておくことによって、簡便で、汎用性のある変換によって迅速に目的とする特定されている整形文書構造の文章を作成することをできるようにする。
【解決手段】データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段を備える。
【選択図】図4
When input document data approximates a desired specified formatted document structure, it is simple and versatile by specifying the formatted document by making use of this approximation. By converting, it is possible to quickly create a sentence of a specified and well-formed document structure.
Using a first conversion rule stored in a database, a client document structure of an arbitrary style is simply flattened regardless of a formatting model attribute of a formatting model in which a hierarchical document structure is specified. Solid document text composing means for constructing a solid document text of a specific style converted into a solid document structure to be arranged.
[Selection] Figure 4

Description

本発明は、入力された文書データを整形して整形文書に変換する文書整形装置および文書整形方法に関する。   The present invention relates to a document shaping apparatus and a document shaping method for shaping input document data and converting it into a shaped document.

ワードプロセッサ等の文書作成装置の中には、文書の“章”、“節”および“項”というような文書構造を論理解析し、予め定められた変換ルールに従って整形し、整形文書を作成する装置がある。   Among document creation devices such as word processors, a device for logically analyzing a document structure such as “chapter”, “section”, and “term” of a document, shaping it according to a predetermined conversion rule, and creating a shaped document There is.

特許文献1には、抽出した段落について文書構造上の要素を決定し、段落内の文字位置と構成文字種からルールに基づいて段落内の文書構造上の階層レベルを判定し、判定した階層レベルに応じた文書構造上の要素を決定し、決定した段落の要素と、決定した段落内の要素について、構造スタイル定義に設定された構造スタイルを体裁スタイルに代えてそれぞれ適用することが記載されている。   In Patent Document 1, an element on the document structure is determined for the extracted paragraph, a hierarchical level on the document structure in the paragraph is determined based on a rule from a character position and a constituent character type in the paragraph, and the determined hierarchical level is determined. The document structure element is determined, and the structural style set in the structural style definition is applied to the determined paragraph element and the determined paragraph element instead of the appearance style. .

特許文献2には、文書の各記載項目の属性を判別し、記載項目間の階層構造を特定し、その階層構造を表わすルールデータを生成することが記載されている。   Patent Document 2 describes that the attribute of each description item of a document is determined, a hierarchical structure between the description items is specified, and rule data representing the hierarchical structure is generated.

特許文献3には、レイアウト編集ルールを準備しておいて、編集対象文書における各種文字列情報の存在を認識し、その文字列情報に応じたレイアウト編集処理を施すことにより編集対象文書のレイアウトに整えることが記載されている。   In Patent Document 3, a layout editing rule is prepared, the existence of various character string information in the document to be edited is recognized, and a layout editing process corresponding to the character string information is performed to create the layout of the document to be edited. It is described that it is arranged.

特許文献4には、整形処理が異なる1種類あるいは複数種類の文書整形装置を選択し、選択した文書整形装置の各々によって文書整形のルールを示す属性を含んだ同一文書を整形させ、選択した文書整形装置の各々が整形した結果をビットマップ画像に変換することが記載されている。   In Patent Document 4, one type or a plurality of types of document shaping devices with different shaping processes are selected, the same document including an attribute indicating a document shaping rule is shaped by each of the selected document shaping devices, and the selected document is selected. It describes that the result of shaping by each shaping device is converted into a bitmap image.

特開2007−164705号公報JP 2007-164705 A 特開2007−52615号公報JP 2007-52615 A 特開平6−139235号公報JP-A-6-139235 特開平11−282840号公報JP-A-11-282840

上述したように、従来入力された文書データを解析ルールによって複数の段落に分割し、各段落の階層構造を決定し、各種のルールを適用して目的とする構造スタイルの文書を自動的に作成することが行われ、多種多様なスタイルの電子化文書に対応することが行われている。しかしながら、従来の文書変換方法にあっては入力された文書データから整形された構造の文書への変換に当って複雑な、高度な、あるいは多種多様の変換ルールを用いて行っており、汎用性があるというものではなかった。   As described above, previously input document data is divided into multiple paragraphs according to analysis rules, the hierarchical structure of each paragraph is determined, and various rules are applied to automatically create a document with the desired structural style. It has been done to deal with a wide variety of styles of electronic documents. However, in the conventional document conversion method, conversion from input document data to a document with a structured structure is performed using complicated, advanced or various conversion rules. There was no such thing as.

ところで、整形構造の文書の中には取扱説明書あるいは検査報告書のようにこれらを取り扱う企業内に文書構造が特定されていて、入力される文章データがこの特定されている文書構造が近似しているのにもかかわらず一々フォーマットを変換していることが行われている。このような方法では、特定されている文書構造の文章に変換するのがわずらわしいので、目的とする特定されている文書構造を予め指定することによって、簡便で、汎用性のある変換によって迅速に目的とする特定されている文書構造の文書を作成したいというニーズがある。
本発明は、かかる点に鑑みて入力される文章データが目的とする特定されている整形文書構造に近似している場合に、この近似していることを生かして当該整形文書を指定しておくことによって、簡便で、汎用性のある変換によって迅速に目的とする特定されている整形文書構造の文章を作成することのできる文書整形装置および文書整形方法を提供することを目的とする。
By the way, the document structure is specified in the company that handles these, such as an instruction manual or an inspection report, in the document of the structured structure, and the document structure to which the specified sentence data is approximated is input. Despite the fact that the format is being converted one by one. In such a method, since it is troublesome to convert to a sentence having a specified document structure, it is easy to quickly specify a target structure by specifying the target specified document structure in a simple and versatile manner. There is a need to create a document having a specified document structure.
In consideration of this point, the present invention designates the formatted document by taking advantage of this approximation when the input text data approximates the target specified formatted document structure. Accordingly, it is an object of the present invention to provide a document shaping apparatus and a document shaping method capable of creating a sentence of a specified formatted document structure quickly and easily by simple and versatile conversion.

本発明は、データベースに格納された整形モデルを指定しておくことを前提として、任意スタイルの認識されたクライアント文書構造について第一のルールを適用して特定スタイルのベタ書き文書構造を有するベタ書き文書テキストを構成し、ベタ書き文書構造を認識して第二ル−ルを適用して整形された整形文書構造に変換して整形スタイルの整形テキストを構成することを特徴とする。   The present invention is based on the premise that a formatting model stored in a database is designated, and the first rule is applied to a recognized client document structure of an arbitrary style to thereby create a solid writing having a solid writing document structure of a specific style. A document text is formed, a solid document structure is recognized, converted to a formatted document structure formed by applying a second rule, and a formatted text of a formatting style is configured.

本発明は、具体的には、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置において、
文書データを入力する文書データ入力手段と、
整形モデルを指定する整形モデル指定手段と、
入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成するクライアント文書テキスト構成手段と、
クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識するクライアント文書構造認識手段と、
データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段と、
特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識するベタ書き文書構造認識手段と、
データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する整形文書テキスト構成手段と、
第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納するデータベースを備え、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成すること
を特徴とする文書整形装置を提供する。この文書整形装置は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを表示する文書表示手段を備えることができる。従って、整形モデルを文書表示手段に表示して、指定することができる。
Specifically, the present invention provides a document shaping apparatus including a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute.
Document data input means for inputting document data;
A shaping model specifying means for specifying a shaping model;
Client document text composing means for composing an input document data having a hierarchical structure as a client document text of an arbitrary style of a sentence structure having a hierarchical structure;
A client document structure recognizing means for recognizing a client document structure having a hierarchical structure by analyzing a client document structure having an arbitrary style for a client document text.
Using the first conversion rule stored in the database, the client document structure of an arbitrary style is simply written in a flat form regardless of the formatting model attribute of the formatting model in which the hierarchical document structure is specified. A solid document text composing means for composing a specific style solid document text converted into a document structure;
A solid document text having a specific style of a solid-written document structure is composed of a hierarchical structure, and the solid-written document structure in which the document structure is recognized is analyzed. A solid document structure recognition means for recognizing a written document structure;
Using the second conversion rule stored in the database, convert the recognized solid document structure of a specific style into a formatted formatted document structure according to the attributes of the registered formatting model, and configure the formatting text of the formatting style Formatted text formatting means to
The first conversion rule is a rule that determines the attribute conversion method for a document that converts text into a uniform solid text that is simply arranged in a flat form regardless of the attributes of the specified shaping model. A second conversion rule that defines a sentence attribute conversion method for converting to a formatted model sentence in accordance with the attributes of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model indicating the shaping model attribute It has a database that stores models whose model features are predetermined,
The formatted document text composing means provides a document formatting apparatus that configures a specific formatted document text according to a specified specific formatting model attribute. The document formatting apparatus can include a document display unit that displays a specific formatted document text configured by the formatted document text configuration unit. Therefore, the shaping model can be displayed and designated on the document display means.

本発明は、また、前記クライアント文書構造認識手段またはベタ書き文書構造認識手段は、階層構成の各階層の文書を解析して、文書の文頭、または文章の文頭および文書の文尾にタグを付与し、ベタ書き文書構造認識手段は、双方のタグによって1つの文書として認識することを特徴とする文書整形装置
を提供する。
In the present invention, the client document structure recognizing unit or the solid document structure recognizing unit analyzes the document of each layer of the hierarchical structure, and adds a tag to the beginning of the document, or the beginning of the document and the end of the document. The solid-written document structure recognizing means provides a document shaping apparatus characterized by recognizing as one document by both tags.

本発明は、また、前記クライアント文書構造認識手段またはベタ書き文書構造認識手段は、1つまたは2つのタグによって規定された1つの文書の中に特異構成の文書がある時に、この特異文書の文頭または文頭および文尾に別のタグが付与されて特異文書として認識することを特徴とする文書整形装置を提供する。   In the present invention, the client document structure recognizing unit or the solid document structure recognizing unit is configured such that when there is a document having a unique configuration in one document defined by one or two tags, Alternatively, there is provided a document shaping device characterized in that a different tag is attached to the beginning and end of a sentence so that the document is recognized as a unique document.

本発明は、また、前記クライアント文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成され、
クライアント文書構造認識手段が、タグから文字列および行からなる構造を認識し、
ベタ書き文書構成手段が、文字列および行構造からなるベタ書き文書テキストを構成し、
ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析してタグが付与されたベタ書き文字列および行構造を認識し、
整形テキスト構成手段が、タグが付与されたベタ書き文字列および行構造を整形モデルに従って、整形された文字列および行構造に変換し、
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が単にフラットに並べられる特定のベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、整形モデルに従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法、および整形モデルが、文字行および列が定められたモデルであること、
を特徴とする文字整形装置を提供する。
According to the present invention, the client document structure includes a character string and a line structure including “chapter”, “section”, and “section”.
The client document structure recognition means recognizes the structure consisting of character strings and lines from the tag,
The solid document composition means composes a solid document text composed of a character string and a line structure,
The solid writing structure recognizing means analyzes the solid writing character string and line structure consisting of “chapter”, “section” and “section” to recognize the solid writing character string and line structure to which the tag is attached,
The formatted text composing means converts the solid character string and the line structure to which the tag is attached into the formatted character string and the line structure according to the formatting model,
The first conversion rule is a string and line attribute conversion method that converts a character string and a column structure to a specific solid writing structure that is simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is an attribute conversion method to a character string and a line formatted according to the “chapter”, “section” and “term” of the solid writing structure according to the formatting model, and the formatting The model is a model with character lines and columns,
A character shaping device characterized by the above.

本発明は、また、前記任意スタイルのクライアント文書テキストはページ書式属性を備え、第一の変換ルールはクライアント文書テキストが備えるページ書式属性を解除するルールでもあり、第二の変換ルールは整形モデルに従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあり、整形文書テキストはページ書式の属性を備えることを特徴とする文書整形装置を提供する。   According to the present invention, the client document text of any style has a page format attribute, the first conversion rule is a rule for canceling the page format attribute of the client document text, and the second conversion rule is in accordance with a formatting model. This is also a rule for adding a page format attribute to a solid document structure, and provides a document formatting device in which a formatted document text has a page format attribute.

本発明は、また、前記整形文書テキスト構成手段は、特定スタイルのベタ書き文書構造を整形モデルに従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成するときに、双方のタグによって規定された文書ごとに構成することを特徴とする文書整形装置を提供する。   According to the present invention, when the formatted document text composing means converts the solid document structure of a specific style into a formatted document structure formed according to the formatting model to construct the formatted text of the formatting style, both tags A document shaping apparatus is provided that is configured for each document defined by the above.

本発明は、また、上述に規定する整形文書テキストを構成するときに、上述に規定された別のタグによって規定された特異文書について、整形後の文書の該当の個所の文書を特異構成とすることを特徴とする文書整形装置を提供する。   In the present invention, when the formatted document text specified above is configured, the document at the corresponding position of the formatted document is set as a specific configuration for the specific document specified by another tag specified above. A document shaping apparatus characterized by the above is provided.

本発明は、また、第一の変換ルールが、
設定済み文字の大きさを統一する
設定済み書体を統一する
設定済み書体の強調なくす
設定済み行の間隔を統一する
設定済み文頭、文末位置、揃え、インデント、タブを解除する
設定済みの1つの段落内複数行における2行目以降の文頭位置の字下げをなくす
設定済みの改ページ設定をなくす
ことを定める文章構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法であることを特徴とする文書整形装置を提供する。
In the present invention, the first conversion rule is
Unify the size of the set type Unify the typeface that has been set Unset emphasis on the set type Unify the spacing between the set lines Preset sentence, end of sentence position, alignment, indent, one set paragraph to release tabs It is an attribute conversion method that converts the sentence structure, character string and line attributes, and page format attributes that eliminate the indentation at the beginning of the second and subsequent sentences in multiple lines. A document shaping apparatus characterized by the above.

本発明は、また、前記第一の変換ルールのページの書式の属性変換方法が、
1行の文字数、1ページの行数の設定を解除する
用紙の大きさ、方向設定を解除する
変換方法を備えることを特徴とする文書整形装置を提供する。
The present invention also provides an attribute conversion method of the page format of the first conversion rule.
There is provided a document shaping apparatus including a conversion method for canceling the setting of the number of characters per line and the number of lines for canceling the setting of the number of lines per page.

本発明は、また、前記第二の変換ルールが、
各文書構造にかかる本文文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造にかかる本文行の間隔が登録および選択されたものに適用される
各文書構造行の間隔が登録および選択されたものに適用される
各文章の文頭、文尾位置および揃え、インデントにタブ設定が適用される
各文章の1つの段落内複数行における2行目以降の文頭位置を設定する字下げが適用される
“章”、“節”および“項”の階層に下位階層が適用される
組み合わせおよび文字の置換えとして、半角化、補足及び統一化が適用される
最終行で改ページされることを定めるページの書式の属性を変換する
を定める文書構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法であることを特徴とする文書整形装置を提供する。
In the present invention, the second conversion rule may be
Each of the text structure font sizes, typefaces, and emphasis instructions applied to those registered and selected for each document structure. Applies to the document structure line interval that is registered and selected for the document structure. Applies to each document structure line interval that is registered and selected. The lower hierarchy is applied to the “chapter”, “section”, and “section” hierarchies where the indentation that sets the beginning of the second and subsequent sentences in multiple lines within one paragraph of each sentence to which the setting is applied is applied. As a combination and character replacement, the document structure that defines the conversion of page format attributes that specify page breaks at the last line to which half-width, supplement, and unification is applied, string and line attributes, and To provide a document formatting apparatus which is a attribute conversion method for converting an attribute of the over-di format.

本発明は、また、前記第二の変換ルールのページの書式の属性変換方法が、
上下左右の余白が登録および選択されたものに適用される
ページ、柱文が登録および選択された形式に適用される
1ページの行数および1行の文字数が登録および選択されたものに適用される
用紙方向が登録および選択されたものに適用される
変換方法を備えることを特徴とする文書整形装置を提供する。
The present invention also provides an attribute conversion method for the page format attribute of the second conversion rule.
Applies to pages where the top, bottom, left, and right margins are registered and selected, and those where the number of lines per page and the number of characters per line are applied to registered and selected forms. There is provided a document shaping apparatus comprising a conversion method applied to a registered and selected sheet orientation.

本発明は、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置による文書整形方法において、
文書データ入力手段によって、文書データを入力し、
整形モデル指定手段によって、整形モデルを指定し、
クライアント文書テキスト構成手段によって、入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成し、
クライアント文書構造認識手段によって、クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識し、
ベタ書き文書構成手段によって、データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成し、
ベタ書き文書構造認識手段によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識し、
整形文書テキスト構成手段によって、データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成し、
データベースに、第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納し、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成表示すること、
を特徴とする文書整形方法を提供する。
The present invention relates to a document shaping method by a document shaping device comprising a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute.
Enter the document data by the document data input means,
Specify the shaping model by the shaping model designation means,
By the client document text composing means, the input document data is configured as a client document text of an arbitrary style with a sentence structure consisting of a hierarchical structure, with respect to a document having a hierarchical structure,
The client document structure recognizing means recognizes the client document structure consisting of a hierarchical structure by analyzing the client document structure in which the hierarchical structure of the client document text is an arbitrary style,
By using the first conversion rule stored in the database by the solid document composition means, the client document structure of an arbitrary style is simply changed regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. Construct a solid text document of a specific style converted to a solid document structure that is arranged in a flat form,
The solid document structure recognizing means has a hierarchical structure for a solid document text having a solid document structure of a specific style. Recognizes the structure of a solid document with a specific style
Using the second conversion rule stored in the database, the formatted document text composing means converts the recognized solid document structure of a specific style into a formatted document structure according to the attributes of the registered formatting model. Compose formatting style formatting text,
Attribute conversion method for documents, which is the first conversion rule in the database, and the text is uniformly converted into a specific solid text arranged in a flat shape regardless of the shaping model attribute of the specified shaping model A second conversion rule, a rule for determining a sentence attribute conversion method for converting to a formatted model sentence according to the attribute of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model attribute Stores a model whose shaping model features indicated by
The formatted document text composing means composes and displays a specific formatted document text according to a specified specific formatting model attribute,
A document shaping method characterized by the above.

本発明は、上述のように、データベースに格納された整形モデルを指定しておいて、任意スタイルの認識されたクライアント文書構造について第一のルールを適用して特定スタイルのベタ書き文書構造を有するベタ書き文書テキストを構成し、ベタ書き文書構造を認識して第二ル−ルを適用して整形された整形文書構造に変換して整形スタイルの整形テキストを構成するようにしているので、入力される文章データが目的とする特定されている整形文書構造に近似している場合に、当該整形文書を指定しておくことによって、近似性を利用して、簡便で、汎用性のある変換によって迅速に目的とする特定されている整形文書構造の文章を作成することのできる文書整形装置および文書整形方法を提供することができる。   As described above, the present invention has a solid document structure of a specific style by specifying a formatting model stored in a database and applying the first rule to a recognized client document structure of an arbitrary style. Since it is composed of solid document text, it recognizes the solid document structure and converts it into a formatted document structure that is formatted by applying the second rule. If the text data to be processed is similar to the target specified formatted document structure, by specifying the formatted document, the approximation can be used to make the conversion simple and versatile. It is possible to provide a document shaping apparatus and a document shaping method capable of quickly creating a sentence having a specified formatted document structure.

以下、本発明の実施例を図面に基づいて説明する。   Embodiments of the present invention will be described below with reference to the drawings.

図1は、本発明の実施例である文書整形装置の構成を示すブロック図である。
図1において、文書整形装置100は文書整形手段1および文書表示手段2から構成され、文書整形のルールを示す属性を含んだ文書をこの属性に対応したルールに従って整形する文書整形手段(装置)と文書整理結果を表示する文書表示手段(装置)を備える。
FIG. 1 is a block diagram showing a configuration of a document shaping apparatus according to an embodiment of the present invention.
In FIG. 1, a document shaping apparatus 100 includes a document shaping means 1 and a document display means 2, and a document shaping means (apparatus) for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute. Document display means (apparatus) for displaying the result of document organization is provided.

図1(a)において、文書整形手段1は、演算処理手段11およびデータベース12から構成される。演算処理手段11は、整形モデル処理(手段)21、文書データ入力22、クライアント文書テキスト構成23、クライアント文書構造認識24、タグ設定機能25、ベタ書き文書テキスト構成機能26、ベタ書き構造認識27、整形文書テキスト構成28、および整形文書テキスト表示29を備える。   In FIG. 1A, the document shaping unit 1 includes an arithmetic processing unit 11 and a database 12. The arithmetic processing means 11 includes a shaping model process (means) 21, a document data input 22, a client document text structure 23, a client document structure recognition 24, a tag setting function 25, a solid document text composition function 26, a solid structure recognition 27, A formatted document text configuration 28 and a formatted document text display 29 are provided.

整形モデル処理21によってデータベース12に登録済み整形モデルを指定することができる。
データベース12は、登録済みモデル31、第一の変換ルール32および第二の変換ルール33を格納し、コンピュータ処理によって必要とされる各種のプログラムおよび手順を格納する。また、データベース12はタグ付与ルール34および各種文書テキスト35を格納する。
A shaping model registered in the database 12 can be designated by the shaping model processing 21.
The database 12 stores a registered model 31, a first conversion rule 32, and a second conversion rule 33, and stores various programs and procedures required by computer processing. Further, the database 12 stores a tag assignment rule 34 and various document texts 35.

文書表示手段2は、文書表示機能を備え、画面36に文書で構成される画面を表示することができる。   The document display means 2 has a document display function, and can display a screen composed of documents on the screen 36.

文書データ37は、キーボードからあるいは読み取り手段等の各種の入力手段の操作によって文書整形手段1に入力され、データベース12に格納される。
図1(b)は、上述した文書整形手段1の演算処理手段による整形モデル処理機能21になされる整形モデル登録処理を示す。
The document data 37 is input to the document shaping unit 1 from the keyboard or by operating various input units such as a reading unit and stored in the database 12.
FIG. 1B shows a shaping model registration process performed by the shaping model processing function 21 by the arithmetic processing means of the document shaping means 1 described above.

整形モデルデータ38が上述したと同様の各種の入力手段の操作によって演算処理手段11に入力される。   The shaping model data 38 is input to the arithmetic processing means 11 by operating various input means similar to those described above.

整形モデル処理21は整形モデルデータ38を入力し、登録処理することができる。具体的には、整形モデル処理21は入力された整形モデルについて後述する整形モデル特徴項目を画面36に表示し、整形モデル特徴項目を操作者に選択させ、組み合わせて、この特徴項目の選択(指定)、組み合わされた整形モデルの登録指示を行うことができる。登録指示された整形モデルは整形モデルリストに加えられて、番号等のIDが付されて、もしくはIDなしで整形モデルとして登録される。登録された整形モデルはリストによる一覧と共に、リストの1つを選択することによって整形モデルを特定し、上述した特徴項目の組み合わせから各項目内のいずれかの特徴を選択できるようにして、画面36に表示させ得る。   The shaping model processing 21 can input the shaping model data 38 and perform registration processing. Specifically, the shaping model processing 21 displays a shaping model feature item, which will be described later, for the inputted shaping model on the screen 36, causes the operator to select the shaping model feature item, and combines them to select (specify) the feature item. ), The combined shaping model can be registered. The shaping model instructed for registration is added to the shaping model list, and an ID such as a number is added, or is registered as a shaping model without an ID. The registered shaping model is specified by selecting one of the lists together with the list by the list, so that any feature in each item can be selected from the combination of feature items described above. Can be displayed.

以上のように構成された図1および図2に示す演算処理手段11において、文書データ37を入力する文書データ入力22によって文書データ入力手段が構成される。   In the arithmetic processing means 11 shown in FIGS. 1 and 2 configured as described above, the document data input means is configured by the document data input 22 for inputting the document data 37.

整形モデル処理21によって文書表示手段2の画面36に表示された、登録された整形モデルを指定する整形モデル指定手段が構成される。   The shaping model designating means for designating the registered shaping model displayed on the screen 36 of the document display means 2 by the shaping model processing 21 is configured.

クライアント文書テキスト構成23によって、入力された文書データ37が階層構成からなる文書である場合に、階層構成からなる文書構造が任意スタイルのクライアント文書テキストとして構成するクライアント文書テキスト構成手段が構成される。従って、ここで「クライアント」とは、ユーザ等の利用者という意味であって変換する前のデータであることを示す。   When the input document data 37 is a document having a hierarchical structure, the client document text structure 23 constitutes client document text composing means for composing the document structure having a hierarchical structure as client document text of an arbitrary style. Therefore, here, “client” means a user such as a user and indicates data before conversion.

クライアント文書構造認識24によって、クライアント文書テキストについて、階層構成からなる文書構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識するクライアント文書構造認識手段が構成される。   The client document structure recognition unit 24 constitutes client document structure recognition means for analyzing a client document structure having a hierarchical structure by analyzing a client document structure having an arbitrary style for a client document text.

タグ設定25によってクライアント文書構造を構成する各文章の文頭と文尾、各文章中の特異文章の文頭と文尾にタグを付着するタグ設定手段が構成される。このタグ設定手段は、クライアント文書構造認識手段の一部をなし、各文章、すなわち各文章を構成する文字列の文頭と文尾にタグが付着されてクライアント文書構造が認識される。クライアント文書構造の認識には各文章を構成する文字列の中の特異文章の文頭と文尾に付着されたタグによって切り出し可能な文章についての認識が含まれる。上記の例では文頭と文尾にタグを付着させているが、文頭のみにタグを付着させてもよい。   The tag setting 25 constitutes tag setting means for attaching a tag to the beginning and end of each sentence constituting the client document structure, and to the beginning and end of the unique sentence in each sentence. The tag setting means constitutes a part of the client document structure recognition means, and a tag is attached to each sentence, that is, the sentence head and the sentence end of each character string to recognize the client document structure. Recognition of the client document structure includes recognition of a sentence that can be extracted by a tag attached to the beginning and end of a unique sentence in a character string constituting each sentence. In the above example, the tag is attached to the beginning and end of the sentence, but the tag may be attached only to the beginning of the sentence.

ベタ書き文章テキスト構成26によって、データベース12に格納された第一の交換ルール32を用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が、指定される整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段が構成される。   By using the first exchange rule 32 stored in the database 12 by the solid sentence text structure 26, the client document structure of an arbitrary style can be changed regardless of the formatting model attribute designated by the hierarchical structure. Solid document text composing means for constructing a solid document text of a specific style converted into a solid document structure simply arranged in a flat form.

ベタ書き文書構造認識27によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識するベタ書き文書構造認識手段が構成される。   By the solid document structure recognition 27, the solid document text having a solid document structure of a specific style has a hierarchical structure, and the solid document structure in which the document structure is recognized is analyzed to have a hierarchical structure. A solid document structure recognizing means for recognizing a solid document structure of a specific style in which is recognized.

整形文書テキスト構成28によって、データベース12に格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き構造を登録済みモデル31の属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する整形文書テキスト構成手段が構成される。   By using the second conversion rule stored in the database 12, the formatted document text configuration 28 converts the recognized solid-style structure of a specific style into a formatted document structure that is formatted according to the attributes of the registered model 31. Formatted document text composing means for composing formatted text of the formatting style is configured.

データベース12は、第一の変換ルール32であって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納する。   The database 12 is the first conversion rule 32, and the attribute of the document in which the text is uniformly converted into a specific solid text arranged in a flat shape regardless of the attributes of the shaping model of the designated shaping model. A rule for determining a conversion method, a second conversion rule, a rule for determining a sentence attribute conversion method for converting to a formatted model sentence according to the attributes of the shaping model and corresponding to the hierarchical structure, and a shaping model, A model whose shaping model feature indicated by the model attribute is predetermined is stored.

また、データベース12は、各文章および各文章中の特異文章の文頭および文尾にタグを付与するルール(タグ付与ルール)を格納し、タグが付与された文章からなる文章構造を格納する。すなわち認識されたクライアント文章構造および認識されたベタ書き文書構造、更には構成された整形文書テキストを含む各種文書テキスト35を格納する。   Further, the database 12 stores a rule for attaching a tag to each sentence and a sentence head and a sentence tail of a unique sentence in each sentence (tag assignment rule), and stores a sentence structure including sentences to which a tag is attached. That is, various document texts 35 including the recognized client sentence structure, the recognized solid document structure, and the formed formatted document text are stored.

整形文書テキスト構成手段は、最終的に指定された特定の整形モデル属性に従って特定の整形文書テキストを構成する。   The formatted document text composing means configures the specific formatted document text according to the finally specified specific formatting model attribute.

文書表示手段2は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを画面36に表示する。   The document display unit 2 displays the specific formatted document text configured by the formatted document text configuration unit on the screen 36.

図2は、データベース12に登録された整形モデル(登録済みモデル)31の構成を示す。   FIG. 2 shows the configuration of the shaping model (registered model) 31 registered in the database 12.

整形モデル31はX軸、Y軸構成からなる表形式で表現できる。X軸には整形モデル属性である整形モデル特徴項目が設定され、Y軸には文書名および文書名に関連した整形モデル例が設定される。   The shaping model 31 can be expressed in a tabular format consisting of X-axis and Y-axis configurations. A shaping model feature item, which is a shaping model attribute, is set on the X axis, and a shaping model example related to the document name and the document name is set on the Y axis.

整形モデル属性として、文章の構成である“章”、“節”および“項”の階層属性、文章の構成付帯である文字列、行の属性、ページ書式の属性、次ページの属性、本文以外のページの書式の属性(頁番号、柱文)、加算、削減、補正についての置換え属性および特異文章についての記録済み文字効果属性が設定される。   Formatting model attributes include “chapter”, “section” and “section” hierarchy attributes that are sentence structures, text strings that are incidental to sentence structures, line attributes, page format attributes, next page attributes, and other than body text The page format attributes (page number, column sentence), replacement attributes for addition, reduction, correction, and recorded character effect attributes for unique sentences are set.

文書名としては、例えば取扱説明書、検査報告書が設定され、取扱説明書についての整形モデルとして例えば据付編、解析編、サービスマン編が設定され、検査報告書についての整形モデルとして、例えば評価編(1)、評価編(2)が設定される。   As the document name, for example, an instruction manual and an inspection report are set. For example, an installation edition, an analysis edition, and a service man edition are set as a shaping model for the instruction manual. For example, an evaluation is given as a shaping model for the inspection report. Part (1) and evaluation part (2) are set.

文章の構成は、“章”、“節”および“項”の階層属性とされる。この場合、項の下位についても設定可能であるが、本例の場合、項に含めて考えてよい。   The composition of the sentence is a hierarchical attribute of “chapter”, “section”, and “section”. In this case, the lower order of the term can be set, but in this example, it may be included in the term.

各種文字列情報としては、例えば章、節、項などのタイトルや見出し、強調した文字、文章がある。それに対応して文章構成についての属性は、文字列が見出し、その他のワードのいずれかであるか、さらに見出しである場合には、それが章(大見出し)、節(中見出し)、項(小見出し)で規定される。   Examples of various character string information include titles and headings such as chapters, sections, and sections, emphasized characters, and sentences. Correspondingly, the attribute of the sentence structure is that if the character string is a heading, another word, or even a heading, it is a chapter (major heading), section (medium heading), section ( Subheading).

文章の構成を基本属性として、文字の列、行の属性、ページの属性、改ページの属性、本文以外の書式の属性、置換え属性あるいは/および記録済み文字効果属性が付帯として設定され得る。これらの属性の内容は図2に示す通りである。   A text string, a line attribute, a page attribute, a page break attribute, a format attribute other than the body text, a replacement attribute, and / or a recorded character effect attribute can be set as an appendage with the composition of the sentence as a basic attribute. The contents of these attributes are as shown in FIG.

図3は、他のデータベースの例を示す。文章の構成属性について相違があるが、基本的には図2に示す例と同じである。   FIG. 3 shows another database example. Although there is a difference in the composition attribute of the sentence, it is basically the same as the example shown in FIG.

図4は、クライアント文書テキスト41からベタ書き文書テキスト42に第一の変換ルール32を用いて変換し、ベタ書き文書テキスト42を第二の変換ルール33を用いて整形文書テキスト43に変換している様子を示す図である。第一の変換ルール32および第二の変換ルール33はデータベース12に格納され、演算処理手段11(図1)によって演算処理のために参照される。文書データの入力と共に、整形モデルが指定される。   FIG. 4 shows the conversion from the client document text 41 to the solid document text 42 using the first conversion rule 32, and the solid document text 42 is converted to the formatted document text 43 using the second conversion rule 33. FIG. The first conversion rule 32 and the second conversion rule 33 are stored in the database 12 and are referred to for arithmetic processing by the arithmetic processing means 11 (FIG. 1). A shaping model is specified along with the input of document data.

図5は、図4に示す例についての他の例を示しており、ベタ書き状態で入力されるが、任意スタイルの一つであると考えると、基本的には図4に示す例と同じである。   FIG. 5 shows another example of the example shown in FIG. 4, which is input in a solid writing state, but is basically the same as the example shown in FIG. 4 when considered as one of arbitrary styles. It is.

上述したように、クライアント文書テキスト構成手段によって、入力された文章データが階層構成からなる文書である場合に、階層構成からなる文書構造が任意スタイルのクライアント文書テキスト41として構成される。この場合は図6の(a)、(b)に示すように任意の形でのクライアント文書テキストは、クライアント文書構造認識手段によって、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造が認識される。   As described above, when the input text data is a document having a hierarchical structure by the client document text composing means, the document structure having the hierarchical structure is configured as the client document text 41 having an arbitrary style. In this case, as shown in FIGS. 6A and 6B, the client document text in an arbitrary form is analyzed by the client document structure recognizing means by analyzing the client document structure in which the hierarchical sentence structure is an arbitrary style. Thus, a client document structure having a hierarchical structure is recognized.

図4、図5に示すように、クライアント文書構造認識手段は、階層構成の各階層の文書を解析して、文書の文頭および文書の文尾にタグ(T)を付与し、双方のタグによって1つの文書として認識するようにしている。図4、図5において、文頭のタグについてはTを四角で囲ったマークで、文尾のタグについては、改行マークの後に示したTを四角で囲ったマークで示している。勿論、Tに代わるマークが使用可能である。また、クライアント文書構造認識手段は、前記2つのタグによって規定された1つの文書の中に特異構成の文書がある時に、この特異文書の文頭および文尾に別のタグを付与し特異文書として認識することができるようにしている。   As shown in FIGS. 4 and 5, the client document structure recognizing unit analyzes the document of each layer of the hierarchical structure, and gives a tag (T) to the beginning of the document and the end of the document. The document is recognized as one document. 4 and 5, the tag at the beginning of the sentence is indicated by a mark surrounded by a square, and the tag at the end of the sentence is indicated by a mark surrounded by a square after the line feed mark. Of course, a mark in place of T can be used. The client document structure recognizing means recognizes a unique document by assigning another tag to the head and tail of the unique document when there is a unique document in one document defined by the two tags. To be able to.

ベタ書き文書テキスト構成手段によって、データベースに格納された第一の変換ルールが用いられ、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストが構成される。   The first conversion rule stored in the database is used by the solid document text composing means, and the client document structure in an arbitrary style is used regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. A solid document text of a specific style converted to a solid document structure that is simply arranged in a flat form is constructed.

図7にベタ書き文書テキストの属性を示す。図7(a)はベタ書き文書テキストの属性について、文字列、行の属性およびページ書式の属性について示し、図7(b)、(c)は2つの例について文字列方向、行方向についてのベタ書き文書テキストにタグを付与する例について示す。
特定スタイルのベタ書き文書構造を有するベタ書き文書テキストは、ベタ書き文書構造認識手段によって、階層構成からなり、文書構造の認識されたベタ書き文書構造が解析されて、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造が認識される。
FIG. 7 shows the attributes of the solid document text. FIG. 7A shows the character string, line attribute, and page format attribute for the solid document text attribute. FIGS. 7B and 7C show the character string direction and the line direction for two examples. An example of adding a tag to a solid document text will be described.
A solid document text having a solid document structure of a specific style is composed of a hierarchical structure by a solid document structure recognition means, and the solid document structure in which the document structure is recognized is analyzed to form a hierarchical structure. A solid document structure of a specific style in which is recognized is recognized.

図8に、ベタ書き文書テキストについての文書構造認識例(a)、(b)を示す。
クライアント文書構造認識手段によるタグ付与に代えて、ベタ書き文書構造認識手段によってタグを付与するようにしてもよい。この場合に、別のタグを付与する時には、データベース12に特異文字、文章を記憶させておいて、該当のベタ書き文章についてタグを付与することを行う。タグの付与は、クライアント文書テキストについて行うのがベタ書き文書テキストについて行うのに比べて望ましい。いずれにしてもベタ書き文書構造認識手段は、双方のタグによって1つの文書として認識することになる。別のタグが付与されている場合も同様である。
FIG. 8 shows document structure recognition examples (a) and (b) for a solid document text.
Instead of tagging by the client document structure recognition unit, a tag may be added by the solid document structure recognition unit. In this case, when assigning another tag, the unique character and sentence are stored in the database 12, and the tag is assigned to the corresponding solid sentence. It is preferable to add a tag to the client document text as compared to the solid document text. In any case, the solid document structure recognizing means recognizes one document by both tags. The same applies when another tag is assigned.

図4、図5に示すように、整形テキスト構成手段によって、データベースに格納された第二の変換ルール33を用いて、認識された特定スタイルのベタ書き文書構造が登録済み整形モデルの属性に従って、整形された整形文書構造に変換されて整形スタイルの整形文書テキストが構成される。   As shown in FIG. 4 and FIG. 5, by using the second conversion rule 33 stored in the database by the formatted text composing means, the solid document structure of the recognized specific style is determined according to the attributes of the registered formatted model. It is converted into a formatted document structure to form a formatted document text in a formatting style.

上述したクライアント文書テキストが構成されるに際して、文書データの入力の際に、操作者は目的とする特定の整形モデルを指定し、整形モデルの属性に近似した構造で文書データの入力を行う。従って、ベタ書き文書テキストから整形文書テキストへの変換は迅速、スムーズになされることになる。   When the above-described client document text is constructed, when inputting the document data, the operator designates a specific specific shaping model and inputs the document data with a structure approximate to the attributes of the shaping model. Therefore, the conversion from the solid document text to the formatted document text is performed quickly and smoothly.

図4、図5において、クライアント文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成される。
クライアント文書構造認識手段が、双方のタグから文字列および行からなる構造を認識する。
4 and 5, the client document structure is composed of a character string and a line structure including “chapter”, “section”, and “section”.
The client document structure recognizing means recognizes a structure composed of a character string and a line from both tags.

ベタ書き文書テキスト構成手段が、文字列および行構造からなるベタ書き文書テキストを構成する。図9に、ベタ書き文書テキストを画面表示した(a)、(b)、(c)の例について示す。
ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析して双方のタグが付与されたベタ書き文字列および行構造を認識する。
整形テキスト構成手段が、双方のタグが付与されたベタ書き文字列および行構造を整形モデルに従って、整形された文字列および行構造に変換する。
The solid document text composing means constructs a solid document text composed of a character string and a line structure. FIG. 9 shows examples of (a), (b), and (c) in which a solid document text is displayed on the screen.
The solid writing structure recognizing means analyzes the solid writing character string and the line structure made up of “chapter”, “section”, and “item” to recognize the solid writing character string and the line structure to which both tags are attached.
The formatted text composing means converts the solid-written character string and line structure to which both tags are attached into the shaped character string and line structure according to the formatting model.

図10に、タグの属性について例示する。図10(a)は、文書の構成タグについて、図10(b)本文用タグについて、図10(c)は表用タグについて、そして図10(d)は図面用タグについて説明する。例えば、図10(a)において、変換内容が章、節、項の組み合わせにタグが付着されると、変換後にあっては、第1章、1.1.1・・・のように表示されることになる。他の例についても同様に変換される。なお、図10(c)におけるセルは表の1つのマスを表わしている。   FIG. 10 illustrates the tag attributes. FIG. 10A illustrates a document configuration tag, FIG. 10B illustrates a body tag, FIG. 10C illustrates a table tag, and FIG. 10D illustrates a drawing tag. For example, in FIG. 10A, when a tag is attached to a combination of chapters, sections, and terms in the conversion content, after conversion, it is displayed as Chapter 1, 1.1.1. Will be. Other examples are similarly converted. In addition, the cell in FIG.10 (c) represents one square of a table | surface.

図11に、整形文書テキストのページ書式属性を示し、図11(a)は奇数ページ書式、図11(b)は偶数ページ書式の例を示す。
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が単にフラットに並べられる特定のベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、整形モデルに従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法、および整形モデルが、文字行および列が定められたモデルである。これらのルールについて説明する。
FIG. 11 shows page format attributes of the formatted document text, FIG. 11A shows an example of an odd page format, and FIG. 11B shows an example of an even page format.
The first conversion rule is a string and line attribute conversion method that converts a character string and a column structure to a specific solid writing structure that is simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is an attribute conversion method to a character string and a line formatted according to the “chapter”, “section” and “term” of the solid writing structure according to the formatting model, and the formatting The model is a model in which character lines and columns are defined. These rules will be described.

図12は、データベース12の詳細内容を示し、整形モデル属性である整形モデル特徴項目の詳細を示す。内容については図12の記載事項が参照される。   FIG. 12 shows the detailed contents of the database 12 and shows the details of the shaping model feature item which is the shaping model attribute. Refer to the description of FIG. 12 for the content.

図13は、クライアント文書テキストをベタ書き文書テキストへ変換する第一の変換ルールについて示す。このルールによれば、文字列、行の属性、ページの書式属性に従ってそれぞれ変換がなされる。文字列にその一部として表、図面が加えられる。   FIG. 13 shows a first conversion rule for converting client document text into solid document text. According to this rule, conversion is performed according to the character string, line attribute, and page format attribute. A table and a drawing are added as part of the character string.

このルールによれば、任意スタイルのクライアント文書構造は、階層構成からなる文書構造が指定される整形モデルに関係なく、単にフラット状に並べられるベタ書き文書構造に変換される。   According to this rule, the client document structure of an arbitrary style is converted into a solid document structure that is simply arranged in a flat form, regardless of the formatting model in which the document structure having a hierarchical structure is specified.

具体的には、第一の変換ルールは、
設定済み文字の大きさを統一する
設定済み書体を統一する
設定済み書体の強調なくす
設定済み行の間隔を統一する
設定済み文頭、文末位置、揃え、インデント、タブを解除する
設定済みの1つの段落内複数行における2行目以降の文頭位置の字下げをなくす
設定済みの改ページ設定をなくす
ことを定める文章構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法である。また、第一の変換ルールのページの書式の属性変換方法が、
1行の文字数、1ページの行数の設定を解除する
用紙の大きさ、方向設定を解除する
変換方法を備える。
Specifically, the first conversion rule is
Unify the size of the set type Unify the typeface that has been set Unset emphasis on the set type Unify the spacing between the set lines Preset sentence, end of sentence position, alignment, indent, one set paragraph to release tabs This is an attribute conversion method for converting a sentence structure, a character string and line attributes, and a page format attribute that determine that a set page break setting that eliminates indentation at the second and subsequent lines in a plurality of lines is eliminated. Also, the attribute conversion method of the page format of the first conversion rule is
There is a conversion method for canceling the setting of the number of characters per line and the setting of the paper size and direction for canceling the setting of the number of lines per page.

図14は、クライアント文書テキストからベタ書き文書テキストへの変換の事例を(a)、(b)で示す。   FIG. 14 shows an example of conversion from client document text to solid document text by (a) and (b).

図15は、ベタ書き文書テキストを整形文書テキストへ変換する第二の変換ルールについて示す。このルールによれば、文字列、行の属性、ページの書式属性に従ってそれぞれ変換がなされる。文字列にその一部として表、図面が加えられる。このルールによれば、認識された特定スタイルのベタ書き文書構造は、登録済み整形モデルの属性に従って、整形された整形文書構造に変換される。更に、このルールによれば、基本変形された整形文書構造は更に指定された特定の整形モデルの属性に従って特定の整形テキストに変換される。具体的には、第二の変換ルールは、
各文書構造にかかる本文文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造文字の大きさ、書体、強調指示が登録および選択されたものに適用される
各文書構造にかかる本文行の間隔が登録および選択されたものに適用される
各文書構造行の間隔が登録および選択されたものに適用される
各文章の文頭、文尾位置および揃え、インデントにタブ設定が適用される
各文章の1つの段落内複数行における2行目以降の文頭位置を設定する字下げが適用される
“章”、“節”および“項”の階層に下位階層が適用される
組み合わせおよび文字の置換えとして、半角化、補足及び統一化が適用される
最終行で改ページされることを定めるページの書式の属性を変換する
を定める文書構成、文字列および行の属性およびページ書式の属性を変換する属性変換方法である。また、第二の変換ルールのページの書式の属性変換方法が、
上下左右の余白が登録および選択されたものに適用される
ページ、柱文が登録および選択された形式に適用される
1ページの行数および1行の文字数が登録および選択されたものに適用される
用紙方向が登録および選択されたものに適用される
変換方法を備える。
FIG. 15 shows a second conversion rule for converting a solid document text into a formatted document text. According to this rule, conversion is performed according to the character string, line attribute, and page format attribute. A table and a drawing are added as part of the character string. According to this rule, the recognized solid document structure of a specific style is converted into a formatted formatted document structure according to the attributes of the registered formatting model. Further, according to this rule, the basic deformed formatted document structure is further converted into specific formatted text according to the attribute of the specified specific formatting model. Specifically, the second conversion rule is
Each of the text structure font sizes, typefaces, and emphasis instructions applied to those registered and selected for each document structure. Applies to the document structure line interval that is registered and selected for the document structure. Applies to each document structure line interval that is registered and selected. The lower hierarchy is applied to the “chapter”, “section”, and “section” hierarchies where the indentation that sets the beginning of the second and subsequent sentences in multiple lines within one paragraph of each sentence to which the setting is applied is applied. As a combination and character replacement, the document structure that defines the conversion of page format attributes that specify page breaks at the last line to which half-width, supplement, and unification is applied, string and line attributes, and It is an attribute conversion method for converting the attributes of the over-di format. Also, the attribute conversion method of the page format of the second conversion rule is
Applies to pages where the top, bottom, left, and right margins are registered and selected, and those where the number of lines per page and the number of characters per line are applied to registered and selected forms. Conversion method applied to the registered and selected paper orientation.

図16は、ベタ書きテキストから整形文書テキストへの変換の事例を(a)、(b)で示す。   FIGS. 16A and 16B show an example of conversion from solid text to formatted document text by (a) and (b).

このように、任意スタイルのクライアント文書テキストはページ書式属性を備え、第一の変換ルールはクライアント文書テキストが備えるページ書式属性を解除するルールでもある。第二の変換ルールは整形モデルに従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあり、整形文書テキストはページ書式の属性を備える。   As described above, the client document text of an arbitrary style has a page format attribute, and the first conversion rule is also a rule for canceling the page format attribute of the client document text. The second conversion rule is also a rule for adding a page format attribute to the solid document structure according to the formatting model, and the formatted document text has a page format attribute.

整形文書テキスト構成手段は、特定スタイルのベタ書き文書構造を整形モデルに従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成するときに、双方のタグによって規定された文書ごとに構成する。   The formatted document text constructing means converts the formatted text structure of a specific style into a formatted formatted document structure according to the formatting model and constructs the formatted text of the formatted style for each document defined by both tags. Constitute.

図17は、本発明の実施例のフローチャートを示す。
フローは、整形モデル登録フローおよび整形文書構成・表示フローからなる。
FIG. 17 shows a flowchart of an embodiment of the present invention.
The flow includes a shaping model registration flow and a shaping document configuration / display flow.

整形モデル登録フローは、ステップS1からS5で構成される。画面に、整形モデルの属性を示す整形モデル特徴項目が表示され(S1)、操作者によって整形モデル特徴項目についての項目内容が指定され(S2)、これによって整形モデル特徴項目が組み合わされて整形モデルの属性が決定される(S3)。   The shaping model registration flow includes steps S1 to S5. A shaping model feature item indicating the attributes of the shaping model is displayed on the screen (S1), and an item content about the shaping model feature item is designated by the operator (S2), and the shaping model feature item is combined thereby, and the shaping model is combined. Are determined (S3).

整形項目の組み合わされた整形モデルの登録指示が操作者によってなされ(S4)、演算処理手段によってデータベースへの整形モデルの登録がなされ(S5)、登録済み整形モデルとしての出力が可能とされる。
整形文書テキスト構成・表示フローは、ステップS11からS21で構成される。
The operator gives an instruction to register the shaping model in which the shaping items are combined (S4), and the shaping model is registered in the database by the arithmetic processing means (S5), and output as a registered shaping model is possible.
The formatted document text composition / display flow is composed of steps S11 to S21.

新たに、整形モデルに従って整形モデルを構成しようとする操作者は、データベースに登録された整形モデルを呼び出し、当該整形モデルを指定する。データベースに多くの整形モデルが登録されているような場合には、順次整形モデルを画面に表示して行って、操作者が目的としている特定の整形モデルに最も近似した整形モデルを選択し、特定する。データベースに近似した整形モデルがないような場合には、既存の文書テキストを読み込んで、整形モデルの属性を特定し、整形モデルとして登録し、この整形モデルを画面上で指定することを行う。データベースが特定のサーバ内に構築され、特定の操作者のみが、特定のデータベースにアプローチして利用できるようにしてもよいし、数多くの整形モデルを一般に公開して誰でも利用できるようにしてもよい。   A new operator who intends to configure a shaping model according to the shaping model calls the shaping model registered in the database and designates the shaping model. When many shaping models are registered in the database, the shaping models are sequentially displayed on the screen, and the shaping model that is closest to the specific shaping model intended by the operator is selected and specified. To do. If there is no shaping model that approximates the database, the existing document text is read, the attributes of the shaping model are specified, registered as a shaping model, and this shaping model is designated on the screen. The database may be built in a specific server and only a specific operator may approach and use the specific database, or a number of formatting models may be made publicly available to anyone. Good.

いずれにしても、ステップS5で登録された整形モデルの一つが画面に表示され、目的とする特定の整形モデルとして指定される。次いで、文書データが入力される(S12)。文書データを入力してから整形モデルを指定するようにしてもよい。   In any case, one of the shaping models registered in step S5 is displayed on the screen and designated as the specific shaping model of interest. Next, document data is input (S12). The shaping model may be designated after inputting the document data.

クライアント文書テキスト構成手段によってクライアント文書テキストが構成され、クライアント文書構造認識手段によってクライアント文書構造が認識される(S13)。タグ設定のルールが適用され(S14)、各文章についてタグが設定される(S15)。   The client document text is composed by the client document text composing means, and the client document structure is recognized by the client document structure recognizing means (S13). A tag setting rule is applied (S14), and a tag is set for each sentence (S15).

第一の変換ルールが適用され(S16)、ベタ書き文書テキスト構成手段によってベタ書き文書テキストが構成される(S17)。ベタ書き文書構造認識手段によってベタ書き文書テキストについてベタ書き文書構造が認識される(S18)。このベタ書き文書構造には、タグ設定による文章構造の“章”、“節”および“項”からなる階層構造が含まれる。タグ設定は、ベタ書き文書テキストについて行ってもよいが、S15の段階で設定するのが望ましい。整形テキスト構成手段に、第二の変換ルールが適用され(S19)、設定タグおよび第二の変換ルールに従って階層テキストに変換され、特定の整形モデルの属性に従って目的の整形文書構造を備えたテキストとして構成される(S21)。構成された整形文書テキストは、整形文書テキストとして文書表示手段の画面に表示され、利用に供される(S22)。   The first conversion rule is applied (S16), and the solid document text is constituted by the solid document text composing means (S17). The solid document structure recognition unit recognizes the solid document structure for the solid document text (S18). This solid document structure includes a hierarchical structure consisting of “chapter”, “section”, and “section” of the text structure by tag setting. Although the tag setting may be performed for the solid document text, it is desirable to set the tag in step S15. The second conversion rule is applied to the formatted text composing means (S19), converted into hierarchical text according to the setting tag and the second conversion rule, and the text having the desired formatted document structure according to the attribute of the specific formatting model Configured (S21). The configured formatted document text is displayed as a formatted document text on the screen of the document display means and used (S22).

以上のフローによれば、文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段と、文書整理結果を表示する文書表示手段を備えた文書整形装置によって、次に示すステップを備えた文書整形方法が構成される。
文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段と、文書整理結果を表示する文書表示手段を備えた文書整形装置による文書整形方法において、
文書データ入力手段によって、文書データを入力する。
文書表示手段に表示された整形モデルを指定する整形モデル指定手段と、
クライアント文書テキスト構成手段によって、入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成する。
According to the above flow, by the document shaping device including the document shaping means for shaping the document including the attribute indicating the document shaping rule according to the rule corresponding to the attribute, and the document display means for displaying the document organization result, A document shaping method including the following steps is configured.
In a document shaping method by a document shaping device comprising a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute, and a document display means for displaying a document organization result,
The document data is input by the document data input means.
A shaping model designation means for designating a shaping model displayed on the document display means;
The client document text composing means configures a document whose input document data has a hierarchical structure as an arbitrary style client document text having a hierarchical structure.

クライアント文書構造認識手段によって、クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識する。   The client document structure recognizing means analyzes the client document structure having a hierarchical structure by analyzing the client document structure having an arbitrary style for the client document text.

ベタ書き文書テキスト構成手段によって、データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成する。
ベタ書き文書構造認識手段によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識する。
By using the first conversion rule stored in the database by the solid-written document text composing means, the client document structure in an arbitrary style can be changed regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. It constructs a solid document text of a specific style converted into a solid document structure that is simply arranged in a flat form.
The solid document structure recognizing means has a hierarchical structure for a solid document text having a solid document structure of a specific style. Recognize a solid document structure of a specific style.

整形文書テキスト構成手段によって、データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する。
そして、整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成し、文書表示手段は、整形文書テキスト構成手段によって構成された特定の整形文書テキストを画面に表示する
ことからなる文書整形方法が構成される。
Using the second conversion rule stored in the database, the formatted document text composing means converts the recognized solid document structure of a specific style into a formatted document structure according to the attributes of the registered formatting model. Configure formatting text in formatting style.
Then, the formatted document text composing means configures the specific formatted document text according to the specified specific formatting model attribute, and the document display means displays the specific formatted document text configured by the formatted document text composing means on the screen. A document shaping method consisting of:

本発明の実施例の全体構成を示す図。The figure which shows the whole structure of the Example of this invention. 本実施例に使用するデータベースの内容を示す図。The figure which shows the content of the database used for a present Example. 図2に示すデータベースの他の例を示す図。The figure which shows the other example of the database shown in FIG. 本実施例の変換方法を説明する図。The figure explaining the conversion method of a present Example. 図4に示す変換方法の他の例を示す図。The figure which shows the other example of the conversion method shown in FIG. クライアント文書構造認識を示す図。The figure which shows client document structure recognition. ベタ書き文書テキスト属性を示す図。The figure which shows a solid writing document text attribute. ベタ書き文書構造認識を示す図。The figure which shows solid writing document structure recognition. ベタ書き文書テキスト画面表示例を示す図。The figure which shows the example of a solid writing document text screen display. タグの属性を示す図。The figure which shows the attribute of a tag. 整形文書テキストのページの書式属性を示す図。The figure which shows the format attribute of the page of formatted document text. データベースに格納された整形モデルの属性を示す図。The figure which shows the attribute of the shaping model stored in the database. ベタ書き文書テキストに変換する第一変換ルールを説明する図。The figure explaining the 1st conversion rule converted into a solid document text. ベタ書き文書テキストへの変換事例を示す図。The figure which shows the conversion example to a solid writing document text. 整形文書テキストに変換する第二の変換ルールを説明する図。The figure explaining the 2nd conversion rule converted into formatted document text. 整形文書テキストへの変換事例を示す図。The figure which shows the conversion example to the formatted document text. 本発明の実施例のフローチャート図。The flowchart figure of the Example of this invention.

符号の説明Explanation of symbols

1…文書整形手段、2…文書表示手段、11…演算処理手段、12…データベース、21…整形モデル処理、22…文書データ入力、23…クライアント文書テキスト構成、24…クライアント文書構造認識、25…タグ設定、26…ベタ書き文書テキスト構成、27…ベタ書き文書構造認識、28…整形文書テキスト構成、29…整形文書テキスト表示、31…登録済みモデル、32…第一の変換ルール、33…第二の変換ルール、34…タグ付与ルール、35…各種文書テキスト、36…画面、37…文書データ、38…整形モデルデータ、41…クライアント文書テキスト、42…ベタ書き文書テキスト、43…整形文書テキスト、100…文書整形装置。   DESCRIPTION OF SYMBOLS 1 ... Document shaping means, 2 ... Document display means, 11 ... Arithmetic processing means, 12 ... Database, 21 ... Formatting model processing, 22 ... Document data input, 23 ... Client document text structure, 24 ... Client document structure recognition, 25 ... Tag setting, 26 ... solid document text structure, 27 ... solid document structure recognition, 28 ... formatted document text structure, 29 ... formatted document text display, 31 ... registered model, 32 ... first conversion rule, 33 ... first Two conversion rules, 34 ... tag assignment rules, 35 ... various document texts, 36 ... screen, 37 ... document data, 38 ... formatted model data, 41 ... client document text, 42 ... solid document text, 43 ... formatted document text , 100 ... Document shaping apparatus.

Claims (8)

文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置において、
文書データを入力する文書データ入力手段と、
整形モデルを指定する整形モデル指定手段と、
入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成するクライアント文書テキスト構成手段と、
クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識するクライアント文書構造認識手段と、
データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成するベタ書き文書テキスト構成手段と、
特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識するベタ書き文書構造認識手段と、
データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成する整形文書テキスト構成手段と、
第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納するデータベースを備え、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成すること
を特徴とする文書整形装置。
In a document shaping apparatus having a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute,
Document data input means for inputting document data;
A shaping model specifying means for specifying a shaping model;
Client document text composing means for composing an input document data having a hierarchical structure as a client document text of an arbitrary style of a sentence structure having a hierarchical structure;
A client document structure recognizing means for recognizing a client document structure having a hierarchical structure by analyzing a client document structure having an arbitrary style for a client document text.
Using the first conversion rule stored in the database, the client document structure of an arbitrary style is simply written in a flat form regardless of the formatting model attribute of the formatting model in which the hierarchical document structure is specified. A solid document text composing means for composing a specific style solid document text converted into a document structure;
A solid document text having a specific style of a solid-written document structure is composed of a hierarchical structure, and the solid-written document structure in which the document structure is recognized is analyzed. A solid document structure recognition means for recognizing a written document structure;
Using the second conversion rule stored in the database, convert the recognized solid document structure of a specific style into a formatted formatted document structure according to the attributes of the registered formatting model, and configure the formatting text of the formatting style Formatted text formatting means to
The first conversion rule is a rule that determines the attribute conversion method for a document that converts text into a uniform solid text that is simply arranged in a flat form regardless of the attributes of the specified shaping model. A second conversion rule that defines a sentence attribute conversion method for converting to a formatted model sentence in accordance with the attributes of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model indicating the shaping model attribute It has a database that stores models whose model features are predetermined,
A document shaping apparatus, wherein the formatted document text composing means composes a specific formatted document text according to a specified specific formatting model attribute.
請求項1において、クライアント文書構造認識手段またはベタ書き文書構造認識手段は、階層構成の各階層の文書を解析して、文書の文頭、または文章の文頭および文書の文尾にタグを付与し、ベタ書き文書構造認識手段は、双方のタグによって1つの文書として認識することを特徴とする文書整形装置。   The client document structure recognizing unit or the solid document structure recognizing unit according to claim 1, analyzes the document of each layer of the hierarchical structure, and assigns a tag to the beginning of the document, or the beginning of the sentence and the end of the document, A solid-state document structure recognition means for recognizing a single document by both tags. 請求項2において、クライアント文書構造認識手段またはベタ書き文書構造認識手段は、1つまたは2つのタグによって規定された1つの文書の中に特異構成の文書がある時に、この特異文書の文頭、または文章の文頭および文尾に別のタグが付与されて特異文書として認識することを特徴とする文書整形装置。   3. The client document structure recognizing unit or the solid document structure recognizing unit according to claim 2, wherein when there is a unique document in one document defined by one or two tags, A document shaping device characterized by being recognized as a unique document with a different tag attached to the beginning and end of a sentence. 請求項2または3において、クライアント文書構造は、“章”、“節”および“項”からなる文字列および行構造から構成され、
クライアント文書構造認識手段が、タグから文字列および行からなる構造を認識し、
ベタ書き文書構成手段が、文字列および行構造からなるベタ書き文書テキストを構成し、
ベタ書き構造認識手段が“章”、“節”および“項”からなるベタ書き文字列および行構造を解析してタグが付与されたベタ書き文字列および行構造を認識し、
整形テキスト構成手段が、タグが付与されたベタ書き文字列および行構造を整形モデルに従って、整形された文字列および行構造に変換し、
第一の変換ルールが“章”、“節”および“項”に関係なく一律に文字列および列構造が単にフラットに並べられる特定のベタ書き構造に変換する文字列および行の属性変換方法を定めるルールであり、第二の変換ルールが、整形モデルに従って、ベタ書き構造の“章”、“節”および“項”に対応して整形された文字列および行への属性変換方法、および整形モデルが、文字行および列が定められたモデルであること、
を特徴とする文字整形装置。
4. The client document structure according to claim 2 or 3, wherein the client document structure is composed of a character string and a line structure including “chapter”, “section”, and “section”.
The client document structure recognition means recognizes the structure consisting of character strings and lines from the tag,
The solid document composition means composes a solid document text composed of a character string and a line structure,
The solid writing structure recognizing means analyzes the solid writing character string and line structure consisting of “chapter”, “section” and “section” to recognize the solid writing character string and line structure to which the tag is attached,
The formatted text composing means converts the solid character string and the line structure to which the tag is attached into the formatted character string and the line structure according to the formatting model,
The first conversion rule is a string and line attribute conversion method that converts a character string and a column structure to a specific solid writing structure that is simply arranged flat regardless of “chapter”, “section”, and “section”. The second conversion rule is an attribute conversion method to a character string and a line formatted according to the “chapter”, “section” and “term” of the solid writing structure according to the formatting model, and the formatting The model is a model with character lines and columns,
Character shaping device characterized by.
請求4において、任意スタイルのクライアント文書テキストはページ書式属性を備え、第一の変換ルールはクライアント文書テキストが備えるページ書式属性を解除するルールでもあり、第二の変換ルールは整形モデルに従って、ベタ書き文書構造にページ書式の属性を付加するルールでもあり、整形文書テキストはページ書式の属性を備えることを特徴とする文書整形装置。   In claim 4, the client document text of any style has a page format attribute, the first conversion rule is also a rule for canceling the page format attribute of the client document text, and the second conversion rule is written in accordance with the formatting model. A document formatting apparatus, which is also a rule for adding a page format attribute to a document structure, and a formatted document text has a page format attribute. 請求項4において、整形文書テキスト構成手段は、特定スタイルのベタ書き文書構造を整形モデルに従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成するときに、タグによって規定された文書ごとに構成することを特徴とする文書整形装置。   5. The formatted document text constructing unit according to claim 4, wherein the formatted document text composing means is defined by the tag when the formatted text of the formatted style is constructed by converting the solid document structure of a specific style into a shaped formatted document structure according to the formatting model. A document shaping apparatus configured for each document. 請求項6に規定する整形文書テキストを構成するときに、請求項5に規定された別のタグによって規定された特異文書について、整形後の文書の該当の個所の文書を特異構成とすることを特徴とする文書整形装置。   When the formatted document text defined in claim 6 is configured, regarding the unique document defined by another tag defined in claim 5, the document in the corresponding part of the formatted document is configured as a unique configuration. A document formatting device. 文書整形のルールを示す属性を含んだ文書を前記属性に対応したルールに従って整形する文書整形手段を備えた文書整形装置による文書整形方法において、
文書データ入力手段によって、文書データを入力し、
整形モデル指定手段によって、整形モデルを指定し、
クライアント文書テキスト構成手段によって、入力された文書データが階層構成からなる文書について、階層構成からなる文章構造の任意スタイルのクライアント文書テキストとして構成し、
クライアント文書構造認識手段によって、クライアント文書テキストについて、階層構成からなる文章構造が任意スタイルのクライアント文書構造を解析して階層構成からなるクライアント文書構造を認識し、
ベタ書き文書テキスト構成手段によって、データベースに格納された第一の変換ルールを用いて、任意スタイルのクライアント文書構造を、階層構成からなる文書構造が指定される整形モデルの整形モデル属性に関係なく、単にフラット状に並べられるベタ書き文書構造に変換された特定スタイルのベタ書き文書テキストを構成し、
ベタ書き文書構造認識手段によって、特定スタイルのベタ書き文書構造を有するベタ書き文書テキストについて、階層構成からなり、文書構造が認識されたベタ書き文書構造を解析して、階層構成からなり、文章構造が認識された特定スタイルのベタ書き文書構造を認識し、
整形文書テキスト構成手段によって、データベースに格納された第二の変換ルールを用いて、認識された特定スタイルのベタ書き文書構造を登録済み整形モデルの属性に従って、整形された整形文書構造に変換して整形スタイルの整形テキストを構成し、
データベースに、第一の変換ルールであって、指定される整形モデルの整形モデルの属性に関係なく一律に文章が、単にフラット状に並べられた特定のベタ書き文章に変換する文書の属性変換方法を定めるルール、第二の変換ルールであって、整形モデルの属性に従って、かつ階層構成に対応して整形モデル文章へ変換する文章属性変換方法を定めるルール、および整形モデルであって、整形モデル属性が示す整形モデル特徴が予め定められたモデルを格納し、
整形文書テキスト構成手段は、指定された特定の整形モデル属性に従って特定の整形文書テキストを構成すること
を特徴とする文書整形方法。
In a document shaping method by a document shaping device having a document shaping means for shaping a document including an attribute indicating a document shaping rule according to a rule corresponding to the attribute,
Enter the document data by the document data input means,
Specify the shaping model by the shaping model designation means,
By the client document text composing means, the input document data is configured as a client document text of an arbitrary style with a sentence structure consisting of a hierarchical structure, with respect to a document having a hierarchical structure,
The client document structure recognizing means recognizes the client document structure consisting of a hierarchical structure by analyzing the client document structure in which the hierarchical structure of the client document text is an arbitrary style,
By using the first conversion rule stored in the database by the solid-written document text composing means, the client document structure in an arbitrary style can be changed regardless of the formatting model attribute of the formatting model in which the document structure consisting of the hierarchical structure is specified. Construct a solid document text of a specific style converted into a solid document structure that is simply arranged flatly,
The solid document structure recognizing means has a hierarchical structure for a solid document text having a solid document structure of a specific style. Recognizes the structure of a solid document with a specific style
Using the second conversion rule stored in the database, the formatted document text composing means converts the recognized solid document structure of a specific style into a formatted document structure according to the attributes of the registered formatting model. Compose formatting style formatting text,
Attribute conversion method for documents, which is the first conversion rule in the database, and the text is uniformly converted into a specific solid text arranged in a flat shape regardless of the shaping model attribute of the specified shaping model A second conversion rule, a rule for determining a sentence attribute conversion method for converting to a formatted model sentence according to the attribute of the shaping model and corresponding to the hierarchical structure, and a shaping model, the shaping model attribute Stores a model whose shaping model features indicated by
A document formatting method, wherein the formatted document text composing means constructs a specific formatted document text according to a specified specific formatting model attribute.
JP2008294857A 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method Expired - Fee Related JP4474670B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008294857A JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008294857A JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Publications (2)

Publication Number Publication Date
JP2010122829A true JP2010122829A (en) 2010-06-03
JP4474670B2 JP4474670B2 (en) 2010-06-09

Family

ID=42324126

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008294857A Expired - Fee Related JP4474670B2 (en) 2008-11-18 2008-11-18 Document shaping apparatus and document shaping method

Country Status (1)

Country Link
JP (1) JP4474670B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457659A (en) * 2019-07-05 2019-11-15 中国平安人寿保险股份有限公司 Clause document structure tree method and terminal device

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303571A (en) * 1992-04-24 1993-11-16 Casio Comput Co Ltd Document processor
JPH10334087A (en) * 1998-03-23 1998-12-18 Canon Inc Document processing method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05303571A (en) * 1992-04-24 1993-11-16 Casio Comput Co Ltd Document processor
JPH10334087A (en) * 1998-03-23 1998-12-18 Canon Inc Document processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457659A (en) * 2019-07-05 2019-11-15 中国平安人寿保险股份有限公司 Clause document structure tree method and terminal device
CN110457659B (en) * 2019-07-05 2023-07-25 中国平安人寿保险股份有限公司 Clause document generation method and terminal equipment

Also Published As

Publication number Publication date
JP4474670B2 (en) 2010-06-09

Similar Documents

Publication Publication Date Title
JP2006506713A (en) Iterative method for assigning elements and apparatus for assigning elements
WO2006046523A1 (en) Document analysis system and document adaptation system
JP2018028751A (en) Document conversion method and document conversion program
CN112100977B (en) Window local refreshing method, electronic device and storage medium
JP4474670B2 (en) Document shaping apparatus and document shaping method
JP3076348B2 (en) Document shaping apparatus and document shaping method
JP5645481B2 (en) Apparatus, method, and program
JP2000076226A (en) Document data editing system
JP4770285B2 (en) Image processing apparatus and control program therefor
JP2000339307A (en) Typesetting device
JP5589396B2 (en) Layout support device, layout support method, and program
JP4508264B2 (en) Database construction apparatus, database construction method, database construction program, recording medium
JPH05314108A (en) Document editing device
JP3674905B2 (en) Document editing device
WO2015022759A1 (en) Document file generation device, document file generation method, and document file generation program
King Design spaces: The limitations of variability in typeface design
JP4737659B2 (en) Table set database system and table set data creation device
JP2013161375A (en) Edition system
JP2005352880A (en) Xml document creation system
JPH04369073A (en) Menu display method and information processing device
Style Guidelines for Formatting Style and Writing Style
JPS61229161A (en) Documentation and editing device
JPH09123381A (en) Composition style deciding and supporting method
JP2009230423A (en) Template output control device and program
JPH10287015A (en) Electronic sticky note pasting device

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100226

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4474670

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130319

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140319

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees