[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP4756930B2 - ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置 - Google Patents

ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置 Download PDF

Info

Publication number
JP4756930B2
JP4756930B2 JP2005183461A JP2005183461A JP4756930B2 JP 4756930 B2 JP4756930 B2 JP 4756930B2 JP 2005183461 A JP2005183461 A JP 2005183461A JP 2005183461 A JP2005183461 A JP 2005183461A JP 4756930 B2 JP4756930 B2 JP 4756930B2
Authority
JP
Japan
Prior art keywords
image data
data
text
converted
document management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005183461A
Other languages
English (en)
Other versions
JP2007004453A (ja
Inventor
高幸 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005183461A priority Critical patent/JP4756930B2/ja
Priority to US11/473,804 priority patent/US7911629B2/en
Publication of JP2007004453A publication Critical patent/JP2007004453A/ja
Application granted granted Critical
Publication of JP4756930B2 publication Critical patent/JP4756930B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Facsimiles In General (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)

Description

本発明は、画像データを生成する画像形成装置および前記画像データを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置に関する。
従来、ドキュメント管理システムとして、印刷された文字、図形、画像等の原稿をスキャナ装置で読み込むことにより作成された文書の画像データや、ワードプロセッサ等で作成された文書データ等の文書情報に、キーワード等の文書付加情報を関連付けて記憶・保存する文書管理サーバと、これらの情報を検索し、表示や印刷等を行う文書管理クライアントとがネットワークを介して接続された文書管理システムが知られている(特許文献1参照)。
また、印刷システムの中には、情報漏洩の防止や監査を目的として、印刷データおよびログ情報を蓄積することによって、後に、管理者によって検索・閲覧することが可能なものが知られている(特許文献2参照)。
また、文書管理システムで、プリントやスキャンなどの各種ジョブの結果をログデータとして管理するものもあった(特許文献3参照)。
特開平08−202731号公報 特開2004−118243号公報 特開2002−189686号公報
図23はネットワーク文書管理システムの構成例を示す図である。このネットワーク文書管理システムは、文書管理クライアント1700、文書管理サーバ1701、画像転送装置1706およびデジタル複合機1707がネットワーク1708を介して接続された構成を有する。
文書管理サーバ1701は、属性管理サーバ部1702、属性データベースファイル1703、ボリュームサーバ部1704およびボリュームファイル1705から構成される。属性管理サーバ部1702は、画像データや文書サーバを、階層化されたフォルダに格納された文書として管理することができるように、フォルダ、文書、ページの包含関係とこれらの属性を管理するためのデータベース管理システムであるRDBM(Relational Database Management System)を用いて、フォルダ属性、文書属性、ページ属性等の属性情報を属性データベースファイル1703内に記憶している。ボリュームサーバ部1704は、属性管理サーバ部1702を用いてページ毎に対応付けられている実データを管理しており、画像データ、文書データ等の文書情報をボリュームファイル1705内に記憶している。
また、文書管理クライアント1700は、ネットワーク文書管理システムのクライアントであり、文書管理サーバ1701によって管理される文書の検索や閲覧等を行う。この場合、文書管理クライアント1700は、TCP/IPプロトコル上に定義されるSQL(Structured Query Language)プロトコルに従って、属性管理サーバ部1702に各種要求を送信し、その処理結果を属性管理サーバ部1702から受信するとともに、画像データや文書データに対する処理が発生した場合、RPC(Remote Procedure Call)によりボリュームサーバ部1704に各種要求を送信し、その処理結果をボリュームサーバ部1704から受信する。
また、デジタル複合機1707は、コピー、スキャナ、プリンタ、ファクシミリ(FAX)等の複合機能を有する画像形成装置である。このデジタル複合機1707は、コピージョブ、プリントジョブ等の各種ジョブを実行した場合、上記特許文献3では各種ジョブの結果をログデータとして管理していた。
一方、本出願では、ジョブのログ情報とともに、当該ジョブで使用した画像データ(当該画像の内容)を管理できるようにする。このような形態を実現するためには、例えば、ジョブのログ情報とともに、スキャナから読み込んだ画像データあるいはプリンタで印刷した画像データを、ネットワークプロトコル(例えば、FTP)により画像転送装置1706に送信する形態が考えられる。なお、ログ情報は、デバイス名、IPアドレス等のデバイス情報と、ユーザ名、部門ID等のユーザ情報と、ジョブ名、開始/終了日時、ページ数、部数、ジョブの結果等の制御情報とから構成される。そして、画像転送装置1706は、ネットワークプロトコル(例えば、FTP)によりデジタル複合機1707から受信したログ情報および画像データを、予め設定されている格納先フォルダ等の登録設定に従って、文書管理サーバ1701に文書として登録することが考えられる。この画像転送装置1706は、文書管理クライアント1700と同様、文書管理サーバ1701に対し、ログ情報を文書属性として属性管理サーバ部1702に保存し、画像データをボリュームサーバ部1704に保存するように、情報転送制御を行う。
しかしながら、上記ドキュメント管理システムでは、デジタル複合機1707で生成されたジョブの画像データそのものを画像転送装置1706に送信し、文書管理サーバ1701に保存することになるのでデータサイズが大きくなってしまう。例えば、コピージョブやプリントジョブにより生成される画像データが解像度600×600dpiの画像データである場合、その解像度600×600dpiの画像データをそのまま画像転送装置1706に送信し、文書管理サーバ1701に保存することになる。ここで、解像度600×600dpiの画像データは、多値のカラー画像データであっても、2値の白黒画像データであっても、そのデータサイズは大きく、このような大きいデータサイズの画像データを転送する場合、データの送信時間の増大、ネットワーク負荷の増大、あるいは文書管理サーバ1701における記憶装置の使用容量の増大といった問題が生じることになる。
そこで、本発明は、データを受信する情報処理装置側の記憶媒体の使用容量を軽減することができるドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置を提供することを目的とする。また、本発明は、ネットワークを介してデータを転送する際、データの送信時間やネットワークの負荷を軽減することができるドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置を提供することを他の目的とする。
上記目的を達成するために、本発明のドキュメント管理システムは、画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムであって、前記生成された画像データに対して領域分割を行う領域分割手段記生成された画像データに対して前記領域分割手段により行われた領域分割の結果から文字領域を抽出し、前記抽出された文字領域が所定の比率以上であるか否かを判別する判別手段と記判別手段により文字領域が所定の比率以上であると判別された場合、前記画像データの文字認識を行って前記画像データをテキストデータに変換し、前記判別手段により文字領域が所定の比率以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とす
本発明によれば、生成された画像データが所定の条件を満たす場合、画像データをテキストデータに変換し、情報処理装置において、変換されたテキストデータを記憶媒体に登録するので、情報処理装置側の記憶媒体の使用容量を軽減することができる。
また、ネットワークを介して画像データを転送する際、画像データの送信時間やネットワークの負荷を軽減することができる。また、画像データ中の文字領域の大きさに応じて、テキストデータに変換するか否かを決定することができる。また、画像データ中の文字数に応じて、テキストデータに変換するか否かを決定することができる。また、テキストデータに変換する価値のある画像データだけをテキストデータに変換することができる。また、不正なジョブを繰り返し実行しようとする場合、テキストデータへの変換を行わないようにすることで、セキュリティを高めることができる。また、所定の条件を満たさない画像データは、テキストデータへの変換を行わないようにすることで、セキュリティを高めることができる。また、テキストデータへの変換を行わない画像データについても低解像度化することにより、記憶媒体の使用容量を軽減することができる。また、情報の漏洩がなされたジョブを特定することができるようになる。
本発明のドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置の実施の形態について図面を参照しながら説明する。本実施形態のドキュメント管理システムは、ネットワークを介して送受信される文書情報を管理するネットワーク文書管理システムに適用される。ここで、文書情報としては、印刷された文字、図形、画像等の原稿をスキャナ装置で読み込むことにより作成された文書の画像データや、ワードプロセッサ等で作成された文書データ等が挙げられる。
[第1の実施形態]
図1は第1の実施形態におけるネットワーク文書管理システムの構成を示す図である。このネットワーク文書管理システムは、文書管理クライアント装置100、文書管理サーバ装置110およびデジタル複合機130がネットワーク140を介して接続された構成を有する。
文書管理クライアント装置(単に、文書管理クライアントという)100は、文書管理サーバ装置(単に文書管理サーバという)110で管理される文書情報の検索や表示を行うものであり、ユーザインタフェース(UI)部101、クライアント処理部102、およびネットワークI/F103から構成される。ユーザインタフェース(UI)部101は、CRT、液晶等のディスプレイに代表される表示装置、およびキーボードやポインティングデバイス等の入力装置から構成され、文書情報の検索や表示等、文書管理クライアント100の各機能に係わる指示をオペレータから受け付けるとともに、その処理結果などの各種情報をオペレータに提供する。クライアント処理部102は、CPUやメモリ等から構成され、文書情報の検索や表示等、文書管理クライアント100の各機能の処理を行い、文書管理サーバ110に対する処理が発生した場合、ネットワークI/F103を介して文書管理サーバ110に各種要求コマンドを送信し、その応答を受信する。
文書管理サーバ110は、ネットワークI/F111、属性管理サーバ部112、ボリュームサーバ部115およびサービスサーバ部118から構成され、デジタル複合機130から送信されたジョブのログ情報およびコンテンツデータ(ジョブで使用した画像などの内容を示すデータ)を管理する。尚、本実施形態では、属性管理サーバ部112、ボリュームサーバ部115およびサービスサーバ部118は1つのパーソナルコンピュータで構成されているが、ネットワーク140で接続される別々のパーソナルコンピュータで構成されてもよい。
ネットワークI/F111は、ネットワーク140に接続され、TCP/IPなどのネットワークプロトコルの処理を行う。
属性管理サーバ部112は、ジョブのログ情報およびコンテンツデータを、階層化されたフォルダに格納されている文書として管理することができるように、フォルダ、文書、ページの包含関係とこれらの属性などを管理する属性管理サーバ処理部113、および属性記憶部114から構成される。属性管理サーバ処理部113は、CPUやメモリ等から構成され、クライアント処理部102あるいはサービスサーバ部118からネットワークI/F111を介して要求コマンドを受信し、属性記憶部114に対して更新や検索等の処理を行い、その処理結果をクライアント処理部102あるいはサービスサーバ部118に送信する。属性記憶部114は、通常、大容量の記憶装置であるハードディスクドライブ239aから構成され、フォルダ属性、文書属性、ログ情報、ページ属性等を記憶する。
ボリュームサーバ部115は、属性管理サーバ部112でページ毎に対応付けられているコンテンツデータを蓄積して管理するものであり、ボリュームサーバ処理部116およびボリューム記憶部117から構成される。ボリュームサーバ処理部116は、CPUやメモリ等から構成され、クライアント処理部102あるいはサービスサーバ部118からネットワークI/F111を介して要求コマンドを受信し、ボリューム記憶部117に対して更新やデータ取得等の処理を行い、その処理結果をクライアント処理部102あるいはサービスサーバ部118に送信する。ボリューム記憶部117は、通常、大容量の記憶装置であるハードディスクドライブ239aから構成され、コンテンツデータを記憶する。
サービスサーバ部118は、CPUやメモリ等から構成され、デジタル複合機130からネットワークI/F111を介して要求コマンドを受信し、デジタル複合機130から要求された各処理を行い、ジョブのログ情報およびコンテンツデータの登録など、属性管理サーバ部112あるいはボリュームサーバ部115に対する処理が発生した場合、ネットワークI/F111を介して、属性管理サーバ部112あるいはボリュームサーバ部115に各種要求コマンドを送信し、その応答を受信し、この処理結果をデジタル複合機130に送信する。
デジタル複合機130は、コピー、スキャナ、プリンタ、ファクシミリ(FAX)等の複合機能を有する画像形成装置であり、画像入力デバイスとしてのスキャナ部131、画像出力デバイスとしてのプリンタ部132、コントローラユニット133、およびユーザインタフェースとしての操作部134から構成される。コントローラユニット133には、スキャナ部131、プリンタ部132および操作部134が接続される。また、コントローラユニット133は、ネットワーク(LAN)140および公衆回線(WAN)150に接続される。コントローラユニット133は、操作部134からの入力情報に従って、コピージョブ、プリントジョブ等の処理を行い、機器の状態やジョブの状態等の情報を操作部134に提供するとともに、生成されたジョブの画像データおよびログ情報を記憶する。また、コントローラユニット133は、文書管理サーバ110に対する処理が発生した場合、サービスサーバ部118に要求コマンドを送信するとともに、その応答を受信し、文書管理サーバ110から取得した情報を操作部134に提供する。
図2は文書管理サーバ110のハードウェア構成例を示す図である。文書管理クライアント100および文書管理サーバ110は同様の構成を有するので、ここでは文書管理サーバ110だけを示す。CPU231は中央処理装置であり、装置全体の制御および演算処理を行う。ROM232は読み出し専用メモリであり、システム起動プログラム、基本I/Oプログラム、文字コードをビットパターンに変換するための文字パターンデータ(フォントデータ)等を記憶している。RAM233はランダムアクセスメモリであり、CPU231の演算に使用されるデータ、演算結果、表示のために文字コードから変換された文字パターンデータ列や図形データ、イメージデータ等を一時的に記憶する。
キーボード制御部(KBC)234は、キーボード(KB)235からのキー入力データ(文字コードや制御コード)を受け取り、CPU231に伝達する。ディスプレイ制御部(CRTC)236は、RAM233に格納された文字パターンデータ列を読み出してCRT237に転送する。ディスプレイ装置(CRT)237は、ディスプレイ制御部(CRTC)236から文字パターンデータ列、図形データ、イメージデータを受け取り、表示画面に表示する。
ディスク制御部(DKC)238は、外部記憶装置239に対するアクセス制御を行う。外部記憶装置239として、本実施形態では、フロッピー(登録商標)ディスクドライブ(FD)239a、ハードディスクドライブ(HD)239b、CD−ROMドライブ239cが接続される。ハードディスクドライブ239bには、文字パターンデータ(フォントデータ)やフォントデータを読み出してビットマップデータに変換する文字展開処理プログラム、図形データを処理する図形展開処理プログラム、イメージデータを処理するイメージデータ処理プログラム等の他、後述する各種のプログラムが記憶されている。また、ハードディスクドライブ239bは、前述した属性記憶部114およびボリューム記憶部117としての役割を担う。
プリンタドライバおよび関連データは、フロッピー(登録商標)ディスクドライブ239a、CD−ROMドライブ239c等の外部記憶装置239から供給される。ネットワーク制御部(NTC)240は、ネットワーク装置(NT)241の動作を制御する。システムバス242は、上記各部の間でデータ転送を行う。
図3は文書管理クライアント100内のクライアント処理部102の機能的構成を示す図である。クライアント処理部102は、クライアントアプリケーション部200、画像処理部201、キャビネット文書管理部202、データベース通信部203およびボリューム通信部204から構成される。クライアントアプリケーション部200は、ユーザインタフェース(UI)部101からの指示に従って、文書管理クライアント100の各機能の処理を行うとともに、ユーザインタフェース(UI)部101の表示画面を制御する。また、属性管理サーバ部112やボリュームサーバ部115に対する処理が発生した場合、その要求をキャビネット文書管理部202に渡す。その要求に対する処理結果が送信されてくると、クライアントアプリケーション部200は当該処理結果をキャビネット文書管理部202から受け取る。画像処理部201は、クライアントアプリケーション部200あるいはキャビネット文書管理部202からの要求に従い、画像データの伸張、圧縮、色空間変換、下地とばし、拡大/縮小、回転等の画像処理を行う。
キャビネット文書管理部202は、属性管理サーバ部112やボリュームサーバ部115に対する要求を、キャビネット、フォルダ、文書、ページからなるオブジェクトモデルで行えるようにするものであり、フォルダ属性、文書属性、ページ属性に対する参照、更新等の処理が発生した場合、その要求をデータベース通信部203に供給し、その処理結果をデータベース通信部203から受け取るとともに、コンテンツデータに対する登録、削除、取得等の処理が発生した場合、その要求をボリューム通信部204に供給し、その処理結果をボリューム通信部204から受け取る。
データベース通信部203は、TCP/IPプロトコル上に定義されるSQL(Structured Query Language)プロトコルにより、属性管理サーバ部112に対する要求コマンドをネットワークI/F103を介してデータベース通信部205に送信し、その応答コマンドをデータベース通信部205から受信する。ボリューム通信部204は、RPC(Remote Procedure Call)により、ボリュームサーバ部115に対する要求コマンドをネットワークI/F103を介してボリューム通信部207に送信し、その応答コマンドをボリューム通信部207から受信する。
図4は文書管理サーバ110内の属性管理サーバ部112、ボリュームサーバ部115およびサービスサーバ部118の機能的構成を示す図である。属性管理サーバ部112内の属性管理サーバ処理部113は、データベース通信部205およびデータベース処理部206から構成される。
データベース通信部205は、TCP/IPプロトコル上に定義されるSQL(Structured Query Language)プロトコルにより、属性管理サーバ部112に対する要求コマンドをデータベース通信部203あるいはデータベース通信部210からネットワークI/F111を介して受信した場合、その要求をデータベース処理部206に供給する。そして、データベース通信部205は、その要求の処理結果をデータベース処理部206から受け取ると、応答コマンドとしてデータベース通信部203あるいはデータベース通信部210に送信する。データベース処理部206は、フォルダ、文書、ページの包含関係とこれらの属性を管理するためのデータベース管理システムであるRDBMS(Relational Database Management System)を用いて、データベースファイルである属性記憶部114に対して更新や検索などの処理を行う。
図5は属性記憶部114に記憶され、データベース処理部206によって管理されるフォルダ、文書、ページの包含関係とこれらの属性を管理するためのテーブルを示す図である。フォルダ管理テーブル300は、フォルダを識別するためのフォルダID、親のフォルダを識別するための親フォルダID、フォルダ名および作成日時から構成される。文書管理テーブル301は、文書を識別するための文書ID、親のフォルダを識別するための親フォルダID、文書名、サイズ、ページ数、作成日時、および対応付けられたログを識別するためのログIDから構成される。
ログ情報管理テーブル302は、ログを識別するためのログIDと、デバイス情報としてのデバイス名、プロダクト名、IPアドレスおよびコメントと、ユーザ情報としての部門ID、ユーザ名、IPアドレスおよびMACアドレス、ジョブ情報としてのジョブ種、ジョブ名、ページ数、部数、開始日時、終了日時およびジョブの結果と、対応付けられた文書を識別するための文書IDとから構成される。
ページ管理テーブル303は、ページを識別するためのページIDと、親の文書を識別するための親文書IDと、ページ番号と、ページデータのファイルフォーマットを識別するためのフォーマットと、画像データの場合に用紙サイズを識別するための用紙サイズと、ファイルサイズと、ページを検索するためのインデックス1、インデックス2およびインデックス3と、ボリュームサーバ部115で管理される画像データを識別するためのボリュームIDとから構成される。
また、文書管理サーバ110内のボリュームサーバ処理部116は、ボリューム通信部207およびボリューム処理部208から構成される。ボリューム通信部207は、RPC(Remote Procedure Call)により、ボリュームサーバ部115に対する要求コマンドをボリューム通信部204あるいはボリューム通信部211からネットワークI/F111を介して受信した場合、その要求をボリューム処理部208に供給する。そして、ボリューム通信部204は、その要求の処理結果をボリューム処理部208から受け取ると、応答コマンドとしてボリューム通信部204あるいはボリューム通信部211に送信する。ボリューム処理部208は、ボリュームファイルであるボリューム記憶部117に対して更新やデータ取得などの処理を行う。
図6はボリューム記憶部117に記憶され、ボリューム処理部208によって追加・取得されるコンテンツデータのデータ構成を示す図である。ボリューム管理ファイル400は、データを識別するためのボリュームID、データが記憶されているボリューム記憶ファイルを識別するためのボリュームファイル名、データの記憶開始位置であるオフセット、およびデータのサイズから構成される。ボリューム記憶ファイル401には、コンテンツデータである画像データあるいはテキストデータが連続して記憶される。
また、文書管理サーバ110内のサービスサーバ部118は、サービス通信部209、データベース通信部210、ボリューム通信部211、キャビネット文書管理部212、画像処理部213およびサービスプロバイダ部214から構成される。
サービス通信部209は、HTTPプロトコル上のSOAPプロトコルにより、文書管理サーバ110に対する要求コマンドをデジタル複合機130からネットワークI/F111を介して受信した場合、その要求をサービスプロバイダ部214に供給する。そして、サービス通信部は、その処理結果をサービスプロバイダ部214から得ると、応答コマンドとしてデジタル複合機130に送信する。
サービスプロバイダ部214は、サービス通信部209からの要求に従って処理を行い、その処理結果を返す。また、文書情報の登録、属性の更新、検索など、属性管理サーバ部112およびボリュームサーバ部115に対する処理が発生した場合、その要求をキャビネット文書管理部212に供給する。そして、その処理結果をキャビネット文書管理部212から受け取る。また、デジタル複合機130からジョブのコンテンツデータおよびログ情報を受信した場合、サービスプロバイダ部214は、サービス通信部209からコンテンツデータおよびログ情報を受け取る。そして、ハードディスクドライブ239aに一時保存した後、コンテンツデータおよびログ情報を登録する要求をキャビネット文書管理部212に供給する。そして、サービスプロバイダ部214は、その処理結果をキャビネット文書管理部212から受け取る。また、サービスプロバイダ部214は、コンテンツデータの解像度変換処理あるいはデータ変換処理を行う場合、ハードディスクドライブ239aからコンテンツデータを読み込み、画像データであるコンテンツデータに対して解像度変換処理、あるいはデータ変換処理を行った後、コンテンツデータとログ情報を文書登録する要求をキャビネット文書管理部212に供給し、その処理結果を受け取る。
画像処理部213は、サービスプロバイダ部214あるいはキャビネット文書管理部212からの要求に従い、画像データの伸長、圧縮、色空間変換、下地とばし、解像度変換、回転、領域分割、文字認識等の画像処理を行う。また、サービスサーバ部118におけるデータベース通信部210、ボリューム通信部211およびキャビネット文書管理部212の各機能的構成は、それぞれ前述した文書管理クライアントにおけるデータベース通信部203、ボリューム通信部204およびキャビネット文書管理部202の機能的構成と同様であるので、これらの説明を省略する。
図7はデジタル複合機130の内部構成を示す縦断面図である。スキャナ部131側では、原稿自動送り装置(原稿フィーダ)292から給送された原稿は順次、原稿台ガラス251上の所定位置に載置される。原稿照明ランプ252は、例えばハロゲンランプから構成され、原稿台ガラス251上に載置された原稿を露光する。走査ミラー253、254、255は、光学走査ユニット(図示せず)に収容されており、往復動しながら原稿からの反射光をCCDユニット256に導く。CCDユニット256は、原稿からの反射光を撮像素子に結像させる結像レンズ257、例えばCCDからなる撮像素子258、この撮像素子258を駆動するCCDドライバ259等から構成される。撮像素子258から出力される画像信号は、例えば8ビットのデジタルデータに変換された後、コントローラユニット133に入力される。
一方、プリンタ部132側では、画像形成に備え、感光ドラム260は前露光ランプ262によって除電される。1次帯電器263では感光ドラム260を一様に帯電させる。露光手段としての半導体レーザ267は、コントローラユニット133で処理された画像データに基づき、感光ドラム260を露光し、静電潜像を形成する。現像器268は黒色の現像剤(トナー)を収容する。転写前帯電器269は感光ドラム260上に現像されたトナー像を用紙に転写する前に高圧をかける。手差し給紙ユニット270および給紙ユニット272、274、296、294では、それぞれ各給紙ローラ271、273、275、293、295の駆動により、転写用紙が装置内に給送され、レジストローラ276の位置で一旦停止した後、感光ドラム260に形成された画像との書き出しタイミングに一致するように、再給送される。転写帯電器277は、感光ドラム260に現像されたトナー像を給送される転写用紙に転写する。分離帯電器278は、転写動作が終了した転写用紙を感光ドラム260から分離する。転写されずに感光ドラム260上に残ったトナーは、クリーナ261によって回収される。
搬送ベルト279は、転写プロセスが終了した転写用紙を定着器280に搬送し、例えば加熱により定着する。フラッパ281は、定着プロセスが終了した転写用紙の搬送パスを、ソータ282または中間トレイ287の配置方向のいずれかに制御する。また、給送ローラ283〜286は、一度定着プロセスが終了した転写用紙を、中間トレイ287に反転(多重)させて、あるいは非反転(両面)のまま給送する。再給送ローラ288は、中間トレイ287に載置された転写用紙を再度、レジストローラ276の位置まで搬送する。後述するように、コントローラユニット133は、マイクロコンピュータ、画像処理部等を有し、操作部134からの指示に従って、上記画像形成動作を制御する。
図8は操作部134の外観的構成を示す図である。この操作部134はLCD表示部600および各種キーから構成されている。LCD表示部600は、LCDの画面上にタッチパネルシート601が貼られたものであり、デジタル複合機の操作画面およびソフトキーを表示するとともに、表示されているキーが押されると、その位置情報をコントローラユニット133内のCPU500に伝える。スタートキー602は原稿画像の読み取り動作開始時に押下される。スタートキー602の中央部には、緑と赤の2色LED603が設けられており、点灯しているLEDの色によってスタートキー602が使える状態にあるか否かが分かる。ストップキー604は稼働中の動作を止める働きをする。IDキー605は使用者のユーザIDを入力する際に用いられる。リセットキー606は操作部134の設定を初期化する際に用いられる。
図9はデジタル複合機130のハードウェア構成を示す図である。コントローラユニット133は、画像入力デバイスであるスキャナ部131および画像出力デバイスであるプリンタ部132に接続されるともに、ネットワーク(LAN)140や公衆回線(WAN)150に接続され、画像情報やデバイス情報の入出力を行う。
コントローラユニット133内のシステムバス507には、CPU500、ROM502、RAM501、ハードディスクドライブ503、操作部I/F504、ネットワーク部505、モデム506およびイメージバスI/F508が接続されている。
CPU500はシステム全体を制御する。RAM501はCPU500が動作するためのシステムワークメモリであり、入力された画像データを一時記憶するための画像メモリ(バッファメモリ)でもある。ROM502はブートROMであり、システムのブートプログラムを格納している。ハードディスクドライブ(HDD)503はシステムソフトウェア、ジョブのコンテンツデータ、ログ情報等を格納する。
操作部I/F504は、操作部134とのインターフェース部であり、操作部134に表示される画面データを操作部134に出力する。また、操作部I/F504は、操作部134からオペレータが入力した情報をCPU500に伝える役割を行う。ネットワーク部(Network)505は、ネットワーク(LAN)140に接続されており、情報の入出力を行う。モデム(MODEM)506は、公衆回線(WAN)150に接続され、画像情報の入出力を行う。
イメージバス(Image Bus)I/F508は、システムバス507と画像データを高速で転送する画像バス509とを接続し、データ構造を変換するバスブリッジである。画像バス509はPCIバスまたはIEEE1394で構成される。
一方、画像バス509には、イメージバスI/F508、ラスタイメージプロセッサ510、デバイスI/F部511、スキャナ画像処理部514、プリンタ画像処理部515、画像回転部516、画像圧縮部517、解像度変換部518、色空間変換部519および階調変換部520が接続されている。
ラスタイメージプロセッサ(RIP)510は、PDLコードをビットマップイメージに展開する。デバイスI/F部511は、画像入力部インタフェース512および印刷部インタフェース513を介してスキャナ部131およびプリンタ部132とコントローラ133とを接続し、画像データの同期系/非同期系の変換を行う。
スキャナ画像処理部514は、入力画像データに対し、補正、加工および編集を行う。また、スキャナ画像処理部514は、入力された画像データ彩度信号からカラー原稿であるか白黒原稿であるかを判断し、その結果を保持する機能を有する。プリンタ画像処理部515は、出力画像データに対し、補正、加工および編集を行う。
画像回転部516は、スキャナ画像処理部514と連携し、スキャナ部131からの画像読み込みと同時に画像データを回転させてメモリに格納したり、メモリに格納されている画像データを回転させてメモリに格納したり、あるいはメモリに格納されている画像データをプリンタ画像処理部515と連携し、回転させながら印字・出力する。
画像圧縮部517は、多値画像データをJPEG、2値画像画像データをJBIG、MMR、MR、MHの圧縮伸長処理を行う。解像度変換部518は、メモリに格納されている画像データの解像度変換処理を行ってメモリに格納する。色空間変換部519は、マトリクス演算により、例えばメモリに格納されているYUV画像データをLab画像データに変換してメモリに格納する。
階調変換部520は、例えばメモリに格納されている8bitかつ256階調の画像データを、誤差拡散処理等の手法により、1bitかつ2階調の画像データに変換してメモリに格納する。尚、画像回転部516、画像圧縮部517、解像度変換部518、色空間変換部519および階調変換部520は、それぞれ連結して処理可能であり、例えばメモリ上の画像データに対し、画像回転および解像度変換を行う場合、これらの処理をメモリを介することなく、実行できる。
図10はコントローラユニット133内のソフトウェアによる機能的構成を示す図である。ユーザインタフェース(UI)部700は、オペレータからの入力情報をアプリケーション部701に供給するとともに、その処理結果をアプリケーション部701から受け取り、操作部134に表示する画面データを生成する。
アプリケーション部701は、ユーザインタフェース(UI)部700からの要求に従って処理を行い、例えばコピーが要求された場合、ジョブコントロールドメイン部702に、指定されたコピー設定とともにコピージョブを投入し、機器の状態やジョブの状態等の情報をジョブコントロールドメイン部702から受け取る。また、アプリケーション部701は、文書管理サーバ110にジョブのコンテンツデータおよびログ情報を送信する場合、ジョブコントロールドメイン部702からジョブの画像データおよびログ情報を受け取り、ジョブのコンテンツデータおよびログ情報を送信する要求をサービス通信部703に供給し、その処理結果を受け取る。
また、アプリケーション部701は、コンテンツデータの解像度変換処理あるいはデータ変換処理を行う場合、ジョブコントロールドメイン部702からジョブの画像データおよびログ情報を受け取り、ジョブの画像データに対して解像度変換処理あるいはデータ変換処理を行った後、コンテンツデータおよびログ情報を送信する要求をサービス通信部703に供給し、その処理結果を受け取る。
ジョブコントロールドメイン部702は、スキャンジョブ、コピージョブ、プリントジョブ、FAXジョブ等、複数のジョブの処理を司るものである。例えば、コピージョブが投入された場合、ジョブコントロールドメイン部702は、指定されたコピー設定に従って、スキャナ部131およびプリンタ部132を動作させ、原稿を読み込み、この画像データの印刷を行わせるとともに、デバイス情報、ユーザ情報、ジョブ情報等から構成されるジョブのログ情報とこのジョブの画像データとを関連付けて、ハードディスクドライブ503に保存する。ここで、ジョブの画像データの解像度は、例えばコピージョブである場合、600×600dpiである。一方、プリントジョブである場合、1200×1200dpiである。
また、ジョブコントロールドメイン部702は、アプリケーション部701からの要求に従い、ハードディスクドライブに保存されているログ情報および画像データをアプリケーション部701に供給する。サービス通信部703は、HTTPプロトコル上のSOAPプロトコルにより、文書管理サーバ110に対する要求コマンドをネットワークI/F704を介して文書管理サーバ110内のサービス通信部209に送信し、その応答を受信する。ネットワークI/F704は、ネットワーク140に接続され、TCP/IPなどのネットワークプロトコルの処理を行う。
図11はハードディスクドライブに保存されているログ情報のXMLスキーマを示す図である。この例では、ログ情報のルートを表すlogInformation要素は、デバイス名やIPアドレスなどのデバイス情報を表すdeviceInformation要素と、部門IDやユーザ名などのユーザ情報を表すuserInformation要素と、ジョブ種やジョブ名や開始日時などのジョブ情報を示すjobInformation要素とを含んでいる。
上記構成を有するネットワーク文書管理システムの動作を示す。図12はデジタル複合機におけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。この処理プログラムはデジタル複合機130内の記憶媒体(ROM502、ハードディスクドライブ503)に格納されており、コピージョブ、プリントジョブなどのジョブ処理の開始に応じて、CPU500によって実行される。
まず、デジタル複合機130はジョブ処理を実行した際に、当該ジョブの処理結果等を示すログ情報と当該ジョブの内容を示すコンテンツデータとを生成し、ハードディスクドライブ503に保存する(ステップS1)。ここで、生成・保存されるジョブのコンテンツデータは画像データであり、JBIGなどの圧縮方式で圧縮されている。
そして、保存されたコンテンツデータの変換処理を行う(ステップS2)。このコンテンツデータの変換処理では、後述するように、画像データであるコンテンツデータを所定の解像度を有する画像データに変換する処理、あるいは文字認識を行ってテキストデータに変換する処理が行われる。尚、本実施形態では、解像度を変換する処理について後述する。そして、変換後のコンテンツデータをハードディスクドライブ503に保存し、元のコンテンツデータをハードディスクドライブ503から削除することが行われる。
この後、ログ情報および変換後のコンテンツデータを文書管理サーバ110に送信し(ステップS3)、ログ情報およびコンテンツデータをハードディスクドライブ503から削除し(ステップS4)、本処理を終了する。尚、後述するように、コンテンツデータの変換処理がデジタル複合機ではなく文書管理サーバで行われる場合、ステップS2の処理は実行されない。
図13は文書管理サーバにおけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。この処理プログラムは文書管理サーバ110内の外部記憶装置239に格納されており、デジタル複合機130からデータ転送予約を受信することに応じて、一旦、RAM233にロードされた後、CPU231によって実行される。まず、デジタル複合機130からジョブのログ情報およびコンテンツデータを受信し、ハードディスクドライブ239bの所定領域に一時保存する(ステップS11)。そして、ログ情報およびコンテンツデータをそれぞれ属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部117に登録し(ステップS12)、一時保存していたログ情報およびコンテンツデータをハードディスクドライブ239bの所定領域から削除し(ステップS13)、本処理を終了する。
図14はデジタル複合機および文書管理サーバ間のデータ転送処理の流れを示す図である。デジタル複合機130は、ジョブの実行処理が終了したり、あるいはタイマが予め設定された送信時間になると、転送処理を開始し、文書管理サーバ110にデータ転送予約を行う(T1)。文書管理サーバ110は、データ転送予約を受けると、接続数を確認し、受付可能である場合、データ転送許可をデジタル複合機130に返信する(T2)。
デジタル複合機130は、データ転送許可を受信すると、ハードディスクドライブ503に保存されているジョブのログ情報を読み込み(T3)、このログ情報を文書管理サーバ110に送信する(T4)。文書管理サーバ110は、受信したログ情報をハードディスクドライブ239aの所定領域に一時保存する(T5)。この後、デジタル複合機130は、ハードディスクドライブ503に保存されているジョブの1ページ分のコンテンツデータ(解像度変換済みのコンテンツデータ)を読み込み(T6)、このコンテンツデータを文書管理サーバ110に送信する(T7)。文書管理サーバ110は、受信したコンテンツデータをハードディスクドライブ239aの所定領域に一時保存する(T8)。全てのページに対し、T6〜T8の処理を繰り返し行った後、デジタル複合機130は、文書管理サーバ110に文書登録要求を送信する(T9)。
文書管理サーバ110は、文書登録要求を受信すると、別プロセスによる文書登録処理を開始し(T10)、直ちに文書登録受付をデジタル複合機130に返信する(T11)。デジタル複合機130は、文書登録処理が完了したか否かの問い合わせを文書管理サーバ110に定期的に行い(T12)、その問い合わせ結果を文書管理サーバ110から受け取る(T13)。そして、文書登録処理が完了した後、デジタル複合機130は、データ転送予約解除を文書管理サーバ110に送信し(T14)、転送が完了したログ情報およびコンテンツデータをハードディスクドライブ503から削除する(T15)。全てのジョブのログ情報およびコンテンツデータの転送が完了するか、あるいは転送終了時刻になるまで、T1〜T15の処理を繰り返し行う。
図15はステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。この変換処理は、実行されたジョブに関するログ情報とコンテンツデータ(例えば印刷ジョブの場合のコンテンツデータとは、印刷内容を示す画像データ)の生成および保存の処理が終了した後に行われる。まず、ハードディスクドライブ503に保存されているコンテンツデータの1ページ分の画像データ(例えば印刷ジョブの場合は、印刷対象の画像データ)をメモリ(RAM501)に読み込み(ステップS21)、JBIG等の画像データの圧縮方式に従った伸張処理を行う(ステップS22)。伸張した画像データに対して領域分割を行い、文字領域における各行の平均文字高さを抽出する(ステップS23)。ここで、画像データに対する領域分割とは、画像をその内容の種別に従った領域に分割する処理である。例えば、画像中のテキスト部分、図形部分、表部分等の種別に従った領域に分割する。図22は画像データの領域分割を示す図である。この図では、画像データ800の中にテキスト領域801、802および図形領域803、804が存在している。領域分割の手法としては、既に種々の手法が提案されており、例えば、テキスト領域を分割する手法として、画像データ中の黒画素を隣接する1つあるいは複数の白画素にまで水平・垂直方向に膨張させて画像データを塗りつぶすことにより分割する塗りつぶし手法や、画像中の各画素を適切な領域に配分する処理を所定状態に収束するまで繰り返し、少しずつ領域を求めていくK平均アルゴリズムによる領域分割の手法等が挙げられる。
また、文字領域における各行の平均文字高さを抽出する手法としては、種々の手法が挙げられるが、例えば次のように行われる。図21は文字領域の画像データおよびこの文字領域における黒画素分布を示す図である。同図(A)は黒画素分布を示し、同図(B)は文字領域の画像データを示す。2値化された文字領域の画像データに対し、主走査方向(文字行方向)に投影された黒画素の計数値(度数)を副走査方向(文字列方向)に亘って表した黒画素分布を求める。この黒画素分布において、副走査方向に亘る黒画素の分布度数が大きい部分が文字行データとして判断され、この文字行データから各行の平均文字高さを抽出する。
そして、抽出された平均文字高さが最も小さい行の文字を認識するのに適している解像度(最適解像度)を求める(ステップS24)。ここで、文字認識に適している最適解像度とは、所定の文字サイズ(ポイント数)の文字に対して文字認識を行った際、所定の認識率を達成することができる必要かつ十分な解像度のことである。この最適解像度は、文字認識処理の特性によって異なるが、例えば、日本語の全角文字の場合、6ポイント文字に対して400*400dpiの分解能であり、8ポイント文字に対して300*300dpiの分解能であり、12〜48ポイント文字に対して200*200dpiの分解能である。これらの文字サイズ(ポイント数)と最適解像度との対応表は、予めデジタル複合機130内のメモリ(ROM502)に格納しておくことで、いつでも参照可能である。
算出された最適解像度が画像データの解像度より小さいか否かを判別する(ステップS25)。最適解像度が画像データの解像度より小さい場合、画像データを最適解像度に変換する(ステップS26)。そして、再びJBIG等の圧縮方式で画像データを圧縮し(ステップS27)、変換後の画像データをハードディスクドライブ503の所定領域に保存するとともに、元の画像データをハードディスクドライブ503の所定領域から削除する(ステップS28)。一方、最適解像度が画像データの解像度以上である場合、ステップS26からステップS28までの処理を行わず、ステップS29の処理に移行する。そして、ステップS21で読み込まれた画像データのページが最終ページであるか否かを判別し(ステップS29)、最終ページに至るまでステップS21からステップS29の処理を繰り返し行い、最終ページに至ると、本処理を終了する。
このように、第1の実施形態のネットワーク文書管理システムによれば、文書管理サーバ110側のハードディスクドライブ239a(つまり、属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部115)の使用容量を軽減することができる。また、ネットワーク140を介して画像データを転送する際、画像データの送信時間やネットワークの負荷を軽減することができる。
[第2の実施形態]
第2の実施形態におけるネットワーク文書管理システムのハードウェア構成は、前記第1の実施形態と同様であるので、その説明を省略し、ここでは前記第1の実施形態と異なる、デジタル複合機におけるコンテンツデータの変換処理を示す。
図16は第2の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。この処理はログ情報とコンテンツデータの生成および保存の処理が終了した後に行われる。第2の実施形態では、文字領域の比率に応じて、コンテンツデータ(画像データ)のデータ変換処理を行うことに特徴がある。
まず、ハードディスクドライブ503に保存されているコンテンツデータの1ページ分の画像データをメモリ(RAM501)に読み込み(ステップS31)、JBIG等の画像データの圧縮方式に従った伸張処理を行う(ステップS32)。伸張した画像データに対して領域分割を行い、文字領域および画像領域を抽出する(ステップS33)。ここで、領域分割を行って文字領域および画像領域を抽出する際、前記第1の実施形態と同様、塗りつぶし法やK平均アルゴリズムによる領域分割の手法等を用いることが可能である。
そして、伸張した画像データに対し、文字領域が所定の比率以上を占めているか否かを判別する(ステップS34)。ここで、所定の比率は、画像データ全体の領域に対する文字領域の比率(例えば50%)であってもよいし、文字領域を除いた画像データの領域に対する文字領域の比率であってもよく、文字領域が大きくてテキストデータとして管理した方が得策であると判断される場合の閾値(画像データ内の非文字領域に比べて文字領域の方が重要と判断される閾値や、テキストデータの量が十分多くなり扱いやすくなるような閾値など)を予め実験的に求めることにより、設定される。
文字領域が所定の比率以上である場合、画像データに対して文字認識を行い、画像データからテキストデータを抽出する(ステップS35)。ここで、文字認識の手法は種々知られているが、例えば、前述した各行の平均文字高さを抽出する際、得られた文字行データと、同様の手法により得られる文字列データとから、文字単位の文字パターンデータを切り出し、切り出された文字パターンデータと予め文字辞書に登録された文字パターンデータとの類似度を基に、文字認識を行ってテキストデータを抽出するようにしてもよい。そして、抽出したテキストデータをコンテンツデータとしてハードディスクドライブ503に保存するとともに、元の画像データをハードディスクドライブ503から削除する(ステップS36)。
一方、文字領域が所定の比率以上でない場合、ステップS35およびS36の処理を行わず、ステップS37の処理に移行する。そして、ステップS31で読み込まれた画像データのページが最終ページであるか否かを判別し(ステップS37)、最終ページに至るまでステップS31からステップS37の処理を繰り返し行い、最終ページに至ると、本処理を終了する。
このように、第2の実施形態のネットワーク文書管理システムによれば、画像データ中の文字領域の大きさに応じて、コンテンツデータにおける画像データをテキストデータに更新するか否かを決定することができ、文書管理サーバ110内のハードディスクドライブ239a(つまり、属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部115)の使用容量を一層軽減することができる。また、テキストデータを転送する際、送信時間やネットワークの負荷を一層軽減することができる。
なお、ステップS34で文字領域が所定の比率以上でなかった場合、何も処理を行わずに、ステップS37に進むとしたが、画像データの解像度が所定の解像度より大きければ、画像データの解像度変換(低解像度化)を行った後にステップS37に進むようにしてもよい。
[第3の実施形態]
第3の実施形態におけるネットワーク文書管理システムのハードウェア構成は、前記第1の実施形態と同様であるので、その説明を省略し、ここでは前記第1の実施形態と異なる、デジタル複合機におけるコンテンツデータの変換処理を示す。
図17は第3の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。この処理はログ情報とコンテンツデータの生成および保存の処理が終了した後に行われる。第3の実施形態では、文字数に応じて、コンテンツデータのデータ変換処理を行うことに特徴がある。
まず、ハードディスクドライブ503に保存されているジョブの1ページ分の画像データをメモリ(RAM501)に読み込み(ステップS41)、JBIG等の画像データの圧縮方式に従った伸張処理を行う(ステップS42)。そして、画像データに対して文字認識の前処理(文字ごとの文字矩形領域を抽出)を行い、文字矩形を抽出する(ステップS43)。抽出した文字矩形の個数(つまり文字数)が所定の文字数以上であるか否かを判別する(ステップS44)。ここで、所定の文字数として、文字数が多くてテキストデータとして管理した方が得策であると判断されるような閾値を予め設定しておく。なお、この閾値は、テキストデータ量が十分かどうかに基づいて定められる閾値であってもよいし、文字認識処理の負荷を増大させるより画像データのままの方が得策かどうかに基づいて定められるような閾値であってもよい。
抽出した文字矩形の数が所定の文字数以上である場合、抽出した文字矩形を文字認識処理することによってテキストデータ化し、当該得たテキストデータをコンテンツデータとしてハードディスクドライブ503に保存するとともに、元の画像データをハードディスクドライブ503から削除する(ステップS45)。一方、抽出した文字数が所定の文字数以上でない場合、ステップS45の処理を行わず、ステップS46の処理に移行する。そして、ステップS41で読み込まれた画像データのページが最終ページであるか否かを判別し(ステップS46)、最終ページに至るまでステップS41からステップS46の処理を繰り返し行い、最終ページに至ると、本処理を終了する。
このように、第3の実施形態のネットワーク文書管理システムによれば、前記第2の実施形態と同様、画像データ中の文字数に応じて、テキストデータに変換するか否かを決定することができ、文書管理サーバ110内のハードディスクドライブ239a(つまり、属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部115)の使用容量を軽減することができる。また、画像データの代わりにテキストデータを転送することになった場合は、送信時間やネットワークの負荷を軽減することができる。
なお、ここでは、ステップS43で文字認識の前処理(文字矩形抽出処理)までを行うこととしたが、ステップS43の時点で辞書マッチング処理を行い文字認識結果を出力してしまう形態でも構わない。
[第4の実施形態]
第4の実施形態におけるネットワーク文書管理システムのハードウェア構成は、前記第1の実施形態と同様であるので、その説明を省略し、ここでは前記第1の実施形態と異なる、デジタル複合機におけるコンテンツデータの変換処理を示す。
図18は第4の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。この処理はログ情報とコンテンツデータの生成および保存の処理が終了した後に行われる。第4の実施形態では、キーワードに応じて、コンテンツデータのデータ変換処理を行うことに特徴がある。
まず、ハードディスクドライブ503に保存されているジョブの1ページ分の画像データをメモリ(RAM501)に読み込み(ステップS51)、JBIG等の画像データの圧縮方式に従った伸張処理を行う(ステップS52)。そして、画像データに対して文字認識を行い、画像データからテキストデータを抽出する(ステップS53)。ここで、文字認識は、前記第2の実施形態と同様の方法で行われる。抽出したテキストデータに所定のキーワードが含まれているか否かを判別する(ステップS54)。ここで、所定のキーワードとは、テキストデータに変換しない方が良いと判断される用語であり、例えば、テキストデータに変換すると、当該コンテンツデータの価値が小さくなる設計図面等が含まれていることを表す「設計図」、「図面」の用語や、特定の見出し用語等が挙げられる。
抽出したテキストデータに所定のキーワードが含まれていない場合、抽出したテキストデータをハードディスクドライブ503に保存するとともに、元の画像データをハードディスクドライブ503から削除する(ステップS55)。一方、抽出したテキストデータに所定のキーワードが含まれている場合、ステップS55の処理を行わず、ステップS56の処理に移行する。そして、ステップS51で読み込まれた画像データのページが最終ページであるか否かを判別し(ステップS56)、最終ページに至るまでステップS51からステップS56の処理を繰り返し行い、最終ページに至ると、本処理を終了する。
このように、第4の実施形態のネットワーク文書管理システムによれば、テキストデータに変換する価値のある画像データだけをテキストデータに変換することができ、文書管理サーバ110内のハードディスクドライブ239a(つまり、属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部115)の使用容量を軽減することができる。また、テキストデータを転送する際、送信時間やネットワークの負荷を軽減することができる。
[第5の実施形態]
第5の実施形態におけるネットワーク文書管理システムのハードウェア構成は、前記第1の実施形態と同様であるので、その説明を省略し、ここでは前記第1の実施形態と異なる、デジタル複合機におけるコンテンツデータの変換処理を示す。
図19は第5の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。この処理はログ情報とコンテンツデータの生成および保存の処理が終了した後に行われる。第5の実施形態では、不正ジョブ実行回数に応じて、コンテンツデータのデータ変換処理を行うことに特徴がある。
まず、ジョブを実行させたユーザの不正ジョブ実行回数が所定回数未満であるか否かを判別する(ステップS61)。ここで、所定回数は、任意に設定可能であり、値1であってもよい。ジョブを実行させたユーザの不正ジョブ実行回数が所定の回数未満でない場合、画像データをテキストデータに変換することなく、当該画像データをコンテンツデータのままとして、本処理を終了する。
一方、ジョブを実行させたユーザの不正ジョブ実行回数が所定回数未満である場合、不正ジョブ実行フラグを値0に設定する(ステップS62)。ここで、不正ジョブ実行フラグ(Flag)はコントローラユニット133内のRAM501に記憶されている。そして、ハードディスクドライブ503に保存されているジョブの1ページ分の画像データをメモリ(RAM501)に読み込み(ステップS63)、JBIG等の画像データの圧縮方式に従った伸張処理を行う(ステップS64)。
画像データに対して文字認識を行い、画像データからテキストデータを抽出する(ステップS65)。ここで、文字認識は前記第2の実施形態と同様の方法で行われる。そして、抽出したテキストデータに所定のキーワードが含まれているか否かを判別する(ステップS66)。ここで、所定のキーワードとは、例えば、コピージョブやプリントジョブを実行することが不正であることを表す「社外秘」、「コピー禁止」、「機密文書」等の用語が挙げられる。抽出したテキストデータに所定のキーワードが含まれている場合、不正ジョブ実行フラグを値1に設定し(ステップS67)、抽出したテキストデータをコンテンツデータとしてハードディスクドライブ503に保存するとともに、元の画像データをハードディスクドライブ503から削除する(ステップS68)。
一方、抽出したテキストデータに所定のキーワードが含まれていない場合、ステップS67の処理を行わず、ステップS69の処理に移行する。ステップS63で読み込まれた画像データのページが最終ページであるか否かを判別し(ステップS69)、最終ページに至るまでステップS63からステップS69の処理を繰り返し行う。ステップS69で最終ページに至ると、不正ジョブ実行フラグが値1であるか否かを判別し(ステップS70)、不正ジョブ実行フラグが値1である場合、ジョブを実行させたユーザの不正ジョブ実行回数を値1増加させ(ステップS71)、本処理を終了する。一方、不正ジョブ実行フラグが値1でない場合、ステップS71の処理を行わず、本処理を終了する。
このように、第5の実施形態のネットワーク文書管理システムによれば、不正なジョブを実行する場合、テキストデータへの変換を行わないようにすることができ、セキュリティを高めることができる。
尚、本発明は、上記実施形態の構成に限られるものではなく、特許請求の範囲で示した機能、または本実施形態の構成が持つ機能が達成できる構成であればどのようなものであっても適用可能である。
例えば、上記第1乃至第5の実施形態では、コンテンツデータの変換処理はデジタル複合機で行われる場合を示したが、文書管理サーバでコンテンツデータの変換処理を行ってもよい。図20はコンテンツデータの変換処理が文書管理サーバで行われる場合の文書管理サーバにおけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。この処理プログラムは文書管理サーバ110内の外部記憶装置239に格納されており、デジタル複合機130からデータ転送予約を受信することに応じて、一旦、RAM233にロードされた後、CPU231によって実行される。
まず、デジタル複合機130からジョブのログ情報およびコンテンツデータを受信し、ハードディスクドライブ239bに一時保存する(ステップS11)。そして、保存されたコンテンツデータの変換処理を行う(ステップS11A)。コンテンツデータの変換処理では、前記第1の実施形態の図15乃至第5の実施形態の図19のフローチャートで示した処理と同様、画像データであるコンテンツデータを所定の解像度の画像データに変換したり、あるいは文字認識を行ってテキストデータに変換し、変換後のコンテンツデータをハードディスクドライブ239bの所定領域に保存し、元のコンテンツデータをハードディスクドライブ239bの所定領域から削除することが行われる。この後、ログ情報およびコンテンツデータをそれぞれ属性管理サーバ部112内の属性記憶部114およびボリュームサーバ部115内のボリューム記憶部117に登録し(ステップS12)、一時保存していたログ情報およびコンテンツデータをハードディスクドライブ239bの所定領域から削除し(ステップS13)、本処理を終了する。これにより、文書管理サーバ110側のハードディスクドライブ239bの使用容量を軽減することができる。
このように、コンテンツデータの変換処理がデジタル複合機ではなく文書管理サーバで行われる場合、デジタル複合機側の図12におけるステップS2の処理は実行されない。そして、図15乃至図19のフローチャートに示されるコンテンツデータの変換処理は、文書管理サーバで行われることになり、この場合、文書管理サーバは、デジタル複合機から文書登録要求(図14の処理T9参照)を受信することに応じて、コンテンツデータの変換処理を開始する。
また、上記第2乃至第5の実施形態における画像データをテキストデータに変換する際の複数の条件を論理和あるいは論理積によって任意に組み合わせて新たな条件とし、この新たな条件を用いてテキストデータへの変換処理を行うか否かを決定するようにしてもよい。これにより、テキストデータへの変換を詳細に設定できる。
また、上記実施形態のネットワーク文書管理システム(図1参照)では、文書管理クライアント、文書管理サーバおよびデジタル複合機がそれぞれ1台しかネットワークに接続されていない構成が示されているが、これらの装置が任意の数だけ接続された構成でも、データ転送装置など他の装置がネットワークに接続された構成でもよいことは勿論である。また、上記実施形態では、画像データを生成可能な画像形成装置として、多機能を有するデジタル複合機を示したが、単機能のスキャナ装置やプリンタ装置であってもよいし、ビットイメージ形式等の画像データを生成可能な汎用のコンピュータであってもよい。
また、本発明の目的は、実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。
又、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。
また、コンピュータが読み出したプログラムコードを実行することにより、前述した各実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOSなどが実際の処理の一部または全部を行い、その処理によって前述した各実施の形態の機能が実現される場合も、本発明に含まれることは言うまでもない。
この場合、上記プログラムは、該プログラムを記憶した記憶媒体から直接、又はインターネット、商用ネットワーク、若しくはローカルエリアネットワーク等に接続された不図示の他のコンピュータやデータベース等からダウンロードすることにより供給される。
上記実施の形態では、デジタル複合装置の印刷方式を電子写真方式とした場合を例に挙げたが、本発明は、電子写真方式に限定されるものではなく、インクジェット方式、熱転写方式、感熱方式、静電方式、放電破壊方式など各種印刷方式に適用することができる。
上記プログラムの形態は、オブジェクトコード、インタプリタにより実行されるプログラムコード、OS(オペレーティングシステム)に供給されるスクリプトデータ等の形態から成ってもよい。
第1の実施形態におけるネットワーク文書管理システムの構成を示す図である。 文書管理サーバ110のハードウェア構成例を示す図である。 文書管理クライアント100内のクライアント処理部102の機能的構成を示す図である。 文書管理サーバ110内の属性管理サーバ部112、ボリュームサーバ部115およびサービスサーバ部118の機能的構成を示す図である。 属性記憶部114に記憶され、データベース処理部206によって管理されるフォルダ、文書、ページの包含関係とこれらの属性を管理するためのテーブルを示す図である。 ボリューム記憶部117に記憶され、ボリューム処理部208によって追加・取得されるコンテンツデータのデータ構成を示す図である。 デジタル複合機130の内部構成を示す縦断面図である。 操作部134の外観的構成を示す図である。 デジタル複合機130のハードウェア構成を示す図である。 コントローラユニット133内のソフトウェアによる機能的構成を示す図である。 ハードディスクドライブに保存されているログ情報のXMLスキーマを示す図である。 デジタル複合機におけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。 文書管理サーバにおけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。 デジタル複合機および文書管理サーバ間のデータ転送処理の流れを示す図である。 ステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。 第2の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。 第3の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。 第4の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。 第5の実施形態のステップS2におけるコンテンツデータの変換処理手順を示すフローチャートである。 コンテンツデータの変換処理が文書管理サーバで行われる場合の文書管理サーバにおけるジョブのログ情報およびコンテンツデータの処理手順を示すフローチャートである。 文字領域の画像データおよびこの文字領域における黒画素分布を示す図である。 画像データの領域分割を示す図である。 従来のネットワーク文書管理システムの構成を示す図である。
符号の説明
100 文書管理クライアント装置
110 文書管理サーバ装置
112 属性管理サーバ部
115 ボリューム管理サーバ部
130 デジタル複合機
131 スキャナ部
132 プリンタ部
133 コントロールユニット
140 ネットワーク

Claims (25)

  1. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムであって、
    前記生成された画像データに対して領域分割を行う領域分割手段
    記生成された画像データに対して前記領域分割手段により行われた領域分割の結果から文字領域を抽出し、前記抽出された文字領域が所定の比率以上であるか否かを判別する判別手段と
    記判別手段により文字領域が所定の比率以上であると判別された場合、前記画像データの文字認識を行って前記画像データをテキストデータに変換し、前記判別手段により文字領域が所定の比率以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とするドキュメント管理システム。
  2. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムであって、
    記画像データに含まれる文字数が所定の文字数以上であるか否か判別する判別手段と
    記判別手段により画像データに含まれる文字数が所定の文字数以上であると判別された場合、前記画像データの文字認識を行って前記画像データをテキストデータに変換し、前記判別手段により画像データに含まれる文字数が所定の文字数以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とするドキュメント管理システム。
  3. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムであって、
    字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているか否かを判別する判別手段と、
    記判別手段により所定のキーワードが含まれていないと判別された場合、前記画像データをテキストデータに変換し、前記判別手段により所定のキーワードが含まれていると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とするドキュメント管理システム。
  4. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムであって、
    字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているジョブの実行回数を不正ジョブ実行回数としてユーザ毎に管理し、前記不正ジョブ実行回数が所定回数以上であるか否かを判別する判別手段と、
    記判別手段により不正ジョブ実行回数が所定回数未満であると判別された場合、前記画像データをテキストデータに変換し、前記判別手段により前記不正ジョブ実行回数が所定回数以上であると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とするドキュメント管理システム。
  5. 前記変換されたテキストデータを前記ネットワークを介して前記画像形成装置から前記情報処理装置に転送する転送手段を備え、
    前記テキスト変換手段は、前記画像形成装置において、前記画像データをテキストデータに変換することを特徴とする請求項1乃至4のいずれか一項に記載のドキュメント管理システム。
  6. 前記画像データを前記ネットワークを介して前記画像形成装置から前記情報処理装置に転送する転送手段を備え、
    前記テキスト変換手段は、前記情報処理装置において、前記画像データをテキストデータに変換することを特徴とする請求項1乃至4のいずれか一項に記載のドキュメント管理システム。
  7. 前記テキスト変換手段によって前記画像データがテキストデータに変換されない場合、前記データ登録手段は、前記生成された画像データを前記ログ情報と関連付けて前記記憶媒体に登録することを特徴とする請求項1乃至のいずれか一項に記載のドキュメント管理システム。
  8. 前記テキスト変換手段によって前記画像データがテキストデータに変換されない場合、前記データ登録手段は、前記生成された画像データを低解像度の画像に変換した後、前記ログ情報と関連付けて前記記憶媒体に登録することを特徴とする請求項1乃至のいずれか一項に記載のドキュメント管理システム。
  9. 前記ログ情報は、前記画像形成装置で実行されたジョブに基づいて生成され、
    前記生成された画像データは、当該ジョブの内容を示す画像データであることを特徴とする請求項1乃至のいずれか一項に記載のドキュメント管理システム。
  10. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムのドキュメント管理方法であって、
    前記生成された画像データに対して領域分割を行う領域分割ステップと、
    前記生成された画像データに対して前記領域分割ステップで行われた領域分割の結果から文字領域を抽出し、前記抽出された文字領域が所定の比率以上であるか否かを判別する判別ステップと、
    前記文字領域が所定の比率以上であると判別された場合、前記画像データをテキストデータに変換し、前記文字領域が所定の比率以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換ステップと、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録ステップとを有することを特徴とするドキュメント管理方法。
  11. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムのドキュメント管理方法であって、
    前記画像データに含まれる文字数が所定の文字数以上であるか否か判別する判別ステップと、
    前記画像データに含まれる文字数が所定の文字数以上であると判別された場合、前記画像データをテキストデータに変換し、前記画像データに含まれる文字数が所定の文字数以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換ステップと、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録ステップとを有することを特徴とするドキュメント管理方法。
  12. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムのドキュメント管理方法であって、
    文字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているか否かを判別する判別ステップと、
    前記所定のキーワードが含まれていないと判別された場合、前記画像データをテキストデータに変換し、前記所定のキーワードが含まれていると判別された場合、前記画像データをテキストデータに変換しないテキスト変換ステップと、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録ステップとを有することを特徴とするドキュメント管理方法。
  13. 画像データを生成する画像形成装置およびテキストデータを管理する情報処理装置がネットワークを介して接続されたドキュメント管理システムのドキュメント管理方法であって、
    文字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているジョブの実行回数を不正ジョブ実行回数としてユーザ毎に管理し、前記不正ジョブ実行回数が所定回数以上であるか否かを判別する判別ステップと、
    前記不正ジョブ実行回数が所定回数未満であると判別された場合、前記画像データをテキストデータに変換し、前記不正ジョブ実行回数が所定回数以上であると判別された場合、前記画像データをテキストデータに変換しないテキスト変換ステップと、
    前記情報処理装置において、前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録ステップとを有することを特徴とするドキュメント管理方法。
  14. テキストデータを管理する情報処理装置にネットワークを介して接続され、画像データを生成する画像形成装置であって、
    前記生成された画像データに対して領域分割を行う領域分割手段と、
    前記生成された画像データに対して前記領域分割手段により行われた領域分割の結果から文字領域を抽出し、前記抽出された文字領域が所定の比率以上であるか否かを判別する判別手段と、
    記判別手段により文字領域が所定の比率以上であると判別された場合、前記画像データをテキストデータに変換し、前記文字領域が所定の比率以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて、前記ネットワークを介して前記情報処理装置に送信する送信手段とを備えたことを特徴とする画像形成装置。
  15. テキストデータを管理する情報処理装置にネットワークを介して接続され、画像データを生成する画像形成装置であって、
    前記画像データに含まれる文字数が所定の文字数以上であるか否か判別する判別手段と
    前記判別手段により画像データに含まれる文字数が所定の文字数以上であると判別された場合、前記画像データをテキストデータに変換し、前記画像データに含まれる文字数が所定の文字数以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて、前記ネットワークを介して前記情報処理装置に送信する送信手段とを備えたことを特徴とする画像形成装置。
  16. テキストデータを管理する情報処理装置にネットワークを介して接続され、画像データを生成する画像形成装置であって、
    文字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているか否かを判別する判別手段と、
    前記判別手段により所定のキーワードが含まれていないと判別された場合、前記画像データをテキストデータに変換し、前記所定のキーワードが含まれていると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて、前記ネットワークを介して前記情報処理装置に送信する送信手段とを備えたことを特徴とする画像形成装置。
  17. テキストデータを管理する情報処理装置にネットワークを介して接続され、画像データを生成する画像形成装置であって、
    文字認識を行って前記画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているジョブの実行回数を不正ジョブ実行回数としてユーザ毎に管理し、前記不正ジョブ実行回数が所定回数以上であるか否かを判別する判別手段と、
    前記判別手段により不正ジョブ実行回数が所定回数未満であると判別された場合、前記画像データをテキストデータに変換し、前記不正ジョブ実行回数が所定回数以上であると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて、前記ネットワークを介して前記情報処理装置に送信する送信手段とを備えたことを特徴とする画像形成装置。
  18. 画像データを生成する画像形成装置にネットワークを介して接続され、テキストデータを管理する情報処理装置であって、
    前記生成された画像データを前記画像形成装置から受信する受信手段と、
    前記受信した画像データに対して領域分割を行う領域分割手段と、
    前記受信した画像データに対して前記領域分割手段により行われた領域分割の結果から文字領域を抽出し、前記抽出された文字領域が所定の比率以上であるか否かを判別する判別手段と、
    前記判別手段により文字領域が所定の比率以上であると判別された場合、前記画像データをテキストデータに変換し、前記文字領域が所定の比率以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とする情報処理装置。
  19. 画像データを生成する画像形成装置にネットワークを介して接続され、テキストデータを管理する情報処理装置であって、
    前記生成された画像データを前記画像形成装置から受信する受信手段と、
    前記受信した画像データに含まれる文字数が所定の文字数以上であるか否か判別する判別手段と、
    前記判別手段により画像データに含まれる文字数が所定の文字数以上であると判別された場合、前記画像データをテキストデータに変換し、前記画像データに含まれる文字数が所定の文字数以上でないと判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とする情報処理装置。
  20. 画像データを生成する画像形成装置にネットワークを介して接続され、テキストデータを管理する情報処理装置であって、
    前記生成された画像データを前記画像形成装置から受信する受信手段と、
    文字認識を行って前記受信した画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているか否かを判別する判別手段と、
    前記判別手段により所定のキーワードが含まれていないと判別された場合、前記画像データをテキストデータに変換し、前記所定のキーワードが含まれていると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とする情報処理装置。
  21. 画像データを生成する画像形成装置にネットワークを介して接続され、テキストデータを管理する情報処理装置であって、
    前記生成された画像データを前記画像形成装置から受信する受信手段と、
    文字認識を行って前記受信した画像データからテキストを抽出し、抽出したテキスト中に所定のキーワードが含まれているジョブの実行回数を不正ジョブ実行回数としてユーザ毎に管理し、前記不正ジョブ実行回数が所定回数以上であるか否かを判別する判別手段と、
    前記判別手段により不正ジョブ実行回数が所定回数未満であると判別された場合、前記画像データをテキストデータに変換し、前記不正ジョブ実行回数が所定回数以上であると判別された場合、前記画像データをテキストデータに変換しないテキスト変換手段と、
    前記変換されたテキストデータをログ情報と関連付けて記憶媒体に登録するデータ登録手段とを備えたことを特徴とする情報処理装置。
  22. 請求項14乃至17のいずれか一項に記載の画像形成装置を実現するためのコンピュータ読み取り可能なプログラムコードを有するプログラム。
  23. 請求項22記載のプログラムを格納した記憶媒体。
  24. 請求項18乃至21のいずれか一項に記載の情報処理装置を実現するためのコンピュータ読み取り可能なプログラムコードを有するプログラム。
  25. 請求項24記載のプログラムを格納した記憶媒体。
JP2005183461A 2005-06-23 2005-06-23 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置 Expired - Fee Related JP4756930B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005183461A JP4756930B2 (ja) 2005-06-23 2005-06-23 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置
US11/473,804 US7911629B2 (en) 2005-06-23 2006-06-23 Image resolution and text conversion management

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005183461A JP4756930B2 (ja) 2005-06-23 2005-06-23 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置

Publications (2)

Publication Number Publication Date
JP2007004453A JP2007004453A (ja) 2007-01-11
JP4756930B2 true JP4756930B2 (ja) 2011-08-24

Family

ID=37568866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005183461A Expired - Fee Related JP4756930B2 (ja) 2005-06-23 2005-06-23 ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置

Country Status (2)

Country Link
US (1) US7911629B2 (ja)
JP (1) JP4756930B2 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
JP4682837B2 (ja) * 2005-12-13 2011-05-11 富士ゼロックス株式会社 ジョブログ管理プログラム、ジョブログ管理方法、画像処理装置および画像処理システム
JP4725726B2 (ja) * 2005-12-13 2011-07-13 富士ゼロックス株式会社 画像処理装置、ジョブログ管理プログラムおよび画像処理システム
JP2007253598A (ja) * 2006-03-27 2007-10-04 Fuji Xerox Co Ltd 印刷装置
JP5042562B2 (ja) * 2006-08-22 2012-10-03 株式会社リコー 画像処理装置、手書き情報認識方法、手書き情報認識プログラム
KR101015663B1 (ko) * 2008-06-24 2011-02-22 삼성전자주식회사 문자인식장치에서의 문자인식방법 및 그 장치
JP5199761B2 (ja) * 2008-07-11 2013-05-15 キヤノン株式会社 情報処理装置と画像入力装置、文書配信システムとそれらの制御方法
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP2011139363A (ja) * 2009-12-28 2011-07-14 Canon Inc 画像形成装置、情報処理装置、データ処理サーバ及び情報処理方法
JP5811708B2 (ja) * 2010-09-30 2015-11-11 ブラザー工業株式会社 画像処理システム、画像処理方法、中継装置、及び、中継プログラム。
JP5712607B2 (ja) * 2010-12-23 2015-05-07 ブラザー工業株式会社 サーバ,情報処理装置およびプリンタ
JP5805424B2 (ja) * 2011-04-13 2015-11-04 三菱電機ビルテクノサービス株式会社 文書読取装置
JP5879734B2 (ja) * 2011-04-19 2016-03-08 株式会社リコー 情報処理装置及び情報処理プログラム
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
JP6036020B2 (ja) * 2012-08-31 2016-11-30 ブラザー工業株式会社 印刷装置および印刷システム
JP2016517587A (ja) 2013-03-13 2016-06-16 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたデジタル画像におけるオブジェクトの分類
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
CN105518704A (zh) 2013-05-03 2016-04-20 柯法克斯公司 检测和分类使用移动设备采集的视频中对象的系统和方法
JP5918172B2 (ja) * 2013-06-03 2016-05-18 京セラドキュメントソリューションズ株式会社 画像形成システムおよび画像形成装置
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
JP6743470B2 (ja) * 2016-04-20 2020-08-19 富士ゼロックス株式会社 画像蓄積装置及び画像蓄積プログラム
US11037330B2 (en) * 2017-04-08 2021-06-15 Intel Corporation Low rank matrix compression
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
JP7131041B2 (ja) * 2018-04-05 2022-09-06 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム、及び情報処理プログラム
US11776129B2 (en) 2020-12-16 2023-10-03 Qualcomm Incorporated Semantic refinement of image regions

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4956666A (en) * 1989-06-13 1990-09-11 Eastman Kodak Company Secure copier and method of reproduction
US5640467A (en) * 1994-03-30 1997-06-17 Ricoh Company, Ltd. Image forming apparatus which monitors hardware errors of a controller of a copying-inhibited function
JP3527326B2 (ja) * 1994-08-31 2004-05-17 株式会社リコー 画像処理装置
JP3623998B2 (ja) 1995-01-27 2005-02-23 キヤノン株式会社 画像処理方法および画像処理装置
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
US5752152A (en) * 1996-02-08 1998-05-12 Eastman Kodak Company Copy restrictive system
JP3608356B2 (ja) * 1997-11-18 2005-01-12 富士ゼロックス株式会社 画像処理装置、画像処理方法、画像送信装置、画像送信方法
JPH11187252A (ja) * 1997-12-22 1999-07-09 Minolta Co Ltd 画像処理装置
JP2000033730A (ja) * 1998-07-16 2000-02-02 Canon Inc 印刷装置とその制御方法及び印刷システム
US6580820B1 (en) * 1999-06-09 2003-06-17 Xerox Corporation Digital imaging method and apparatus for detection of document security marks
JP3630627B2 (ja) * 2000-10-10 2005-03-16 シャープ株式会社 画像形成装置の不正使用監視装置
JP2002149371A (ja) * 2000-11-13 2002-05-24 Ricoh Co Ltd 印刷ログ及び印刷データ保存によるセキュリティ管理システム
JP2002189686A (ja) 2000-12-19 2002-07-05 Canon Inc 文書配信システム、文書配信装置、文書登録依頼装置、文書登録方法及び記憶媒体
JP4031210B2 (ja) * 2001-03-30 2008-01-09 株式会社東芝 文字認識装置、文字認識方法、及び記録媒体
JP2004118243A (ja) 2002-09-20 2004-04-15 Ricoh Co Ltd ネットワーク印刷システム
JP4145171B2 (ja) * 2003-03-12 2008-09-03 シャープ株式会社 画像処理装置の不正使用監視装置
JP2005057490A (ja) * 2003-08-04 2005-03-03 Ricoh Co Ltd 周辺機器管理システム
US7245765B2 (en) * 2003-11-11 2007-07-17 Sri International Method and apparatus for capturing paper-based information on a mobile computing device
JP4328604B2 (ja) * 2003-11-21 2009-09-09 キヤノン株式会社 画像処理方法、画像処理装置及びプログラム
JP2007004512A (ja) * 2005-06-24 2007-01-11 Fuji Xerox Co Ltd 画像処理システム及び装置及び承認サーバ
JP4743691B2 (ja) * 2005-08-31 2011-08-10 株式会社リコー セキュリティ保護機能付き文書入出力装置
JP4617328B2 (ja) * 2006-07-20 2011-01-26 キヤノン株式会社 画像処理装置及びその処理方法

Also Published As

Publication number Publication date
US20060294154A1 (en) 2006-12-28
JP2007004453A (ja) 2007-01-11
US7911629B2 (en) 2011-03-22

Similar Documents

Publication Publication Date Title
JP4756930B2 (ja) ドキュメント管理システム、ドキュメント管理方法、画像形成装置および情報処理装置
US8593661B2 (en) Image output apparatus including transmission units, image output apparatus control method, program, electronic document management system
US8339645B2 (en) Managing apparatus, image processing apparatus, and processing method for the same, wherein a first user stores a temporary object having attribute information specified but not partial-area data, at a later time an object is received from a second user that includes both partial-area data and attribute information, the storage unit is searched for the temporary object that matches attribute information of the received object, and the first user is notified in response to a match
US7853866B2 (en) Apparatus, method and system for document conversion, apparatuses for document processing and information processing, and storage media that store programs for realizing the apparatuses
US8326090B2 (en) Search apparatus and search method
US7930292B2 (en) Information processing apparatus and control method thereof
US7545992B2 (en) Image processing system and image processing method
JP4405793B2 (ja) 文書管理システム及びその制御方法並びに記録媒体
JP4533027B2 (ja) 印刷装置、及び、印刷装置の制御方法
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
US20090284779A1 (en) Image processing system, image processing method, image processing apparatus and control method thereof
US20090279136A1 (en) Image forming apparatus, job processing method, and storage medium
US8224131B2 (en) Image processing apparatus and image processing method
US8717584B2 (en) Image processing apparatus and control method thereof
US8185504B2 (en) Image processing apparatus and image processing method
JP5030985B2 (ja) 文字列処理装置および画像形成装置
JP2006155308A (ja) 画像形成装置
JP2009271729A (ja) 画像処理装置及びその制御方法、プログラム。
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
JP2006331274A (ja) ネットワーク文書管理システム、及びその制御方法、並びに記憶媒体
JP2006229305A (ja) ネットワーク文書管理システム
JP5094551B2 (ja) 画像形成装置およびその制御方法ならびにそのプログラムおよび記憶媒体
US8279472B2 (en) Image processing apparatus and control method therefor
JP2008042241A (ja) 画像形成装置、及び、その制御方法
JP2008042403A (ja) 画像処理装置及び方法並びにネットワーク文書管理システム及びその制御方法

Legal Events

Date Code Title Description
RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20070626

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080620

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110308

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110523

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110531

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140610

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees