[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2017010187A - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP2017010187A
JP2017010187A JP2015123513A JP2015123513A JP2017010187A JP 2017010187 A JP2017010187 A JP 2017010187A JP 2015123513 A JP2015123513 A JP 2015123513A JP 2015123513 A JP2015123513 A JP 2015123513A JP 2017010187 A JP2017010187 A JP 2017010187A
Authority
JP
Japan
Prior art keywords
ruled
ruled line
line
ruled lines
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015123513A
Other languages
English (en)
Inventor
正和 福永
Masakazu Fukunaga
正和 福永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015123513A priority Critical patent/JP2017010187A/ja
Publication of JP2017010187A publication Critical patent/JP2017010187A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

【課題】罫線によって囲まれている領域を分割するための区切りを抽出する場合にあって、フィールド枠線の下側の枠線から短く直立したものを区切りとして抽出する技術に比べて、精度よく区切りを抽出することができるようにした画像処理装置を提供する。【解決手段】画像処理装置の第1の抽出手段は、画像から罫線と非罫線を抽出し、第2の抽出手段は、前記罫線における前記非罫線の位置が規則的に並んでいる場合は、該罫線によって囲まれている領域を分割するための区切りとして、該非罫線を抽出する。【選択図】図1

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、文字枠線の傾きや、実線、破線など枠線の線種にかかわりなく文字枠線を検出できる文字認識装置及び文字枠線の検出方法を提供することを課題とし、文字枠線検出部はフィールド枠線検出部、文字区切り線検出部及びひげ線検出部を備えており、文字枠線をその性質に応じて検出し、すなわち、フィールド枠線検出部によりフィールドを構成する文字枠線の一種であるフィールド枠線(フィールド区切り線)を検出し、文字区切り線検出部はフィールド枠線検出部によって検出されたフィールド区切り線を基準としてフィールドを構成する文字枠線の一種である文字区切り線を検出し、また、ひげ線検出部は同様にフィールド区切り線を基準としてフィールドを構成する文字枠線の一種であるひげ線を検出することが開示されている。
特許文献2には、罫線や枠などの要素をできるだけ正確に抽出し、未抽出や過抽出を抑え、手作業による図形入力を削減することを課題とし、読み込まれた帳票画像から罫線を抽出し、罫線情報から罫線枠を抽出した後、抽出された罫線枠に相当する部分の画像データを前記帳票画像から消去し、生成された枠消去画像から再び罫線を抽出し、さらに抽出された罫線に相当する部分の画像データを消去し、生成された罫線消去画像から文字列を抽出することが開示されている。
特開2001−155113号公報 特開2000−172780号公報
従来技術によれば、フィールド枠線の下側の枠線から短く直立し、そのフィールド内で1文字ずつの記入領域を区画する縦線からなるひげ線を検出することが行われている。
しかし、規則的に並んでいない非罫線であっても、フィールド枠線の下側の枠線から短く直立したものであれば、区切りのひげ線として検出してしまう。
本発明は、罫線によって囲まれている領域を分割するための区切りを抽出する場合にあって、フィールド枠線の下側の枠線から短く直立したものを区切りとして抽出する技術に比べて、精度よく区切りを抽出することができるようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像から罫線と非罫線を抽出する第1の抽出手段と、前記罫線における前記非罫線の位置が規則的に並んでいる場合は、該罫線によって囲まれている領域を分割するための区切りとして、該非罫線を抽出する第2の抽出手段を具備することを特徴とする画像処理装置である。
請求項2の発明は、前記第2の抽出手段は、予め定められた幅を最小幅として、前記罫線を等分に分割した位置に、前記非罫線がある場合に、該非罫線を前記区切りとして抽出することを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記第2の抽出手段は、高さと幅が予め定められた範囲にある前記非罫線を対象とすることを特徴とする請求項1又は2に記載の画像処理装置である。
請求項4の発明は、前記第2の抽出手段は、前記第2の抽出手段によって抽出された非罫線のうち、区切りとしての大きさを超える第1の非罫線とその他の第2の非罫線に分類し、該第2の非罫線の大きさを用いて、該第1の非罫線を分割することを特徴とする請求項1から3のいずれか一項に記載の画像処理装置である。
請求項5の発明は、前記第2の抽出手段は、罫線によって囲まれている領域内に、既に印刷された文字が含まれている場合は、該文字以外の領域を形成する罫線部分を分割するための区切りとして、非罫線を抽出することを特徴とする請求項1から4のいずれか一項に記載の画像処理装置である。
請求項6の発明は、前記第2の抽出手段は、罫線に囲まれている領域が複数並んでいる場合は、他の領域における区切りとしての非罫線を用いて、個々の領域における区切りとしての非罫線を抽出することを特徴とする請求項1から5のいずれか一項に記載の画像処理装置である。
請求項7の発明は、コンピュータを、画像から罫線と非罫線を抽出する第1の抽出手段と、前記罫線における前記非罫線の位置が規則的に並んでいる場合は、該罫線によって囲まれている領域を分割するための区切りとして、該非罫線を抽出する第2の抽出手段として機能させるための画像処理プログラムである。
請求項1の画像処理装置によれば、罫線によって囲まれている領域を分割するための区切りを抽出する場合にあって、フィールド枠線の下側の枠線から短く直立したものを区切りとして抽出する技術に比べて、精度よく区切りを抽出することができる。
請求項2の画像処理装置によれば、予め定められた幅を最小幅として、罫線を等分に分割した位置に、非罫線がある場合に、その非罫線を区切りとして抽出することができる。
請求項3の画像処理装置によれば、高さと幅が予め定められた範囲にある非罫線を対象として、区切りを抽出することができる。
請求項4の画像処理装置によれば、区切り以外の非罫線と区切りである非罫線が接触している場合であっても、それを分割して区切りを抽出することができる。
請求項5の画像処理装置によれば、罫線によって囲まれている領域内に、既に印刷された文字が含まれている場合であっても、区切りを抽出することができる。
請求項6の画像処理装置によれば、罫線に囲まれている領域が複数並んでいる場合は、他の領域における区切りとしての非罫線を用いて、個々の領域における区切りとしての非罫線を抽出することができる。
請求項7の画像処理プログラムによれば、罫線によって囲まれている領域を分割するための区切りを抽出する場合にあって、フィールド枠線の下側の枠線から短く直立したものを区切りとして抽出する技術に比べて、精度よく区切りを抽出することができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態を利用したシステム構成例を示す説明図である。 本実施の形態において、対象とする画像の例を示す説明図である。 本実施の形態で、罫線と非罫線を抽出した例を示す説明図である。 非罫線部分を文字認識した場合の例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示すフローチャートである。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態による処理例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
本実施の形態である画像情報処理装置100は、罫線によって囲まれている領域を分割するための区切りを抽出するものであって、図1の例に示すように、データ読込モジュール110、線分検出モジュール120、セル構成検出モジュール130、非罫線要素接続算出モジュール140、非線分区切り判断モジュール150を有している。
データ読込モジュール110は、線分検出モジュール120と接続されている。データ読込モジュール110は、画像を読み取り、その画像を線分検出モジュール120へ渡す。画像を読み取るとは、例えば、スキャナー、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。読み取る画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、例えば、帳票のようにビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。なお、その画像の読み取り対象である原稿内には、文字枠線が印刷されている。文字枠線は、その文字枠線内に収まるように文字を、印刷又は手書きで記入させるためのものである。また、読み取られた画像の文字枠線内には、文字が印刷又は記入(以下、記入という)されていてもよいし、記入されておらず空白のままのものであってもよい。文字が記入されている場合は、例えば、画像情報処理装置100の後処理で、その文字を認識することが行われる。また、文字が記入されていない場合は、例えば、画像情報処理装置100の後処理で、テンプレート作成に利用される。
文字枠線で囲まれている領域は、罫線によって囲まれている領域である。そして、文字の位置を規定するために、その領域を分割するための区切りが付されている場合が多い。この区切りが実線である場合は、従来技術によって区切りも含めた罫線(直線状の線分)と、その罫線以外の画素塊(非罫線、例えば、文字等)を分離することが可能である。なお、画素塊とは、4連結又は8連結で連続する画素領域である。
しかし、図3の例に示すような、上辺又は下辺の罫線から対方向(下又は上)にのびている短い線である区切り(セル区切り、ひげ線ともいわれる)がある。前述の特許文献1において「フィールド枠線の下側の枠線から短く直立したもの」と表現されているものである。なお、横書の場合は、上辺又は下辺の罫線から対方向にのびている区切りとなり、縦書の場合は、左辺又は右辺の罫線から対方向(右又は左)にのびている区切りとなる。
画像情報処理装置100は、主に、このような区切りを対象としている。
線分検出モジュール120は、データ読込モジュール110、セル構成検出モジュール130、非罫線要素接続算出モジュール140と接続されている。線分検出モジュール120は、線分を抽出する。この線分は、文字枠線となる罫線の候補となる。例えば、直線状の線分を抽出する従来技術を用いればよい。
セル構成検出モジュール130は、線分検出モジュール120、非罫線要素接続算出モジュール140、非線分区切り判断モジュール150と接続されている。セル構成検出モジュール130は、線分検出モジュール120によって抽出された線分を対象として、文字枠線である罫線の構成を検出する。例えば、水平、垂直な線分によって構成される罫線構造を分析し、文字枠のセル構成要素を検出する。なお、文字枠の集合である表を、分析の対象として含んでいてもよい。分析として、罫線の始点、終点(線分の端点)の座標を抽出することを含む。また、その線分の太さ、色等を抽出するようにしてもよい。
非罫線要素接続算出モジュール140は、線分検出モジュール120、セル構成検出モジュール130、非線分区切り判断モジュール150と接続されている。非罫線要素接続算出モジュール140は、セル構成検出モジュール130によって検出された文字枠線である罫線と、その罫線以外の画素塊である非罫線を分離する。なお、前述した文字枠内の区切りは、非罫線として抽出されることになる。
そして、罫線における非罫線の位置を算出する。つまり、罫線を座標軸として、非罫線の位置を抽出するものである。例えば、文字枠線のうち下辺の罫線をX座標軸(例えば、左端を0)として、非罫線の位置(X座標)を抽出すればよい。この場合、区切りの他に、文字等の画素塊である非罫線が含まれることもある。また、その罫線に接触している非罫線のみの座標を抽出してもよい。この場合も、文字等が罫線に接触していることがあるので、区切りの他に、文字等の画素塊である非罫線が含まれることもある。
非線分区切り判断モジュール150は、セル構成検出モジュール130、非罫線要素接続算出モジュール140と接続されている。非線分区切り判断モジュール150は、罫線における非罫線の位置が規則的に並んでいる場合は、その罫線によって囲まれている領域を分割するための区切りとして、その非罫線を抽出する。非罫線要素接続算出モジュール140によって算出された罫線における非罫線の位置を用いる。その位置のうち、規則的に並んでいるものを区切りの非罫線として抽出する。
非線分区切り判断モジュール150は、予め定められた幅を最小幅として、罫線を等分に分割した位置に、非罫線がある場合に、その非罫線を区切りとして抽出するようにしてもよい。
また、非線分区切り判断モジュール150は、高さと幅が予め定められた範囲にある非罫線を対象とするようにしてもよい。詳細な処理について、図12の例を用いて後述する。
また、非線分区切り判断モジュール150は、前述の処理によって抽出した非罫線のうち、区切りとしての大きさを超える第1の非罫線とその他の第2の非罫線に分類し、その第2の非罫線の大きさを用いて、その第1の非罫線を分割するようにしてもよい。詳細な処理について、図13、図14の例を用いて後述する。
また、非線分区切り判断モジュール150は、罫線によって囲まれている領域内に、既に印刷された文字が含まれている場合は、その文字以外の領域を形成する罫線部分を分割するための区切りとして、非罫線を抽出するようにしてもよい。詳細な処理について、図15の例を用いて後述する。
また、非線分区切り判断モジュール150は、罫線に囲まれている領域が複数並んでいる場合は、他の領域における区切りとしての非罫線を用いて、個々の領域における区切りとしての非罫線を抽出するようにしてもよい。ここで「罫線に囲まれている領域が複数並んでいる場合」として、それらの領域が接触している場合(例えば、文字枠線によって表を形成している場合)であってもよいし、それらの領域が離れている場合であってもよい。また、それらの領域が接触している場合のみに適用するようにしてもよい。そして、それらの領域が離れている場合は、逆に、他の領域における区切りの位置とは独立に(無関係に)、区切りとなる非罫線を抽出してもよい。詳細な処理について、図16の例を用いて後述する。
図2は、本実施の形態を利用したシステム構成例を示す説明図である。
図2(a)に示す例は、画像読取装置210と画像情報処理装置100と帳票処理装置230によって構成したものである。
画像読取装置210は、画像情報処理装置100と接続されている。画像読取装置210は、区切りのある文字枠が記載されている帳票を読み取るスキャナーである。
画像情報処理装置100は、画像読取装置210、帳票処理装置230と接続されている。画像情報処理装置100は、画像読取装置210によって読み取られた画像を受け付け、その文字枠から、区切りの非罫線を抽出し、文字枠内の文字部分を識別可能にする。
帳票処理装置230は、画像情報処理装置100と接続されている。帳票処理装置230は、画像情報処理装置100によって識別可能とされた文字枠内の文字部分を文字認識し、その結果を用いて各種の帳票処理を行う。
なお、画像情報処理装置100は、画像読取装置210又は帳票処理装置230のいずれかと一体として構成してもよいし、画像読取装置210、画像情報処理装置100、帳票処理装置230を一体として構成してもよい。
図2(b)に示す例では、画像情報処理装置100、画像読取装置210A、画像読取装置210B、画像読取装置210C、帳票処理装置230A、帳票処理装置230Bは、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。
ここでの画像読取装置210は、スキャナーであってもよいし、ファックスであってもよい。画像情報処理装置100による機能をクラウドサービスとして実現してもよい。例えば、複数の拠点に設置された画像読取装置210から帳票の画像が送信され、画像情報処理装置100が処理を行い、それらの帳票について帳票処理装置230が統合的な帳票処理を行うようにしてもよい。
図3は、本実施の形態において、対象とする画像の例を示す説明図である。データ読込モジュール110が読み込んだ画像の例を示している。この例では、文字枠内には、4つの文字を記載してもらうために、区切りが上辺と下辺の罫線に3個ずつある。なお、文字は手書きの数字であり、下辺の罫線又は区切りに接続しているものがあったり、ノイズが発生したりしている。
図4は、本実施の形態で、罫線と非罫線を抽出した例を示す説明図である。線分検出モジュール120による処理結果を示している。図4(a)の例は、罫線だけを抽出したものであり、図4(b)の例は、罫線以外の画素塊(非罫線)だけを抽出したものである。
なお、図4(b)に示した画像をそのまま文字認識した場合(本実施の形態のセル構成検出モジュール130、非罫線要素接続算出モジュール140、非線分区切り判断モジュール150による処理が行われなかった場合)、文字認識結果は図5の例に示すようになる。つまり、「.3.’7.’2”’9..」のように認識されてしまう。例えば、区切りが「.’」に、ノイズが[. ”]に、区切りと重なった数字(本来は[8])が[9]に誤認識されている。
図6は、本実施の形態による処理例を示すフローチャートである。具体例として、図3の例に示す画像を対象とした場合の処理例を説明する。
ステップS602では、データ読込モジュール110が、画像データを読み込む。図3の例に示すような画像を読み込む。
ステップS604では、線分検出モジュール120が、直線状の線分を抽出する。図4(a)の例に示すように罫線を抽出する。もちろんのことながら、罫線を抽出した結果、図4(b)の例に示すように非罫線も抽出することになる。
ステップS606では、セル構成検出モジュール130が、セル構成要素を抽出する。図4(a)の例に示すように罫線を対象として、図7の例に示すように、矩形を構成する罫線710、罫線720、罫線730、罫線740を抽出する。例えば、各罫線の始点と終点の座標を抽出する。そして、この例は、1個の文字枠からなっていることを抽出する。
ステップS608では、非罫線要素接続算出モジュール140が、罫線と非罫線要素と接続関係を抽出する。図では、図7の例で示した罫線720(上辺の罫線)と罫線740(下辺の罫線)と、図4(b)の例で示した非罫線との関係を抽出したものである。非罫線(非罫線要素810〜836)として、文字、区切り、ノイズ等が混在している。罫線720に接触している非罫線は非罫線要素810から818であり、罫線740に接触しているのは非罫線要素820〜828、非罫線要素832〜836であり、非罫線要素830(数字の「2」)は、接触していない。
ステップS610では、非線分区切り判断モジュール150が、区切り要素を抽出する。ステップS610の処理内容については、図9の例に示すフローチャートを用いて説明する。
図9は、本実施の形態(非線分区切り判断モジュール150)による処理例を示すフローチャートである。
ステップS902では、罫線の区間内における非罫線要素の座標を抽出する。図10に例を示す。図10(a)に示す例は、図8と同じものであり、罫線720と非罫線要素810等との関係、罫線740と非罫線要素820等との関係例を示している。図10(b)に示す例は、罫線740における非罫線要素820等の位置を示すものである。例えば、罫線740を、その左端を[0]とした座標軸(右端は[600]、罫線740の幅W:=600)として、各非罫線(非罫線要素820等)の位置を示したものである。具体的には、非罫線要素820は50、非罫線要素822は80、非罫線要素824は150、非罫線要素826は225、非罫線要素828は300、非罫線要素832は500、非罫線要素834は570、非罫線要素836は570の位置にある。この数値列を{Yj}j=1〜N(この例では8)とする。なお、単位は、ピクセル(画素数)であってもよいし、mm等であってもよい。もちろんのことながら、上辺である罫線720に対しても同等のことを行う。
ステップS904では、規則的に並んでいる非罫線要素を抽出する。図11に例を示す。文字幅の最小値をTminとする。Tminは予め定められた数値であり、例えば、Tmin:=40とする。Tminと罫線740の長さによって、この文字枠(セル、又は罫線720)を分割できる最大値Smaxを算出できる。この例ではSmax:=15(=600/40)となる。また、分割数の最小値をSminとする。Sminは予め定められた数値であり、例えば、Smin:=3とする。Sminは、2以上で設定可能である。なお、文字幅の最大値を定めた後に、分割数の最小値を定めるようにしてもよい。この例では、3(Smin)〜15(Smax)の範囲で、以下の探索処理を行う。
ステップS902で抽出した座標列に対して、分割数の最小値(Smin)から当てはまり具合を検査する。
分割数Sで想定される座標値列({Xi(:=i*W/S)} i=1〜S−1)に対して、予め定められた近傍δの範囲に実データの座標値列{Yj}で一致する点がいくつあるかカウントする。カウント数がS−1個に一致するならば採用する。なお、{Xi}は、分割数Sの場合の区切りの位置を示している。実際の座標値列{Yj}には、種々の分割数Sにおける{Xi}に合致するものが含まれているはずであり、その合致する位置にある非罫線を区切りとして抽出すればよい。
図11の例では、3分割した場合の{Xi}の位置(近傍δの範囲)には、{Yj}がないので、罫線740を3分割した区切りではないと判断されている。次に、4分割した場合の{Xi}の位置(近傍δの範囲)には、{Yj}が全てあるので、罫線740を4分割した区切りであり、その位置にある非罫線を区切りとして抽出する。
なお、前述の例では、探索順序として、分割数が少ない方から順に行ったが、分割数が多い方から順に行ってもよいし、予め定められた分割数(罫線の長さに基づいて定めた分割数であって、具体的には、罫線の長さを一般的な文字幅で除算した値等)から探索を始めるようにしてもよい。
また、前述の例では、カウント数がS−1個に一致したものを採用したが、全て探索した後に、一致したものの数が最も多いものを採用するようにしてもよい。
また、ここでの対象とする罫線は、横書の場合は、上辺又は下辺の罫線、縦書の場合は、左辺又は右辺の罫線としてもよい。
図12は、本実施の形態による処理例を示す説明図である。文字枠を構成している罫線(前述の例では、罫線710〜740)と接続した非罫線を、サイズチェックを行い、条件を満たさないものは削除する。なお、ここで非罫線のサイズチェックにおける幅とは罫線の方向(図11の例では横方向)をいい、高さとは非罫線の罫線との接続方向(図11の例では上方向)をいうものとする。
区切り(つまり、ひげ線状の突起)と認められない要素を以下のような処理例で削除する。
図12の例に示すように、幅、高さに関する2次元空間での範囲内を満たす(図12の例では、色の濃い部分の領域)ならば削除する。この例は、非罫線の幅が小さいものは基本的に区切り候補として残して、幅が大きいほど区切り候補ではないと判断するようにしたものである。例えば、スキャンの際、又はファックス送信等で発生する間延びした雑音ランレングスを区切り候補に入れない効果が期待できる。
さらに、非罫線の位置が規則的に並んでいる場合に、その非罫線が同じサイズ等であるか否かを判断するようにしてもよい。つまり、サイズ等が揃っている場合は、区切りとして採用する。そして、逸脱した非罫線に対しては補正を行うようにしてもよい。図13、図14の例を用いて説明する。
図14は、本実施の形態による処理例を示す説明図である。前述したように、この例では、4分割であり、非罫線要素824、非罫線要素828、非罫線要素832が区切りとして抽出されている。しかし、非罫線要素832は、数字「8」と区切りが接触しており、非罫線要素832そのものを区切りとして抽出してしまうと、後の文字認識等の処理において、数字「8」が認識対象とならない等の不具合が発生することになる。また、非罫線要素832そのものを文字認識してしまうと、数字「8」と区切りが接触しているので、誤認識してしまうことがある。
なお、図14内の外接矩形(外接矩形1424、外接矩形1428、外接矩形1432)は、見やすくするために、実際の外接矩形よりも大きく描画している。
図13は、本実施の形態(非線分区切り判断モジュール150)による処理例を示すフローチャートである。
ステップS1302では、区切りと認識された部分画像のサイズを計測して、そのサイズの同形性、そもそもの点又は線分らしさを算出する。例えば、図14に示すように、非罫線要素824の外接矩形1424、非罫線要素828の外接矩形1428、非罫線要素832の外接矩形1432のサイズを計測する。サイズの同形性として、例えば、外接矩形の幅、外接矩形の高さ、又は、外接矩形の幅と高さの比率等の差分が予め定められた範囲内にあることをいう。そもそもの点又は線分らしさとは、予め定められた外接矩形の幅、外接矩形の高さ、又は、外接矩形の幅と高さの比率等が予め定められた範囲内にあることをいう。
ステップS1304では、想定外のサイズのものを区分する。つまり、サイズの同形性を満たさない非罫線、そもそもの点又は線分らしさを満たさない非罫線を抽出する。
ステップS1306では、予め定められた閾値の範囲でクラスタ化を行う。例えば、予め定められた範囲内にある非罫線の外接矩形の幅と高さでの2次元空間におけるクラスタリングを行う。また、サイズ差によるクラスタリングを行うようにしてもよい。
ステップS1308では、小さいサイズのクラスタを区切りの候補として決定する。
ステップS1310では、その他のクラスタに所属する要素を区切り候補のサイズと同等になるように分解する。つまり、区切りとその他の文字部に分けることを行う。具体的には、区切りの候補としてのクラスタ内にある非罫線のサイズ、位置関係(実際に非罫線がある位置(Yi)と本来区切りがある位置(Xi)との差分)を用いて、想定外のサイズの非罫線から、その位置関係にある画素塊を区切りの候補のサイズの分だけ除外する処理を行えばよい。図14の例では、X1とY3(非罫線要素824の位置)との位置関係、X2とY5(非罫線要素828の位置)との位置関係と同じ位置関係になるように、X3とY6(非罫線要素832の位置)の位置関係にあって、外接矩形1432内から外接矩形1424等と同じ大きさの部分を削除することによって、本来の数字の「8」の画素塊を抽出する。
図15は、本実施の形態による処理例を示す説明図である。図15(a)の例に示すように、文字枠内にプレプリント文字列(例えば、「価格」、「生年月日」、「名前」等のように文字枠の名称又は文字枠内に記載される情報の名称)が含まれる場合、その文字列の領域を除いた空間(文字が記載される領域)を等分割すると仮定して、区切りの非罫線であるか否かを判断するようにしてもよい。
文字枠内にプレプリント文字列が含まれている場合、その文字列が記入不可エリアとして暗黙に表現されることがある。これらの場合、前述の処理では対応しきれない。
そこで、プレプリント文字列が検出された場合に、以下の処理を行う。
(1)プレプリント部を検出する。
文字枠内で予め定められたサイズ以上の非罫線がある領域を、プレプリント部として抽出する。図15(b)の例に示すように、プレプリント部1510が抽出されることとなる。
(2)プレプリント部の右側に余白を持たせて右端を設定する。
プレプリント部の右側に予め定められた幅の余白を加えて、プレプリント部を拡張する。図15(b)の例に示すように、プレプリント枠の右端1520が設定される。プレプリント枠の右端1520の位置に、縦罫線があると仮定したことになる。
(3)残った領域で、区切りの抽出処理を行う。
図15(b)の例では、プレプリント以外の領域1530を対象として、区切りの抽出処理を行う。
なお、この処理例は、未記入帳票のレイアウト登録時を想定したものである。既に、手書きによる記載がある場合は、プレプリント部と手書きによる記載とを区別する処理を行えばよい。例えば、活字文字と手書き文字の区別処理を行えばよい。具体的には、プレプリント文字が既知である場合は、その文字とのパターンマッチング等によってプレプリント部を区別するようにしてもよい。
図16は、本実施の形態による処理例を示す説明図である。表形式の場合、複数の行又は列で区切りの候補が検出できた場合に、それぞれの行/列で検出できた区切りを総合的に判断するようにしてもよい。
表形式文書の場合、図16の例に示すように、多段で区切りの入った行が設計されている場合がある。この場合、上下に関連したセルで同様の区切りによる記入欄があることが多い。
そこで、各文字枠内での区切り抽出の結果をそのまま利用するのではなく、その結果から好ましい分割数を多数行の文字枠で統合的に判断する。これによって、正確性が増すこととなる。
各行において前述の区切り抽出を行う。ただし、ここでの抽出結果は、区切り候補としてであって、最終的な区切り抽出の結果ではない。例えば、行1610はn1分割が候補であり、行1620はn2分割が候補であり、行1630はni分割が候補であり、行1640はnN分割が候補である。
そして、分割数の多数決によって分割数を決定するようにしてもよい。また、分割数の決定方法は、比率等を用いた確率計算を行ってもよい。
また、分割数だけでなく、分割位置(区切りの位置)、区切りのサイズについても、全ての文字枠で統一するようにしてもよい。
図17を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図17に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナー等のデータ読み取り部1717と、プリンタ等のデータ出力部1718を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1701は、前述の実施の形態において説明した各種のモジュール、すなわち、データ読込モジュール110、線分検出モジュール120、セル構成検出モジュール130、非罫線要素接続算出モジュール140、非線分区切り判断モジュール150等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1702は、CPU1701が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1703は、CPU1701の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1704により相互に接続されている。
ホストバス1704は、ブリッジ1705を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1706に接続されている。
キーボード1708、マウス等のポインティングデバイス1709は、操作者により操作される入力デバイスである。ディスプレイ1710は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1711は、ハードディスク(フラッシュメモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU1701によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、読み込まれた画像データ、罫線を示すデータ、非罫線を示すデータ等が格納される。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。
ドライブ1712は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1713に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1707、外部バス1706、ブリッジ1705、及びホストバス1704を介して接続されているRAM1703に供給する。リムーバブル記録媒体1713も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1714は、外部接続機器1715を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1714は、インタフェース1707、及び外部バス1706、ブリッジ1705、ホストバス1704等を介してCPU1701等に接続されている。通信部1716は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1717は、例えばスキャナーであり、ドキュメントの読み取り処理を実行する。データ出力部1718は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図17に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図17に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図17に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナー、プリンタ、複合機(スキャナー、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
また、前述の実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
100…画像情報処理装置
110…データ読込モジュール
120…線分検出モジュール
130…セル構成検出モジュール
140…非罫線要素接続算出モジュール
150…非線分区切り判断モジュール
210…画像読取装置
230…帳票処理装置
290…通信回線

Claims (7)

  1. 画像から罫線と非罫線を抽出する第1の抽出手段と、
    前記罫線における前記非罫線の位置が規則的に並んでいる場合は、該罫線によって囲まれている領域を分割するための区切りとして、該非罫線を抽出する第2の抽出手段
    を具備することを特徴とする画像処理装置。
  2. 前記第2の抽出手段は、予め定められた幅を最小幅として、前記罫線を等分に分割した位置に、前記非罫線がある場合に、該非罫線を前記区切りとして抽出する
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第2の抽出手段は、高さと幅が予め定められた範囲にある前記非罫線を対象とする
    ことを特徴とする請求項1又は2に記載の画像処理装置。
  4. 前記第2の抽出手段は、前記第2の抽出手段によって抽出された非罫線のうち、区切りとしての大きさを超える第1の非罫線とその他の第2の非罫線に分類し、該第2の非罫線の大きさを用いて、該第1の非罫線を分割する
    ことを特徴とする請求項1から3のいずれか一項に記載の画像処理装置。
  5. 前記第2の抽出手段は、罫線によって囲まれている領域内に、既に印刷された文字が含まれている場合は、該文字以外の領域を形成する罫線部分を分割するための区切りとして、非罫線を抽出する
    ことを特徴とする請求項1から4のいずれか一項に記載の画像処理装置。
  6. 前記第2の抽出手段は、罫線に囲まれている領域が複数並んでいる場合は、他の領域における区切りとしての非罫線を用いて、個々の領域における区切りとしての非罫線を抽出する
    ことを特徴とする請求項1から5のいずれか一項に記載の画像処理装置。
  7. コンピュータを、
    画像から罫線と非罫線を抽出する第1の抽出手段と、
    前記罫線における前記非罫線の位置が規則的に並んでいる場合は、該罫線によって囲まれている領域を分割するための区切りとして、該非罫線を抽出する第2の抽出手段
    として機能させるための画像処理プログラム。
JP2015123513A 2015-06-19 2015-06-19 画像処理装置及び画像処理プログラム Pending JP2017010187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015123513A JP2017010187A (ja) 2015-06-19 2015-06-19 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015123513A JP2017010187A (ja) 2015-06-19 2015-06-19 画像処理装置及び画像処理プログラム

Publications (1)

Publication Number Publication Date
JP2017010187A true JP2017010187A (ja) 2017-01-12

Family

ID=57763515

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015123513A Pending JP2017010187A (ja) 2015-06-19 2015-06-19 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP2017010187A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112017006908T5 (de) 2017-01-24 2019-10-02 Sony Semiconductor Solutions Corporation Lichtempfangselement, verfahren zum produzieren eines lichtempfangselements, bildgebungselement und elektronische vorrichtung
JP2020154449A (ja) * 2019-03-18 2020-09-24 富士ゼロックス株式会社 画像処理装置及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112017006908T5 (de) 2017-01-24 2019-10-02 Sony Semiconductor Solutions Corporation Lichtempfangselement, verfahren zum produzieren eines lichtempfangselements, bildgebungselement und elektronische vorrichtung
JP2020154449A (ja) * 2019-03-18 2020-09-24 富士ゼロックス株式会社 画像処理装置及びプログラム

Similar Documents

Publication Publication Date Title
EP2669847B1 (en) Document processing apparatus, document processing method and scanner
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
US20180232573A1 (en) Information processing apparatus, control method, and storage medium
US8391607B2 (en) Image processor and computer readable medium
US9280725B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2015169978A (ja) 画像処理装置及び画像処理プログラム
US20180225541A1 (en) Image processing apparatuses and non-transitory computer readable medium
US8787676B2 (en) Image processing apparatus, computer readable medium storing program, and image processing method
JP2017010187A (ja) 画像処理装置及び画像処理プログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP2018045359A (ja) 画像処理装置及び画像処理プログラム
US11972208B2 (en) Information processing device and information processing method
JP2015099536A (ja) 図表領域検出装置および図表領域検出方法
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム
JP5262778B2 (ja) 画像処理装置及び画像処理プログラム
JP6007720B2 (ja) 情報処理装置及び情報処理プログラム
US8620090B2 (en) Line determination apparatus, line determination method, and computer-readable medium
JP6187307B2 (ja) 画像処理装置及び画像処理プログラム
JP6241311B2 (ja) 画像処理装置及び画像処理プログラム
JP2010039810A (ja) 画像処理装置及び画像処理プログラム
JP6003375B2 (ja) 画像処理装置及び画像処理プログラム
JP2012022359A (ja) 画像処理装置及び画像処理プログラム
JP6409423B2 (ja) 画像処理装置及び画像処理プログラム
JP2022051198A (ja) Ocr処理装置、ocr処理方法、及びプログラム