[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2019144704A - 読取システム、読取方法、プログラム、及び記憶媒体 - Google Patents

読取システム、読取方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP2019144704A
JP2019144704A JP2018026500A JP2018026500A JP2019144704A JP 2019144704 A JP2019144704 A JP 2019144704A JP 2018026500 A JP2018026500 A JP 2018026500A JP 2018026500 A JP2018026500 A JP 2018026500A JP 2019144704 A JP2019144704 A JP 2019144704A
Authority
JP
Japan
Prior art keywords
image
unit
segment display
candidate image
reading system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018026500A
Other languages
English (en)
Other versions
JP6542407B1 (ja
Inventor
利和 瀧
Toshikazu Taki
利和 瀧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2018026500A priority Critical patent/JP6542407B1/ja
Priority to PCT/JP2018/035362 priority patent/WO2019159415A1/ja
Priority to CN201880088163.6A priority patent/CN111670458B/zh
Application granted granted Critical
Publication of JP6542407B1 publication Critical patent/JP6542407B1/ja
Publication of JP2019144704A publication Critical patent/JP2019144704A/ja
Priority to US16/922,097 priority patent/US11301709B2/en
Priority to US17/688,063 priority patent/US11915498B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/49Analysis of texture based on structural texture description, e.g. using primitives or placement rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/457Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/02Recognising information on displays, dials, clocks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)

Abstract

【課題】セグメントディスプレイの数値の読み取り精度を向上できる、読取システム、読取方法、プログラム、及び記憶媒体を提供する。【解決手段】実施形態に係る読取システムは、抽出部、判定部、及び読取部を備える。前記抽出部は、入力画像からセグメントディスプレイが撮影された部分の候補画像を抽出する。前記判定部は、前記候補画像から検出された複数の直線のそれぞれの基準線に対する角度を算出し、前記角度と前記直線の数との関係を示す分布に基づいて前記候補画像がセグメントディスプレイの画像であるか判定を行う。前記読取部は、セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る。【選択図】図1

Description

本発明の実施形態は、読取システム、読取方法、プログラム、及び記憶媒体に関する。
セグメントディスプレイに表示された数値を読み取るシステムがある。このシステムにおいて、数値の読み取りの精度は、高いことが望ましい。
特開2017−10170号公報
本発明が解決しようとする課題は、セグメントディスプレイの数値の読み取り精度を向上できる、読取システム、読取方法、プログラム、及び記憶媒体を提供することである。
実施形態に係る読取システムは、抽出部、判定部、及び読取部を備える。前記抽出部は、入力画像からセグメントディスプレイが撮影された部分の候補画像を抽出する。前記判定部は、前記候補画像から検出された複数の直線のそれぞれの基準線に対する角度を算出し、前記角度と前記直線の数との関係を示す分布に基づいて前記候補画像がセグメントディスプレイの画像であるか判定を行う。前記読取部は、セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る。
実施形態に係る読取システムの構成を表すブロック図である。 実施形態に係る読取システムの動作を表すフローチャートである。 実施形態に係る読取システムにおける処理を例示する図である。 実施形態の第1変形例に係る読取システムの構成を表すブロック図である。 実施形態の第2変形例に係る読取システムの構成を表すブロック図である。 実施形態の第3変形例に係る読取システムの構成を表すブロック図である。 実施形態に係る読取システムを実現するためのハードウェア構成を表すブロック図である。
以下に、本発明の各実施形態について図面を参照しつつ説明する。
また、本願明細書と各図において、既に説明したものと同様の要素には同一の符号を付して詳細な説明は適宜省略する。
図1は、実施形態に係る読取システムの構成を表すブロック図である。
実施形態に係る読取システムは、セグメントディスプレイを含む画像から、セグメントディスプレイに表示された数値を読み取るために用いられる。
本実施形態において、セグメントディスプレイとは、複数のセグメントの表示によって構成される数字や文字等の何らかの表示情報を含むものを表す。
図1に表したように、実施形態に係る読取システム1は、撮像部11、抽出部12、変換部13、判定部15、読取部16、及び記憶部18を備える。
撮像部11は、セグメントディスプレイを撮影し、静止した画像を取得する。撮像部11は、取得した画像を抽出部12に出力する。撮像部11により動画が撮影される場合は、その動画から静止画像を切り出して抽出部12に出力する。撮影される画像には、セグメントディスプレイ以外のものが写っていても良い。
抽出部12は、入力された画像から、セグメントディスプレイの画像の候補を抽出する。ここでは、撮像部11によって撮影され、抽出部12に入力される画像を、入力画像と呼ぶ。入力画像の一部であって、セグメントディスプレイの候補となる画像を、候補画像と呼ぶ。候補画像は、セグメントディスプレイが撮影されていると抽出部12によって判定された、入力画像の一部である。抽出部12から出力される候補画像は複数であっても良い。
具体的な一例として、抽出部12は、加工部12a、二値化部12b、輪郭抽出部12c、第1選定部12d、四角形抽出部12e、第2選定部12fを有する。
加工部12aは、例えば、入力画像を、グレイスケールに変換した加工画像を生成する。加工部12aは、加工画像を二値化部12bに出力する。この際に、加工部12aは、例えば、入力画像を予め設定されたサイズに縮小した加工画像を、二値化部12bに出力してもよい。その際、加工部12aは、縮小されていない原寸画像を記憶部18に記憶する。
二値化部12bは、入力された加工画像を二値化し、白色と黒色で表される二値画像を生成する。輪郭抽出部12cは、二値画像において、例えば白色で表されている領域の輪郭を抽出する。
第1選定部12dは、輪郭で囲まれた領域の面積を算出する。複数の輪郭が抽出された場合は、それぞれの領域の面積を算出する。第1選定部12dは、算出された各面積と所定の閾値とを比較し、面積が閾値以上の領域のみを選定する。これにより、面積が小さすぎる領域が候補から除外される。
四角形抽出部12eは、選定された領域を直線近似し、四角形を抽出する。例えば、四角形抽出部12eは、抽出された四角形の頂点の座標を取得する。
第2選定部12fは、抽出された四角形の領域を予め設定された条件と比較し、条件に適合する領域を選定する。条件としては、例えば、四角形の縦寸法と横寸法の比率が所定範囲内にあること、頂点の角度が所定範囲内にあること、四角形のいずれかの頂点も画像の外枠近傍(例えば、外枠から3ピクセル以内)にないこと、などが用いられる。第2選定部12fは、選定された四角形を、最終的な候補画像として、変換部13に出力する。
変換部13は、以下の第1処理及び第2処理を行う。
第1処理において、変換部13は、抽出部12から入力された候補画像が歪んでいないか判定する。候補画像が歪んでいると判定された場合、変換部13は、候補画像が正面から撮影された画像に近づくように、その歪みを補正する。
第2処理において、変換部13は、候補画像のサイズが、予め設定された規定サイズと一致するか判定する。候補画像のサイズが規定サイズと一致しない場合、変換部13は、候補画像のサイズが規定サイズに近づくように、候補画像を補正する。
変換部13は、例えば、候補画像を射影変換することで、歪み及びサイズを補正する。変換部13は、補正した候補画像を判定部15に出力する。候補画像が歪んでおらず、候補画像のサイズが規定サイズに一致すると判定された場合、変換部13は、入力された候補画像をそのまま判定部15に出力する。
判定部15は、直線検出部15a、角度算出部15b、分布生成部15c、第1比較部15d、端点群検出部15e、評価部15f、及び第2比較部15gを有する。
直線検出部15aは、エッジ検出を行った画像に含まれる複数の直線を検出する。例えば、直線の検出では、線分の始点と終点が検出される。直線検出部15aは、検出結果を、角度算出部15bに出力し、且つ記憶部18に記憶する。直線検出部15bは、所定の長さ以上の線分を所定の角度分解能にて検出する。
角度算出部15bは、それぞれの直線の基準線に対する角度を算出する。角度算出部15bは、例えば、画像底辺(真横に延びる直線)を基準線とし、この基準線とそれぞれの直線との間の角度を算出する。分布生成部15cは、算出結果に基づいて、角度と直線の数との関係を示す分布を生成する。
第1比較部15dは、生成された分布と、予め設定された第1条件と、を比較する。第1条件は、例えば、生成された分布において、第1角度近傍における直線の総数と、第1角度に対して傾斜した第2角度近傍における直線の総数と、の和が、予め設定された値以上となっていることである。
例えば、第1角度は0度であり、第2角度は80度である。「近傍」は、例えば、第1角度または第2角度を中心として、−10度以上+10度以下の範囲を含む。この場合、第1比較部15dは、分布において、−10度以上10度以下の範囲に含まれる直線の総数と、70度以上90度以下の範囲に含まれる直線の総数と、の和を、予め設定された値と比較する。
例えば、画像において、横方向に平行な線の角度を0度、縦方向に平行な線の角度を90度とする。読み取り対象のセグメントディスプレイが、7セグメントディスプレイである場合、約0度の直線と約80度の直線が多く検出される。読み取り対象のセグメントディスプレイが、14セグメントディスプレイまたは16セグメントディスプレイである場合、約0度の直線、約45度の直線、及び約80度の直線が多く検出される。
第1条件は、この特性に基づいて設定される。分布が第1条件を満たす場合、候補画像はセグメントディスプレイを含む可能性が高い。
第1比較部15dは、分布が第1条件を満たす場合、その判定結果を端点群検出部15eに出力する。分布が第1条件を満たさない場合は、候補画像がセグメントディスプレイを含まない可能性が高いため、例えば処理を終了する。
第1比較部15dから判定結果が入力されると、端点群検出部15eは、例えば、記憶部18に記憶された直線の検出結果を参照する。そして、端点群検出部15eは、直線の検出結果から、各直線の端点(始点及び終点)が集まった端点群を検出する。
端点群検出部15eは、例えば、候補画像を横方向及び縦方向において所定の間隔で複数のエリア(マトリクス状)に分割し、所定数以上の端点が存在するエリアを端点群として抽出する。候補画像にセグメントディスプレイが含まれている場合は、候補画像から複数の端点群が検出されうる。これらの端点群が検出された位置は、セグメントの端部の位置に対応する。
例えば、評価部15fは、それぞれの端点群について、ある端点群からそれに隣り合う端点群へ向かうベクトルを算出する。ベクトルは、例えば、ある端点群を別の端点群へ重ね合わせるために必要な移動量を求めることで得られる。評価部15fは、隣接するベクトル同士の大きさの比、及び、ベクトル同士の間の角度を算出する。評価部15fは、これらの評価値を、第2比較部15gに出力する。
第2比較部15gは、評価値と第2条件とを比較する。第2条件は、例えば、上記大きさの比に関する第1範囲、及び上記角度に関する第2範囲を含む。第2比較部15gは、上記大きさの比が第1範囲内にあり、上記角度が第2範囲内にある場合、候補画像が、セグメントディスプレイの画像であると判定し、候補画像を読取部16に出力する。
例えば、一般的な7セグメントディスプレイは、正面視において、縦方向に延びるセグメント(縦セグメント)と、横方向に延びるセグメント(横セグメント)と、を含む。典型的には、縦セグメント同士の長さの比は、略1である。縦セグメントの長さに対する横セグメントの長さの比は、1以下である。また、縦セグメントと横セグメントとの間の角度は、略80度または略100度である。縦セグメント同士の間の角度は、180度である。
評価部15fによって算出される、ベクトル同士の大きさの比は、縦セグメント同士の長さの比または縦セグメントと横セグメントの長さの比に対応する。また、評価部15fによって算出される、ベクトル同士の間の角度は、縦セグメントと横セグメントとの間の角度、または縦セグメント同士の間の角度に対応する。従って、これらの評価値を、それぞれ、予め設定された第1範囲及び第2範囲と比較することで、候補画像がセグメントディスプレイの画像であるか判定することができる。
なお、評価部15fにより、複数の大きさの比及び複数の角度が算出された場合、第2比較部15gは、例えば、それぞれの大きさの比を第1範囲と比較し、それぞれの角度を第2範囲と比較する。
第2比較部15gは、例えば、算出された大きさの比の全体の数を検出する。また、第2比較部15gは、第1範囲に含まれる大きさの比の数を検出する。そして、第2比較部15gは、全体の数に対する第1範囲に含まれる大きさの比の数の割合を算出する。
同様に、第2比較部15gは、例えば、算出された角度の全体の数に対する、第2範囲に含まれる角度の数の割合を算出する。
第2比較部15gは、算出された2つの割合が、それぞれ、予め設定された閾値以上の場合に、候補画像が、セグメントディスプレイの画像であると判定する。
読取部16は、入力された候補画像から、セグメントディスプレイに表示された数値を読み取る。例えば、読取部16は、入力された候補画像から数字を切り出し、点灯しているセグメントを検出することで、数値を読み取る。読取部16は、例えば、読み取った数値を、モニタに表示させたり、データベースに出力したりする。
記憶部18は、読取システム1の処理に必要な情報や、処理の過程で生成されたデータを記憶する。例えば、記憶部18には、判定が行われる際に比較される閾値や条件等が記憶される。
図2及び図3を参照して、実施形態に係る読取システム1の動作について説明する。
図2は、実施形態に係る読取システムの動作を表すフローチャートである。
図3は、実施形態に係る読取システムにおける処理を例示する図である。
撮像部11は、セグメントディスプレイを撮影し、画像を取得する(図2のステップS11)。加工部12aは、入力画像を加工する(ステップS12a)。これにより、入力画像を縮小してグレイスケール化した加工画像と、入力画像をグレイスケール化のみした原寸画像と、が生成される。図3(a)は、加工画像の一例である。二値化部12bは、加工画像を二値化し、図3(b)に表したように、二値画像を生成する(ステップS12b)。輪郭抽出部12cは、二値画像の輪郭を抽出する(ステップS12c)。
第1選定部12dは、輪郭で囲まれた領域を選定する(ステップS12d)。これにより、例えば、図3(c)に表したように、枠Aで囲まれた領域が選定される。四角形抽出部12eは、選定された領域における四角形の抽出結果に基づき、原寸画像から四角形を抽出する(ステップS12e)。第2選定部12fは、抽出された四角形を選定し(ステップS12f)、候補画像として出力する。図3(d)は、候補画像として出力される四角形を表す。変換部13は、図3(e)に表したように、歪みを補正するよう候補画像を変換する。変換部13は、例えば、候補画像を射影変換することで、歪み及びサイズを補正する(ステップS13)。
直線検出部15aは、図3(f)に表したように、候補画像から複数の直線SLを検出する(ステップS15a)。なお、図3(f)以降では、候補画像の一部のみを例示している。角度算出部15bは、それぞれの直線SLの角度を算出する(ステップS15b)。分布生成部15cは、図3(g)に表したように、角度θと直線の数Nとの関係を示す分布を生成する(ステップS15c)。
第1比較部15dは、分布が第1条件を満たすか判定する(ステップS15d)。例えば、第1比較部15dは、0度近傍のピークと、80度近傍のピークと、をこれらの中間の角度で折り返して重ね合わせる。これにより、図3(g)の破線で例示した分布が生成される。第1比較部15dは、この分布において、−10度以上10度以下の範囲に含まれる直線の数Nの総数を算出し、予め設定された値と比較する。
第1条件が満たされている場合(総数が当該値以上である場合)、端点群検出部15eは、図3(f)に表した直線の検出結果から、図3(h)に表したように、端点群EGを検出する(ステップS15e)。評価部15fは、隣り合う端点群同士を結ぶベクトルを算出し、評価値(大きさの比及び角度)を算出する(ステップS15f)。
第2比較部15gは、評価値が第2条件を満たすか判定する(ステップS15g)。評価値が第2条件を満たす場合、読取部16は、候補画像から、セグメントディスプレイの数値を読み取る(ステップS16)。
判定部15は、ステップS15a〜S15gが未だ行われていない、他の候補画像が無いか判定する(ステップS17)。他の候補画像がある場合、その候補画像について、ステップS15aが行われる。他の候補画像がない場合、処理を終了する。
実施形態の効果を説明する。
セグメントディスプレイを読み取る際には、上述したように、入力画像の中から、セグメントディスプレイが撮影された部分の候補となる候補画像が抽出される。従来は、例えば、抽出された候補画像に対して歪みなどの補正を適宜行い、候補画像からセグメントディスプレイの数値を読み取っていた。
しかし、候補画像には。例えば、セグメントディスプレイに似た表示器が含まれる場合がある。この場合、別の表示器の数値をセグメントディスプレイの数値として読み取ってしまい、誤検出が生じる可能性がある。
実施形態に係る読取システム1は、このような誤検出を抑制するために、候補画像について、直線検出の結果及び端点群検出の結果に基づいて、候補画像がセグメントディスプレイを含むか判定を行っている。セグメントディスプレイを含むと判定された候補画像のみを読み取ることで、誤検出の可能性を低減できる。
また、直線検出の結果及び端点群検出の結果に基づく判定は、一般的なセグメントディスプレイの特徴(セグメントの長さ及び角度)を利用している。このため、読取システム1は、多様なセグメントディスプレイに対して適用でき、その数値をより精度良く読み取ることが可能である。
なお、図1〜図3に表した例では、第1比較部15dと第2比較部15gの2つで判定が行われていたが、読取システム1において、第1比較部15d及び第2比較部15gの一方のみにより判定が行われても良い。この場合でも、読取部16による読み取りの前に、セグメントディスプレイを含む可能性が低い候補画像を除外できるため、セグメントディスプレイの数値の読み取り精度を向上できる。ただし、読み取り精度をより向上させるためには、第1比較部15d及び第2比較部15gの両方が設けられていることが望ましい。
なお、図1に表した例では、実施形態に係る読取システム1が撮像部11を備えているが、読取システム1は撮像部11を備えていなくても良い。例えば、他の撮像装置で撮影された画像が読取システム1へ入力され、その入力画像から読取システム1によってセグメントディスプレイの数値が読み取られても良い。
また、読取システム1は、変換部13を備えていなくても良いが、読取の精度を向上させるためには、変換部13を備えていることが望ましい。
例えば、変換部13により候補画像の歪みが補正されることで、適合率の精度を向上させることができる。これにより、セグメントディスプレイが撮影された候補画像をより正確に選別できるようになる。
また、図3では、7セグメントディスプレイに表示された数値を読み取る例を示した。しかし、実施形態に係る読取システム1で読み取り可能なセグメントディスプレイは、7セグメントディスプレイに限定されない。読み取り対象のセグメントディスプレイは、14セグメントディスプレイまたは16セグメントディスプレイであっても良い。
また、抽出部12における処理は、候補画像を抽出できれば、適宜変更可能である。例えば、入力画像のサイズが小さい場合、または入力画像が予め二値化されている場合などは、加工部12aまたは二値化部12bは不要である。また、入力画像から候補画像を抽出するための処理も適宜変更可能である。これらの変形例について、以下で説明する。
(第1変形例)
図4は、実施形態の第1変形例に係る読取システムの構成を表すブロック図である。
図1〜図3の例では、セグメントディスプレイの表示領域の枠が四角形であった。そのため、当該表示領域の形状に合わせて、抽出部12には、四角形抽出部12eが設けられていた。
表示領域の枠が円形の場合には、図4に表した読取システム2のように、抽出部12において、四角形抽出部12eに代えて、楕円抽出部12gが設けられる。楕円抽出部12gは、第1選定部12dによって選定された領域から楕円を抽出する。このとき、楕円抽出部12gは、抽出された楕円の座標を取得する。楕円抽出部12gは、原寸画像において、上記座標に対応する楕円の画像を抽出し、第2選定部12fに出力する。
第2選定部12fは、入力された楕円の画像を予め設定された条件と比較し、条件に適合する楕円を選定する。条件としては、例えば、楕円の扁平率、輝度の分布などが用いられる。第2選定部12fは、選定された楕円の画像を候補画像として変換部13に出力する。以降の処理は、図1〜図3で説明した例と同様である。すなわち、変換部13は、候補画像の歪みを補正する。そして、判定部15による判定を経て、読取部16によってセグメントディスプレイの数値が読み取られる。
(第2変形例)
図5は、実施形態の第2変形例に係る読取システムの構成を表すブロック図である。
図5に表した読取システム3は、読取システム1との比較において、抽出部12及び変換部13に代えて、抽出部21を備える。
読取システム3では、セグメントディスプレイの数値を読み取る前に、撮像部11により、読み取り対象のセグメントディスプレイのみを正面から撮影する。ここでは、セグメントディスプレイのみを正面から撮影した画像を、テンプレート画像と呼ぶ。
抽出部21は、特徴量抽出部21a、マッチング部21b、変換部21c、及び探索部21dを有する。
特徴量抽出部21aは、入力画像の特徴量を抽出する。また、特徴量抽出部21aは、記憶部18に記憶されたテンプレート画像を参照し、テンプレート画像の特徴量を抽出する。あるいは、予め、特徴量抽出部21aによって、テンプレート画像の特徴量が抽出されて記憶部18に記憶されていても良い。この場合、特徴量抽出部21aは、記憶部18に記憶されたテンプレート画像の特徴量を参照する。特徴量抽出部21aは、入力画像の特徴量及びテンプレート画像の特徴量を、マッチング部21bに出力する。
マッチング部21bは、入力画像の特徴量を、テンプレート画像の特徴量とマッチングさせるために必要な、入力画像の補正量を算出する。例えば、マッチング部21bは、入力画像において歪んでいるセグメントディスプレイを、正面から撮影された画像に近づけるために必要な補正量を算出する。マッチング部21bは、算出した補正量及び入力画像を、変換部13に出力する。
なお、特徴量同士をマッチング出来ない場合は、入力画像にセグメントディスプレイが含まれていない可能性が高い。従って、この場合、例えば、補正量を算出せずに処理を終了する。
変換部21cは、入力された補正量に基づき、入力画像を変換する。これにより、入力画像がテンプレート画像に対して歪んでいる場合には、その歪みが補正される。
探索部21dは、記憶部18に記憶されたテンプレート画像を参照する。そして、探索部21dは、入力画像から、テンプレート画像とマッチングする部分を探索する。探索部21dは、マッチングした部分を、候補画像として判定部15に出力する。
以降の判定部15及び読取部16における処理は、図1に表した読取システム1と同様である。
なお、特徴量抽出部21aによる特徴量の抽出は、例えば、KAZE、AKAZE(Accelerated KAZE)、またはSIFT(Scale-invariant feature transform)などを用いて行われる。マッチング部21bにおけるマッチングは、例えば、KNN(K Nearest Neighbor)、またはFLANN(Fast Library for Approximate Nearest Neighbors)などを用いて行われる。探索部21dによる探索は、例えば、画像間の類似度に基づくパターンマッチングを用いて行われる。
本変形例に係る読取システム3では、特徴量を用いた入力画像の変換、及びテンプレート画像を用いたマッチングが行われる。すなわち、入力画像の全領域を変換するため、読取システム1に比べて、同一平面上に複数のセグメントディスプレイが存在する場合に有効である。
(第3変形例)
図6は、実施形態の第3変形例に係る読取システムの構成を表すブロック図である。
図6に表した読取システム4は、読取システム1との比較において、抽出部12及び変換部13に代えて抽出部31を備える。抽出部31は、学習部31a、入力部31b、検出部31c、及び処理部31dを有する。
読取システム4では、ニューラルネットワークを用いて、入力画像からセグメントディスプレイが撮影された候補画像が抽出される。例えば、抽出部31には、事前に、教師データが入力され、ニューラルネットワークの学習が行われる。教師データは、例えば、セグメントディスプレイを含む歪んだ画像と、その画像においてセグメントディスプレイの位置を示すデータと、その画像の歪み量と、を含む。
学習部31aは、画像データが入力された際に、セグメントディスプレイが撮影された部分のデータに対してニューロンが反応(発火)し、且つ、その画像の歪み量に対応するニューロンが反応するよう、ニューラルネットワークを学習させる。学習部31aは、学習させたニューラルネットワークを記憶部18に記憶する。なお、学習部31aによる上記学習は、判定部15や読取部16による処理が実行される処理装置で行われても良いし、これとは異なる別の処理装置を用いて行われても良い。上記学習には、好ましくは、より高速な演算性能を有する処理装置が用いられる。
その後、撮像部11により、セグメントディスプレイの数値を読み取るために画像が取得され、画像が抽出部31に入力される。画像が入力されると、入力部31bは、記憶部18に記憶された学習済みのニューラルネットワークを参照する。そして、入力部31bは、このニューラルネットワークに、画像のデータを入力する。
ニューラルネットワークに画像データが入力されている間、ニューロンの反応があると、検出部31cはその反応を検出する。そして、検出部31cは、ニューロンが反応した画像の座標及び歪み量を検出し、処理部31dに出力する。
処理部31dは、入力された座標に基づき、入力画像から候補画像を抽出する。また、処理部31dは、入力された歪み量に基づいて、候補画像の歪みを補正する。処理部31dは、補正された候補画像を判定部15に出力する。
なお、候補画像の抽出と、歪みの補正と、が行われる順序は、適宜変更できる。例えば、処理部31dにおいて、入力画像の歪みが補正された後に、候補画像が抽出されても良い。
以降の判定部15及び読取部16における処理は、図1に表した読取システム1と同様である。
本変形例に係る読取システム3では、ニューラルネットワークを用いて画像の切り出しや補正を行う。このため、セグメントディスプレイの表示領域とその外枠とのコントラスト比が大きくなく、2値化画像から輪郭を抽出しにくい場合にも、より高精度に候補画像を抽出できる。従って、読取システム1に比べて、入力画像中のセグメントディスプレイの数値を、より高精度に読み取ることが可能となる。
図7は、実施形態に係る読取システムを実現するためのハードウェア構成を表すブロック図である。
例えば、実施形態に係る読取システムは、図7に表した読取装置5及び撮像装置6から構成される。読取装置5は、例えばコンピュータであり、ROM(Read Only Memory)51、RAM(Random Access Memory)52、CPU(Central Processing Unit)53、およびHDD(Hard Disk Drive)54を有する。
ROM51は、コンピュータの動作を制御するプログラムを格納している。ROM51には、コンピュータを、上述した実施形態における、抽出部、変換部、判定部、読取部、探索部などとして機能させるために必要なプログラムが格納されている。
RAM52は、ROM51に格納されたプログラムが展開される記憶領域として機能する。CPU53は、ROM51に格納された制御プログラムを読み込み、当該制御プログラムに従ってコンピュータの動作を制御する。また、CPU53は、コンピュータの動作によって得られた様々なデータをRAM52に展開する。HDD54は、上述した実施形態における記憶部18として機能し、読み取りに必要な情報や、読み取りの過程で得られた情報を記憶する。
読取装置5を用いて、ニューラルネットワークを利用した読取システム4を実現させる場合、読取装置5は、さらに、GPU(Graphics Processing Unit)や、ニューラルネットワークの処理に特化した専用チップを有していても良い。また、読取装置5は、HDD54に代えて、eMMC(embedded Multi Media Card)、SSD(Solid State Drive)、SSHD(Solid State Hybrid Drive)などを有していても良い。
撮像装置6は、被写体(セグメントディスプレイ)を撮影し、取得した画像を読取装置5へ送信する。撮像装置6は、例えば、カメラである。
出力装置7は、読取装置5から出力されたデータ(読み取られたセグメントディスプレイの数値)を、ユーザが認識できるように出力する。出力装置7は、例えば、モニタ、プリンタ、またはスピーカなどである。
読取装置5、撮像装置6、及び出力装置7は、例えば、有線又は無線で相互に接続される。または、これらはネットワークを介して相互に接続されていても良い。あるいは、読取装置5、撮像装置6、及び出力装置7の少なくとも2つが、1つの装置に組み込まれていても良い。例えば、読取装置5が、撮像装置6の画像処理部などと一体に組み込まれていても良い。
以上で説明した実施形態に係る読取システム及び読取方法を用いることで、セグメントディスプレイに表示された数値を、より高精度に読み取ることが可能となる。同様に、コンピュータを、読取システムとして動作させるためのプログラムを用いることで、セグメントディスプレイに表示された数値を、より高精度にコンピュータに読み取らせることが可能となる。
以上、本発明のいくつかの実施形態を例示したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更などを行うことができる。これら実施形態やその変形例は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。また、前述の各実施形態は、相互に組み合わせて実施することができる。
1〜4 読取システム、 5 読取装置、 6 撮像装置、 7 出力装置、 11 撮像部、 12、21、31 抽出部、 13 変換部、 15 判定部、 16 読取部、 18 記憶部

Claims (12)

  1. 入力画像からセグメントディスプレイが撮影された部分の候補画像を抽出する抽出部と、
    前記候補画像から検出された複数の直線のそれぞれの基準線に対する角度を算出し、前記角度と前記直線の数との関係を示す分布に基づいて前記候補画像がセグメントディスプレイの画像であるか判定を行う判定部と、
    セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る読取部と、
    を備えた読取システム。
  2. 前記判定部は、前記分布において、第1角度の近傍における前記直線の数と、前記第1角度に対して傾斜した第2角度の近傍における前記直線の数と、の和が、予め設定された値以上である場合に、前記候補画像がセグメントディスプレイの画像であると判定する請求項1記載の読取システム。
  3. 前記判定部は、さらに、
    前記候補画像において端点が集まった端点群を検出し、
    隣接する端点群同士を結ぶベクトルを算出し、
    前記分布に加えて、隣接するベクトル同士の大きさの比、及び、隣接するベクトル同士の間の角度の少なくともいずれかに基づいて前記判定を行う、
    請求項1記載の読取システム。
  4. 前記判定部は、前記分布において、第1角度の近傍における前記直線の数と、前記第1角度に対して傾斜した第2角度の近傍における前記直線の数と、の和が、予め設定された値以上である第1条件と、前記大きさの比が予め設定された第1範囲にあり、且つ、前記角度が予め設定された第2範囲にある第2条件と、が満たされた場合に、前記候補画像がセグメントディスプレイの画像であると判定する請求項3記載の読取システム。
  5. 入力画像からセグメントディスプレイが撮影された部分の候補画像を抽出する抽出部と、
    前記候補画像において端点が集まった端点群を検出し、
    隣接する端点群同士を結ぶベクトルを算出し、
    隣接するベクトル同士の大きさの比、及び、隣接するベクトル同士の間の角度の少なくともいずれかに基づいて、前記候補画像がセグメントディスプレイの画像であるか判定を行う、判定部と、
    セグメントディスプレイの画像と判定された前記候補画像から、セグメントディスプレイに表示された数値を読み取る読取部と、
    を備えた読取システム。
  6. 前記判定部は、前記大きさの比が予め設定された第1範囲にあり、且つ、前記角度が予め設定された第2範囲にある場合に、前記候補画像がセグメントディスプレイの画像であると判定する請求項5記載の読取システム。
  7. 前記候補画像が歪んでいる場合に、前記候補画像を正面から撮影された画像に近づけるよう変換する第1処理と、
    前記候補画像のサイズが、予め設定された規定サイズと異なる場合に、前記候補画像の前記サイズを前記規定サイズに近づけるよう補正する第2処理と、
    を行う変換部をさらに備え、
    前記判定部は、変換された前記候補画像を用いて前記判定を行う請求項1〜6のいずれか1つに記載の読取システム。
  8. 前記抽出部は、
    前記入力画像から輪郭を抽出し、
    前記輪郭で囲まれた領域の面積を算出し、
    前記面積が予め設定された閾値以上の場合、前記輪郭に基づいて、前記入力画像から所定の形状の画像を抽出し、
    予め設定された条件を満たす前記抽出された画像を、前記候補画像として出力する、
    請求項1〜7のいずれか1つに記載の読取システム。
  9. 前記抽出部は、前記入力画像から、予め用意された、読み取り対象のセグメントディスプレイのテンプレート画像とマッチングする部分を探索し、マッチングした前記部分を候補画像として抽出する請求項1〜6のいずれか1つに記載の読取システム。
  10. 前記抽出部は、
    前記入力画像から特徴量を抽出し、
    抽出された前記特徴量が、前記テンプレート画像の特徴量とマッチングするように、前記入力画像を補正し、
    補正された前記入力画像から、前記テンプレート画像とマッチングする前記候補画像を抽出する、
    請求項9記載の読取システム。
  11. 前記抽出部は、
    前記入力画像のデータを、予め学習されたニューラルネットワークに入力し、
    前記ニューラルネットワークの出力結果に基づいて、前記入力画像においてセグメントディスプレイが撮影された前記部分を検出し、前記候補画像として抽出する、
    請求項1〜6のいずれか1つに記載の読取システム。
  12. 前記抽出部は、前記ニューラルネットワークの前記出力結果に基づいて、さらに、前記候補画像の歪みを補正する請求項11記載の読取システム。
JP2018026500A 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体 Active JP6542407B1 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018026500A JP6542407B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体
PCT/JP2018/035362 WO2019159415A1 (ja) 2018-02-16 2018-09-25 読取システム
CN201880088163.6A CN111670458B (zh) 2018-02-16 2018-09-25 读取系统
US16/922,097 US11301709B2 (en) 2018-02-16 2020-07-07 Reading system, reading device, and storage medium
US17/688,063 US11915498B2 (en) 2018-02-16 2022-03-07 Reading system, reading device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018026500A JP6542407B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019108670A Division JP6684947B2 (ja) 2019-06-11 2019-06-11 読取システム、読取装置、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP6542407B1 JP6542407B1 (ja) 2019-07-10
JP2019144704A true JP2019144704A (ja) 2019-08-29

Family

ID=67212220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018026500A Active JP6542407B1 (ja) 2018-02-16 2018-02-16 読取システム、読取方法、プログラム、及び記憶媒体

Country Status (4)

Country Link
US (2) US11301709B2 (ja)
JP (1) JP6542407B1 (ja)
CN (1) CN111670458B (ja)
WO (1) WO2019159415A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020194281A (ja) * 2019-05-27 2020-12-03 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体
US12142062B2 (en) 2018-11-16 2024-11-12 Kabushiki Kaisha Toshiba Reading system, reading method, storage medium, and moving body

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0244487A (ja) * 1988-08-05 1990-02-14 Fujitsu Ltd 光学文字読取装置の7b文字読取方式
JPH11316794A (ja) * 1998-05-06 1999-11-16 Aisin Aw Seimitsu Kk セグメント情報読み取り判定方法
JP2017010170A (ja) * 2015-06-18 2017-01-12 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8290274B2 (en) * 2005-02-15 2012-10-16 Kite Image Technologies Inc. Method for handwritten character recognition, system for handwritten character recognition, program for handwritten character recognition and storing medium
US8611723B2 (en) * 2006-09-06 2013-12-17 James Andrew Aman System for relating scoreboard information with event video
JP4630936B1 (ja) * 2009-10-28 2011-02-09 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラム、画像処理プログラムを記録した記録媒体
JP5658873B2 (ja) * 2009-11-13 2015-01-28 オリンパス株式会社 画像処理装置、電子機器、内視鏡システム及びプログラム
JP5530752B2 (ja) * 2010-02-25 2014-06-25 日本システムウエア株式会社 計器読み取り装置、方法、プログラム、および該ソフトウェアを格納したコンピュータ可読媒体
CN103118647B (zh) * 2010-09-22 2016-04-06 松下知识产权经营株式会社 运动支援系统
JP5755089B2 (ja) * 2011-09-08 2015-07-29 株式会社Pfu 画像処理装置、画像処理方法、画像処理プログラム及び画像処理システム
JP6551195B2 (ja) * 2015-11-30 2019-07-31 株式会社アンセイ ケーブル装置
JP6505767B2 (ja) 2016-11-09 2019-04-24 株式会社東芝 データ収集システム、処理システム、プログラム、および記憶媒体
CN108062076B (zh) 2016-11-09 2020-10-27 株式会社东芝 数据收集系统、处理系统以及存储介质
CN106874911A (zh) * 2017-03-03 2017-06-20 沈阳工程学院 一种应用划分法得到的面积比例来进行印刷体数字识别的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0244487A (ja) * 1988-08-05 1990-02-14 Fujitsu Ltd 光学文字読取装置の7b文字読取方式
JPH11316794A (ja) * 1998-05-06 1999-11-16 Aisin Aw Seimitsu Kk セグメント情報読み取り判定方法
JP2017010170A (ja) * 2015-06-18 2017-01-12 株式会社Pfu 画像処理装置、日付識別装置、画像処理方法、および、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12142062B2 (en) 2018-11-16 2024-11-12 Kabushiki Kaisha Toshiba Reading system, reading method, storage medium, and moving body
JP2020194281A (ja) * 2019-05-27 2020-12-03 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体

Also Published As

Publication number Publication date
US11301709B2 (en) 2022-04-12
CN111670458A (zh) 2020-09-15
WO2019159415A1 (ja) 2019-08-22
US20200334483A1 (en) 2020-10-22
US11915498B2 (en) 2024-02-27
US20220189182A1 (en) 2022-06-16
JP6542407B1 (ja) 2019-07-10
CN111670458B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
US11386640B2 (en) Reading system, reading method, and storage medium
JP6609345B2 (ja) 読取システム、読取方法、プログラム、及び記憶媒体
JP6716996B2 (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP6352695B2 (ja) 文字検出装置、方法およびプログラム
JP6566768B2 (ja) 情報処理装置、情報処理方法、プログラム
US11900664B2 (en) Reading system, reading device, reading method, and storage medium
JP7355601B2 (ja) 計算装置、処理方法、プログラム、及び記憶媒体
WO2019159415A1 (ja) 読取システム
JP6591257B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP6656453B2 (ja) 読取システム、読取装置、プログラム、及び記憶媒体
JP6684947B2 (ja) 読取システム、読取装置、プログラム、及び記憶媒体
JP6278757B2 (ja) 特徴量生成装置、特徴量生成方法、およびプログラム
JP6175904B2 (ja) 照合対象抽出システム、照合対象抽出方法、照合対象抽出プログラム
US12080037B2 (en) Reading system, reading method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190218

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190218

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190515

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190612

R151 Written notification of patent or utility model registration

Ref document number: 6542407

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151