JP2011028611A - 文字情報読取装置および文字情報読取方法 - Google Patents
文字情報読取装置および文字情報読取方法 Download PDFInfo
- Publication number
- JP2011028611A JP2011028611A JP2009175111A JP2009175111A JP2011028611A JP 2011028611 A JP2011028611 A JP 2011028611A JP 2009175111 A JP2009175111 A JP 2009175111A JP 2009175111 A JP2009175111 A JP 2009175111A JP 2011028611 A JP2011028611 A JP 2011028611A
- Authority
- JP
- Japan
- Prior art keywords
- character information
- image
- information reading
- video signal
- display screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 abstract description 6
- 238000012015 optical character recognition Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
【課題】表示画面に表示される文字情報を正確かつ迅速に読み取ることができる文字情報読取装置および文字情報読取方法を提供する。
【解決手段】レシピ管理サーバ3は、画像転送ユニット2を介して、表示画面13に文字情報を表示するためのビデオ信号を取得する。画像作成手段32は、取得された前記ビデオ信号を画像に変換する。認識手段33は、画像作成手段32により得られた前記画像に対する画像処理によって前記文字情報を認識する。
【選択図】図1
【解決手段】レシピ管理サーバ3は、画像転送ユニット2を介して、表示画面13に文字情報を表示するためのビデオ信号を取得する。画像作成手段32は、取得された前記ビデオ信号を画像に変換する。認識手段33は、画像作成手段32により得られた前記画像に対する画像処理によって前記文字情報を認識する。
【選択図】図1
Description
本発明は、表示画面に表示される文字情報を読み取る文字情報読取装置および文字情報読取方法に関する。
印刷物や手書きの文字を光学的に読み取る装置(OCR:Optical Character Reader)が知られている。OCRは光学的に取り込んだ印刷物等のイメージから文字列の領域を抽出し、その領域にある文字列を認識する機能を有する。
通常、コンピュータ画面に文字列を含む情報が表示される状態にある場合には、当然のことながら、元の情報自体にアクセスすることにより画面表示される文字列の内容を認識することが可能である。しかし、オンライン化されていない装置で取り扱っている情報など、元情報にアクセス困難な場合もある。例えば、半導体デバイスの既存生産ラインなど、オンライン化されていない製造設備が生産工程内に含まれている場合などには、当該設備の画面上に表示されるレシピパラメータ(製造条件を規定するパラメータ)の元データにアクセスできない場合もある。このため、レシピパラメータのチェックが画面上での目視に頼らざるを得なくなり、レシピパラメータの内容(パラメータ値)の誤りを見過ごすおそれがある。
一方、元情報にアクセスできない場合であっても、コンピュータ画面に表示される文字列をOCRにより認識させることが可能である。この場合には、カメラにより画面を撮影し、あるいは画面の印刷物を光学的に読み取ることが考えられる。
しかし、カメラにより画面を撮影する場合には、画像が不鮮明になるだけでなく、画像の大きさや歪み、傾きなどを補正する必要がある。また、印刷物を読み取る場合にも、読み取った画像のずれや傾きを修正する処理等が必要となる。したがって、OCRを用いる方法では単時間で正確な読み取りを行うことが困難である。
本発明の目的は、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる文字情報読取装置および文字情報読取方法を提供することにある。
本発明の文字情報読取装置は、表示画面に表示される文字情報を読み取る文字情報読取装置において、前記表示画面に前記文字情報を表示するためのビデオ信号を取得するビデオ信号取得手段と、前記ビデオ信号取得手段により取得された前記ビデオ信号を画像に変換する画像作成手段と、前記画像作成手段により得られた前記画像に対する画像処理によって前記文字情報を認識する認識手段と、を備えることを特徴とする。
この文字情報読取装置によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
この文字情報読取装置によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
前記認識手段は、前記画像に対する画像処理に基づき前記画像の座標原点を設定する処理と、設定された前記座標原点を基準とする特定の相対座標の領域に対する文字認識処理と、を実行してもよい。
前記座標原点を設定する処理では、あらかじめ登録された特徴的な形状を発見し、当該形状の位置に基づいて前記座標原点を設定してもよい。
前記文字情報は製造工程における製造条件を規定するパラメータであってもよい。
本発明の文字情報読取方法は、表示画面に表示される文字情報を読み取る文字情報読取方法において、前記表示画面に前記文字情報を表示するためのビデオ信号を取得するステップと、前記ビデオ信号を取得するステップにより取得された前記ビデオ信号を画像に変換するステップと、前記変換するステップにより得られた前記画像に対する画像処理によって前記文字情報を認識するステップと、を備えることを特徴とする。
この文字情報読取方法によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
この文字情報読取方法によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
本発明の文字情報読取装置によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
本発明の文字情報読取方法によれば、ビデオ信号を画像に変換し、変換後の画像に対する画像処理によって文字情報を認識するので、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
以下、本発明による文字情報読取方法の実施形態について説明する。
図1は、オペレーションコンソールに表示される文字情報を読み取るためのシステム構成を示すブロック図である。
図1に示すように、オペレーションコンソール1は、レシピパラメータを格納するパラメータ格納部11と、パラメータ格納部11に格納されたレシピパラメータの表示画面を作成する演算部12と、演算部12で作成された上記表示画面を表示する表示装置13と、を備える。
演算部12で作成された表示画面はビデオ信号として表示装置13に与えられる。また、図1に示すように、演算部12から表示装置13に送られるビデオ信号は、画像転送ユニット2を介してレシピ管理サーバ3にネットワーク転送可能とされている。
図1に示すように、レシピ管理サーバ3は、画像転送ユニット2から転送されてきた上記ビデオ信号を格納する画像格納部31と、画像格納部31に格納されたビデオ信号に基づいて画像を生成する画像生成手段32と、画像生成手段32により生成された画像に含まれる文字列を認識する認識手段33と、を備える。画像生成手段32により生成された画像は、適宜、表示画面4に表示される。
次に、レシピ管理サーバ3の動作について説明する。
表示装置13の表示画面にレシピパラメータを表示させた状態で、ユーザが画像転送ユニット2に対して画像転送の指示を与えると、表示装置13の表示画面に表示されている画像に対応するビデオ信号が演算部12から転送され、画像処理装置3の画像格納部31に静止画像として格納される。
図2は、表示装置13の表示画面を例示する図である。図2の例では、一覧表形式でパラメータ格納部11に格納されたレシピパラメータが表示されており、レシピパラメータの項目名と、その項目名に対応するパラメータ値とが対応付けられて配置された画像51が示されている。
図3は、画像作成手段32により作成される画像を例示する図である。図3に示す画像52は、画像作成手段32により作成された画像を示している。この例では、認識手段33での認識処理の負担を軽減するため、画像51の明暗を反転させることで画像52を作成している。
図4は、画像52における原点および文字列の読み込み処理を行う箇所を指定する方法を例示する図である。
図4の例では、原点61を「通信先TCPポート」という文字列の中心に位置付けている。この場合、ユーザは原点61を定めるための領域として、「通信先TCPポート」という文字列が表示される領域を指定し、予め登録しておく。また、ユーザは認識したい文字列が配置された領域62を予め指定し、登録しておく。領域62の位置は原点61からの相対位置(座標)として認識、登録される。原点61および領域62の指定は、例えば、表示画面4に画像52を表示させ、画面上へのユーザの操作を介して受け付けることができる。
認識手段33は、画像処理によって画像52の全域を検索し、登録された領域のパターンと同一パターンの領域を抽出し、その領域の中心を原点61とする。
次に、認識手段33は、登録されている原点61からの上記相対位置(座標)に基づいて領域62を確定し、領域62にある文字列の認識処理を実行する。この認識処理では、OCRにおいて用いられる各種の技術を用いて文字列を認識することができる。この場合には、「7001」という文字列が認識される。
また、認識手段33により認識された文字列は、予め文字情報として登録されたレシピパラメータと照合され、不一致であったパラメータが通知される。これにより、パラメータ格納部11に格納されているレシピパラメータの誤りを見過ごすおそれがなくなる。
図5は、別の箇所の読み込みを指定する例を示している。
図5の例では、領域63に表示される「対応する」という文字列を認識する。原点61からの相対位置(座標)に基づいて領域63が特定される点は、図4の例と同じである。この場合、領域63に表示される文字列は、「対応する」と「対応しない」の2つの文字列のいずれか一方である。この場合には、認識手段33における処理では、通常のOCRにおける処理のような手順で具体的な文字列を特定する必要はなく、二者のうちいずれか1つであると判定できればよい。したがって、認識手段33における処理負担を軽減できる。
図6は、複数の文字列を認識させる例を示している。
図6の例では、複数の文字列を1つの領域64として指定している。原点61からの相対位置(座標)に基づいて領域64が特定される点は、図4の例と同じである。この場合、認識手段33は、領域64における文字列の配置状況を認識し、次に、それぞれの箇所に配置された文字列を認識する。
図7は、原点の位置が画面上で移動可能な例を示している。
この例では、図7(a)および図7(b)に示すように、ダイアログボックス7が画面上で移動可能とされているため、ダイアログボックス7中にある原点71の位置は、ダイアログボックス7の位置に応じて移動する。
図7の例では、原点65を「T3 Timeout」という文字列の中心に位置付けている。この場合、ユーザは原点65を定めるための領域として、「T3 Timeout」という文字列が表示される領域を指定し、予め登録しておく。また、ユーザは認識したい文字列が配置された領域66およびチェックボックスの領域67を予め指定し、登録しておく。領域66および領域67の位置は原点65からの相対位置(座標)として登録される。
認識手段33は、画像処理によって画像の全域を検索し、登録された領域のパターンと同一パターンの領域を抽出し、その領域の中心を原点65とする。このため、ダイアログボックス7がどの位置にあっても、原点65の位置を特定することができる。
次に、認識手段33は、登録されている原点65からの上記相対位置(座標)に基づいて領域66を確定し、領域66にある文字列の認識処理を実行する。この認識処理では、OCRにおいて用いられる各種の技術を用いて文字列を認識することができる。図7の例では、「45」という文字列が認識される。
また、認識手段33は、登録されている原点65からの上記相対位置(座標)に基づいて領域67を確定し、画像処理によって領域66にあるチェックボックスに対するチェックの有無を判定する。
以上のように、本発明の文字情報読取方法によれば、ビデオ信号に基づいて作成された画像に対して文字情報の認識処理を実行するため、光学的に画像を読み込む場合と異なり、画像の変形や回転、ずれ、あるいは歪みなどが発生しない。このため、文字情報を認識するに際して、画像の縮小、拡大、回転、歪みの除去、あるいは文字列の位置ずれの補正などの煩雑な前処理を実行する必要がない。このため、表示画面に表示される文字情報を正確かつ迅速に読み取ることができる。
本発明の適用範囲は上記実施形態に限定されることはない。本発明は、表示画面に表示される文字情報を読み取る文字情報読取装置および文字情報読取方法に対し、広く適用することができる。
2 画像転送ユニット(ビデオ信号取得手段)
32 画像作成手段
33 認識手段
32 画像作成手段
33 認識手段
Claims (5)
- 表示画面に表示される文字情報を読み取る文字情報読取装置において、
前記表示画面に前記文字情報を表示するためのビデオ信号を取得するビデオ信号取得手段と、
前記ビデオ信号取得手段により取得された前記ビデオ信号を画像に変換する画像作成手段と、
前記画像作成手段により得られた前記画像に対する画像処理によって前記文字情報を認識する認識手段と、
を備えることを特徴とする文字情報読取装置。 - 前記認識手段は、前記画像に対する画像処理に基づき前記画像の座標原点を設定する処理と、設定された前記座標原点を基準とする特定の相対座標の領域に対する文字認識処理と、を実行することを特徴とする請求項1に記載の文字情報読取装置。
- 前記座標原点を設定する処理では、あらかじめ登録された特徴的な形状を発見し、当該形状の位置に基づいて前記座標原点を設定することを特徴とする請求項2に記載の文字情報読取装置。
- 前記文字情報は製造工程における製造条件を規定するパラメータであることを特徴とする請求項1〜3のいずれか1項に記載の文字情報読取装置。
- 表示画面に表示される文字情報を読み取る文字情報読取方法において、
前記表示画面に前記文字情報を表示するためのビデオ信号を取得するステップと、
前記ビデオ信号を取得するステップにより取得された前記ビデオ信号を画像に変換するステップと、
前記変換するステップにより得られた前記画像に対する画像処理によって前記文字情報を認識するステップと、
を備えることを特徴とする文字情報読取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009175111A JP2011028611A (ja) | 2009-07-28 | 2009-07-28 | 文字情報読取装置および文字情報読取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009175111A JP2011028611A (ja) | 2009-07-28 | 2009-07-28 | 文字情報読取装置および文字情報読取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011028611A true JP2011028611A (ja) | 2011-02-10 |
Family
ID=43637260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009175111A Pending JP2011028611A (ja) | 2009-07-28 | 2009-07-28 | 文字情報読取装置および文字情報読取方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011028611A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023238538A1 (ja) * | 2022-06-07 | 2023-12-14 | コベルコ建機株式会社 | 表示支援装置 |
-
2009
- 2009-07-28 JP JP2009175111A patent/JP2011028611A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023238538A1 (ja) * | 2022-06-07 | 2023-12-14 | コベルコ建機株式会社 | 表示支援装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4868186B2 (ja) | マーカ生成及びマーカ検出のシステム、方法とプログラム | |
JP6557943B2 (ja) | 画像照合装置、画像センサ、処理システム、画像照合方法 | |
KR20190095651A (ko) | 문자 학습 트레이닝 데이터 생성 장치 및 그 방법 | |
WO2011129113A1 (ja) | 帳票処理装置及び帳票処理方法及び記録媒体 | |
JP6208094B2 (ja) | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム | |
JP2012103789A (ja) | オブジェクト表示装置及びオブジェクト表示方法 | |
JP2011022867A (ja) | 画像処理装置、画像処理システムおよびプログラム | |
WO2012144496A1 (ja) | 10指指紋カード入力装置、10指指紋カード入力方法、及び記憶媒体 | |
CN115035032B (zh) | 神经网络训练方法、相关方法、设备、终端及存储介质 | |
CN110717060B (zh) | 图像mask的过滤方法、装置及存储介质 | |
CN110569845A (zh) | 一种试卷图像的校正方法及相关装置 | |
CN111325106B (zh) | 生成训练数据的方法及装置 | |
JP2011028611A (ja) | 文字情報読取装置および文字情報読取方法 | |
JP2017097859A (ja) | 情報処理装置と、その処理方法及びプログラム | |
WO2022024835A1 (ja) | 画像処理システム、画像処理方法、画像処理プログラム、画像処理サーバ、及び学習モデル | |
JP2017199288A (ja) | 画像処理装置、画像処理方法及びプログラム | |
WO2018158818A1 (ja) | 点検支援装置、点検支援方法および記録媒体 | |
JP2014026592A (ja) | 文字認識装置 | |
CN112150559A (zh) | 图像采集装置的标定方法、计算机设备及存储介质 | |
JP7478628B2 (ja) | 画像処理装置、制御方法及び制御プログラム | |
JP6225096B2 (ja) | 帳票読取プログラム、帳票読取方法、および情報処理装置 | |
JP5944221B2 (ja) | 画像処理プログラムおよび画像処理装置、画像読取装置 | |
JP2020057298A (ja) | 判定装置、判定方法及び判定プログラム | |
CN116930207B (zh) | 展示区与实时区视野同步放大的显示方法 | |
JP2004280530A (ja) | 帳票処理システム及び帳票処理方法 |