JP6408055B2 - 情報処理装置、方法及びプログラム - Google Patents
情報処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6408055B2 JP6408055B2 JP2017055368A JP2017055368A JP6408055B2 JP 6408055 B2 JP6408055 B2 JP 6408055B2 JP 2017055368 A JP2017055368 A JP 2017055368A JP 2017055368 A JP2017055368 A JP 2017055368A JP 6408055 B2 JP6408055 B2 JP 6408055B2
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- image
- displayed
- target
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 123
- 230000010365 information processing Effects 0.000 title claims description 22
- 230000008569 process Effects 0.000 claims description 113
- 238000012545 processing Methods 0.000 claims description 100
- 238000001514 detection method Methods 0.000 claims description 5
- 238000013519 translation Methods 0.000 description 11
- 238000003384 imaging method Methods 0.000 description 6
- 239000003086 colorant Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
- G06V20/582—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads of traffic signs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/222—Character recognition characterised by the type of writing of characters separated by spaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
Description
図1は、本実施形態に係る情報処理装置の構成の一例を示すブロック図である。本実施形態に係る情報処理装置は、画像から認識対象を認識することが可能な機能を有し、例えばスマートフォン及びタブレットコンピュータ等の携帯型の電子機器として実現され得る。以下の説明においては、上記した認識対象として文字を認識する情報処理装置(以下、文字認識装置と表記)について主に説明する。
Claims (11)
- 第1画像に含まれる第1認識対象を認識する第1認識手段と、
前記第1認識手段における認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第1認識対象の認識結果を表示する第1表示処理手段と、
前記第1画像とは異なる第2画像に含まれる第2認識対象を認識する第2認識手段と、
前記第2認識手段における認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第2認識対象の認識結果を表示する第2表示処理手段と
を具備し、
前記第1認識対象の認識結果と前記第2認識対象の認識結果とは、認識結果の履歴として表示され、
前記履歴として表示された前記第1認識対象の認識結果及び前記第2認識対象の認識結果のうち前記第1認識対象の認識結果が選択された場合、前記第1画像及び前記第1画像が撮像された位置が表示され、前記第2認識対象の認識結果が選択された場合、前記第2画像及び前記第2画像が撮像された位置が表示される
情報処理装置。 - 前記第1表示処理手段によって表示されるフィードバック情報は、前記第1認識対象の位置を示す情報を含み、
前記第2表示処理手段によって表示されるフィードバック情報は、前記第2認識対象の位置を示す情報を含む
請求項1記載の情報処理装置。 - 前記第1認識対象の位置を示す情報は、前記第1画像の一部領域を示す情報であり、
前記第2認識対象の位置を示す情報は、前記第2画像の一部領域を示す情報である
請求項2記載の情報処理装置。 - 前記第1認識対象の位置を示す情報は、前記第1画像の一部領域を包含する枠線の情報であり、
前記第2認識対象の位置を示す情報は、前記第2画像の一部領域を包含する枠線の情報である
請求項2または3に記載の情報処理装置。 - 前記第1認識対象の位置を示す情報及び前記第2認識対象の位置を示す情報は、色彩情報である請求項2乃至4の何れか一項に記載の情報処理装置。
- 前記第1認識対象の位置を示す情報は、前記第1認識手段における認識処理が実行中であることを示す文字列に関する情報であり、
前記第2認識対象の位置を示す情報は、前記第2認識手段における認識処理が実行中であることを示す文字列に関する情報である
請求項2記載の情報処理装置。 - 前記第1認識対象の位置を示す情報は、前記第1認識手段における検出の尤度情報に基づく情報であり、
前記第2認識対象の位置を示す情報は、前記第2認識手段における検出の尤度情報に基づく情報である
請求項2記載の情報処理装置。 - 前記第1認識対象及び前記第2認識対象が同一対象である場合、前記第1認識対象の認識結果及び前記第2認識対象の認識結果はまとめて表示される請求項1記載の情報処理装置。
- 前記フィードバック情報及び前記認識結果を表示する表示手段を更に備える請求項1乃至8の何れか一項に記載の情報処理装置。
- 情報処理装置のコンピュータが実行するプログラムであって、
前記コンピュータに、
第1画像に含まれる第1認識対象を認識するステップと、
前記第1認識対象に対する認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第1認識対象の認識結果を表示するステップと、
前記第1画像とは異なる第2画像に含まれる第2認識対象を認識するステップと、
前記第2認識対象に対する認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第2認識対象の認識結果を表示するステップと
を実行させ、
前記第1認識対象の認識結果と前記第2認識対象の認識結果とは、認識結果の履歴として表示され、
前記履歴として表示された前記第1認識対象の認識結果及び前記第2認識対象の認識結果のうち前記第1認識対象の認識結果が選択された場合、前記第1画像及び前記第1画像が撮像された位置が表示され、前記第2認識対象の認識結果が選択された場合、前記第2画像及び前記第2画像が撮像された位置が表示される
プログラム。 - 情報処理装置が実行する方法であって、
第1画像に含まれる第1認識対象を認識するステップと、
前記第1認識対象に対する認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第1認識対象の認識結果を表示するステップと、
前記第1画像とは異なる第2画像に含まれる第2認識対象を認識するステップと、
前記第2認識対象に対する認識処理が終了する前に当該認識処理が実行中であることを示すフィードバック情報を表示し、当該認識処理が終了した後に前記第2認識対象の認識結果を表示するステップと
を備え、
前記第1認識対象の認識結果と前記第2認識対象の認識結果とは、認識結果の履歴として表示され、
前記履歴として表示された前記第1認識対象の認識結果及び前記第2認識対象の認識結果のうち前記第1認識対象の認識結果が選択された場合、前記第1画像及び前記第1画像が撮像された位置が表示され、前記第2認識対象の認識結果が選択された場合、前記第2画像及び前記第2画像が撮像された位置が表示される
方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055368A JP6408055B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
US15/694,594 US10528852B2 (en) | 2017-03-22 | 2017-09-01 | Information processing apparatus, method and computer program product |
EP17189256.5A EP3379452B1 (en) | 2017-03-22 | 2017-09-04 | Information processing apparatus, method and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017055368A JP6408055B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018159978A JP2018159978A (ja) | 2018-10-11 |
JP6408055B2 true JP6408055B2 (ja) | 2018-10-17 |
Family
ID=59955337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017055368A Active JP6408055B2 (ja) | 2017-03-22 | 2017-03-22 | 情報処理装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10528852B2 (ja) |
EP (1) | EP3379452B1 (ja) |
JP (1) | JP6408055B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020091748A (ja) * | 2018-12-06 | 2020-06-11 | トッパン・フォームズ株式会社 | 端末装置、プログラム、画像管理方法 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2746904B2 (ja) * | 1988-03-24 | 1998-05-06 | 株式会社東芝 | 文書読取り装置 |
JPH05282091A (ja) | 1992-04-02 | 1993-10-29 | Mitsubishi Electric Corp | 任意サイズ文字の入力装置 |
JP4128275B2 (ja) | 1998-07-06 | 2008-07-30 | オリンパス株式会社 | 翻訳機能付カメラ |
JP2000207487A (ja) | 1999-01-20 | 2000-07-28 | Sony Corp | 情報処理装置および方法、並びに提供媒体 |
JP2001357355A (ja) | 2000-06-13 | 2001-12-26 | Fujitsu Ltd | 手書き文字入力装置と方法及びそれを実現するためのプログラムを記録した記録媒体 |
JP2002358523A (ja) * | 2001-05-31 | 2002-12-13 | Canon Inc | パターン認識処理装置及びその方法、画像入力装置 |
JP4240859B2 (ja) | 2001-09-05 | 2009-03-18 | 株式会社日立製作所 | 携帯端末装置及び通信システム |
JP2004341977A (ja) | 2003-05-19 | 2004-12-02 | Mitsubishi Electric Corp | 文字認識装置及び携帯情報端末 |
JP2005018507A (ja) | 2003-06-27 | 2005-01-20 | Hitachi Ltd | 携帯情報端末及びそれを用いた文字認識方法 |
JP4383790B2 (ja) * | 2003-08-06 | 2009-12-16 | 日立オムロンターミナルソリューションズ株式会社 | 携帯情報端末 |
JP2005135210A (ja) * | 2003-10-31 | 2005-05-26 | Hitachi Ltd | 文字認識機能を有する携帯機器 |
JP2007140684A (ja) * | 2005-11-15 | 2007-06-07 | Toshiba Corp | 画像処理装置、方法、プログラム |
JP2007266873A (ja) | 2006-03-28 | 2007-10-11 | Toshiba Corp | 撮影装置および撮影方法 |
JP2009296533A (ja) | 2008-06-09 | 2009-12-17 | Kyocera Mita Corp | スキャナ装置及び画像形成装置 |
US20110090253A1 (en) | 2009-10-19 | 2011-04-21 | Quest Visual, Inc. | Augmented reality language translation system and method |
JP2012222581A (ja) | 2011-04-08 | 2012-11-12 | Canon Inc | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 |
EP2740052A4 (en) * | 2011-08-05 | 2015-04-08 | Blackberry Ltd | SYSTEM AND METHOD FOR TEXT SEARCH AND TEXT DISPLAY FOUND IN INCREASED REALITY |
JP5631362B2 (ja) | 2011-08-08 | 2014-11-26 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
US9336456B2 (en) * | 2012-01-25 | 2016-05-10 | Bruno Delean | Systems, methods and computer program products for identifying objects in video data |
US9165406B1 (en) * | 2012-09-21 | 2015-10-20 | A9.Com, Inc. | Providing overlays based on text in a live camera view |
US8965129B2 (en) | 2013-03-15 | 2015-02-24 | Translate Abroad, Inc. | Systems and methods for determining and displaying multi-line foreign language translations in real time on mobile devices |
US8761513B1 (en) | 2013-03-15 | 2014-06-24 | Translate Abroad, Inc. | Systems and methods for displaying foreign character sets and their translations in real time on resource-constrained mobile devices |
JP6419421B2 (ja) * | 2013-10-31 | 2018-11-07 | 株式会社東芝 | 画像表示装置、画像表示方法およびプログラム |
US9514376B2 (en) * | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9367766B2 (en) | 2014-07-22 | 2016-06-14 | Adobe Systems Incorporated | Text line detection in images |
JP6208094B2 (ja) | 2014-08-26 | 2017-10-04 | 株式会社東芝 | 情報処理装置、情報処理システム、情報処理方法及びそのプログラム |
JP6371662B2 (ja) | 2014-10-07 | 2018-08-08 | 富士通フロンテック株式会社 | 文字認識支援装置、文字認識支援プログラム及び文字認識支援方法 |
US9760792B2 (en) * | 2015-03-20 | 2017-09-12 | Netra, Inc. | Object detection and classification |
JP6530432B2 (ja) | 2017-02-03 | 2019-06-12 | 株式会社東芝 | 画像処理装置、画像処理方法及びプログラム |
-
2017
- 2017-03-22 JP JP2017055368A patent/JP6408055B2/ja active Active
- 2017-09-01 US US15/694,594 patent/US10528852B2/en active Active
- 2017-09-04 EP EP17189256.5A patent/EP3379452B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10528852B2 (en) | 2020-01-07 |
JP2018159978A (ja) | 2018-10-11 |
EP3379452A1 (en) | 2018-09-26 |
EP3379452B1 (en) | 2024-10-23 |
US20180276506A1 (en) | 2018-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10032072B1 (en) | Text recognition and localization with deep learning | |
JP4759638B2 (ja) | リアルタイムなカメラ辞書 | |
JP2007034847A5 (ja) | ||
EP4057163A1 (en) | Facilitating use of images as search queries | |
US9639603B2 (en) | Electronic device, display method, and storage medium | |
US20150242684A1 (en) | Method and system for linking printed objects with electronic content | |
EP2806336A1 (en) | Text prediction in a text input associated with an image | |
JP6408055B2 (ja) | 情報処理装置、方法及びプログラム | |
JP2010205121A (ja) | 情報処理装置および携帯端末 | |
JP6828421B2 (ja) | 卓上カメラ−プロジェクタシステムでの文書閲覧時における関連文書及び人物を可視化するための計算実行方法、プログラムおよび計算処理システム | |
KR20190020281A (ko) | 시각적 입력의 처리 | |
JP2015187846A (ja) | 文書処理システム、及び文書処理装置 | |
CN111079777B (zh) | 一种基于书页定位的点读方法及电子设备 | |
US20110294522A1 (en) | Character recognizing system and method for the same | |
US20160004789A1 (en) | Visual Search Engine | |
CN110851631A (zh) | 一种检索系统 | |
JP5991323B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
CN107203572A (zh) | 一种图片搜索的方法及装置 | |
JP4474231B2 (ja) | 文書リンク情報取得システム | |
JP3164748U (ja) | 情報処理装置 | |
JP5489478B2 (ja) | 画像表示装置及び画像表示方法 | |
US11010978B2 (en) | Method and system for generating augmented reality interactive content | |
JP5541868B2 (ja) | 画像検索指令システムおよびその動作制御方法 | |
JP7231529B2 (ja) | 情報端末装置、サーバ及びプログラム | |
JP2016062307A (ja) | 情報表示装置、情報表示プログラムおよび情報表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180821 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180919 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6408055 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |