[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2005216102A - Personal digital assistant and image processing method thereby - Google Patents

Personal digital assistant and image processing method thereby Download PDF

Info

Publication number
JP2005216102A
JP2005216102A JP2004023595A JP2004023595A JP2005216102A JP 2005216102 A JP2005216102 A JP 2005216102A JP 2004023595 A JP2004023595 A JP 2004023595A JP 2004023595 A JP2004023595 A JP 2004023595A JP 2005216102 A JP2005216102 A JP 2005216102A
Authority
JP
Japan
Prior art keywords
character recognition
function
image
format control
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004023595A
Other languages
Japanese (ja)
Inventor
Kazuaki Yokota
和章 横田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Solutions Corp filed Critical Toshiba Solutions Corp
Priority to JP2004023595A priority Critical patent/JP2005216102A/en
Publication of JP2005216102A publication Critical patent/JP2005216102A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Telephone Function (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To perform data processing, specialized for individual operation, of an image read by using a cell phone with a camera generally sold on the market. <P>SOLUTION: The cell phone 10 is provided with: a user area 12b of a memory 12 which disables rewriting of information by a user, and firmware for operating basic functions such as an image capturing function, a character recognition function, an e-mail function and a display function of a personal digital assistant with a camera is stored; a system area 12a of the memory 12 which enables rewriting of the information by the user, and a format control descriptive expression (format control file 20) including each function processing and hardware control of the cell phone is stored; and a CPU 18 which if the character recognition function is designated during the operation of the basic function by the firmware, interprets the format control file 20 stored in the user area 12b, and controls, according to the description contents of the file, the image capturing function, the character recognition function, the e-mail function and the display function. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、例えば帳票を処理する業務に用いられる携帯情報端末及び携帯情報端末による画像処理方法に関する。   The present invention relates to a portable information terminal used for business, for example, for processing a form, and an image processing method using the portable information terminal.

一般に、配送業などでは、物品の配達を行う車両の運転者(配送員)と、物流センターの電話オペレータ間の連絡、配送管理などに、携帯電話機が利用されている。   In general, in the delivery industry and the like, a mobile phone is used for communication, delivery management, etc. between a driver (delivery person) of a vehicle delivering goods and a telephone operator of a distribution center.

また、現在、物流センターでは、配送員が物品を配達する顧客の伝票を配送員から回収し、その伝票をOCR(光学的文字読取装置)にかけて電子データ化する処理を行い、データベースに蓄積することで、業務管理及び照会を行っている。
電子データ化される情報は、伝票のイメージデータと、このイメージデータを部分的に文字認識することで読み取った文字データ(伝票番号、配送金額など)である。
物流センターでは、伝票の一極集中のため、ときには、数百万枚という伝票を一日で処理することもあり、このため、数百人規模の事務員が処理作業に携っている。
At the distribution center, a delivery person collects a customer's voucher for delivering an article from the delivery person and applies the OCR (optical character reader) to convert it into electronic data, which is stored in a database. In business management and inquiry.
Information to be converted into electronic data is image data of a slip and character data (slip number, delivery amount, etc.) read by partially recognizing the image data.
In the distribution center, due to the extreme concentration of slips, sometimes millions of slips are processed in one day. For this reason, hundreds of clerk are engaged in processing work.

近年、携帯電話機の機能向上は目覚しく、高解像度のカメラ機能が標準機能として付加されるようになった。   In recent years, functions of mobile phones have been remarkably improved, and high-resolution camera functions have been added as standard functions.

そこで、携帯電話機を携行している配送員にカメラ機能を利用させて伝票を直接電子データ化することで、物流センターにおける伝票処理を廃止し、人員削減及び業務の効率化を行うことが考えられる。   Therefore, it is possible to eliminate the voucher processing at the distribution center, reduce the number of personnel, and improve the efficiency of work by letting the delivery person carrying the mobile phone use the camera function and directly convert the voucher into electronic data. .

従来の携帯電話機のカメラ機能を利用した文字認識の技術としては、例えばカメラを用いて撮像して得た動画像から文字認識を行うため静止画を画像抽出部が抽出し、抽出した静止画像について文字認識を行う技術が開示されている(例えば特許文献1参照)。
この技術は、携帯電話機にカメラ制御機能と文字認識機能とを組み込んだものである。
As a technology for character recognition using the camera function of a conventional mobile phone, for example, a still image is extracted by an image extraction unit to perform character recognition from a moving image obtained by imaging using a camera, and the extracted still image A technique for performing character recognition is disclosed (see, for example, Patent Document 1).
This technology incorporates a camera control function and a character recognition function in a mobile phone.

しかしながら、通常、携帯電話機は、電話機メーカにより製造されて携帯キャリアにより販売されることから、カメラ機能を配達伝票の文字読み取りに特化したものを開発しても、購入者が限定されるため商品化は難しい。
特開2003−216893号公報
However, since mobile phones are usually manufactured by phone manufacturers and sold by mobile carriers, even if a camera function specializing in reading a letter on a delivery slip is developed, the purchaser is limited, so It is difficult to make it.
JP 2003-216893 A

このように携帯電話機の従来の技術として、カメラで撮影した画像から部分的に文字認識を行う技術は公開されているものの、この種の技術は、ハードウェア制御を伴うため、ダウンロードして使用する追加ソフトウェア(アプレット)では対応不可能であり、組み込みプログラム(ファームウェア)としての実装を余儀なくされ、特に配送業の帳票のデータ処理のためにだけ利用するようにものの商品化、実用化は難しいという問題があった。   As described above, although a technology for partially recognizing characters from an image photographed by a camera has been disclosed as a conventional technology for mobile phones, this type of technology involves hardware control and is downloaded and used. It cannot be handled by additional software (applet), it must be implemented as an embedded program (firmware), and it is difficult to commercialize and put it to practical use, especially for use only for data processing of delivery business forms. was there.

本発明はこのような課題を解決するためになされたもので、一般市販される携帯情報端末を利用し、携帯情報端末の撮像手段で撮像した画像の処理を個々の業務に特化して行うことのできる携帯情報端末及び携帯情報端末による画像処理方法を提供することを目的としている。   The present invention has been made to solve such a problem, and uses a commercially available portable information terminal to perform processing of an image captured by the imaging means of the portable information terminal specialized for each job. It is an object of the present invention to provide a portable information terminal capable of performing image processing and an image processing method using the portable information terminal.

上記した課題を解決するために、本発明の携帯情報端末は、画像を撮像するための撮像手段と、前記撮像手段により撮像された画像の中で文字認識対象の第1領域を設定するためのフォーマットコントロール記述式を記憶する記憶手段と、前記フォーマットコントロール記述式に基づいて前記撮像手段より撮像された画像の中の前記第1領域より文字の認識を行う文字認識機能と、前記撮像された画像と前記文字認識結果とを所定の送信先へ送信する送信手段とを具備したことを特徴とする。   In order to solve the above-described problems, a portable information terminal according to the present invention includes an imaging unit for capturing an image, and a first area for character recognition in the image captured by the imaging unit. A storage means for storing a format control description expression; a character recognition function for recognizing characters from the first area in the image captured by the imaging means based on the format control description expression; and the captured image. And a transmission means for transmitting the character recognition result to a predetermined transmission destination.

上記フォーマットコントロール記述式には、画像の位置合せのためのガイドを表示する記述が含まれていることを特徴とする。   The format control description formula includes a description for displaying a guide for image alignment.

本発明の携帯情報端末による画像処理方法は、撮影手段、文字認識機能、送信手段、記憶手段を備えた携帯情報端末による画像処理方法において、前記撮影手段により画像を撮像するステップと、前記記憶手段に記憶され、前記撮影手段により撮像される画像の中で文字認識対象の第1領域を設定するためのフォーマットコントロール記述式に基づいて前記撮像ステップにより撮像された画像の中の前記第1領域より前記文字認識機能が文字の認識を行うステップと、前記撮像ステップにより撮像された画像と前記文字認識結果とを前記送信手段が所定の送信先へ送信するステップとを有することを特徴とする。   An image processing method using a portable information terminal according to the present invention is an image processing method using a portable information terminal including a photographing unit, a character recognition function, a transmission unit, and a storage unit. From the first area in the image captured by the imaging step based on the format control description formula for setting the first area of the character recognition target in the image captured by the imaging means. The character recognition function includes a step of recognizing a character, and a step of transmitting the image captured by the imaging step and the character recognition result to a predetermined transmission destination.

本発明では、携帯情報端末において文字認識機能を動作させると、撮影手段により画像が撮像され、記憶手段に記憶されたフォーマットコントロール記述式に基づいて、撮像された画像の中の第1領域より文字の認識が行われ、文字認識結果と撮像された画像とが所定の送信先へ送信されるので、携帯情報端末に予め個々の業務に特化した文字認識機能を組み込むことなく、各種業務に応じた画像の処理が可能になる。   In the present invention, when the character recognition function is operated in the portable information terminal, an image is picked up by the photographing means, and characters are taken from the first region in the picked-up image based on the format control description formula stored in the storage means. Recognition is performed, and the character recognition result and the captured image are transmitted to a predetermined destination, so that it is possible to respond to various tasks without incorporating a character recognition function specialized for each task in advance into the portable information terminal. Can be processed.

以上説明したように本発明によれば、一般市販される携帯情報端末を利用し、携帯情報端末の撮像手段で撮像した画像のデータ処理を個々の業務に特化して行うことができる。   As described above, according to the present invention, it is possible to perform data processing of an image captured by an image capturing unit of a mobile information terminal by using a commercially available mobile information terminal specialized for each job.

以下、本発明の実施の形態を図面を参照して詳細に説明する。
図1は本発明に係る一つの実施の形態の物流管理システムの構成を示す図である。
同図に示すように、この物流管理システムは、サーバコンピュータ1(以下サーバ1と称す)と、このサーバ1にインターネット、電話網などの通信網2及び無線基地局3を介して通信可能な携帯電話機10とから構成されている。サーバ1は、例えば物流センターなどに設置されている。なお、サーバ1の設置場所については、本社あるいはインターネットサービスプロバイダー(ISP)など、さまざまなところに設置してもよく、物流センターに限るものではない。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 1 is a diagram showing the configuration of a physical distribution management system according to one embodiment of the present invention.
As shown in the figure, this physical distribution management system includes a server computer 1 (hereinafter referred to as “server 1”), a portable computer that can communicate with this server 1 via a communication network 2 such as the Internet and a telephone network, and a wireless base station 3. And a telephone 10. The server 1 is installed in, for example, a distribution center. The installation location of the server 1 may be installed in various places such as a head office or an Internet service provider (ISP), and is not limited to the distribution center.

サーバ1は、携帯電話機10から電子メールを受信および/または送信する電子メール機能と、携帯電話機10から受信される電子メールの受信データ(伝票のイメージデータとこのイメージデータを部分的に文字認識した文字データ(伝票番号、支払い金額など))を対応つけて登録及び管理するデータベースの機能と、伝票番号のキー入力機能と、伝票番号のキー入力によりデータベースを検索し、該当データを読み出しモニタ、プリンタなどに出力する照会機能を備えている。   The server 1 receives and / or transmits an e-mail from the mobile phone 10 and received data of the e-mail received from the mobile phone 10 (the image data of the slip and the image data are partially character-recognized. Database function for registering and managing character data (such as slip number and payment amount)), key input function for slip number, and database search by key input for slip number, reading the corresponding data, monitor, printer Inquiry output function is provided.

携帯電話機10は、キー操作部11、記憶手段としてのメモリ12、通話部14、撮像手段としてカメラ部15、無線通信部16、画面表示手段としてのリキッド・クリスタル・ディスプレイ表示部17(以下LCD表示部17と称す)、制御手段としてのCPU18などを備えている。   The cellular phone 10 includes a key operation unit 11, a memory 12 as a storage unit, a call unit 14, a camera unit 15 as an imaging unit, a wireless communication unit 16, and a liquid crystal display display unit 17 (hereinafter referred to as an LCD display) as a screen display unit. A CPU 18 as control means.

キー操作部11は、電源スイッチ、テンキー(文字キー兼用)、画面に表示された選択項目を上下左右に移動する方向キー、選択項目を確定及び編集終了を指定するファンクションキー(Fキーなどと称す)などを備えている。メモリ12には、第1の記憶手段としてのシステム領域12aと、第2の記憶手段としてのユーザ領域12bとが設けられている。
システム領域12aは、ユーザによる情報の書換えが不可能にされた記憶領域であり、この携帯電話機10の画像撮影機能(カメラ部15の制御など)、文字認識機能(イメージデータの切り出し、文字認識処理などのOCR機能)、フォーマットコントロールファイル20の解釈機能、音声通信機能(通話など)およびメッセージ通信機能(電子メールの送受信など)、表示機能(LCD表示部17の画面表示制御など)などの基本機能を動作させる制御プログラム(ファームウェア)が記憶されている。
ユーザ領域12bは、ユーザにより情報の書換えが可能とされる記憶領域であり、この携帯電話機10の各機能処理とハードウェア制御を含むフォーマットコントロール記述式であるフォーマットコントロールファイル20(図2参照)が記憶されている。
The key operation unit 11 includes a power switch, a numeric keypad (also used as a character key), a direction key for moving a selection item displayed on the screen up / down / left / right, and a function key (F key or the like) for confirming the selection item and finalizing editing. ) Etc. The memory 12 is provided with a system area 12a as a first storage means and a user area 12b as a second storage means.
The system area 12a is a storage area in which information cannot be rewritten by the user, and includes an image shooting function (control of the camera unit 15 and the like) and a character recognition function (image data cutout and character recognition processing) of the mobile phone 10. OCR functions), interpretation functions of the format control file 20, voice communication functions (such as calls) and message communication functions (such as sending and receiving e-mails), display functions (such as screen display control of the LCD display unit 17), etc. A control program (firmware) for operating is stored.
The user area 12b is a storage area in which information can be rewritten by the user. A format control file 20 (see FIG. 2), which is a format control description expression including each function processing and hardware control of the mobile phone 10, is stored in the user area 12b. It is remembered.

フォーマットコントロールファイル20の記述の一例を図2に示す。フォーマットコントロールファイル20は、XML言語などで制御記述が記載されたテキストファイルである。図2には、文字認識対象の帳票が払込伝票である場合の具体例が記述されている。このフォーマットコントロールファイル20には、払込伝票の外形輪郭を囲むための枠(位置合わせをするための枠)を表示するための表示制御記述と、文字認識の対象となるイメージデータの切り出し範囲(領域)を示す枠を表示するための表示制御記述と、この文字認識の対象となるイメージデータの切り出し範囲(領域)を示す枠で指定された範囲から切り出したイメージ中の文字イメージを文字認識するための字種を指定する字種制御記述(一例として、伝票番号や金額を認識する場合は「英数字」と指定する)と、文字認識により得たデータに対するアクションの記述が記載されている。アクションの記述の一例としては、所定のアドレス(ocrceter@xxxx.co.jp)へ日付、時刻、電話番号、文字認識した伝票番号、文字認識した払込金額を記載した電子メールを送信する、というものである。   An example of the description of the format control file 20 is shown in FIG. The format control file 20 is a text file in which a control description is described in an XML language or the like. FIG. 2 describes a specific example in which the form for character recognition is a payment slip. The format control file 20 includes a display control description for displaying a frame for enclosing the outline outline of the payment slip (a frame for alignment), and a cutout range (area) of image data to be subjected to character recognition. For character recognition in a character image in an image cut out from a range specified by a display control description for displaying a frame indicating) and a frame indicating a cut-out range (region) of image data to be character-recognized. A character type control description (for example, “alphanumeric” is specified when recognizing a slip number or amount) and a description of an action for data obtained by character recognition are described. An example of an action description is to send an e-mail with the date, time, telephone number, character-recognized slip number, and character-recognized payment amount to a predetermined address (ocrceter@xxxx.co.jp) It is.

通話部14は、マイク、スピーカなどとその制御回路などから構成されている。カメラ部15は、レンズ、CCDカメラとその制御回路などからなり、レンズの開口部が向けられた方向の画像を撮像する。有効撮影画素数は、例えば31万画素などであり、これ以上の画素数であるとさらに良い。無線通信部16は、無線基地局3と無線通信を行う。LCD表示部17は、各種画面(機能メニュー画面、帳票選択画面、OCR画面、修正画面など)と、OCR画面では文字認識対象の枠線である文字認識領域枠34、ユーザが位置決めを行うためのガイド用の枠線であるガイド枠35などを表示する。   The call unit 14 is composed of a microphone, a speaker, etc. and a control circuit thereof. The camera unit 15 includes a lens, a CCD camera, and a control circuit thereof, and captures an image in a direction in which the lens opening is directed. The number of effective photographing pixels is 310,000 pixels, for example, and it is even better if the number of pixels is more than this. The wireless communication unit 16 performs wireless communication with the wireless base station 3. The LCD display unit 17 includes various screens (function menu screen, form selection screen, OCR screen, correction screen, etc.), a character recognition area frame 34 that is a character recognition target frame line on the OCR screen, and a position for the user to perform positioning. A guide frame 35 or the like, which is a guide frame line, is displayed.

CPU18は、ユーザ操作に伴いシステム領域12aに記憶されたファームウェアにより各機能が動作する中で、例えばOCRの機能など、所定の機能がユーザにより選択及び指定された場合、ユーザ領域12bに記憶されているフォーマットコントロールファイル20を読み込んで解釈する手段として機能する。また、CPU18は、解釈されたフォーマットコントロールファイル20の内容に基づいて画像撮影手段、文字認識機能、音声およびメッセージ通信機能(電子メール送信手段)、画面表示機能を制御する制御手段として機能する。   The CPU 18 is stored in the user area 12b when a predetermined function such as an OCR function is selected and designated by the user while each function is operated by the firmware stored in the system area 12a in response to a user operation. It functions as a means for reading and interpreting the existing format control file 20. Further, the CPU 18 functions as a control means for controlling the image photographing means, the character recognition function, the voice and message communication function (e-mail sending means), and the screen display function based on the contents of the interpreted format control file 20.

すなわち、この携帯電話機10は、画像を撮像する撮像手段としてのカメラ部15と、このカメラ部15により撮像された画像の中で文字認識対象の第1領域としての文字認識領域枠34を表示するための書式制御情報であるフォーマットコントロールファイル20を記憶する記憶手段としてのメモリ12と、このメモリ12に記憶されたフォーマットコントロールファイル20を解釈する解釈機能と、この解釈機能により解釈されたフォーマットコントロールファイル20の記述内容に基づいてカメラ部15により撮像された画像の中の文字認識領域枠34の部分(第1領域)を切り出して文字の認識処理を行う文字認識機能と、この文字認識機能により認識された文字を編集可能に表示する画面表示機能とを備えている。   That is, the cellular phone 10 displays a camera unit 15 as an imaging unit that captures an image, and a character recognition area frame 34 as a first area to be recognized in the image captured by the camera unit 15. A memory 12 as a storage means for storing a format control file 20 that is format control information, an interpretation function for interpreting the format control file 20 stored in the memory 12, and a format control file interpreted by the interpretation function A character recognition function for cutting out a portion (first region) of the character recognition area frame 34 in the image captured by the camera unit 15 based on the description content 20 and performing character recognition processing, and recognition by this character recognition function And a screen display function for displaying the edited characters in an editable manner.

また、この携帯電話機10は、帳票としての伝票R1の画像を撮像する撮像手段としてのカメラ部15と、このカメラ部15により撮像された画像の中で文字認識対象の第1領域としての文字認識領域枠34および画像の位置合せのための第2領域としてのガイド枠35の少なくとも一つを表示するための書式制御情報であるフォーマットコントロールファイル20を記憶する記憶手段としてのメモリ12と、このメモリ12に記憶されたフォーマットコントロールファイル20を解釈する解釈機能と、この解釈機能により解釈されたフォーマットコントロールファイル20の記述内容に基づいてカメラ部15により撮像された画像の中の文字認識領域枠34が指定する部分(第1領域)を切り出して文字の認識処理を行う文字認識機能と、カメラ部15により撮像された伝票R1の画像とガイド枠35と文字認識機能により認識された文字とこの文字に対する修正あるいは確定を促すメッセージとを表示する表示機能と、確定された文字と撮像された伝票R1の画像とを所定の送信先であるサーバ1のアドレスへ送信するメッセージ通信機能としての電子メール送信手段とを備えている。   In addition, the mobile phone 10 includes a camera unit 15 as an imaging unit that captures an image of the slip R1 as a form, and character recognition as a first area to be recognized in the image captured by the camera unit 15. A memory 12 as storage means for storing a format control file 20 which is format control information for displaying at least one of an area frame 34 and a guide frame 35 as a second area for image alignment; The character recognition area frame 34 in the image captured by the camera unit 15 based on the interpretation function for interpreting the format control file 20 stored in FIG. 12 and the description content of the format control file 20 interpreted by the interpretation function A character recognition function that cuts out a designated portion (first region) and performs character recognition processing; A display function for displaying the image of the slip R1 imaged by the camera unit 15, the guide frame 35, the character recognized by the character recognition function, and a message prompting the user to correct or confirm the character, and the image of the confirmed character. E-mail transmission means as a message communication function for transmitting the image of the slip R1 to the address of the server 1 which is a predetermined transmission destination is provided.

以下、図3〜図8を参照してこの物流管理システムの動作を説明する。
この物流管理システムの場合、ユーザである配送員は、図7に示す配送対象の物品の伝票R1を読み取る際に、キー操作部11に対して機能メニュー表示のための操作を行う。
すると、携帯電話機10のCPU18は、システム領域12aに記憶されているファームウェアに従いLCD表示部17に、図4に示すように、機能メニュー画面31を表示する(S201)。
この機能メニュー画面31には、1.送信メールボックス、2.受信メールボックス、3.メロディボックス、4.写真ボックス、5.OCR機能ボックスなどの選択項目が表示される。
Hereinafter, the operation of the physical distribution management system will be described with reference to FIGS.
In the case of this physical distribution management system, a delivery person who is a user performs an operation for displaying a function menu on the key operation unit 11 when reading a slip R1 of an article to be delivered shown in FIG.
Then, the CPU 18 of the mobile phone 10 displays the function menu screen 31 as shown in FIG. 4 on the LCD display unit 17 according to the firmware stored in the system area 12a (S201).
This function menu screen 31 includes: 1. Send mailbox, 2. Receive mailbox; Melody box, 4. Photo box, 5. Selection items such as an OCR function box are displayed.

これら選択項目の中から、例えば「5.」が選択されると(S202のYes)、CPU18は、メモリ12のユーザ領域12bに記憶されているフォーマットコントロールファイル20の内容を読み込み解釈する。なお、複数ある場合は、すべてのフォーマットコントロールファイル20を読み込み、図5に示すように、この読み込んだフォーマットコントロールファイル20に対応する帳票を選択するための帳票選択画面32を表示する(S203)。
帳票選択画面32には、1.一般文書、2.A社通販伝票読取、3.B社申込書読取、4.C社バーコード読取などの選択項目が表示される。
これら選択項目の中から、例えば「2.」の[A社通販伝票読取]が選択されると(S204のYes)、CPU18は、この選択した帳票を読み取るために作成されたフォーマットコントロールファイル20の内容(図2参照)を解釈する(S205)。
When, for example, “5.” is selected from these selection items (Yes in S202), the CPU 18 reads and interprets the contents of the format control file 20 stored in the user area 12b of the memory 12. If there are a plurality of formats, all the format control files 20 are read, and a form selection screen 32 for selecting a form corresponding to the read format control file 20 is displayed as shown in FIG. 5 (S203).
The form selection screen 32 includes: General documents, 2. 2. Company A mail order slip read. B company application form reading, 4. Selection items such as C company bar code reading are displayed.
When, for example, “2. Company A mail order slip reading” of “2.” is selected from these selection items (Yes in S204), the CPU 18 reads the format control file 20 created to read the selected form. The contents (see FIG. 2) are interpreted (S205).

そして、フォーマットコントロールファイル20の内容を解釈した後、CPU18は、図6に示すように、OCR画面33を表示すると共に、カメラ部15を制御して撮像を開始する。OCR画面33には、文字認識領域枠34とガイド枠35と「帳票の上の枠に合せて下さい。」などのメッセージが表示される(S206)。文字認識領域枠34とガイド枠35は、フォーマットコントロールファイル20の記述で指定された位置に表示される。ガイド枠35は、ユーザが携帯電話機10の位置を変えて帳票R1の輪郭を合せるためのものである。これらの枠は、帳票スタイルを簡略化したものである。   Then, after interpreting the contents of the format control file 20, the CPU 18 displays the OCR screen 33 and controls the camera unit 15 to start imaging as shown in FIG. On the OCR screen 33, a character recognition area frame 34, a guide frame 35, and a message such as “Please align with the frame on the form” are displayed (S206). The character recognition area frame 34 and the guide frame 35 are displayed at positions specified by the description of the format control file 20. The guide frame 35 is used by the user to change the position of the mobile phone 10 and match the outline of the form R1. These frames are simplified form styles.

図7に示すように、帳票としての伝票R1は、所定位置、例えば帳票面の左上隅に伝票番号「13」と、帳票面の右下隅に払込金額の記載欄が印刷されたものであり、払込金額の記載欄には「24000」などが記載されている。それ以外の帳票面には、払込人の氏名、住所、品目などが記載されている。払込人の氏名、住所、品目などはイメージデータとして読み取っておくだけで良い。
OCR画面33には、カメラ部15により撮像された帳票R1の画像が文字認識領域枠34とガイド枠35の背景に画面いっぱいに表示される(S207)。このOCR画面33の画像は、所定時間間隔(数msec毎)で撮像されるので、携帯電話機10を動かすと、それに伴って位置がずれる。
As shown in FIG. 7, the slip R1 as a form has a slip number “13” printed in a predetermined position, for example, the upper left corner of the form face, and a payment amount description column printed in the lower right corner of the form face. In the column for the amount to be paid in, “24000” is written. On the other forms, the name, address, item, etc. of the payer are described. The name, address, item, etc. of the payer need only be read as image data.
On the OCR screen 33, the image of the form R1 imaged by the camera unit 15 is displayed in the background of the character recognition area frame 34 and the guide frame 35 in a full screen (S207). Since the images on the OCR screen 33 are taken at predetermined time intervals (every several milliseconds), when the mobile phone 10 is moved, the position is shifted accordingly.

ユーザは、OCR画面33に表示されたメッセージに従い、OCR画面33の背景に映し出された帳票R1の画像の輪郭をガイド枠35に重なるように携帯電話機10を動かして位置を変え、適当と思われる位置でFキーを押すと、CPU18は、フラッシュを点灯しシャッター動作(記憶動作)、つまり撮像された画像をメモリ12に記憶する。なお、カメラ部15を撮像制御して数msec毎に画像を撮像しメモリ12に記憶しつつ下記文字認識処理を実行することで、ユーザのシャッター操作を省略することもできる。
CPU18は、メモリ12に記憶された画像より文字認識領域枠34の部分の画像を切り出して文字認識処理を実行する(S208)。そして、文字認識結果が得られ、文字認識処理が完了すると(S209のYes)、CPU18は、通話部14のスピーカより音声を発生させて(S210)、その旨をユーザに通知する。
According to the message displayed on the OCR screen 33, the user moves the mobile phone 10 so that the outline of the image of the form R1 displayed on the background of the OCR screen 33 overlaps the guide frame 35, and changes the position. When the F key is pressed at the position, the CPU 18 turns on the flash and performs a shutter operation (storage operation), that is, stores the captured image in the memory 12. In addition, a user's shutter operation can also be abbreviate | omitted by performing the following character recognition process, image-controlling the camera part 15 and imaging an image every several msec, and memorize | storing it in the memory 12.
The CPU 18 cuts out the image of the character recognition area frame 34 from the image stored in the memory 12 and executes the character recognition process (S208). When a character recognition result is obtained and the character recognition process is completed (Yes in S209), the CPU 18 generates a sound from the speaker of the calling unit 14 (S210), and notifies the user to that effect.

CPU18は、図8に示すように、修正画面36を表示して(S211)、その画面内に文字認識結果のテキストデータと、「帳票の記載内容と照合してください。」などのメッセージを表示する。この例では、文字認識結果のテキストデータとして、伝票番号の右横に「13」、払込金額の右横に「24000」が表示される。この修正画面36の内容が正しければユーザは修正せずに(正しくなければキー操作により修正した後)、Fキーを押して確定操作する。   As shown in FIG. 8, the CPU 18 displays the correction screen 36 (S211), and displays text data of the character recognition result and a message such as “Please collate with the contents described in the form” on the screen. To do. In this example, “13” is displayed on the right side of the slip number and “24000” is displayed on the right side of the payment amount as text data of the character recognition result. If the content of the correction screen 36 is correct, the user does not correct it (after correction by key operation if it is not correct), presses the F key to perform a confirmation operation.

すると、CPU18は、文字認識結果が確定したものと判定して(S212のYes)、フォーマットコントロールファイル20の記述内容に従って後処理としてのアクションを起こす。
この例では、CPU18は、日付、時刻、電話番号、文字認識結果のテキストデータ(13,24000)をメール本文に挿入し、読み取ったイメージデータを添付した電子メールを所定の宛先、この場合、サーバ1の電子メールアドレスへ送信する(S213)。
サーバ1では、携帯電話機10から電子メールが受信されると、受信メールのデータを定型のフォームに落とし込み、データベースに登録及び管理する。なお、携帯電話機10側で行う後処理は単純な集計処理であっても良い。
Then, the CPU 18 determines that the character recognition result is confirmed (Yes in S212), and causes an action as post-processing according to the description content of the format control file 20.
In this example, the CPU 18 inserts text data (13, 24000) of the date, time, telephone number, and character recognition result into the mail body, and sends an e-mail attached with the read image data to a predetermined destination, in this case, a server. 1 is sent to the e-mail address (S213).
When the server 1 receives an e-mail from the mobile phone 10, the received mail data is dropped into a standard form and registered and managed in a database. Note that the post-processing performed on the mobile phone 10 side may be a simple tabulation process.

このようにこの実施形態の物流管理システムによれば、携帯電話機10にフォーマットコントロールファイル20の解釈機能を備え、メモリ12のユーザ領域12bにフォーマットコントロールファイル20を記憶し、文字認識時にこれを選択して利用することで、配送業の伝票R1の読み取り及び文字認識といった特殊な処理を一般市販のカメラ機能付きの携帯電話機10で行えるようになる。
また、一般市販されるカメラ機能付の携帯電話機10のカメラ機能を利用して伝票R1から読み取った画像から配送用の伝票R1の所定位置に印字あるいは記載された伝票番号(英数字)と金額(数字)を文字認識して、撮像したイメージデータと共に電子メールでサーバ1へ送信するので、物流センターにおいて大量の伝票処理を行わずに済むようになり、センター人員の削減、あるいはセンター処理の廃止など、固定費の削減、業務効率の向上などに寄与することができる。
As described above, according to the physical distribution management system of this embodiment, the cellular phone 10 has the interpretation function of the format control file 20, stores the format control file 20 in the user area 12b of the memory 12, and selects this when recognizing characters. By using them, special processing such as reading of the delivery slip R1 and character recognition can be performed by a general commercially available mobile phone 10 with a camera function.
Further, a slip number (alphanumeric) and an amount (printed or printed at a predetermined position on the delivery slip R1 from an image read from the slip R1 using the camera function of the mobile phone 10 with a camera function that is commercially available. (Number) is recognized and sent to the server 1 by e-mail together with the captured image data, so that it is not necessary to process a large amount of slips at the distribution center, reducing the number of center personnel or abolishing the center processing. This can contribute to reduction of fixed costs and improvement of business efficiency.

続いて、図9〜図12を参照して上記実施形態の他のフォーマットコントロールの例について説明する。
フォーマットコントロールの他の例として、図9に示すように、帳票選択画面32の選択項目の中から、例えば「3.」の[B社申込書]の項目が選択されると、CPU18は、この選択した帳票[B社申込書]に対応するフォーマットコントロールファイルの内容を解釈する。
Next, another example of format control in the above embodiment will be described with reference to FIGS.
As another example of the format control, as shown in FIG. 9, when an item “Application for Company B” of “3.” is selected from the selection items on the form selection screen 32, the CPU 18 Interpret the contents of the format control file corresponding to the selected form [B company application form].

フォーマットコントロールファイルの内容を解釈した後、CPU18は、図10に示すように、OCR画面37を表示すると共に、カメラ部15を制御して撮像を開始する。このOCR画面37には、該当フォーマットコントロールファイルの記述に従い、IDフィールド枠38が表示されると共に、「IDフィールドを上の枠にあわせてください。」などのメッセージが表示される。このIDフィールド枠38は、ガイド枠を兼ねたものである。この例のIDフィールド枠38は、複数枚で一つの帳票とされている申込用紙のうち例えば4枚目のD票か否かを判定するために用いる文字認識枠である。つまり、この例は、帳票自体の種別を識別及び判定するときに利用する。なお、IDフィールド枠38内の画像から文字認識を行う処理以降は上記実施形態と同じである。   After interpreting the contents of the format control file, the CPU 18 displays the OCR screen 37 and controls the camera unit 15 to start imaging as shown in FIG. In the OCR screen 37, an ID field frame 38 is displayed according to the description of the corresponding format control file, and a message such as “Please adjust the ID field to the upper frame” is displayed. The ID field frame 38 also serves as a guide frame. The ID field frame 38 in this example is a character recognition frame used to determine whether, for example, it is the fourth D-form among application sheets that are a single form. That is, this example is used when identifying and determining the type of the form itself. The processing after character recognition from the image in the ID field frame 38 is the same as that in the above embodiment.

また、図11に示すように、帳票選択画面32の選択項目の中から、例えば「4.」の[C社バーコード読取]の項目が選択されると、CPU18は、この選択した帳票[C社バーコード読取]に対応するフォーマットコントロールファイルの内容を解釈する。   As shown in FIG. 11, when the item “4.” [C company barcode reading] is selected from the selection items on the form selection screen 32, the CPU 18 selects the selected form [C Interpret the contents of the format control file corresponding to [Company Bar Code Read].

フォーマットコントロールファイルの内容を解釈した後、CPU18は、図12に示すように、OCR画面39を表示すると共に、カメラ部15を制御して撮像を開始する。このOCR画面39には、該当フォーマットコントロールファイルの記述に従い、3つのマーク40が表示されると共に、「3点マーク検出中。」などのメッセージが表示される。この3つのマーク40は、ガイド枠を兼ねたものであり、ユーザは、各マーク40に、帳票に印字されたマークを合せるように携帯電話機10を動かす。この例では、各マーク40の位置に、帳票のマークが合うと、CPU18は、帳票の右下の所定位置に印字されたバーコードの読み取り処理を行う。なお、バーコードの読み取り処理については、既存の技術を利用する。
このようにフォーマットコントロールファイルの記述を変えるだけでさまざまな形態の帳票の文字認識あるいはバーコード読み取りを行えるようになる。
After interpreting the contents of the format control file, the CPU 18 displays an OCR screen 39 as shown in FIG. 12, and controls the camera unit 15 to start imaging. On the OCR screen 39, three marks 40 are displayed according to the description of the corresponding format control file, and a message such as “3 point mark being detected” is displayed. The three marks 40 also serve as guide frames, and the user moves the mobile phone 10 so that the marks printed on the form are aligned with the marks 40. In this example, when the mark of the form is aligned with the position of each mark 40, the CPU 18 performs a reading process of the barcode printed at a predetermined position on the lower right of the form. Note that the existing technology is used for the barcode reading process.
In this way, it is possible to perform character recognition or barcode reading of various forms simply by changing the description of the format control file.

なお、上記実施形態では、配送員自身が携行する携帯電話機10で帳票を読み取る例について説明したが、ビジネスモデルとしては、この他、顧客から配送依頼される物品をコンビニエンスストアなどの小売店で保管しておき、配送員がルートサービスで取りに行くことも考えられるので、この場合は、小売店が保持する携帯電話機にて伝票を読み取り予め電子データ化しておいた方が効率的である。この場合、小売店の携帯電話機に電子化したデータを携帯電話機のスロットに装着したメモリカードなどに蓄積しておき、メモリカードを介して、配送員が携行する携帯電話機10にデータを移すことで、配送員の携帯電話機10からサーバ1へデータを送信しても良い。また、データの移動媒体としては、メモリカードに限らず、携帯電話機相互接続用のケーブルなどを用いても良く、また、赤外線あるいは電波を利用しても良い。
また、上記実施形態では、携帯情報端末として、携帯電話機10を一例にあげて説明したが、この他、Personal Digital Assistant:PDAなどであっても良い。
In the above-described embodiment, an example in which a form is read by the mobile phone 10 carried by the delivery person is described. However, as a business model, in addition to this, an article requested for delivery by a customer is stored in a retail store such as a convenience store. In addition, since it is conceivable that the delivery person goes to pick up the route service, in this case, it is more efficient to read the slip with a mobile phone held by the retail store and convert it into electronic data in advance. In this case, electronic data is stored in a mobile phone of a retail store in a memory card or the like mounted in a slot of the mobile phone, and the data is transferred to the mobile phone 10 carried by the delivery person via the memory card. Data may be transmitted from the delivery person's mobile phone 10 to the server 1. Further, the data transfer medium is not limited to the memory card, and a mobile phone interconnection cable or the like may be used, or infrared rays or radio waves may be used.
In the above-described embodiment, the mobile phone 10 has been described as an example of the mobile information terminal. However, a personal digital assistant (PDA) or the like may be used.

物流管理システムの構成を示す図。The figure which shows the structure of a physical distribution management system. 図1の物流管理システムで使用する携帯電話機に記憶されたフォーマットコントロールファイルを示す図。The figure which shows the format control file memorize | stored in the mobile telephone used with the physical distribution management system of FIG. 携帯電話機の動作を示すフローチャート。The flowchart which shows operation | movement of a mobile telephone. 携帯電話機の機能メニュー画面を示す図。The figure which shows the function menu screen of a mobile telephone. 携帯電話機の帳票選択画面を示す図。The figure which shows the form selection screen of a mobile telephone. 携帯電話機のOCR画面を示す図。The figure which shows the OCR screen of a mobile telephone. 伝票の一例を示す図。The figure which shows an example of a slip. 携帯電話機の修正画面を示す図。The figure which shows the correction screen of a mobile telephone. 携帯電話機の帳票選択画面を示す図。The figure which shows the form selection screen of a mobile telephone. 携帯電話機のOCR画面を示す図。The figure which shows the OCR screen of a mobile telephone. 携帯電話機の帳票選択画面を示す図。The figure which shows the form selection screen of a mobile telephone. 携帯電話機のOCR画面を示す図。The figure which shows the OCR screen of a mobile telephone.

符号の説明Explanation of symbols

1…サーバ、2…インターネット、3…無線基地局、10…携帯電話機、11…キー層操作部、12…メモリ、14…通話部、15…カメラ部、16…無線通信部、17…LCD表示部、18…CPU、R1…伝票。   DESCRIPTION OF SYMBOLS 1 ... Server, 2 ... Internet, 3 ... Wireless base station, 10 ... Mobile phone, 11 ... Key layer operation part, 12 ... Memory, 14 ... Call part, 15 ... Camera part, 16 ... Wireless communication part, 17 ... LCD display Part, 18 ... CPU, R1 ... slip.

Claims (3)

画像を撮像するための撮像手段と、
前記撮像手段により撮像された画像の中で文字認識対象の第1領域を設定するためのフォーマットコントロール記述式を記憶する記憶手段と、
前記フォーマットコントロール記述式に基づいて前記撮像手段より撮像された画像の中の前記第1領域より文字の認識を行う文字認識機能と、
前記撮像された画像と前記文字認識結果とを所定の送信先へ送信する送信手段と
を具備したことを特徴とする携帯情報端末。
An imaging means for capturing an image;
Storage means for storing a format control description formula for setting a first area for character recognition in an image captured by the imaging means;
A character recognition function for recognizing characters from the first area in the image captured by the imaging means based on the format control description formula;
A portable information terminal comprising: a transmission unit configured to transmit the captured image and the character recognition result to a predetermined transmission destination.
前記フォーマットコントロール記述式には、
画像の位置合せのためのガイドを表示する記述が含まれていることを特徴とする請求項1,2いずれか記載の携帯情報端末。
The format control description formula includes
3. The portable information terminal according to claim 1, further comprising a description for displaying a guide for aligning images.
撮影手段、文字認識機能、送信手段、記憶手段を備えた携帯情報端末による画像処理方法において、
前記撮影手段により画像を撮像するステップと、
前記記憶手段に記憶され、前記撮影手段により撮像される画像の中で文字認識対象の第1領域を設定するためのフォーマットコントロール記述式に基づいて前記撮像ステップにより撮像された画像の中の前記第1領域より前記文字認識機能が文字の認識を行うステップと、
前記撮像ステップにより撮像された画像と前記文字認識結果とを前記送信手段が所定の送信先へ送信するステップと
を有することを特徴とする携帯情報端末による画像処理方法。
In an image processing method by a portable information terminal provided with a photographing means, a character recognition function, a transmission means, and a storage means,
Capturing an image by the photographing means;
The first of the images captured by the imaging step based on a format control description formula for setting a first region for character recognition in an image captured by the imaging unit and stored in the storage unit. The character recognition function recognizes characters from one area;
An image processing method using a portable information terminal, comprising: a step in which the transmission unit transmits the image captured in the imaging step and the character recognition result to a predetermined transmission destination.
JP2004023595A 2004-01-30 2004-01-30 Personal digital assistant and image processing method thereby Pending JP2005216102A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004023595A JP2005216102A (en) 2004-01-30 2004-01-30 Personal digital assistant and image processing method thereby

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004023595A JP2005216102A (en) 2004-01-30 2004-01-30 Personal digital assistant and image processing method thereby

Publications (1)

Publication Number Publication Date
JP2005216102A true JP2005216102A (en) 2005-08-11

Family

ID=34906554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004023595A Pending JP2005216102A (en) 2004-01-30 2004-01-30 Personal digital assistant and image processing method thereby

Country Status (1)

Country Link
JP (1) JP2005216102A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221372A (en) * 2011-04-12 2012-11-12 Panasonic Corp Business form, business form processor, business form processing method and recording medium
JP2015197851A (en) * 2014-04-02 2015-11-09 大成建設株式会社 Image processor, program for image processing and information management system
JP2018504865A (en) * 2015-12-01 2018-02-15 シャオミ・インコーポレイテッド Information processing method and apparatus, program, and recording medium
JP2018157472A (en) * 2017-03-21 2018-10-04 カシオ計算機株式会社 Account book document processing device, account book document processing method, and program
JP2020091748A (en) * 2018-12-06 2020-06-11 トッパン・フォームズ株式会社 Terminal device, program, and image management method

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01161575A (en) * 1987-12-18 1989-06-26 Oki Electric Ind Co Ltd Money order processing system
JPH11184973A (en) * 1997-12-19 1999-07-09 Canon Inc Communication system, control method for the same and computer readable memory
JP2000350077A (en) * 1999-03-30 2000-12-15 Ricoh Co Ltd Digital camera and method for photographing and transferring document
JP2003196589A (en) * 2001-12-25 2003-07-11 Fujitsu Ltd Program and method for reception
JP2003331217A (en) * 2002-03-08 2003-11-21 Nec Corp Character input device, character input method and character input program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01161575A (en) * 1987-12-18 1989-06-26 Oki Electric Ind Co Ltd Money order processing system
JPH11184973A (en) * 1997-12-19 1999-07-09 Canon Inc Communication system, control method for the same and computer readable memory
JP2000350077A (en) * 1999-03-30 2000-12-15 Ricoh Co Ltd Digital camera and method for photographing and transferring document
JP2003196589A (en) * 2001-12-25 2003-07-11 Fujitsu Ltd Program and method for reception
JP2003331217A (en) * 2002-03-08 2003-11-21 Nec Corp Character input device, character input method and character input program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221372A (en) * 2011-04-12 2012-11-12 Panasonic Corp Business form, business form processor, business form processing method and recording medium
JP2015197851A (en) * 2014-04-02 2015-11-09 大成建設株式会社 Image processor, program for image processing and information management system
JP2018504865A (en) * 2015-12-01 2018-02-15 シャオミ・インコーポレイテッド Information processing method and apparatus, program, and recording medium
JP2018157472A (en) * 2017-03-21 2018-10-04 カシオ計算機株式会社 Account book document processing device, account book document processing method, and program
JP2020091748A (en) * 2018-12-06 2020-06-11 トッパン・フォームズ株式会社 Terminal device, program, and image management method

Similar Documents

Publication Publication Date Title
JP4916430B2 (en) Encoding and decoding character data
KR101189877B1 (en) Mobile terminal, icon material management system, and icon material management method
EP1715703A1 (en) Portable communication apparatus cross references to related applications
US20150055182A1 (en) Image-processing system and image-processing method
US20050099653A1 (en) Print terminal
KR101419010B1 (en) Apparatus and method for providing phonebook using image in portable terminal
JP2009122871A (en) Automatic reception system, reception device, reception tag, and terminal equipment
US9197768B2 (en) Cooperation system, mobile information device, cooperation processing method, and non-transitory computer-readable recording medium encoded with cooperation processing program
JP2005216102A (en) Personal digital assistant and image processing method thereby
JP2004164352A (en) Automatic teller machine with prior operation function
JP2005157458A (en) Automatic contract system, automatic contract reception machine, and automatic contract method
US20050174585A1 (en) Mobile terminal, printing processing method, and printing processing program
JP2005129005A (en) Receiving and ordering system and its program
JP2018067269A (en) Cooperation system, information processing apparatus, cooperation method, and cooperation program
CN106470258B (en) Method and device for automatically dialing or sending short message
JP3480734B1 (en) Printing system and printing method
JP2010157940A (en) Photograph printing apparatus, photograph selecting method, and program therefor
JP6268950B2 (en) Image processing system, image processing apparatus, image processing method, and image processing program
JP4289212B2 (en) Image print sales apparatus, image print sales system and program
JP4146700B2 (en) Portable terminal device, information providing system, recording medium on which information providing program is recorded, and print medium
JP2004287825A (en) Image input/output system
JP2003196589A (en) Program and method for reception
JP2004126910A (en) Business form acceptance device and business form acceptance processing method
JP2008187596A (en) Print system, printing method, and program
JP4406791B2 (en) Photo service system

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050524

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061218

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070130