[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

RU2003108434A - Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата - Google Patents

Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата Download PDF

Info

Publication number
RU2003108434A
RU2003108434A RU2003108434/09A RU2003108434A RU2003108434A RU 2003108434 A RU2003108434 A RU 2003108434A RU 2003108434/09 A RU2003108434/09 A RU 2003108434/09A RU 2003108434 A RU2003108434 A RU 2003108434A RU 2003108434 A RU2003108434 A RU 2003108434A
Authority
RU
Russia
Prior art keywords
field
image
spatial
template
reference point
Prior art date
Application number
RU2003108434/09A
Other languages
English (en)
Inventor
Константин Алексеевич Зуев (RU)
Константин Алексеевич Зуев
Руслан Владимирович Гаращук (RU)
Руслан Владимирович Гаращук
Original Assignee
"Аби Софтвер Лтд." (CY)
"Аби Софтвер Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by "Аби Софтвер Лтд." (CY), "Аби Софтвер Лтд." filed Critical "Аби Софтвер Лтд." (CY)
Priority to RU2003108434/09A priority Critical patent/RU2003108434A/ru
Priority to US10/603,216 priority patent/US8170371B2/en
Publication of RU2003108434A publication Critical patent/RU2003108434A/ru
Priority to US13/449,240 priority patent/US9015573B2/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Input (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Image Analysis (AREA)

Claims (13)

1. Способ предварительной обработки изображения машиночитаемой формы с нефиксированным размещением полей, характеризующийся наличием изображения заполненной формы, наличием по крайней мере одного шаблона формы с описанием пространственных и параметрических свойств объектов формы, выполнением следующих этапов: этапа устранения сдвига, наклона изображения и компенсации искажений, этапа разбиения изображения на области, этапа выделения областей, содержащих поля ввода данных, отличающийся выполнением следующих операций: предварительного назначения на форме по крайней мере одного объекта формы в качестве репера для пространственной привязки по крайней мере одного поля ввода данных, описания пространственных характеристик по крайней мере одного указанного репера в описании шаблона формы, идентификации на изображении формы по крайней мере одного репера, определения положения по крайней мере одного поля ввода относительно по крайней мере одного указанного репера.
2. Способ по п.1, отличающийся тем, что репер представляет собой текстовую область.
3. Способ по п.2, отличающийся тем, что дополнительно проводят распознавание текстовой области, используемой в качестве репера.
4. Способ по п.1, отличающийся тем, что при множественном результате поиска идентификацию поля проводят путем выдвижения и проверки гипотез и оценки качества соответствия описанию в шаблоне.
5. Способ по п.4, отличающийся тем, что привлекают дополнительную параметрическую информацию о поле ввода.
6. Способ по п.1, отличающийся тем, что этап определения положения по крайней мере одного поля ввода относительно по крайней мере одного указанного репера в свою очередь включает по крайней мере следующие этапы: выбора поля для поиска из описания шаблона, выбора из описания шаблона характеристик по крайней мере одного репера для пространственной привязки искомого поля, поиска по крайней мере одного указанного репера на изображении формы, поиска указанного поля на изображении формы относительно по крайней мере одного репера с учетом пространственных и параметрических характеристик поля, описанных в шаблоне, идентификации указанного поля из нескольких в случае множественного результата поиска.
7. Способ по п.1, отличающийся тем, что поле ввода может быть репером для поиска других полей.
8. Способ по п.1, отличающийся тем, что этап идентификации поля из нескольких удовлетворяющих набору пространственных и параметрических характеристик выполняют полностью или частично с привлечением оператора.
9. Способ по п.1, отличающийся тем, что пространственное положение репера не фиксировано.
10. Способ по п.1, отличающийся тем, что один репер используют для пространственной привязки более одного поля.
11. Способ по п.1, отличающийся тем, что пространственную привязку поля осуществляют к более чем одному реперу.
12. Способ по п.1, отличающийся тем, что репер включает более одного объекта.
13. Способ по п.1, отличающийся тем, что репер описывают в виде альтернативы.
RU2003108434/09A 2003-03-28 2003-03-28 Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата RU2003108434A (ru)

Priority Applications (3)

Application Number Priority Date Filing Date Title
RU2003108434/09A RU2003108434A (ru) 2003-03-28 2003-03-28 Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата
US10/603,216 US8170371B2 (en) 2003-03-28 2003-06-26 Method of image pre-analyzing of a machine-readable form of non-fixed layout
US13/449,240 US9015573B2 (en) 2003-03-28 2012-04-17 Object recognition and describing structure of graphical objects

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003108434/09A RU2003108434A (ru) 2003-03-28 2003-03-28 Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата

Publications (1)

Publication Number Publication Date
RU2003108434A true RU2003108434A (ru) 2004-09-27

Family

ID=33413765

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003108434/09A RU2003108434A (ru) 2003-03-28 2003-03-28 Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата

Country Status (2)

Country Link
US (1) US8170371B2 (ru)
RU (1) RU2003108434A (ru)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070172130A1 (en) * 2006-01-25 2007-07-26 Konstantin Zuev Structural description of a document, a method of describing the structure of graphical objects and methods of object recognition.
US9015573B2 (en) * 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US9224040B2 (en) 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US8571262B2 (en) * 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US8356252B2 (en) * 2009-09-02 2013-01-15 Synchronoss Technologies, Inc. System and method for providing a computer display form layout
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images
US9129276B1 (en) * 2011-11-02 2015-09-08 Intuit Inc. Inventory management
US10176159B2 (en) * 2014-05-05 2019-01-08 Adobe Systems Incorporated Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field
US9424167B2 (en) 2014-05-21 2016-08-23 Cgi Technologies And Solutions Inc. Automated testing of an application system
US10482170B2 (en) * 2017-10-17 2019-11-19 Hrb Innovations, Inc. User interface for contextual document recognition

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01155484A (ja) * 1987-12-11 1989-06-19 Toshiba Corp 文字読取装置
IL91220A (en) * 1989-08-04 1995-03-30 Ibm Israel Compression of information
US5191525A (en) * 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
US5235654A (en) * 1992-04-30 1993-08-10 International Business Machines Corporation Advanced data capture architecture data processing system and method for scanned images of document forms
US5416849A (en) * 1992-10-21 1995-05-16 International Business Machines Corporation Data processing system and method for field extraction of scanned images of document forms
US5793887A (en) * 1993-11-16 1998-08-11 International Business Machines Corporation Method and apparatus for alignment of images for template elimination
JPH08305778A (ja) * 1995-04-21 1996-11-22 Xerox Corp ユーザの作成したマークの存在を調査するための方法
US7149347B1 (en) * 2000-03-02 2006-12-12 Science Applications International Corporation Machine learning of document templates for data extraction
US6778703B1 (en) * 2000-04-19 2004-08-17 International Business Machines Corporation Form recognition using reference areas
US6760490B1 (en) * 2000-09-28 2004-07-06 International Business Machines Corporation Efficient checking of key-in data entry
US6640009B2 (en) * 2001-02-06 2003-10-28 International Business Machines Corporation Identification, separation and compression of multiple forms with mutants
US7046848B1 (en) * 2001-08-22 2006-05-16 Olcott Peter L Method and system for recognizing machine generated character glyphs and icons in graphic images
US7561734B1 (en) * 2002-03-02 2009-07-14 Science Applications International Corporation Machine learning of document templates for data extraction
JP2007102545A (ja) * 2005-10-05 2007-04-19 Ricoh Co Ltd 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP4848221B2 (ja) * 2006-07-31 2011-12-28 富士通株式会社 帳票処理プログラム、該プログラムを記録した記録媒体、帳票処理装置、および帳票処理方法
US7840890B2 (en) * 2007-02-26 2010-11-23 Emc Corporation Generation of randomly structured forms

Also Published As

Publication number Publication date
US8170371B2 (en) 2012-05-01
US20040190790A1 (en) 2004-09-30

Similar Documents

Publication Publication Date Title
WO2006063268B1 (en) Computer-implemented methods for detecting and/or sorting defects in a design pattern of a reticle
RU2003108434A (ru) Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата
Zhu et al. Machine vision-based concrete surface quality assessment
CN115038965B (zh) 金相组织的相的分类方法、金相组织的相的分类装置、金相组织的相的学习方法、金相组织的相的学习装置、金属材料的材料特性预测方法和金属材料的材料特性预测装置
CN113222913B (zh) 一种电路板缺陷检测定位方法、装置和存储介质
KR102600475B1 (ko) 제품 결함 검출 학습을 위한 딥러닝 기반 데이터 증강 방법
US8023766B1 (en) Method and system of processing an image containing undesirable pixels
RU2007149074A (ru) Грамматический разбор визуальных структур документа
ATE302983T1 (de) Verfahren zur überwachung von dokumenten
ATE504048T1 (de) Vorrichtung und verfahren zum bestimmen eines kanten-histogramms, vorrichtung und verfahren zum ablegen eines bildes in einer bilddatenbank, vorrichtung und verfahren zum auffinden von zwei ähnlichen bildern und computerprogramm
RU2003108433A (ru) Способ предварительной обработки изображения машиночитаемой формы
US20120249770A1 (en) Method for automatically focusing a microscope on a predetermined object and microscope for automatic focusing
KR102808719B1 (ko) 금속 조직의 촬영 조건 결정 방법, 금속 조직의 촬영 방법, 금속 조직의 상 분류 방법, 금속 조직의 촬영 조건 결정 장치, 금속 조직의 촬영 장치, 금속 조직의 상 분류 장치, 금속 재료의 재료 특성 예측 방법 및 금속 재료의 재료 특성 예측 장치
CN110599453A (zh) 一种基于图像融合的面板缺陷检测方法、装置及设备终端
JP7226493B2 (ja) 架線摩耗検査方法
CN117994864B (zh) 中学生物实验操作测评方法、装置、电子设备及存储介质
CN111915635A (zh) 支持自阅卷的试题解析信息生成方法及系统
CN112232390B (zh) 一种高像素大图像的识别方法和系统
CN111462056A (zh) 工件表面缺陷检测方法、装置、设备及存储介质
CN110672620B (zh) 芯片缺陷检测方法及系统
CN109063708B (zh) 基于轮廓提取的工业图像特征识别方法及系统
JP2019046253A (ja) 画像処理装置及びプログラム
CN110135426B (zh) 样本标注方法及计算机存储介质
CN115496960A (zh) 样本生成方法、目标检测模型训练、目标检测方法及系统
JP2002175528A (ja) 画像情報抽出方法および画像情報抽出装置

Legal Events

Date Code Title Description
FA93 Acknowledgement of application withdrawn (no request for examination)

Effective date: 20080228