RU2003108434A - Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата - Google Patents
Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата Download PDFInfo
- Publication number
- RU2003108434A RU2003108434A RU2003108434/09A RU2003108434A RU2003108434A RU 2003108434 A RU2003108434 A RU 2003108434A RU 2003108434/09 A RU2003108434/09 A RU 2003108434/09A RU 2003108434 A RU2003108434 A RU 2003108434A RU 2003108434 A RU2003108434 A RU 2003108434A
- Authority
- RU
- Russia
- Prior art keywords
- field
- image
- spatial
- template
- reference point
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 14
- 238000007781 pre-processing Methods 0.000 title claims 2
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Input (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
- Image Analysis (AREA)
Claims (13)
1. Способ предварительной обработки изображения машиночитаемой формы с нефиксированным размещением полей, характеризующийся наличием изображения заполненной формы, наличием по крайней мере одного шаблона формы с описанием пространственных и параметрических свойств объектов формы, выполнением следующих этапов: этапа устранения сдвига, наклона изображения и компенсации искажений, этапа разбиения изображения на области, этапа выделения областей, содержащих поля ввода данных, отличающийся выполнением следующих операций: предварительного назначения на форме по крайней мере одного объекта формы в качестве репера для пространственной привязки по крайней мере одного поля ввода данных, описания пространственных характеристик по крайней мере одного указанного репера в описании шаблона формы, идентификации на изображении формы по крайней мере одного репера, определения положения по крайней мере одного поля ввода относительно по крайней мере одного указанного репера.
2. Способ по п.1, отличающийся тем, что репер представляет собой текстовую область.
3. Способ по п.2, отличающийся тем, что дополнительно проводят распознавание текстовой области, используемой в качестве репера.
4. Способ по п.1, отличающийся тем, что при множественном результате поиска идентификацию поля проводят путем выдвижения и проверки гипотез и оценки качества соответствия описанию в шаблоне.
5. Способ по п.4, отличающийся тем, что привлекают дополнительную параметрическую информацию о поле ввода.
6. Способ по п.1, отличающийся тем, что этап определения положения по крайней мере одного поля ввода относительно по крайней мере одного указанного репера в свою очередь включает по крайней мере следующие этапы: выбора поля для поиска из описания шаблона, выбора из описания шаблона характеристик по крайней мере одного репера для пространственной привязки искомого поля, поиска по крайней мере одного указанного репера на изображении формы, поиска указанного поля на изображении формы относительно по крайней мере одного репера с учетом пространственных и параметрических характеристик поля, описанных в шаблоне, идентификации указанного поля из нескольких в случае множественного результата поиска.
7. Способ по п.1, отличающийся тем, что поле ввода может быть репером для поиска других полей.
8. Способ по п.1, отличающийся тем, что этап идентификации поля из нескольких удовлетворяющих набору пространственных и параметрических характеристик выполняют полностью или частично с привлечением оператора.
9. Способ по п.1, отличающийся тем, что пространственное положение репера не фиксировано.
10. Способ по п.1, отличающийся тем, что один репер используют для пространственной привязки более одного поля.
11. Способ по п.1, отличающийся тем, что пространственную привязку поля осуществляют к более чем одному реперу.
12. Способ по п.1, отличающийся тем, что репер включает более одного объекта.
13. Способ по п.1, отличающийся тем, что репер описывают в виде альтернативы.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2003108434/09A RU2003108434A (ru) | 2003-03-28 | 2003-03-28 | Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата |
US10/603,216 US8170371B2 (en) | 2003-03-28 | 2003-06-26 | Method of image pre-analyzing of a machine-readable form of non-fixed layout |
US13/449,240 US9015573B2 (en) | 2003-03-28 | 2012-04-17 | Object recognition and describing structure of graphical objects |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2003108434/09A RU2003108434A (ru) | 2003-03-28 | 2003-03-28 | Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2003108434A true RU2003108434A (ru) | 2004-09-27 |
Family
ID=33413765
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2003108434/09A RU2003108434A (ru) | 2003-03-28 | 2003-03-28 | Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата |
Country Status (2)
Country | Link |
---|---|
US (1) | US8170371B2 (ru) |
RU (1) | RU2003108434A (ru) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070172130A1 (en) * | 2006-01-25 | 2007-07-26 | Konstantin Zuev | Structural description of a document, a method of describing the structure of graphical objects and methods of object recognition. |
US9015573B2 (en) * | 2003-03-28 | 2015-04-21 | Abbyy Development Llc | Object recognition and describing structure of graphical objects |
US9224040B2 (en) | 2003-03-28 | 2015-12-29 | Abbyy Development Llc | Method for object recognition and describing structure of graphical objects |
RU2006101908A (ru) * | 2006-01-25 | 2010-04-27 | Аби Софтвер Лтд. (Cy) | Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты) |
US8571262B2 (en) * | 2006-01-25 | 2013-10-29 | Abbyy Development Llc | Methods of object search and recognition |
US8233714B2 (en) | 2006-08-01 | 2012-07-31 | Abbyy Software Ltd. | Method and system for creating flexible structure descriptions |
US8356252B2 (en) * | 2009-09-02 | 2013-01-15 | Synchronoss Technologies, Inc. | System and method for providing a computer display form layout |
US8023697B1 (en) | 2011-03-29 | 2011-09-20 | Kaspersky Lab Zao | System and method for identifying spam in rasterized images |
US9129276B1 (en) * | 2011-11-02 | 2015-09-08 | Intuit Inc. | Inventory management |
US10176159B2 (en) * | 2014-05-05 | 2019-01-08 | Adobe Systems Incorporated | Identify data types and locations of form fields entered by different previous users on different copies of a scanned document to generate an interactive form field |
US9424167B2 (en) | 2014-05-21 | 2016-08-23 | Cgi Technologies And Solutions Inc. | Automated testing of an application system |
US10482170B2 (en) * | 2017-10-17 | 2019-11-19 | Hrb Innovations, Inc. | User interface for contextual document recognition |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01155484A (ja) * | 1987-12-11 | 1989-06-19 | Toshiba Corp | 文字読取装置 |
IL91220A (en) * | 1989-08-04 | 1995-03-30 | Ibm Israel | Compression of information |
US5191525A (en) * | 1990-01-16 | 1993-03-02 | Digital Image Systems, Corporation | System and method for extraction of data from documents for subsequent processing |
JPH05346970A (ja) * | 1991-04-04 | 1993-12-27 | Fuji Xerox Co Ltd | 文書認識装置 |
US5235654A (en) * | 1992-04-30 | 1993-08-10 | International Business Machines Corporation | Advanced data capture architecture data processing system and method for scanned images of document forms |
US5416849A (en) * | 1992-10-21 | 1995-05-16 | International Business Machines Corporation | Data processing system and method for field extraction of scanned images of document forms |
US5793887A (en) * | 1993-11-16 | 1998-08-11 | International Business Machines Corporation | Method and apparatus for alignment of images for template elimination |
JPH08305778A (ja) * | 1995-04-21 | 1996-11-22 | Xerox Corp | ユーザの作成したマークの存在を調査するための方法 |
US7149347B1 (en) * | 2000-03-02 | 2006-12-12 | Science Applications International Corporation | Machine learning of document templates for data extraction |
US6778703B1 (en) * | 2000-04-19 | 2004-08-17 | International Business Machines Corporation | Form recognition using reference areas |
US6760490B1 (en) * | 2000-09-28 | 2004-07-06 | International Business Machines Corporation | Efficient checking of key-in data entry |
US6640009B2 (en) * | 2001-02-06 | 2003-10-28 | International Business Machines Corporation | Identification, separation and compression of multiple forms with mutants |
US7046848B1 (en) * | 2001-08-22 | 2006-05-16 | Olcott Peter L | Method and system for recognizing machine generated character glyphs and icons in graphic images |
US7561734B1 (en) * | 2002-03-02 | 2009-07-14 | Science Applications International Corporation | Machine learning of document templates for data extraction |
JP2007102545A (ja) * | 2005-10-05 | 2007-04-19 | Ricoh Co Ltd | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム |
JP4848221B2 (ja) * | 2006-07-31 | 2011-12-28 | 富士通株式会社 | 帳票処理プログラム、該プログラムを記録した記録媒体、帳票処理装置、および帳票処理方法 |
US7840890B2 (en) * | 2007-02-26 | 2010-11-23 | Emc Corporation | Generation of randomly structured forms |
-
2003
- 2003-03-28 RU RU2003108434/09A patent/RU2003108434A/ru not_active Application Discontinuation
- 2003-06-26 US US10/603,216 patent/US8170371B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8170371B2 (en) | 2012-05-01 |
US20040190790A1 (en) | 2004-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2006063268B1 (en) | Computer-implemented methods for detecting and/or sorting defects in a design pattern of a reticle | |
RU2003108434A (ru) | Способ предварительной обработки изображения машиночитаемой формы нефиксированного формата | |
Zhu et al. | Machine vision-based concrete surface quality assessment | |
CN115038965B (zh) | 金相组织的相的分类方法、金相组织的相的分类装置、金相组织的相的学习方法、金相组织的相的学习装置、金属材料的材料特性预测方法和金属材料的材料特性预测装置 | |
CN113222913B (zh) | 一种电路板缺陷检测定位方法、装置和存储介质 | |
KR102600475B1 (ko) | 제품 결함 검출 학습을 위한 딥러닝 기반 데이터 증강 방법 | |
US8023766B1 (en) | Method and system of processing an image containing undesirable pixels | |
RU2007149074A (ru) | Грамматический разбор визуальных структур документа | |
ATE302983T1 (de) | Verfahren zur überwachung von dokumenten | |
ATE504048T1 (de) | Vorrichtung und verfahren zum bestimmen eines kanten-histogramms, vorrichtung und verfahren zum ablegen eines bildes in einer bilddatenbank, vorrichtung und verfahren zum auffinden von zwei ähnlichen bildern und computerprogramm | |
RU2003108433A (ru) | Способ предварительной обработки изображения машиночитаемой формы | |
US20120249770A1 (en) | Method for automatically focusing a microscope on a predetermined object and microscope for automatic focusing | |
KR102808719B1 (ko) | 금속 조직의 촬영 조건 결정 방법, 금속 조직의 촬영 방법, 금속 조직의 상 분류 방법, 금속 조직의 촬영 조건 결정 장치, 금속 조직의 촬영 장치, 금속 조직의 상 분류 장치, 금속 재료의 재료 특성 예측 방법 및 금속 재료의 재료 특성 예측 장치 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
JP7226493B2 (ja) | 架線摩耗検査方法 | |
CN117994864B (zh) | 中学生物实验操作测评方法、装置、电子设备及存储介质 | |
CN111915635A (zh) | 支持自阅卷的试题解析信息生成方法及系统 | |
CN112232390B (zh) | 一种高像素大图像的识别方法和系统 | |
CN111462056A (zh) | 工件表面缺陷检测方法、装置、设备及存储介质 | |
CN110672620B (zh) | 芯片缺陷检测方法及系统 | |
CN109063708B (zh) | 基于轮廓提取的工业图像特征识别方法及系统 | |
JP2019046253A (ja) | 画像処理装置及びプログラム | |
CN110135426B (zh) | 样本标注方法及计算机存储介质 | |
CN115496960A (zh) | 样本生成方法、目标检测模型训练、目标检测方法及系统 | |
JP2002175528A (ja) | 画像情報抽出方法および画像情報抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA93 | Acknowledgement of application withdrawn (no request for examination) |
Effective date: 20080228 |