JP7108061B2 - 歪んだドキュメント画像の矯正方法及び装置 - Google Patents
歪んだドキュメント画像の矯正方法及び装置 Download PDFInfo
- Publication number
- JP7108061B2 JP7108061B2 JP2021007302A JP2021007302A JP7108061B2 JP 7108061 B2 JP7108061 B2 JP 7108061B2 JP 2021007302 A JP2021007302 A JP 2021007302A JP 2021007302 A JP2021007302 A JP 2021007302A JP 7108061 B2 JP7108061 B2 JP 7108061B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- deformation
- parameter prediction
- distorted document
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000012937 correction Methods 0.000 claims description 89
- 238000013527 convolutional neural network Methods 0.000 claims description 38
- 238000012549 training Methods 0.000 claims description 36
- 238000003702 image correction Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 22
- 230000008521 reorganization Effects 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000010339 dilation Effects 0.000 description 28
- 230000000694 effects Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Processing (AREA)
- Geometry (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
歪んだドキュメント画像を取得するステップと、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得るステップと、を含み、そのうち、前記矯正モデルは、画像サンプルセットを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、前記画像サンプルに歪みが存在する。
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得る前記ステップは、
前記歪んだドキュメント画像を前記矯正モデルに入力し、前記変形パラメータ予測モジュールによって中間結果を出力し、前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得るステップを含み、前記中間結果は、前記歪んだドキュメント画像におけるピクセルごとの変形パラメータを含む。
前記中間結果は、前記少なくとも二段の変形パラメータ予測サブモジュールにおける最終段の変形パラメータ予測サブモジュールの出力結果である。
矯正操作が並行して行われるピクセルの個数を指示する動作パラメータを取得するステップと、
前記動作パラメータに基づいて前記歪んだドキュメント画像で複数のピクセルを取得するステップと、
前記複数のピクセルのそれぞれに対応する変形パラメータに基づいて前記変形矯正モジュールにより、前記複数のピクセルを並行して矯正し、矯正された複数のピクセルを得るステップと、を含む。
歪んだドキュメント画像を取得するための取得モジュールと、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得るための矯正モジュールと、を含み、そのうち、前記矯正モデルは、画像サンプルセットを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、前記画像サンプルに歪みが存在する。
前記矯正モジュールは、具体的に、
前記歪んだドキュメント画像を前記矯正モデルに入力し、前記変形パラメータ予測モジュールによって中間結果を出力し、前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得、前記中間結果は、前記歪んだドキュメント画像におけるピクセルごとの変形パラメータを含む。
前記中間結果は、前記少なくとも二段の変形パラメータ予測サブモジュールにおける最終段の変形パラメータ予測サブモジュールの出力結果である。
矯正操作が並行して行われるピクセルの個数を指示する動作パラメータを取得し、
前記動作パラメータに基づいて前記歪んだドキュメント画像で複数のピクセルを取得し、
前記複数のピクセルのそれぞれに対応する変形パラメータに基づいて前記変形矯正モジュールにより、前記複数のピクセルを並行して矯正し、矯正された複数のピクセルを得るためのものである。
前記メモリは、プログラム命令を記憶するためのものであり、
前記プロセッサは、前記メモリに記憶された前記プログラム命令を呼び出して本発明の第1の態様のいずれか1つの実施形態で提供される方法を実現するためのものである。
第6の態様では、本発明の実施例は、コンピュータプログラムを提供し、該コンピュータプログラムは、可読記憶媒体に記憶される。プロセッサは、該コンピュータプログラムを可読記憶媒体から読み取ることができ、プロセッサは、該コンピュータプログラムを実行して本発明の第1の態様のいずれか1つの実施形態で提供される方法を実現する。
歪んだドキュメント画像を矯正モデルに入力し、変形パラメータ予測モジュールによって中間結果を出力し、中間結果に基づいて変形矯正モジュールにより、歪んだドキュメント画像に対応する矯正された画像を得るステップを含むことができる。そのうち、中間結果は、歪んだドキュメント画像におけるピクセルごとの変形パラメータを含む。
矯正操作が並行して行われるピクセルの個数を指示する動作パラメータを取得するステップと、
動作パラメータに基づいて歪んだドキュメント画像で複数のピクセルを取得するステップと、
複数のピクセルのそれぞれに対応する変形パラメータに基づいて変形矯正モジュールにより、複数のピクセルを並行して矯正し、矯正された複数のピクセルを得るステップと、を含む。
歪んだドキュメント画像を取得するための取得モジュール51と、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得るための矯正モジュール52と、を含むことができ、そのうち、前記矯正モデルは、画像サンプルセットを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、前記画像サンプルに歪みが存在する。
前記矯正モジュール52は、具体的に、
前記歪んだドキュメント画像を前記矯正モデルに入力し、前記変形パラメータ予測モジュールによって中間結果を出力し、前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得、前記中間結果は、前記歪んだドキュメント画像におけるピクセルごとの変形パラメータを含むものである。
前記中間結果は、前記少なくとも二段の変形パラメータ予測サブモジュールにおける最終段の変形パラメータ予測サブモジュールの出力結果である。
矯正操作が並行して行われるピクセルの個数を指示する動作パラメータを取得し、
前記動作パラメータに基づいて前記歪んだドキュメント画像で複数のピクセルを取得し、
前記複数のピクセルのそれぞれに対応する変形パラメータに基づいて前記変形矯正モジュールにより、前記複数のピクセルを並行して矯正し、矯正された複数のピクセルを得るためのものである。
Claims (12)
- 歪んだドキュメント画像を取得するステップと、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得るステップと、を含む歪んだドキュメント画像の矯正方法であって、そのうち、前記矯正モデルは、画像サンプルセットを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、前記画像サンプルに歪みが存在し、
前記矯正モデルは、直列接続された変形パラメータ予測モジュールと変形矯正モジュールを含み、そのうち、前記変形パラメータ予測モジュールは、前記画像サンプルセットを入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、前記変形矯正モジュールは、前記画像サンプルセットと前記変形パラメータ予測モジュールの出力結果を入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得る前記ステップは、
前記歪んだドキュメント画像を前記矯正モデルに入力し、前記変形パラメータ予測モジュールによって中間結果を出力し、前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得るステップを含み、前記中間結果は、前記歪んだドキュメント画像におけるピクセルごとの変形パラメータを含む、歪んだドキュメント画像の矯正方法。 - 前記変形パラメータ予測モジュールは、少なくとも二段の直列接続された変形パラメータ予測サブモジュールを含み、そのうち、第1段の変形パラメータ予測サブモジュールは、前記画像サンプルセットを入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、第2段の変形パラメータ予測サブモジュールは、前記画像サンプルセットと前記第1段の変形パラメータ予測サブモジュールの出力結果を入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、これによって類推し、
前記中間結果は、前記少なくとも二段の変形パラメータ予測サブモジュールにおける最終段の変形パラメータ予測サブモジュールの出力結果である、請求項1に記載の歪んだドキュメント画像の矯正方法。 - 前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得る前記ステップは、
矯正操作が並行して行われるピクセルの個数を指示する動作パラメータを取得するステップと、
前記動作パラメータに基づいて前記歪んだドキュメント画像で複数のピクセルを取得するステップと、
前記複数のピクセルのそれぞれに対応する変形パラメータに基づいて前記変形矯正モジュールにより、前記複数のピクセルを並行して矯正し、矯正された複数のピクセルを得るステップと、を含む、請求項1に記載の歪んだドキュメント画像の矯正方法。 - 前記U型畳み込みニューラルネットワークモデルは、コーディングユニットとデコーディングユニットを含み、前記コーディングユニットと前記デコーディングユニットは、いずれも複数の畳み込み層を含み、前記コーディングユニットにおける畳み込み層は複数回の拡張畳み込み操作を含む、請求項1~3のいずれか1項に記載の歪んだドキュメント画像の矯正方法。
- 前記コーディングユニットにおける畳み込み層に含まれる複数回の拡張畳み込み操作の間の拡張比率は徐々に増大し、且つ互いに素である、請求項4に記載の歪んだドキュメント画像の矯正方法。
- 前記U型畳み込みニューラルネットワークモデルにおける前記コーディングユニットと前記デコーディングユニットの間には、並行畳み込みユニットをさらに含み、前記並行畳み込みユニットは、前記コーディングユニットにおける最終の畳み込み層から出力される特徴図に対して拡張畳み込み操作を並行して複数回実行するためのものであり、並行して実行する複数回の前記拡張畳み込み操作の間の拡張比率は異なるものである、請求項4に記載の歪んだドキュメント画像の矯正方法。
- 前記デコーディングユニットにおける畳み込み層は、畳み込み操作と再編成操作を含み、前記畳み込み操作は、特徴図に対してアップサンプリングするために使用され、前記再編成操作は、アップサンプリングされた特徴図に対してマトリックスの行数と、列数と、次元数を再構築するために使用される、請求項4に記載の歪んだドキュメント画像の矯正方法。
- 歪んだドキュメント画像を取得するための取得モジュールと、
前記歪んだドキュメント画像を矯正モデルに入力して、前記歪んだドキュメント画像に対応する矯正された画像を得るための矯正モジュールと、を含む歪んだドキュメント画像の矯正装置であって、そのうち、前記矯正モデルは、画像サンプルセットを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、前記画像サンプルに歪みが存在し、
前記矯正モデルは、直列接続された変形パラメータ予測モジュールと変形矯正モジュールを含み、そのうち、前記変形パラメータ予測モジュールは、前記画像サンプルセットを入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、前記変形矯正モジュールは、前記画像サンプルセットと前記変形パラメータ予測モジュールの出力結果とを入力とし、前記画像サンプルセットにおける画像サンプルごとに対応する矯正された画像を出力として訓練して得られたモデルであり、
前記矯正モジュールは、
前記歪んだドキュメント画像を前記矯正モデルに入力し、前記変形パラメータ予測モジュールによって中間結果を出力し、前記中間結果に基づいて前記変形矯正モジュールにより、前記歪んだドキュメント画像に対応する矯正された画像を得、前記中間結果は、前記歪んだドキュメント画像におけるピクセルごとの変形パラメータを含む、歪んだドキュメント画像の矯正装置。 - 前記変形パラメータ予測モジュールは、少なくとも二段の直列接続された変形パラメータ予測サブモジュールを含み、そのうち、第1段の変形パラメータ予測サブモジュールは、前記画像サンプルセットを入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、第2段の変形パラメータ予測サブモジュールは、前記画像サンプルセットと前記第1段の変形パラメータ予測サブモジュールの出力結果とを入力とし、前記画像サンプルセットに含まれる画像サンプルごとにおけるピクセルごとの変形パラメータを出力として訓練して得られたU型畳み込みニューラルネットワークモデルであり、これによって類推し、
前記中間結果は、前記少なくとも二段の変形パラメータ予測サブモジュールにおける最終段の変形パラメータ予測サブモジュールの出力結果である、請求項8に記載の歪んだドキュメント画像の矯正装置。 - メモリとプロセッサを含み、
前記メモリは、プログラム命令を記憶するためのものであり、
前記プロセッサは、前記メモリに記憶された前記プログラム命令を呼び出して請求項1~7のいずれか1項に記載の方法を実現するためのものである、歪んだドキュメント画像の矯正装置。 - コンピュータ可読記憶媒体であって、可読記憶媒体とコンピュータプログラムを含み、前記コンピュータプログラムは、請求項1~7のいずれか1項に記載の方法を実現するためものである、コンピュータ可読記憶媒体。
- プロセッサによって実行されるとき、請求項1~請求項7のいずれか1項に記載の歪んだドキュメント画像の矯正方法を実現する、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010066508.7A CN111260586B (zh) | 2020-01-20 | 2020-01-20 | 扭曲文档图像的矫正方法和装置 |
CN202010066508.7 | 2020-01-20 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021100247A JP2021100247A (ja) | 2021-07-01 |
JP7108061B2 true JP7108061B2 (ja) | 2022-07-27 |
Family
ID=70952492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021007302A Active JP7108061B2 (ja) | 2020-01-20 | 2021-01-20 | 歪んだドキュメント画像の矯正方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11756170B2 (ja) |
EP (1) | EP3839875B1 (ja) |
JP (1) | JP7108061B2 (ja) |
KR (1) | KR102428176B1 (ja) |
CN (1) | CN111260586B (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111667556A (zh) * | 2020-06-22 | 2020-09-15 | 深圳壹账通智能科技有限公司 | 表格矫正方法及装置 |
CN111783778A (zh) * | 2020-08-18 | 2020-10-16 | 山东旗帜信息有限公司 | 一种扭曲文档图片的校正模型的训练方法及扭曲文档图片的校正方法 |
CN112597998A (zh) * | 2021-01-07 | 2021-04-02 | 天津师范大学 | 一种基于深度学习的扭曲图像矫正方法、装置和存储介质 |
CN113011144B (zh) * | 2021-03-30 | 2024-01-30 | 中国工商银行股份有限公司 | 表单信息的获取方法、装置和服务器 |
CN113034406B (zh) * | 2021-04-27 | 2024-05-14 | 中国平安人寿保险股份有限公司 | 扭曲文档恢复方法、装置、设备及介质 |
KR102440898B1 (ko) * | 2021-05-10 | 2022-09-06 | 아주대학교산학협력단 | 이미지의 편위 수정 방법 및 시스템 |
WO2022239907A1 (ko) * | 2021-05-10 | 2022-11-17 | 아주대학교산학협력단 | 이미지의 편위 수정 방법 및 시스템 |
CN113591846A (zh) * | 2021-07-23 | 2021-11-02 | 作业帮教育科技(北京)有限公司 | 图像扭曲系数提取方法、扭曲矫正方法及系统、电子设备 |
CN113792730B (zh) * | 2021-08-17 | 2022-09-27 | 北京百度网讯科技有限公司 | 文档图像的矫正方法、装置、电子设备和存储介质 |
CN113591832B (zh) * | 2021-08-20 | 2024-04-05 | 杭州数橙科技有限公司 | 图像处理模型的训练方法、文档图像处理方法及设备 |
CN113724163B (zh) * | 2021-08-31 | 2024-06-07 | 平安科技(深圳)有限公司 | 基于神经网络的图像矫正方法、装置、设备及介质 |
CN114202648B (zh) * | 2021-12-08 | 2024-04-16 | 北京百度网讯科技有限公司 | 文本图像矫正方法、训练方法、装置、电子设备以及介质 |
CN114937271B (zh) * | 2022-05-11 | 2023-04-18 | 中维建通信技术服务有限公司 | 一种通信数据智能录入校对方法 |
CN115497112B (zh) * | 2022-09-20 | 2023-10-13 | 北京百度网讯科技有限公司 | 表单识别方法、装置、设备以及存储介质 |
CN116453131B (zh) * | 2023-06-15 | 2023-10-20 | 荣耀终端有限公司 | 文档图像矫正方法、电子设备及存储介质 |
CN117468084B (zh) * | 2023-12-27 | 2024-05-28 | 浙江晶盛机电股份有限公司 | 晶棒生长控制方法、装置、长晶炉系统和计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018067154A (ja) | 2016-10-19 | 2018-04-26 | ソニーセミコンダクタソリューションズ株式会社 | 演算処理回路および認識システム |
JP2018201146A (ja) | 2017-05-29 | 2018-12-20 | 地方独立行政法人東京都立産業技術研究センター | 画像補正装置、画像補正方法、注目点認識装置、注目点認識方法及び異常検知システム |
WO2019046003A1 (en) | 2017-08-30 | 2019-03-07 | Verily Life Sciences Llc | GRANULARITY CONTRAST ANALYSIS USING AUTOMATIC LEARNING TO VISUALIZE A FLOW |
JP2019097055A (ja) | 2017-11-24 | 2019-06-20 | キヤノン株式会社 | 制御装置、撮像装置およびプログラム |
US20200005034A1 (en) | 2018-07-02 | 2020-01-02 | Capital One Services, Llc | Systems and methods for image data processing |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3093869B2 (ja) * | 1992-04-28 | 2000-10-03 | オリンパス光学工業株式会社 | 画像取り込み装置 |
JPH118763A (ja) | 1997-04-24 | 1999-01-12 | Sharp Corp | 画像読取装置 |
US9953246B2 (en) * | 2014-12-16 | 2018-04-24 | The Regents Of The University Of California | Feature-preserving noise removal |
CN105118040B (zh) * | 2015-09-18 | 2017-12-01 | 中国科学院自动化研究所 | 基于结构激光线的文档图像畸变矫正方法 |
CN106952236B (zh) * | 2017-03-13 | 2020-04-24 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 基于bp神经网络的鱼眼镜头拍摄图像畸变矫正方法 |
CN108335266B (zh) * | 2017-04-14 | 2022-08-05 | 陈思远 | 一种文档图像畸变的矫正方法 |
CN107749048B (zh) * | 2017-07-31 | 2021-06-08 | 中国银联股份有限公司 | 图像矫正系统及方法、色盲图像矫正系统及方法 |
CN107609549B (zh) * | 2017-09-20 | 2021-01-08 | 北京工业大学 | 一种自然场景下证件图像的文本检测方法 |
CN109753971B (zh) * | 2017-11-06 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 扭曲文字行的矫正方法及装置、字符识别方法及装置 |
CN108510467B (zh) * | 2018-03-28 | 2022-04-08 | 西安电子科技大学 | 基于深度可变形卷积神经网络的sar图像目标识别方法 |
CN108968916B (zh) * | 2018-06-19 | 2021-04-16 | 艾瑞迈迪医疗科技(北京)有限公司 | 呼吸运动校正方法、装置、计算机设备和存储介质 |
US11004183B2 (en) * | 2018-07-10 | 2021-05-11 | The Board Of Trustees Of The Leland Stanford Junior University | Un-supervised convolutional neural network for distortion map estimation and correction in MRI |
CN109598270B (zh) * | 2018-12-04 | 2020-05-05 | 龙马智芯(珠海横琴)科技有限公司 | 扭曲文字的识别方法及装置、存储介质及处理器 |
CN109635714B (zh) * | 2018-12-07 | 2023-05-30 | 光典信息发展有限公司 | 文档扫描图像的矫正方法及装置 |
CN109829437B (zh) * | 2019-02-01 | 2022-03-25 | 北京旷视科技有限公司 | 图像处理方法、文本识别方法、装置和电子系统 |
US11024002B2 (en) * | 2019-03-14 | 2021-06-01 | Intel Corporation | Generating gaze corrected images using bidirectionally trained network |
CN109933756B (zh) * | 2019-03-22 | 2022-04-15 | 腾讯科技(深圳)有限公司 | 基于ocr的图像转档方法、装置、设备及可读存储介质 |
CN109993713B (zh) * | 2019-04-04 | 2021-11-05 | 阿波罗智联(北京)科技有限公司 | 车载平视显示系统图像畸变矫正方法和装置 |
CN110060313B (zh) * | 2019-04-19 | 2023-12-19 | 上海联影医疗科技股份有限公司 | 一种图像伪影校正方法和系统 |
CN110136069B (zh) * | 2019-05-07 | 2023-05-16 | 语联网(武汉)信息技术有限公司 | 文本图像矫正方法、装置与电子设备 |
CN110211048B (zh) * | 2019-05-28 | 2020-06-16 | 国家电网有限公司 | 一种基于卷积神经网络的复杂档案图像倾斜矫正方法 |
CN110287960B (zh) * | 2019-07-02 | 2021-12-10 | 中国科学院信息工程研究所 | 自然场景图像中曲线文字的检测识别方法 |
CN110427938A (zh) * | 2019-07-26 | 2019-11-08 | 中科视语(北京)科技有限公司 | 一种基于深度学习的不规则文字识别装置和方法 |
CN110570373A (zh) * | 2019-09-04 | 2019-12-13 | 北京明略软件系统有限公司 | 畸变校正方法和装置、计算机可读的存储介质及电子装置 |
-
2020
- 2020-01-20 CN CN202010066508.7A patent/CN111260586B/zh active Active
-
2021
- 2021-01-19 US US17/151,783 patent/US11756170B2/en active Active
- 2021-01-20 JP JP2021007302A patent/JP7108061B2/ja active Active
- 2021-01-20 EP EP21152493.9A patent/EP3839875B1/en active Active
- 2021-01-20 KR KR1020210008087A patent/KR102428176B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018067154A (ja) | 2016-10-19 | 2018-04-26 | ソニーセミコンダクタソリューションズ株式会社 | 演算処理回路および認識システム |
JP2018201146A (ja) | 2017-05-29 | 2018-12-20 | 地方独立行政法人東京都立産業技術研究センター | 画像補正装置、画像補正方法、注目点認識装置、注目点認識方法及び異常検知システム |
WO2019046003A1 (en) | 2017-08-30 | 2019-03-07 | Verily Life Sciences Llc | GRANULARITY CONTRAST ANALYSIS USING AUTOMATIC LEARNING TO VISUALIZE A FLOW |
JP2019097055A (ja) | 2017-11-24 | 2019-06-20 | キヤノン株式会社 | 制御装置、撮像装置およびプログラム |
US20200005034A1 (en) | 2018-07-02 | 2020-01-02 | Capital One Services, Llc | Systems and methods for image data processing |
Non-Patent Citations (1)
Title |
---|
Ke Ma, Zhixin Shu, Xue Bai, Jue Wang, Dimitris Samaras,DocUNet: Document Image Unwarping via A Stacked U-Net,IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION,2018年06月18日,4700-4707,インターネット:<URL:https://openaccess.thecvf.com/content_cvpr_2018/papers/Ma_DocUNet_Document_Image_CVPR_2018_paper.pdf>,[検索日2022年3月3日] |
Also Published As
Publication number | Publication date |
---|---|
KR102428176B1 (ko) | 2022-08-02 |
CN111260586A (zh) | 2020-06-09 |
EP3839875A1 (en) | 2021-06-23 |
JP2021100247A (ja) | 2021-07-01 |
EP3839875B1 (en) | 2022-06-29 |
US11756170B2 (en) | 2023-09-12 |
CN111260586B (zh) | 2023-07-04 |
KR20210037620A (ko) | 2021-04-06 |
US20210192696A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7108061B2 (ja) | 歪んだドキュメント画像の矯正方法及び装置 | |
KR102640237B1 (ko) | 이미지 프로세싱 방법, 장치, 전자 디바이스 및 컴퓨터 판독가능 저장 매체 | |
CN112750082B (zh) | 基于融合注意力机制的人脸超分辨率方法及系统 | |
CN110322400B (zh) | 图像处理方法及装置、图像处理系统及其训练方法 | |
CN112070670B (zh) | 全局-局部分离注意力机制的人脸超分辨率方法及系统 | |
CN108765425A (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN112270644A (zh) | 基于空间特征变换和跨尺度特征集成的人脸超分辨方法 | |
CN117575915B (zh) | 一种图像超分辨率重建方法、终端设备及存储介质 | |
CN114612289A (zh) | 风格化图像生成方法、装置及图像处理设备 | |
CN112419152A (zh) | 一种图像超分辨率方法、装置、终端设备和存储介质 | |
CN116895037B (zh) | 基于边缘信息和多尺度交叉融合网络的帧插入方法及系统 | |
CN113421187B (zh) | 一种超分辨率重建方法、系统、存储介质、设备 | |
CN116797456B (zh) | 图像超分辨率重建方法、系统、设备和存储介质 | |
CN112767247A (zh) | 图像超分辨率重建方法、模型蒸馏方法、装置及存储介质 | |
CN115953303A (zh) | 结合通道注意力的多尺度图像压缩感知重构方法及系统 | |
CN109447900A (zh) | 一种图像超分辨率重建方法及装置 | |
CN109996085B (zh) | 模型训练方法、图像处理方法、装置及电子设备 | |
Chang et al. | Multi-attention residual network for image super resolution | |
CN115393491A (zh) | 一种基于实例分割和参考帧的水墨视频生成方法及装置 | |
CN112907446A (zh) | 一种基于分组连接网络的图像超分辨率重建方法 | |
CN112446883B (zh) | 一种特征图上采样方法、终端及存储介质 | |
CN117557447B (zh) | 图像还原方法、装置、设备及存储介质 | |
CN114549316B (zh) | 基于通道自关注多尺度特征学习的遥感单图超分辨率方法 | |
CN119295759A (zh) | 去噪超分模型训练、图像处理的方法和装置及计算机设备 | |
CN117036163A (zh) | 基于生成对抗网络的图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210303 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220714 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7108061 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |