JP7409102B2 - 情報処理装置及び画像形成装置 - Google Patents
情報処理装置及び画像形成装置 Download PDFInfo
- Publication number
- JP7409102B2 JP7409102B2 JP2020005402A JP2020005402A JP7409102B2 JP 7409102 B2 JP7409102 B2 JP 7409102B2 JP 2020005402 A JP2020005402 A JP 2020005402A JP 2020005402 A JP2020005402 A JP 2020005402A JP 7409102 B2 JP7409102 B2 JP 7409102B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- unit
- group
- interest
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 18
- 238000012545 processing Methods 0.000 claims description 88
- 238000000605 extraction Methods 0.000 claims description 34
- 238000000034 method Methods 0.000 claims description 33
- 230000008569 process Effects 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 11
- 238000010586 diagram Methods 0.000 description 11
- 239000011521 glass Substances 0.000 description 11
- 238000012546 transfer Methods 0.000 description 7
- 230000032258 transport Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 239000010979 ruby Substances 0.000 description 3
- 229910001750 ruby Inorganic materials 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 239000001301 oxygen Substances 0.000 description 2
- 108091008695 photoreceptors Proteins 0.000 description 2
- 238000003705 background correction Methods 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 150000003627 tricarboxylic acid derivatives Chemical class 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/106—Display of layout of documents; Previewing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/131—Fragmentation of text files, e.g. creating reusable text-blocks; Linking to fragments, e.g. using XInclude; Namespaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/171—Editing, e.g. inserting or deleting by use of digital ink
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/258—Heading extraction; Automatic titling; Numbering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/36—Matching; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Document Processing Apparatus (AREA)
- Editing Of Facsimile Originals (AREA)
- Machine Translation (AREA)
- Processing Or Creating Images (AREA)
Description
10 制御ユニット
100 制御部
101 テキスト変換部
102 分割部
103 抽出部
104 テキスト加工部
5 画像読取部
6 原稿搬送部
12 画像形成部
47 操作部
Claims (9)
- 原稿の画像を読み取る画像読取部と、
前記画像読取部による原稿の読取で得られた原稿画像をテキストデータに変換するテキスト変換部と、
前記テキスト変換部によって変換されたテキストデータを、予め定められた基準を用いて、複数のテキストグループに分割する分割部と、
前記分割部によって分割された前記複数のテキストグループから、前記複数のテキストグループをなすテキストデータに含まれる単語から予め定められた規則により特定された特定単語が含まれる注目テキストグループを抽出する抽出部と、
前記注目テキストグループを先頭にして、前記注目テキストグループに続けて、前記複数のテキストグループのうち前記注目テキストグループ以外となる残留テキストグループを配置した加工テキストデータを作成するテキスト加工部と、を備える情報処理装置。 - 前記抽出部は、前記残留テキストグループから、前記残留テキストグループをなすテキストデータに含まれる単語の中から前記規則により特定された新たな特定単語を含む新たな注目テキストグループを更に抽出し、
前記テキスト加工部は、前記新たな注目テキストグループを、先に抽出された前記注目テキストグループに続けて配置し、これに続けて、前記残留テキストグループのうち前記新たな注目テキストグループ以外のテキストグループを前記残留テキストグループとして、前記新たな注目テキストグループに続けて配置して、前記加工テキストデータを作成する請求項1に記載の情報処理装置。 - 新たな前記残留テキストグループが作成される度に、前記抽出部は前記新たな注目テキストグループを抽出し、前記テキスト加工部は前記加工テキストデータを作成する請求項2に記載の情報処理装置。
- 前記分割部は、前記予め定められた基準として、特定の字体が用いられているテキストから、これに続いて次に出現する当該特定の字体のテキストの直前のテキストまでを1つのテキストグループとするという基準を用いる請求項1乃至請求項3のいずれかに記載の情報処理装置。
- 前記分割部は、前記予め定められた基準に基づく処理として、更に、特定の字体が用いられているテキストに続いて次に当該特定の字体のテキストが出現しても、当該続いて出現したテキストの前に、予め定められた番号付がされている場合には、更に次に当該番号付がされていない当該特定の字体のテキストが出現するまでは、前記1つのテキストグループにするというグループ分けを行わない請求項4に記載の情報処理装置。
- 前記抽出部は、前記規則において、前記テキストデータに含まれる単語のうち最初に出現する単語又は最頻出の単語を前記特定単語とする請求項1乃至請求項5のいずれかに記載の情報処理装置。
- 表示部と、
前記表示部に前記加工テキストデータを表示させる制御部と、
前記表示部に設けられ、ユーザーによる前記表示部の表示画面へのタッチ操作に基づいて指示が入力されるタッチパネルと、を更に備え、
前記テキスト加工部は、前記制御部が前記表示部に前記加工テキストデータを表示させているときに、前記タッチパネルに入力される指示で指定されたテキスト群を、予め定められた字体に変換する請求項1乃至請求項6のいずれかに記載の情報処理装置。 - 前記テキスト加工部は、前記制御部が前記表示部に前記加工テキストデータを表示させているときに、前記タッチパネルに入力される指示で指定されたテキスト群を、当該指示により指定された位置に移動させる請求項7に記載の情報処理装置。
- 請求項1乃至請求項8のいずれかに記載の情報処理装置と、
前記加工テキストデータを記録媒体に画像形成する画像形成部と、を備えた画像形成装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005402A JP7409102B2 (ja) | 2020-01-16 | 2020-01-16 | 情報処理装置及び画像形成装置 |
US17/142,991 US20210227081A1 (en) | 2020-01-16 | 2021-01-06 | Information processing apparatus that creates processed text data from text data, by changing order of sentences in text data, and image forming apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020005402A JP7409102B2 (ja) | 2020-01-16 | 2020-01-16 | 情報処理装置及び画像形成装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021114049A JP2021114049A (ja) | 2021-08-05 |
JP7409102B2 true JP7409102B2 (ja) | 2024-01-09 |
Family
ID=76856378
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020005402A Active JP7409102B2 (ja) | 2020-01-16 | 2020-01-16 | 情報処理装置及び画像形成装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20210227081A1 (ja) |
JP (1) | JP7409102B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005043990A (ja) | 2003-07-23 | 2005-02-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2009251872A (ja) | 2008-04-04 | 2009-10-29 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014052744A (ja) | 2012-09-05 | 2014-03-20 | Konica Minolta Inc | 文書表示装置、文書表示端末および文書表示プログラム |
JP2016099793A (ja) | 2014-11-20 | 2016-05-30 | シャープ株式会社 | 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
US20170220859A1 (en) | 2016-01-29 | 2017-08-03 | Konica Minolta Laboratory U.S.A., Inc. | Bulleted lists |
US20170228369A1 (en) | 2016-02-09 | 2017-08-10 | Yandex Europe Ag | Method of and system for processing a text |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09160914A (ja) * | 1995-12-08 | 1997-06-20 | Matsushita Electric Ind Co Ltd | ペン入力装置 |
JP3940491B2 (ja) * | 1998-02-27 | 2007-07-04 | 株式会社東芝 | 文書処理装置および文書処理方法 |
JP3918374B2 (ja) * | 1999-09-10 | 2007-05-23 | 富士ゼロックス株式会社 | 文書検索装置および方法 |
GB2399427A (en) * | 2003-03-12 | 2004-09-15 | Canon Kk | Apparatus for and method of summarising text |
US11675966B2 (en) * | 2019-05-15 | 2023-06-13 | Fortia Financial Solutions | Table of contents generation |
US11321559B2 (en) * | 2019-10-17 | 2022-05-03 | Adobe Inc. | Document structure identification using post-processing error correction |
KR102710905B1 (ko) * | 2021-01-07 | 2024-09-27 | 주식회사 케이티 | 문서를 요약하는 장치, 방법 및 컴퓨터 프로그램 |
-
2020
- 2020-01-16 JP JP2020005402A patent/JP7409102B2/ja active Active
-
2021
- 2021-01-06 US US17/142,991 patent/US20210227081A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005043990A (ja) | 2003-07-23 | 2005-02-17 | Toshiba Corp | 文書処理装置および文書処理方法 |
JP2009251872A (ja) | 2008-04-04 | 2009-10-29 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014052744A (ja) | 2012-09-05 | 2014-03-20 | Konica Minolta Inc | 文書表示装置、文書表示端末および文書表示プログラム |
JP2016099793A (ja) | 2014-11-20 | 2016-05-30 | シャープ株式会社 | 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
US20170220859A1 (en) | 2016-01-29 | 2017-08-03 | Konica Minolta Laboratory U.S.A., Inc. | Bulleted lists |
US20170228369A1 (en) | 2016-02-09 | 2017-08-10 | Yandex Europe Ag | Method of and system for processing a text |
Also Published As
Publication number | Publication date |
---|---|
JP2021114049A (ja) | 2021-08-05 |
US20210227081A1 (en) | 2021-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20100138757A1 (en) | Display control apparatus, image forming apparatus, and computer-readable recording medium storing display control program | |
JP6638830B2 (ja) | 原稿読取装置 | |
JP5269008B2 (ja) | 表示入力装置及びこれを備えた画像形成装置 | |
JP6141221B2 (ja) | 数値入力装置及び電子機器 | |
US11941903B2 (en) | Image processing apparatus, image processing method, and non-transitory storage medium | |
JP5936051B2 (ja) | 文書処理装置及びプログラム | |
US20170308507A1 (en) | Image processing apparatus | |
JP7409102B2 (ja) | 情報処理装置及び画像形成装置 | |
JP6593303B2 (ja) | 問題作成装置、問題作成方法、及び画像形成装置 | |
JP6816828B2 (ja) | 画像処理装置 | |
US9167110B2 (en) | Input device capable of converting character style of input character, image forming apparatus having the input device, and electronic apparatus having the input device | |
JP5593300B2 (ja) | 文字入力装置及び文字入力プログラム | |
JP2018077794A (ja) | 画像処理装置、及び画像形成装置 | |
JP2021128367A (ja) | 画像形成装置 | |
JP6002646B2 (ja) | 文字入力装置、文字入力プログラム及び画像形成装置 | |
JP2019197321A (ja) | 画像処理装置及び画像形成装置 | |
JP2013030916A (ja) | 画像処理装置及びこれを備えた画像形成装置 | |
JP6477577B2 (ja) | 画像処理装置 | |
US11223727B2 (en) | Image reading apparatus and information processing apparatus that reads documents and generates image data | |
US9323477B2 (en) | Operating device and image formation device | |
JP6399000B2 (ja) | 画像処理装置、及び画像作成プログラム | |
JP6504104B2 (ja) | 画像処理装置 | |
JP6705430B2 (ja) | 画像形成装置 | |
JP5889845B2 (ja) | 検索インターフェイス装置及び電子機器 | |
JP5879286B2 (ja) | 検索システム利用装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20221005 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7409102 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |