WO2023172162A1 - Способ защиты информации при печати документов - Google Patents
Способ защиты информации при печати документов Download PDFInfo
- Publication number
- WO2023172162A1 WO2023172162A1 PCT/RU2022/000383 RU2022000383W WO2023172162A1 WO 2023172162 A1 WO2023172162 A1 WO 2023172162A1 RU 2022000383 W RU2022000383 W RU 2022000383W WO 2023172162 A1 WO2023172162 A1 WO 2023172162A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- uid
- digital
- digital document
- printing
- document
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000007639 printing Methods 0.000 title claims abstract description 24
- 238000012015 optical character recognition Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 5
- 230000002265 prevention Effects 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
Definitions
- the claimed solution relates to the field of information security, in particular to solutions for preventing information leakage when printing documents.
- DLP Data Leak Prevention
- the claimed invention is aimed at solving a technical problem, which is to create an effective means for protecting digital information from leakage during printing.
- the technical result is to increase the efficiency of data protection from leakage by introducing digital tags into the document that encode a unique user identifier for subsequent identification when analyzing printed documents.
- each user UID character is encoded into binary code.
- the area of placement of digital marks is determined based on the bit of the binary code.
- the claimed technical result is also achieved by implementing a method for protecting information from leaks on printed documents, performed using a processor of a computer device, the method comprising the steps of: obtaining at least part of an image of a printed document with an encoded user UID using the above method ; perform recognition of the resulting image; identify letters containing digital marks in their vicinity; performing determination and extraction of the encoded UID.
- digital document recognition is performed using OCR.
- FIG. 1 illustrates a flowchart of a digital mark encoding method.
- FIG. 3 illustrates a block diagram of digital mark decoding.
- FIG. 4 illustrates a diagram of the hour of disclosure of UID positions.
- FIG. 5 illustrates a general view of a computing device.
- FIG. 1 presents a method (100) for protecting information in digital documents from leakage by encoding the user UID in the form of digital marks into the document.
- information about printing of the digital document is obtained.
- the method (100) is carried out on a computer device of a user, for example, an employee, and a user UID is associated with the device, allowing him to be identified.
- the execution of step (101) is animated by software logic executed by a computer device and can be implemented, for example, in the form of a software agent or module that provides signals from the processor indicating that a digital document is being sent for printing.
- a digital document is typically a file and can contain text, graphics, or a combination of both.
- step (102) After receiving a command on the device to intercept and analyze the document before sending it to the printer, at step (102) recognition of the mentioned digital document is performed. Document processing is done using OCR technology to ensure recognition of letters and symbols in a digital document.
- the UID encoding process is carried out at step (103).
- the UID is, for example, a numeric personnel number of an employee - a digital TAB code, consisting, for example, of 8 digits.
- a schematic view of the code is presented in Table 1. Table 1. Schematic representation of the personnel number:
- Table 3 Schematic division of a binary number into digits.
- Each Pos array is filled with those characters from Wrus p . , which correspond to the position from table 4.
- Po5 is filled with all the characters from Wrus p ., which have the values ⁇ a, z, p, h ⁇ , regardless of case.
- the resulting arrays Pos , Pos 2 ... Pos 8 are used to apply digital marks in the manner described above.
- Digital tagging is done by cutting out letters using OCR, adding the tagging to pixel coordinates, and adding the digitally tagged letters back into the document to be printed. After introducing all the labels (21, 22) on the desired page p t , the same is done for the next page p i+1 and so on until the end of the document p g .
- Table 5 shows an example of label encoding for the user UID - 00013400.
- Table 7 Table of frequency of disclosure of personnel number positions.
- Printing was carried out on a Lexmark MX71 Ide office black and white laser printer on “Snow Maiden” office paper with CIE 146 whiteness according to ISO 11475.
- Photographing was done on a Samsung A51 phone under office lighting, the paper lies horizontally on the table, photographing is random at different, slight angles, about 2-4% in 3 dimensions.
- the Telegram messenger was used with image compression when sending.
- FIG. 5 is an overview of a computing device (500) suitable for performing the above methods.
- the device (500) may be, for example, a computer, a server, or other type of suitable computing device.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Security & Cryptography (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Bioethics (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
Заявленное изобретение относится к решениям для предотвращения утечки информации при печати документов. При выполнении способа на компьютерном устройстве пользователя получают информацию о печати цифрового документа (101), содержащего текст, при этом компьютерное устройство связано с уникальным идентификатором (УИД) пользователя; до момента передачи цифрового документа на печать осуществляют его обработку, в ходе которой распознают буквы (102), содержащиеся в цифровом документе; кодируют УИД пользователя в набор цифровых меток, которые располагаются на контурах букв и/или вблизи контуров букв цифрового документа (103); передают цифровой документ на печать с закодированным УИД пользователя (104). Изобретение обеспечивает повышение эффективности защиты данных от утечки.
Description
СПОСОБ ЗАЩИТЫ ИНФОРМАЦИИ ПРИ ПЕЧАТИ ДОКУМЕНТОВ
ОБЛАСТЬ ТЕХНИКИ
[0001] Заявленное решение относится к области защиты информации, в частности к решениям для предотвращения утечки информации при печати документов.
УРОВЕНЬ ТЕХНИКИ
[0002] Технологии предотвращения утечек (англ. Data Leak Prevention, DLP) представляют собой технологии предотвращения утечек конфиденциальной информации из информационной системы вовне, а также технические устройства (программные или программно-аппаратные) для такого предотвращения утечек.
[0003] Из патентной заявки US 20080091954 Al (Morris et al., 17.04.2008) известно решение для проверки целостности данных, представленных на печатных документах. Решение базируется на применении уникального идентификатора, с помощью которого осуществляется анализ содержимого документа. Каждому сегменту документа присваивается цифра или группа цифр, и каждой странице или сегменту документа может быть присвоена одна цифра в общем идентификаторе. Совокупность цифр, связанных с документом, объединяется в строку аутентификации. При получении запроса на последующую обработку документа выполняется аутентификация и проверка целостности документа путем считывания представленного документа для получения строки аутентификации, и последующего сравнения новой строки с ранее сохраненной строкой. После успешного сопоставления документ считается действительным, аутентифицированным и неизмененным.
[0004] Недостатком данного решения является невозможность его использования для предотвращения утечек с целью идентификацию сотрудника, допустившего факт утечки при печати документов. Также, другим недостатком является недостаточная эффективность защиты документов, что обусловлено применением кода для сравнения аутентичности документа, что позволяет только установить факт неизменности и подлинности документа, но не предотвратить утечку информации.
СУЩНОСТЬ ИЗОБРЕТЕНИЯ
[0005] Заявленное изобретение направлено на решение технической проблемы, заключающейся в создании эффективного средства для защиты цифровой информации от утечки при ее печати.
[0006] Технический результат заключается в повышении эффективности защиты данных от утечки, за счет внедрения цифровых меток в документ, кодирующих уникальный идентификатор пользователя, для последующей его идентификации при анализе распечатанных документах.
[0007] Заявленный результат достигается за счет способа кодирования информации для защиты от ее утечек при печати документов, выполняемого с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых: получают на компьютерном устройстве пользователя информацию о печати по меньшей мере одного цифрового документа, содержащего по меньшей мере текст, при этом компьютерное устройство связано с уникальным идентификатором (УИД) пользователя; осуществляют до момента передачи цифрового документа на печать его обработку, в ходе которой распознают буквы, содержащиеся в цифровом документе; кодируют УИД пользователя в набор цифровых меток, которые располагаются на контурах букв и/или вблизи контуров букв цифрового документа; передают цифровой документ на печать с закодированным УИД пользователя.
[0008] В одном из частных примеров реализации способа распознавание цифрового документа выполняется с помощью оптического распознавания символов (OCR).
[0009] В другом частном примере реализации способа распознаются все символы на каждой странице цифрового документа.
[0010] В другом частном примере реализации способа каждый символ УИД пользователя кодируется в двоичный код.
[0011 ] В другом частном примере реализации способа на основании разряда двоичного кода определяется область размещения цифровых меток.
[0012] Заявленный технический результат также достигается за счет осуществления способа защиты информации от утечек на печатных документах, выполняемого с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых: получают по меньшей мере часть изображения печатного документа с закодированным УИД пользователя вышеуказанным способом; выполняют распознавание полученного изображения; определяют буквы, содержащие цифровые метки в своей окрестности; выполняют определение и извлечение закодированного УИД.
[0013] В одном из частных примеров выполнения способа распознавание цифрового документа выполняется с помощью OCR.
[0014] Заявленное решение также осуществляется с помощью соответствующих систем, содержащих процессор и память, которые хранят машиночитаемые инструкции для реализации каждого из вышеописанных способов.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ
[0015] Фиг. 1 иллюстрирует блок-схему способа кодирования цифровой метки.
[0016] Фиг. 2 А - 2В иллюстрируют примеры размещения цифровых меток в цифровом документе.
[0017] Фиг. 3 иллюстрирует блок-схему декодирования цифровых меток.
[0018] Фиг. 4 иллюстрирует диаграмму час раскрытия позиций УИД. [0019] Фиг. 5 иллюстрирует общий вид вычислительного устройства.
ОСУЩЕСТВЛЕНИЕ ИЗОБРЕТЕНИЯ
[0020] На Фиг. 1 представлен способ (100) защиты информации в цифровых документах от утечки с помощью кодирования УИД пользователя в виде цифровых меток в документ. На первом этапе (101) получается информация о печати цифрового документа. Выполнение способа (100) осуществляется на компьютерном устройстве пользователя, например, сотрудника, при этом к устройству привязан УИД пользователя, позволяющий его идентифицировать. Исполнение этапа (101) одушевляется с помощью программной логики, исполняемой компьютерным устройством и может быть реализовано, например, в виде программного агента или модуля, обеспечивающего получение сигналов от процессора, свидетельствующих об отправке цифрового документа на печать. Цифровой документ представляет собой, как правило, файл и может содержать текст, графику или их сочетания.
[0021] После получения на устройстве команды на перехват и анализ документа до его отправки на принтер на этапе (102) выполняется распознавание упомянутого цифрового документа. Обработка документа выполняется с помощью технологии OCR для обеспечения распознавания букв и символов в цифровом документе.
[0022] После этапа распознавания цифрового документа на этапе (103) осуществляется процесс кодирования УИД. УИД представляет собой, например, числовой табельный номер сотрудника - цифровой код TAB, состоящий, например, из 8-ми цифр. Данный код можно представить как массив цифр ТАВ8 = {n1, n2) ... nm , TAB8 G [0 ...9],m = 8. Схематичный вид кода представлен в таблице 1.
Таблица 1. Схематичное изображение табельного номера:
[0023] Каждый элемент табельного номера представляет собой число от 0 до 9, соответственно, каждый элемент табельного номера можно отобразить в двоичном виде размерностью в 4 бит, т.е. он будет представлять собой двоичное число от 1 до 1100, являющееся гомоморфизмом со сдвигом, представленным в таблице 2.
[0024] Отображение 0 в 0001 необходимо для того, чтобы фиксировать наличие 0 в табельном номере. Для кодирования элемента табельного номера в двоичном коде TABQIN = {Ьг, Ь2, Ь3, ... , bi}, i = 8, необходимо 4 разряда = {с1л с2, с3, с4], пример которых представлен в Таблице 3.
[0025] Таким образом, возможно кодировать любое число в букву посредством двоичного кодирования. Пример такого разделения для последующего кодирования представлено на Фиг. 2 А - Фиг. 2В. Каждая распознанная буква (20) делится на 4 четверти в плоскости по часовой стрелке, начиная с левого нижнего угла.
[0026] При наличии 1-цы в I разряде двоичного представления цифры табельного номера С метка размещается в I четверти. Аналогичные операции проводятся со всеми разрядами двоичного представления цифры.
[0027] Метод нанесения метки в пространство возле буквы заключается в том, что как по казано на Фиг. 2Б-2В наносится цифровая метка в виде линии (21) на поверхности буквы или точки (22) в окрестности буквы в заданной четверти.
[0028] Пример кодирования меток в буквы представлен в Таблице 4.
[0029] Выше представленная таблица 4 означает, что каждую позицию числа в табельном номере возможно кодировать на любую из 4-х букв. Выбор букв для нанесения метки осуществляется постранично. Пусть документ D содержит I страниц, тогда документ D - есть массив страниц, D = {plt р2, р3 ... рг], I 6 N.
[0030] На каждой странице pir i Е [1, I] считывается посимвольно текст и записывается в массив символов Sp. где lp.- количество символов на странице Р , из
них выявляются русские буквы Wrusp. Е Sp..
[0031] Далее создаются 8 массивов Pos^ Pos2 ... Pos8, каждый из которых соответствует каждой позиции табельного номера. Каждый массивов Pos заполняется теми символами из Wrusp. , которые соответствуют позиции из таблицы 4. Например, Ро5 заполняется всеми символами из Wrusp., которые имеют значения {а, з, п, ч}, вне зависимости от регистра.
[0032] Массивы Pos^ Pos2 ... Pos8 перемешиваются, к примеру, тасованием Кнута. Пусть lPoS1, lp0S2, lp0S3 ... lpose - размерности полученных массивов, Р -процент символов на
внедрение метки Р Е [0,3 ...0,7], тогда каждый массив из Pos1, Pos2 ... Posa обрезается с конца до размерности
[0033] Полученные массивы Pos , Pos2 ... Pos8 используются для нанесения цифровых меток вышеописанным способом. Внесение цифровых меток осуществляется с помощью вырезания букв с помощью OCR, внесения меток в пиксельные координаты и внесение букв с цифровыми метками обратно в документ, направляемый на печать. После внедрения всех меток (21, 22) на искомой странице pt тоже самое выполняется для следующей страницы pi+1 и так далее до конца документа рг.
[0034] В Таблице 5 приведен пример кодирования меток для УИД пользователя - 00013400.
[0035] После внесения в документ, направленный на печать цифровых меток, кодирующих УИД, на этапе (104) выполняется его направление на печать. Распечатанный документ будет содержать закодированный УИД неразличимый для человеческого глаза. Размер цифровых меток может выбираться произвольно (например, метки радиусом от 1-2 пикселей).
[0036] На Фиг. 3 приведена последовательность этапов, выполняемых при выполнении способа (300) распознавании УИД на распечатанных документах. На этапе (301) вычислительное устройство, используемое для определения УИД в распечатанном документе, получает изображение такого документа. Изображение может содержать полностью или частично текст, с закодированном УИД, полученный, например, с помощью фотографирования внешним устройством (смартфон, камера и т.п.) или при помощи сканирования с помощью OCR распечатанного документа.
[0037] Далее на этапе (302) также при помощи технологии OCR выполняется распознавание букв в документе, при этом если страниц в документе несколько, то распознается каждая страница документа. На этапе (303) выполняется считывание цифровых меток в окрестностях распознанных букв. Пример анализа цифровых меток может осуществляться по примеру, приведенному в Таблице 5, которая может применяться как таблица для сопоставления меток соответствующей цифре УИД пользователя.
[0038] После этого выполняется декодирование УИД на этапе (304) и установление по нему табельного номера сотрудника и соответствующего пользователя, с компьютерного устройства которого была осуществлена печать документа.
[0039] Математическое обоснование метода
[0040] Для этого убедимся, что частоты раскрытия позиций ТАВ
2i ... nm}, m = 8 равномерно распределены для всех т, что позволяет показать вероятность извлечения табельного номера (УИД) из текста страницы.
[0041] Для математического обоснования было проведено исследование по частоте встречающихся букв в тексте с разным содержанием, к примеру, рассмотрим, такое распределение характерное для литературных произведений. Список литературных произведений, участвующих в эксперименте: Сильмариллион. Дж.Р.Р.Толкин, Двадцать тысяч лье под водой. Жюль Г.Верн, Двадцать лет спустя. Александр Дюма, Три мушкетера. Александр Дюма, Унесенные ветром. Маргарет Митчелл, Айвенго. Вальтер Скотт, Герой нашего времени. Н.В. Гоголь, Война и мир. Л.Н.Толстой, Обитаемый остров. Борис и Аркадий Стругацкие, Преступление и наказание. Ф.М.Достоевский, Живые и мертвые. К.М.Симонов, всего 8 366 594 символов, 3919 страниц. Математическая лингвистика показала следующие вероятности частоты встречи букв русского алфавита в текстах (Таблица 6).
[0042] Для получения значения частоты раскрытия позиций ТАВ8 =
n2i ... nm выполняются следующие действия. Из таблиц 4 и 5 известны буквы, в которые кодируются разряды. Для получения частоты раскрытия разрядов для алгоритма нанесения метки в пространстве возле буквы, частоты букв, в которые кодируются метки, складываются, т.к. позиция выкрывается при обнаружении метки хотя бы в одной из них. В результате вышеописанных действий получается таблица 7.
Таблица 7. Таблица частоты раскрытия позиций табельного номера.
И i Частота встречи букв Частота раскрытия разряда
[0043] На основании таблицы 7 формируется диаграмма, представленная на Фиг. 4.
Диаграмма показывает, что частота раскрытия всех позиций распределена относительно равномерно.
[0044] Вычислим количество каждой буквы русского алфавита экспериментальной выборки:
[0045] Для метода нанесения точки в пространство возле буквы принимается следующее допущение: процент Р символов на внедрение метки Р = 0,3, при передаче через мессенджеры теряется определенный процент М = 0,7 меток. На основании вышеописанного можно вычислить вероятность распознавания текста, если для дешифрования доступно: целая страница; г страницы;
!4 страницы.
Таблица 9. Пояснения и вероятностей распознавания текста, закодированного методом нанесения точки в пространство возле буквы
[0046] Пример Экспериментального применения.
[0047] В ходе тестирования было распечатано и анализировано около 500 страниц разного содержания: текст, разреженный текст, текст с таблицами, текст с графиками, текст с формулами; с разными типами шрифтов: Arial, Calibri, Times New Roman; разное оформление текста: обычный, курсив, полужирный, подчеркнутый; разной размерности: 12рх, 14рх; разным межстрочным интервалом: 0.5, 1.15, 1,5; разным межзнаковым интервалом: обычный, разреженный, уплотнённый;
[0048] В каждом случае рассматривалась возможность извлечения метки с: распечатки напрямую; с фотографии распечатки; переданной по мессенджеру распечатки фотографии.
[0049] Печать проводилась на офисном черно белом лазерном принтере Lexmark МХ71 Ide на офисной бумаге «Снегурочка» с белизной CIE 146 по ISO 11475.
[0050] Фотографирование производилось на телефон Samsung А51 при офисном освещении, бумага лежит горизонтально на столе, фотографирование случайное под разными, незначительными углами, порядком 2-4% в 3-х измерениях.
[0051] При передаче фотографий использовался мессенджер Telegram со сжатием изображения при отправлении.
[0052] В ходе эксперимента подбирались параметры, такие как размер меток, их оптимальные места и способы нанесения. Результаты последней фазы эксперимента показаны в таблице 10.
[0053] Вышеописанная таблица показывает хорошие результаты анализа переданных по мессенджеру фотографий распечаток на офисном черно-белом принтере. В результате эксперимента были подобраны оптимальные параметры для внедрения метки, которые с одной стороны, были бы заметны на распечатках как дефекты принтера, с другой стороны, хорошо извлекались из переданных фотографий по мессенджерам.
[0054] На Фиг. 5 представлен общий вид вычислительного устройства (500), пригодного для выполнения вышеуказанных способов. Устройство (500) может представлять собой, например, компьютер, сервер или иной тип пригодного вычислительного устройства.
[0055] В общем случае вычислительное устройство (500) содержит объединенные общей шиной информационного обмена один или несколько процессоров (501), средства памяти, такие как ОЗУ (502) и ПЗУ (503), интерфейсы ввода/вывода (504), устройства ввода/вывода (505), и устройство для сетевого взаимодействия (506).
[0056] Процессор (501) (или несколько процессоров, многоядерный процессор) могут выбираться из ассортимента устройств, широко применяемых в текущее время, например, компаний Intel™, AMD™, Apple™, Samsung Exynos™, MediaTEK™, Qualcomm Snapdragon™ и т.п. В качестве процессора (501) может также применяться графический процессор, например, Nvidia, AMD, Graphcore и пр.
[0057] ОЗУ (502) представляет собой оперативную память и предназначено для хранения исполняемых процессором (501) машиночитаемых инструкций для выполнение необходимых операций по логической обработке данных. ОЗУ (502), как правило, содержит исполняемые инструкции операционной системы и соответствующих программных компонент (приложения, программные модули и т.п.).
[0058] ПЗУ (503) представляет собой одно или более устройств постоянного хранения данных, например, жесткий диск (HDD), твердотельный накопитель данных (SSD), флэш- память (EEPROM, NAND и т.п.), оптические носители информации (CD-R/RW, DVD- R/RW, BlueRay Disc, MD) и др.
[0059] Для организации работы компонентов устройства (500) и организации работы внешних подключаемых устройств применяются различные виды интерфейсов В/В (504). Выбор соответствующих интерфейсов зависит от конкретного исполнения вычислительного устройства, которые могут представлять собой, не ограничиваясь: PCI,
AGP, PS/2, IrDa, FireWire, LPT, COM, SATA, IDE, Lightning, USB (2.0, 3.0, 3.1, micro, mini, type C), TRS/Audio jack (2.5, 3.5, 6.35), HDMI, DVI, VGA, Display Port, RJ45, RS232 и т.п. [0060] Для обеспечения взаимодействия пользователя с вычислительным устройством (500) применяются различные средства (505) В/В информации, например, клавиатура, дисплей (монитор), сенсорный дисплей, тач-пад, джойстик, манипулятор мышь, световое перо, стилус, сенсорная панель, трекбол, динамики, микрофон, средства дополненной реальности, оптические сенсоры, планшет, световые индикаторы, проектор, камера, средства биометрической идентификации (сканер сетчатки глаза, сканер отпечатков пальцев, модуль распознавания голоса) и т.п.
[0061] Средство сетевого взаимодействия (506) обеспечивает передачу данных устройством (500) посредством внутренней или внешней вычислительной сети, например, Интранет, Интернет, ЛВС и т.п. В качестве одного или более средств (506) может использоваться, но не ограничиваться: Ethernet карта, GSM модем, GPRS модем, LTE модем, 5G модем, модуль спутниковой связи, NFC модуль, Bluetooth и/или BLE модуль, Wi-Fi модуль и др.
[0062] Дополнительно могут применяться также средства спутниковой навигации в составе устройства (500), например, GPS, ГЛОНАСС, BeiDou, Galileo.
[0063] Представленные материалы заявки раскрывают предпочтительные примеры реализации технического решения и не должны трактоваться как ограничивающие иные, частные примеры его воплощения, не выходящие за пределы испрашиваемой правовой охраны, которые являются очевидными для специалистов соответствующей области техники.
Claims
1. Способ кодирования информации для защиты от ее утечек при печати документов, выполняемый с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых: получают на компьютерном устройстве пользователя информацию о печати по меньшей мере одного цифрового документа, содержащего по меньшей мере текст, при этом компьютерное устройство связано с уникальным идентификатором (УИД) пользователя; осуществляют до момента передачи цифрового документа на печать его обработку, в ходе которой распознают буквы, содержащиеся в цифровом документе; кодируют УИД пользователя в набор цифровых меток, которые располагаются на контурах букв и/или вблизи контуров букв цифрового документа; передают цифровой документ на печать с закодированным УИД пользователя.
2. Способ по п.1, характеризующийся тем, что распознавание цифрового документа выполняется с помощью оптического распознавания символов (OCR).
3. Способ по п.2, характеризующийся тем, что распознаются все символы на каждой странице цифрового документа.
4. Способ по п.1, характеризующийся тем, что каждый символ УИД пользователя кодируется в двоичный код.
5. Способ по п.4, характеризующийся тем, что на основании разряда двоичного кода определяется область размещения цифровых меток.
6. Способ защиты информации от утечек на печатных документах, выполняемый с помощью процессора компьютерного устройства, при этом способ содержит этапы, на которых: получают по меньшей мере часть изображения печатного документа с закодированным УИД пользователя способом по любому из пп. 1-5; выполняют распознавание полученного изображения; определяют буквы, содержащие цифровые метки в своей окрестности; выполняют определение и извлечение закодированного УИД.
7. Способ по п.6, характеризующийся тем, что распознавание цифрового документа выполняется с помощью OCR.
8. Система кодирования информации для защиты от ее утечек при печати документов, содержащая по меньшей мере один процессор, по меньшей мере одну память, связанную с процессором и содержащую машиночитаемые инструкции, которые при их исполнении процессором осуществляют способ по любому из пп. 1-5.
9. Система защиты информации от утечек на печатных документах, содержащая по меньшей мере один процессор, по меньшей мере одну память, связанную с процессором и содержащую машиночитаемые инструкции, которые при их исполнении процессором осуществляют способ по любому из пп. 6-7.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2022106206 | 2022-03-10 | ||
RU2022106206A RU2790938C1 (ru) | 2022-03-10 | Способ и система защиты информации от утечки при печати документов с помощью внедрения цифровых меток |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023172162A1 true WO2023172162A1 (ru) | 2023-09-14 |
Family
ID=87935599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/RU2022/000383 WO2023172162A1 (ru) | 2022-03-10 | 2022-12-20 | Способ защиты информации при печати документов |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2023172162A1 (ru) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040001606A1 (en) * | 2002-06-28 | 2004-01-01 | Levy Kenneth L. | Watermark fonts |
US20070047818A1 (en) * | 2005-08-23 | 2007-03-01 | Hull Jonathan J | Embedding Hot Spots in Imaged Documents |
US20080205699A1 (en) * | 2005-10-25 | 2008-08-28 | Fujitsu Limited | Digital watermark embedding and detection |
RU2446464C2 (ru) * | 2010-05-06 | 2012-03-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и система встраивания и извлечения скрытых данных в печатаемых документах |
US20130028466A1 (en) * | 2005-09-16 | 2013-01-31 | Sursen Corp. | Embedding and Detecting Hidden Information |
RU2758666C1 (ru) * | 2021-03-25 | 2021-11-01 | Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) | Способ и система защиты цифровой информации, отображаемой на экране электронных устройств, с помощью динамических цифровых меток |
-
2022
- 2022-12-20 WO PCT/RU2022/000383 patent/WO2023172162A1/ru active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040001606A1 (en) * | 2002-06-28 | 2004-01-01 | Levy Kenneth L. | Watermark fonts |
US20070047818A1 (en) * | 2005-08-23 | 2007-03-01 | Hull Jonathan J | Embedding Hot Spots in Imaged Documents |
US20130028466A1 (en) * | 2005-09-16 | 2013-01-31 | Sursen Corp. | Embedding and Detecting Hidden Information |
US20080205699A1 (en) * | 2005-10-25 | 2008-08-28 | Fujitsu Limited | Digital watermark embedding and detection |
RU2446464C2 (ru) * | 2010-05-06 | 2012-03-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и система встраивания и извлечения скрытых данных в печатаемых документах |
RU2758666C1 (ru) * | 2021-03-25 | 2021-11-01 | Публичное Акционерное Общество "Сбербанк России" (Пао Сбербанк) | Способ и система защиты цифровой информации, отображаемой на экране электронных устройств, с помощью динамических цифровых меток |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10339378B2 (en) | Method and apparatus for finding differences in documents | |
CN112016273B (zh) | 文档目录生成方法、装置、电子设备及可读存储介质 | |
CN107239666B (zh) | 一种对医疗影像数据进行脱敏处理的方法及系统 | |
US9626555B2 (en) | Content-based document image classification | |
CN108805787B (zh) | 一种纸质文档篡改鉴真的方法和装置 | |
US20200097713A1 (en) | Method and System for Accurately Detecting, Extracting and Representing Redacted Text Blocks in a Document | |
KR102503880B1 (ko) | 머신 판독 가능 보안 마크 및 이를 생성하는 프로세스 | |
US11961094B2 (en) | Fraud detection via automated handwriting clustering | |
JP2016048444A (ja) | 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法 | |
US20190384971A1 (en) | System and method for optical character recognition | |
US10867170B2 (en) | System and method of identifying an image containing an identification document | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
RU2790938C1 (ru) | Способ и система защиты информации от утечки при печати документов с помощью внедрения цифровых меток | |
CN107016320B (zh) | 一种基于中文词库提高图片密级识别准确率的方法 | |
WO2023172162A1 (ru) | Способ защиты информации при печати документов | |
RU2793611C1 (ru) | Способ и система защиты информации от утечки при печати документов с помощью смещения символов | |
EA044732B1 (ru) | Способ и система защиты информации от утечки при печати документов с помощью внедрения цифровых меток | |
WO2023172161A1 (ru) | Способ и система защиты информации при печати документов | |
US7596270B2 (en) | Method of shuffling text in an Asian document image | |
EA045968B1 (ru) | Способ и система защиты информации от утечки при печати документов с помощью смещения символов | |
CN110942075A (zh) | 信息处理装置、存储介质及信息处理方法 | |
US20170337165A1 (en) | System and method of embedding symbology in alphabetic letters and then linking the letters to a site or sites on the global computer network | |
CN113971804B (zh) | 签名伪造的检测装置、方法、计算设备及存储介质 | |
KR102490515B1 (ko) | 이미지정보를 기반으로 하는 비가시적인 데이터 코드를 처리하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체 | |
CN113077048B (zh) | 基于神经网络的印章匹配方法、系统、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22931154 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 22931154 Country of ref document: EP Kind code of ref document: A1 |