JP5671320B2 - 情報処理装置及びその制御方法並びにプログラム - Google Patents
情報処理装置及びその制御方法並びにプログラム Download PDFInfo
- Publication number
- JP5671320B2 JP5671320B2 JP2010273944A JP2010273944A JP5671320B2 JP 5671320 B2 JP5671320 B2 JP 5671320B2 JP 2010273944 A JP2010273944 A JP 2010273944A JP 2010273944 A JP2010273944 A JP 2010273944A JP 5671320 B2 JP5671320 B2 JP 5671320B2
- Authority
- JP
- Japan
- Prior art keywords
- learning
- encoding
- structured data
- data
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/146—Coding or compression of tree-structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/14—Tree-structured documents
- G06F40/143—Markup, e.g. Standard Generalized Markup Language [SGML] or Document Type Definition [DTD]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/149—Adaptation of the text data for streaming purposes, e.g. Efficient XML Interchange [EXI] format
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
本実施形態の情報処理装置の構成について、図1のブロック図を参照して説明する。本実施形態の情報処理装置は単一のコンピュータ装置で実現してもよいし、必要に応じた複数のコンピュータ装置で機能を分散して実現してもよい。複数のコンピュータ装置で構成される場合は、互いに通信可能なようにLocal Area Network(LAN)などで接続されうる。
S504において学習中のGrammarがないと判定された場合は、S506において、学習したGrammarを使って、一時保存されているデータと入力されたXMLデータを符号化する。
実施形態2では、記憶領域の少ない機器でも適用できるように、学習条件に、保存する入力データサイズの制限を指定した際の例を示す。図10は、本実施形態で符号化するXMLデータの例である。本実施形態においても、実施形態1と同様に、Path要素、M要素、C要素、S要素、L要素を学習対象として指定する。このとき、Path要素のGrammarの学習が開始するのは、Pathの開始要素であるデータの先頭、学習が終了するのは、Pathの終了要素であるデータの末尾になる。順次符号化処理を行う場合、学習中の入力データは全て保持しなければならないので、記憶領域の少ない機器では符号化が難しくなる。そこで、Grammarの学習条件の指定で、保存する入力データサイズの閾値を設定しておく。
スキーマを使ったバイナリXML符号化の目的として、スキーマという共通情報を使って各XMLインスタンスの圧縮効率を高めたいというものがある。しかしEXIではさらに、データ型適合符号化を行いたいという目的もある。データ型適合符号化は、整数値を文字列型ではなく整数型で符号化するというように、データ型に適した符号化を行うことで圧縮効率を高めるものである。
以下の実施形態4では、ユーザの選択に応じたGrammar学習対象の指定について説明する。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (11)
- 入力した構造化データを符号化規則に従い符号化する情報処理装置であって、
前記符号化規則の学習対象を指定する指定手段と、
入力した前記構造化データが前記指定手段により指定された学習対象に適合するときに前記符号化規則の学習開始と判定する開始判定手段と、
前記開始判定手段により学習開始と判定された場合に、前記構造化データの構造及びデータ型を認識して前記符号化規則の学習を行う学習手段と、
入力した前記構造化データに対し、前記指定手段により指定された学習対象に応じた終了条件が成立したときに前記符号化規則の学習終了と判定する終了判定手段と、
前記終了判定手段により学習終了と判定されるまで前記構造化データを保存する保存手段と、
前記終了判定手段により学習終了と判定されたとき、前記保存手段により保存された構造化データを、前記学習手段により学習した符号化規則に従い符号化する符号化手段と、
を有し、
前記終了判定手段は更に、入力した前記構造化データのデータサイズと前記保存手段により保存されている構造化データのデータサイズとの和が所定のデータサイズを超えたときに学習終了と判定する
ことを特徴とする情報処理装置。 - 前記学習手段により学習した符号化規則を学習終了後に出力する出力手段を更に有することを特徴とする請求項1に記載の情報処理装置。
- 前記出力手段は、前記学習手段により学習した符号化規則の出力形式を設定する手段を含み、前記学習手段により学習した符号化規則を前記設定された出力形式で出力することを特徴とする請求項2記載の情報処理装置。
- 前記指定手段は、前記符号化規則の学習対象とする要素名を指定し、
前記開始判定手段は、入力した前記構造化データの要素名が前記指定手段により指定された要素名に適合したときに学習開始と判定する
ことを特徴とする請求項1に記載の情報処理装置。 - 前記終了判定手段は、入力した前記構造化データが前記指定手段により指定された要素名の終了要素に適合したときに前記終了条件が成立し、学習終了と判定することを特徴とする請求項4に記載の情報処理装置。
- 前記学習手段は、前記構造化データのデータ型を推定する手段を含むことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
- 前記学習手段は、前記構造化データに記述されたtype属性からデータ型を解釈する手段を含むことを特徴とする請求項1乃至5のいずれか1項に記載の情報処理装置。
- 前記構造化データはXMLデータであることを特徴とする請求項1乃至7のいずれか1項に記載の情報処理装置。
- 前記符号化手段は、前記保存手段により保存された構造化データを、前記学習手段により学習した符号化規則に従い、EXI(Efficient XML Interchange)に符号化することを特徴とする請求項1乃至8のいずれか1項に記載の情報処理装置。
- 入力した構造化データを符号化規則に従い符号化する情報処理装置の制御方法であって、
指定手段が、前記符号化規則の学習対象を指定する指定ステップと、
開始判定手段が、入力した前記構造化データが前記指定ステップで指定された学習対象に適合するときに前記符号化規則の学習開始と判定する開始判定ステップと、
学習手段が、前記開始判定ステップで学習開始と判定された場合に、前記構造化データの構造及びデータ型を認識して前記符号化規則の学習を行う学習ステップと、
終了判定手段が、入力した前記構造化データに対し、前記指定ステップで指定された学習対象に応じた終了条件が成立したときに前記符号化規則の学習終了と判定する終了判定ステップと、
保存手段が、前記終了判定ステップで学習終了と判定されるまで前記構造化データを保存する保存ステップと、
符号化手段が、前記終了判定ステップで学習終了と判定されたとき、前記保存ステップで保存された構造化データを、前記学習ステップで学習した符号化規則に従い符号化する符号化ステップと、
を有し、
前記終了判定ステップにおいて、前記終了判定手段は更に、入力した前記構造化データのデータサイズと前記保存手段により保存されている構造化データのデータサイズとの和が所定のデータサイズを超えたときに学習終了と判定する
ことを特徴とする情報処理装置の制御方法。 - コンピュータを請求項1乃至9のいずれか1項に記載の情報処理装置が有する各手段として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010273944A JP5671320B2 (ja) | 2009-12-18 | 2010-12-08 | 情報処理装置及びその制御方法並びにプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009288418 | 2009-12-18 | ||
JP2009288418 | 2009-12-18 | ||
JP2010273944A JP5671320B2 (ja) | 2009-12-18 | 2010-12-08 | 情報処理装置及びその制御方法並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011146036A JP2011146036A (ja) | 2011-07-28 |
JP5671320B2 true JP5671320B2 (ja) | 2015-02-18 |
Family
ID=44152476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010273944A Expired - Fee Related JP5671320B2 (ja) | 2009-12-18 | 2010-12-08 | 情報処理装置及びその制御方法並びにプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US8849726B2 (ja) |
JP (1) | JP5671320B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5670859B2 (ja) * | 2011-10-21 | 2015-02-18 | 株式会社東芝 | 記述方法、exiデコーダおよびプログラム |
US10019418B2 (en) * | 2012-07-20 | 2018-07-10 | Fujitsu Limited | Efficient XML interchange profile stream decoding |
US9128912B2 (en) * | 2012-07-20 | 2015-09-08 | Fujitsu Limited | Efficient XML interchange schema document encoding |
JP2015115652A (ja) | 2013-12-09 | 2015-06-22 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
DE102014219090A1 (de) * | 2014-09-22 | 2016-03-24 | Siemens Aktiengesellschaft | Gerät mit Kommunikationsschnittstelle und Verfahren zur Steuerung eines Datenbankzugriffs |
US10282400B2 (en) * | 2015-03-05 | 2019-05-07 | Fujitsu Limited | Grammar generation for simple datatypes |
US10311137B2 (en) * | 2015-03-05 | 2019-06-04 | Fujitsu Limited | Grammar generation for augmented datatypes for efficient extensible markup language interchange |
CN108737392B (zh) * | 2018-05-03 | 2020-10-30 | 杭州鸿泉物联网技术股份有限公司 | 一种终端上报数据的压缩方法及发送端和接收端 |
CN112382165B (zh) * | 2020-11-19 | 2022-10-04 | 北京罗克维尔斯科技有限公司 | 驾驶策略生成方法、装置、介质、设备及仿真系统 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6008A (en) * | 1849-01-09 | Pkoto-litho | ||
FR2670973B1 (fr) * | 1990-12-19 | 1994-04-15 | Ouest Standard Telematique Sa | Systeme de transmission par paquets a compression de donnees, procede et equipement correspondant. |
JP3855423B2 (ja) * | 1998-01-09 | 2006-12-13 | 富士ゼロックス株式会社 | データ管理装置および記録媒体 |
US7669120B2 (en) * | 2002-06-21 | 2010-02-23 | Microsoft Corporation | Method and system for encoding a mark-up language document |
US7350199B2 (en) * | 2003-01-17 | 2008-03-25 | Microsoft Corporation | Converting XML code to binary format |
US20060085737A1 (en) * | 2004-10-18 | 2006-04-20 | Nokia Corporation | Adaptive compression scheme |
JP4898405B2 (ja) * | 2006-12-01 | 2012-03-14 | キヤノン株式会社 | 文書データ処理方法、文書データ作成装置、及び文書データ処理装置 |
US7970082B2 (en) | 2007-06-29 | 2011-06-28 | Texas Instruments Incorporated | Frequency offset correction when decoding a packet encoded in a frequency modulated signal |
JP5207886B2 (ja) * | 2007-09-20 | 2013-06-12 | キヤノン株式会社 | 文書符号化装置、文書符号化方法 |
JP4898615B2 (ja) * | 2007-09-20 | 2012-03-21 | キヤノン株式会社 | 情報処理装置および符号化方法 |
EP2040178B1 (en) | 2007-09-20 | 2016-07-13 | Canon Kabushiki Kaisha | Document encoding apparatus, document encoding method, and computer-readable storage medium |
US8090731B2 (en) * | 2007-10-29 | 2012-01-03 | Oracle International Corporation | Document fidelity with binary XML storage |
FR2933793B1 (fr) * | 2008-07-11 | 2013-07-05 | Canon Kk | Procedes de codage et de decodage, par referencement, de valeurs dans un document structure, et systemes associes. |
EP2219117A1 (en) * | 2009-02-13 | 2010-08-18 | Siemens Aktiengesellschaft | A processing module, a device, and a method for processing of XML data |
-
2010
- 2010-12-08 JP JP2010273944A patent/JP5671320B2/ja not_active Expired - Fee Related
- 2010-12-17 US US12/971,237 patent/US8849726B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8849726B2 (en) | 2014-09-30 |
JP2011146036A (ja) | 2011-07-28 |
US20110153531A1 (en) | 2011-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5671320B2 (ja) | 情報処理装置及びその制御方法並びにプログラム | |
US8117217B2 (en) | Information processing apparatus and encoding method | |
US11132540B2 (en) | Ink file searching method, apparatus, and program | |
US20090254882A1 (en) | Methods and devices for iterative binary coding and decoding of xml type documents | |
EP1519279B1 (en) | Document transformation system | |
CN117749899A (zh) | 协议转换框架、设备通讯方法、装置和计算机存储介质 | |
CN111159394A (zh) | 一种文本摘要生成方法和装置 | |
KR102689642B1 (ko) | 확산 모델과 암시적 신경망 기반의 임의의 해상도와 스케일의 이미지를 생성하는 방법 및 이를 위한 장치 | |
CN115134433B (zh) | 一种工控协议的语义解析方法、系统、设备及存储介质 | |
KR102610431B1 (ko) | 인공지능 분석 기반 프로그램 소스코드의 요약문 생성 장치 및 방법 | |
CN112698825B (zh) | 编程积木块转换方法、装置、处理设备及存储介质 | |
CN113485829B (zh) | 用于微服务集群的数据增量步段的标识值生成方法 | |
CN115935909A (zh) | 一种文件生成方法、装置及电子设备 | |
US8386922B2 (en) | Information processing apparatus and information processing method | |
CN115297327A (zh) | 基于语义结构化编码的语义先验编解码方法与系统 | |
JP4821287B2 (ja) | 構造化文書の符号化方法、符号化装置、符号化プログラム、復号装置及び符号化された構造化文書のデータ構造 | |
JPWO2004079586A1 (ja) | マークアップ言語の処理を最適に行なうことのできるデータ変換方法 | |
JP2007219579A (ja) | ドキュメント変換装置、およびプログラム | |
CN115001628B (zh) | 数据编码的方法及装置、数据解码的方法及装置和数据结构 | |
KR102714552B1 (ko) | 공통 자산 관리 쉘 템플릿을 생성하는 장치 및 방법 | |
CN116074412B (zh) | 一种数据高速读写方法、系统、设备和可读存储介质 | |
JP5400344B2 (ja) | ドキュメント変換装置、およびプログラム | |
CN117789233A (zh) | 文本识别方法、装置、设备及存储介质 | |
CN118963564A (zh) | Linux系统中文键入方法、装置、设备、介质及产品 | |
CN118427156A (zh) | 一种文件编码方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140630 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140820 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141219 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5671320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |