JP5015806B2 - Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof - Google Patents
Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof Download PDFInfo
- Publication number
- JP5015806B2 JP5015806B2 JP2008000892A JP2008000892A JP5015806B2 JP 5015806 B2 JP5015806 B2 JP 5015806B2 JP 2008000892 A JP2008000892 A JP 2008000892A JP 2008000892 A JP2008000892 A JP 2008000892A JP 5015806 B2 JP5015806 B2 JP 5015806B2
- Authority
- JP
- Japan
- Prior art keywords
- product
- data
- voice
- character string
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Cash Registers Or Receiving Machines (AREA)
Description
本発明は、音声認識技術を利用した商品販売データ処理装置及びその装置を機能させるプログラム並びに商品データ入力装置及びその装置を機能させるプログラムに関する。 The present invention relates to a merchandise sales data processing apparatus using voice recognition technology, a program that causes the apparatus to function, a merchandise data input apparatus, and a program that causes the apparatus to function.
近年、キーボードの代わりに音声を用いる音声認識の技術を利用したデータ入力が様々な場面で実用化されており、この技術を利用した商品販売データ処理装置、及び商品データ入力装置等が知られている。これらの装置は、商品毎にその商品が属するグループを特定するキーワードを予め設定記憶したキーワード記憶手段を備えており、操作者が音声にて特定のキーワードを入力すると、このキーワードを基にキーワードと対応して設定された商品名が抽出され、画面上に表示される(例えば、特許文献1参照)。
しかしながら現在の音声認識技術では正確に正しい名称を発声しない限り誤認識するおそれがあり、また、周囲の雑音や他人の会話の影響を受け認識に失敗する可能性もある。このため、商品名称が長い場合や類似した商品名称を発生する場合、音声を正しく認識させるためのユーザ負担が大きい。また、上述の装置には入力音声を誤認識した場合の対応が施されていないため、誤ったキーワードを認識した際には誤ったグループに属する商品名が画面上に出力表示される場合が考えられる。このため、操作者の所望する商品名が表示されないといった候補漏れを生ずる可能性があり、販売データ処理に時間がかかる場合や処理ができないおそれがある。 However, with current voice recognition technology, there is a risk of misrecognition unless the correct name is spoken, and there is a possibility that recognition may fail due to the influence of ambient noise and other people's conversation. For this reason, when the product name is long or a similar product name is generated, the user burden for correctly recognizing the voice is large. In addition, since the above-mentioned device is not provided with a case where the input speech is misrecognized, the product name belonging to the wrong group may be output and displayed on the screen when the wrong keyword is recognized. It is done. For this reason, there is a possibility that a candidate omission such as the display of the product name desired by the operator may not occur, and there is a possibility that the sales data processing takes time or the processing cannot be performed.
本発明はこのような事情に基づいてなされたものであり、誤認識された音声は少なくとも音声的に類似していると考えられるので、音声的に類似する候補を漏れ無く抽出し、その候補と対応する商品データを出力表示させることによって、入力音声について誤認識がある場合においても操作者が所望する音声候補を出力表示させることができる商品販売データ処理装置を提供しようとするものである。 The present invention has been made based on such circumstances, and misrecognized speech is considered to be at least speech-similar. Therefore, speech-similar candidates are extracted without omission and An object of the present invention is to provide a merchandise sales data processing apparatus capable of outputting and displaying voice candidates desired by an operator even when there is a misrecognition of input voice by outputting and displaying corresponding merchandise data.
予め作成された音声の音声特徴量と音声パターンデータを関連付けて記憶した音響辞書と、前記音声パターンデータと商品文字列を関連付けて記憶した音声辞書と、少なくとも商品名称を含んで商品を識別する商品データ、及び、この商品データと対応して設定されるとともに、前記商品名称の一部あるいは全部を構成する文字列から構成された前記商品文字列を記憶した商品データ・商品文字列辞書と、音声を入力する音声入力手段と、前記音響辞書を参照して、前記音声入力手段により入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致若しくは類似した音声特徴量と関連付けられて記憶された前記音声パターンデータを出力する音声認識手段と、前記音声辞書を参照して、前記音声認識手段により出力された前記音声パターンデータに基づいて前記商品文字列を候補として抽出する音声パターンデータ抽出手段と、前記音声パターンデータ抽出手段により抽出された前記商品文字列を商品文字列候補として記憶する商品文字列候補記憶手段と、前記商品文字列候補と対応して設定された前記商品データを前記商品データ・商品文字列辞書から読み出す商品データ読み出し手段と、前記商品データ読み出し手段により読み出された前記商品データを出力表示する出力表示手段と、前記出力表示手段により出力表示された前記商品データの中から任意の前記商品データが選択されると、商品販売データ処理を行う商品販売データ処理手段と、を備えた商品販売データ処理装置であって、前記商品データ・商品文字列辞書には、同一の商品データに対して、複数の商品文字列が設定され、前記同一の商品データに対応して設定された前記複数の商品文字列は、前記商品名称のうち最初の1文字を有する第一の商品文字列と、この第一の商品文字列を全て含むとともに更に文字数が多く、前記商品名称の全ての文字列を有する第二の商品文字列と、前記第一の商品文字列の文字数と前記第二の商品文字列の文字数との間であって、且つ、前記第一の文字列の文字数に対し連続して1文字ずつ文字数が増加する第三の商品文字列郡と、を含むことを特徴とする商品販売データ処理装置。 An acoustic dictionary that stores voice feature quantities and voice pattern data that are created in advance in association with each other, a voice dictionary that stores the voice pattern data in association with a product character string, and a product that includes at least a product name and identifies a product Data and a product data / product character string dictionary that is set in correspondence with the product data and stores the product character string composed of a character string that constitutes part or all of the product name, and voice A voice input means for inputting a voice, and referring to the acoustic dictionary, the voice feature quantity of the voice inputted by the voice input means is compared with a voice feature quantity created in advance, and is associated with a matching or similar voice feature quantity Voice recognition means for outputting the stored voice pattern data, and the voice dictionary with reference to the voice dictionary. Voice pattern data extraction means for extracting the product character string as a candidate based on voice pattern data, and product character string candidate storage means for storing the product character string extracted by the voice pattern data extraction means as a product character string candidate Product data reading means for reading the product data set corresponding to the product character string candidate from the product data / product character string dictionary, and outputting and displaying the product data read by the product data reading means Product sales data processing means for performing product sales data processing when any product data is selected from the product data output and displayed by the output display means a data processing apparatus, wherein the product data and product string dictionary for the same product data, double Commercialized string is set, the plurality of product string configured to correspond to the same product data, a first item character string having a first character of the product name, the first product further characters with character includes all columns rather large, and a second product string with all strings of the product name, the number of characters of the first product string of the second product string A product sales data process comprising: a third product character string group that is between the number of characters and has a character number that is successively increased by one character with respect to the number of characters of the first character string. apparatus.
本発明によれば商品名の文字列の一部を音声入力すると、その入力した音声について類似すると判断された複数の商品文字列候補といった音声候補が抽出される。これらの音声候補は1つ1つの商品データと対応して設定されているため、その商品文字列候補と対応した商品データを漏れなく出力表示することができる。これによって、入力された音声が誤認識された時の候補漏れを防ぐことができる。また、商品文字列の一部を発話することで販売処理又は入力処理を行うことが可能となる。このため、販売入力処理操作に際して操作者が正式な商品名称がわからない場合であっても装置の操作を行うことが可能となる効果を奏する。 When a portion of a string of trade name, according to the present invention is a voice input, voice candidates are extracted such a plurality of goods string candidate is determined to be similar for the voice and the input. Since these sound candidate is set to correspond to one single product data can be output and displayed without omission product data corresponding with goods string candidates of that. Thereby, it is possible to prevent candidate omission when the input voice is erroneously recognized. Further, it is possible to perform sales processing or input process by speaking a portion of goods string. For this reason, there is an effect that it is possible to operate the apparatus even when the operator does not know the official product name at the time of the sales input processing operation.
以下、本発明の実施の形態を図面を参照して説明する。なお、この実施の形態は、飲食店向けの商品販売に用いる処理装置に適用した場合である。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. In addition, this embodiment is a case where it applies to the processing apparatus used for the merchandise sale for restaurants.
第1の実施形態は、操作者が商品カテゴリを音声入力すると、この商品カテゴリの音声パターンデータと音声的に一致若しくは類似する商品カテゴリ候補を参照し、この商品カテゴリ候補と対応して設定された商品データを出力表示する商品販売データ処理装置であり、図1〜図9を用いて説明する。本実施形態における商品カテゴリとは商品毎に各商品が属するグループを特定する属性をいう。図1は本発明の第1の実施形態における商品販売データ処理装置の外観を示す斜視図である。商品販売データ処理装置1があり、操作者の音声を入力する音声入力手段としてマイクロホン13が設けられている、出力表示手段12は例えば液晶を利用したディスプレイ121とタッチパネルセンサ122とからなるタッチパネル式のものを用いている。但し、マイクロホン13は図示したように本体と別に設けられている必要はなく、出力表示手段12に内蔵されていてもよい。また出力表示手段12に関しては本実施形態ではタッチパネル方式を用いているがこれに限定する必要はない。
In the first embodiment, when the operator inputs a product category by voice, a product category candidate that matches or resembles the voice pattern data of the product category is referred to and set corresponding to the product category candidate. A merchandise sales data processing apparatus that outputs and displays merchandise data, and will be described with reference to FIGS. The product category in the present embodiment refers to an attribute that specifies a group to which each product belongs for each product. FIG. 1 is a perspective view showing an appearance of a product sales data processing apparatus according to the first embodiment of the present invention. The merchandise sales
次に、図2に装置本体11の内部構成について示す。装置本体11には各装置の制御を行いコンピュータの中核機能を担うCPU(Central Processing Unit)111、このCPU111の動作を制御するプログラム等の固定的データが予め格納されたROM(Read Only Memory)112、CPU111から直接、データの書込みや読み出しが行われるRAM(Random Access Memory)113、販売データや各種データの記憶を行うことができる大容量記憶媒体であるHDD(Hard Disc Drive)114、LAN(Local Area Network)等の通信ネットワークを介して接続される電子機器とのデータ通信を制御する通信インターフェイス115、ディスプレイの画面表示を制御する表示コントローラ116、タッチパネルセンサ122からタッチ検出信号が入力されるタッチパネルインターフェース117、マイクロホン13から入力されたアナログの音声データをディジタル音声データに変換するA/Dコンバータ118及びこのA/Dコンバータ118から出力されるディジタル音声データに基づいて音声認識を行う音声認識エンジン119が備えられている。そしてCPU111とROM112、RAM113、HDD114、通信インターフェイス115、表示コントローラ116、タッチパネルインターフェース117、音声認識エンジン119とはアドレスバス、データバスなどのバスラインで電気的に接続されている。
Next, FIG. 2 shows an internal configuration of the apparatus
続いて、音声入力手段はマイクロホン13を介して操作者の音声入力の開始から終了までの音声を取り込むものであり、後述する図9のステップST9−1からステップST9−4に相当する手段である。音声の取り込み方法はタッチパネルセンサ122の信号により図3の音声認識キー37がタッチ操作されたことを検知すると、CPU111は、A/D変換によりアナログ音声データからディジタル音声データに変換し、この変換された音声データを音声認識エンジン119に取り込ませる。なお、この音声データの取り込みはディスプレイ121上の音声認識キー37から指が離されてオフ操作されるまで継続される。そして、A/D変換が行われた後に雑音処理を行う。
Subsequently, the voice input means captures the voice from the start to the end of the operator's voice input via the
音声入力手段の雑音処理方法について述べる。雑音処理には、指向性マイクロホンを用いた遅延和法や予め音声パターンデータに雑音を含ませた音響辞書1134を用意して雑音処理を行うHMM合成法等があるが、本発明ではスペクトラムサブトラクション法(以下SS法)による雑音処理を用いている。
A noise processing method of the voice input means will be described. Noise processing includes a delay sum method using a directional microphone and an HMM synthesis method in which an
スペクトラムサブトラクション法(以下SS法)は、操作者が発声した音声に雑音が混入してできた音声データの振幅スペクトラムから雑音の振幅スペクトラムを差し引く、または雑音の混入した音声データのパワースペクトラムから雑音のパワースペクトラムを差し引くことによって雑音抑圧を実現するものである。なお、パワースペクトラムは振幅スペクトラムを2乗したものであってSS法による出力は、雑音の抑圧された振幅スペクトラムかパワースペクトラムである。ただし、本発明の実施の際における雑音処理はSS法に限定されるものではなく、雑音を処理して音声データを取り出せる手法であるならばよい。 The spectrum subtraction method (hereinafter referred to as SS method) is a method of subtracting the noise amplitude spectrum from the amplitude spectrum of the voice data produced by mixing noise into the voice uttered by the operator, or from the power spectrum of the voice data containing noise. Noise suppression is achieved by subtracting the power spectrum. The power spectrum is a square of the amplitude spectrum, and the output by the SS method is an amplitude spectrum or a power spectrum in which noise is suppressed. However, the noise processing in the implementation of the present invention is not limited to the SS method, and any method may be used as long as it can process the noise and extract voice data.
次に、音声認識手段は、CPU111が音声認識エンジン119を動作させることにより、音声認識キー37がオン操作されている期間中に取り込んだ音声の音声特徴量に基づいて、音響辞書1134を参照し一致若しくは類似する音声パターンデータを出力する手段である。なお、ここでの音声パターンデータとは後述する音響辞書1134から出力される音素パターン列のことを示す。具体的には、入力音を基にして線形予測分析を行って音声特徴量を求める。線形予測分析は入力音からスペクトル包絡を求める手法であり、発声メカニズムの声道特性を反映した一般に知られた音声特徴量抽出手法である(鹿野清宏(他4名)“音声認識システム”オーム社出版,第1版(2001年5月)P1〜P13参照)。予め作成された音声の音声特徴量と音声パターンを記憶する音響辞書1134を用い、音声認識手段は音声パターンデータを出力する。例えば、音声パターンデータの出力にはHMM法(中川聖一著 “確率モデルによる音声認識”電子情報通信学会P29〜P80参照)を用いる。
Next, the voice recognition unit refers to the
音声パターンデータ抽出手段1111は、音声認識手段により出力された音声パターンデータに基づいて商品カテゴリを商品カテゴリ候補として抽出を行う手段である。この手段により商品データを読み出すための候補が抽出され、後述する商品カテゴリ候補記憶手段1141に記憶される。
The voice pattern
CPU111は、この商品カテゴリ候補と対応して設定された商品データを、後述する商品カテゴリ・商品データ辞書1132から読み出す商品データ読み出し手段1113及び売上のあった商品データの入力処理または、登録処理等といった販売処理を行う商品販売データ処理手段1114を有している。
The
この商品データ読み出し手段1113によって読み出された商品データをディスプレイ121上に表示させる。ここで、ディスプレイ121に表示された商品販売処理画面38の一例を図3に示す。図示するように商品販売処理画面38には「0」〜「9」等のテンキー33の他、確認キー、取り消しキー等のタッチキー35が表示されている。また、商品販売処理画面38左上には商品、個数、値段を表示するテーブル31があり、さらに入力した数値を表示するテーブル32が設けられている。ここで、操作者がタッチパネル中の音声認識キー37を押しながら発話を行い、音声の取り込みを行う。音声の取り込みが終了した後、商品販売処理画面38中央に位置するテーブル36に認識された音声候補から得た商品データが表示される。この画面中央上方に位置する表示部34には操作者によって選択された商品データ項目が表示される。
The product data read by the product
次に、商品販売処理画面38上に商品カテゴリ候補が出力された一例について図4を用いて示す。本実施の形態では音声候補から得た商品データをディスプレイ121上に最大で10個程度出力をする。しかし、この形態に限定する必要は必ずしも無く、抽出された商品カテゴリ候補と対応して設定された全商品データを商品販売処理画面38上に出力させてもよいし、スクロール形式で商品データを順番に表示させてもよい。また、表示形式としては商品の名称のみを示してもよいし、名称と共に商品画像を同時に表示させてもよい。また、商品販売情報等の付加情報を加えてより詳細な商品情報を示した形で表示をさせてもよく、表示形式についてはこの実施の形態に限定するものではない。
Next, an example in which product category candidates are output on the product
次に、商品データ読み出し手段1113により読み出された商品データをディスプレイ121上に表示させる際に、商品が持つ情報を基に序列をつけて並べ替え処理を行うものが出力表示制御手段1161である。例えば、商品が選択入力された回数を商品データ情報とした場合は、選択入力が多く行われた商品の順に並べ替える。また、商品データ情報を商品価格とした場合は価格が高価な順に並び替える、といった一定の規則性を持たせて序列制御を行い、操作者の処理操作の便宜を図る形態にしてもよい。
Next, when displaying the product data read by the product
RAM113に記憶されている辞書について説明する。RAM113は商品カテゴリ・商品データ辞書1131、商品データ・商品文字列辞書1132、音声辞書1133、音響辞書1134を有している。図5に示す音響辞書1134は音声の音声特徴量と音声パターンデータと結びつけたものである。例えば、操作者が発話した言葉が「あんぱん」であった場合は、この音の音声特徴量ベクトルは図5の51のように示され、これに対応して音声パターンデータ52が「anpan」として関連付けて記憶されている。次に、図6に示す音声辞書1133には所定の語句を発話したときの音声の読みを記述した音声パターンデータ52が格納されている。この音声パターンデータ52は、ここでは各商品カテゴリについての読み方である。この音声パターンデータ52と商品カテゴリ61とは関連づけて記憶されており、この音声辞書1133によって入力された音声がどのような商品カテゴリ61であるかが認識される。
A dictionary stored in the
商品カテゴリ・商品データ辞書1131は、商品を識別する商品データと、さらにこの商品データと対応して設定された商品カテゴリを記憶する手段である。図7はこの商品カテゴリ・商品データ辞書1131に保存されているデータ内容を示したものである。同図には、データとして商品カテゴリ61、メニューコード72、商品データとしての商品名称73が記憶されており、同じ商品カテゴリ61に分類される商品名称73には同じ商品カテゴリ61が設定されている。この商品カテゴリ61を基に商品データ読み出し手段1113が同じ商品カテゴリ61として設定されている商品名称73を読み出す。ここで、商品データは商品名称73だけでなく、画像情報や販売情報などであってもよい。
The product category /
例えば、「つぶあんぱん」という商品名称73と対応する商品カテゴリ61として「あんぱん」を設定する。この際、商品データとして商品名称73と共に「つぶあんぱん」の画像情報を「あんぱん」の商品カテゴリ61に対応させて設定してもよい。また、商品カテゴリは商品の色彩、形状、模様といった外観の特徴によって分類分けをされていてもよい。例えば、パンの場合であるならば、「アンパン」、「食パン」といった一般的な商品名のカテゴリ以外に、「黒」、「白」等といった色彩のカテゴリ、「丸」、「四角形」、「三角形」等の形状のカテゴリ、「まだら」、「格子状」等の模様のカテゴリでもよい。これらの商品カテゴリ61は先に例示した分類区分に限定されることはなく、商品を分類できるものであるならばよい。なお、商品データ・商品文字列辞書1132については後述の第2の実施形態にて説明する。
For example, “Anpan” is set as the
なお、上述した辞書はRAM113以外にも商品販売データ処理装置内にあるHDD114に設けて、HDD114から音声パターンデータを読み出すようにしてもよいし、若しくはサーバ内に辞書を設けて電気通信回線を介してサーバからデータを読み出すようにしてもよい。
In addition to the
次に、HDD114は商品カテゴリ候補記憶手段1141及び商品文字列候補記憶手段1142、商品販売データ処理回数情報記憶手段1143を有している。商品カテゴリ候補記憶手段1141は音声パターンデータ抽出手段1111によって抽出された音声的に類似する商品カテゴリ候補を記憶する手段である。図8は商品カテゴリ候補記憶手段1141に記憶されているデータ内容を示したものであり、音声パターンデータ抽出手段1111によって抽出された商品カテゴリ候補がこの商品カテゴリ記憶候補エリア81に記憶される。また、商品販売データ処理回数情報記憶手段1143は、商品販売データ処理回数情報を記憶する手段である。この商品販売データ処理回数は例えば、単なる商品選択入力回数であってもよいし、売上登録回数であってもよく、商品販売処理回数に関するデータであるならばよい。これらの記憶手段は他の辞書・記憶手段と同様に電気通信回線上に設けてもよい。
Next, the
まず、電源オンにより商品販売データ処理装置が立ち上がり、CPU111は図3に示す商品販売処理時に音声認識を利用する商品販売処理画面38をディスプレイ121に表示する。この画面に移ると音声入力が開始され装置本体1に取り付けられているマイクロホン13から周囲の雑音の取り込みが開始される(ST9−1)。商品販売処理画面38上の音声認識キー37を押下しながら操作者が発話を行った場合は、操作者の音声の取り込みが行われる(ST9−2)。取り込まれた音声はマイクロホン13を介して取り込まれ、A/Dコンバータ118にてアナログ音声データからディジタル音声データへとA/D変換される(ST9−3)。A/D変換後のディジタル音声データはSS法により雑音処理が施され(ST9−4)、そのディジタル音声データに含まれている雑音が取り除かれる。
First, when the power is turned on, the merchandise sales data processing apparatus is activated, and the
なお、本実施の形態では、操作者の音声の取り込み時において音声認識の認識率の精度を高めるために音声入力の開始と終了を検知する入力区間検知手段1191を用いている。この手段は操作者が発話を開始すると同時に、この商品販売処理画面38上に表示されている音声認識キー37を押下すると、音声取得が開始される手段である。図3の音声認識キー37がタッチ操作されたことをタッチパネルセンサ122が検知すると、操作者により入力された音声はA/Dコンバータ118にてディジタル音声データに変換され、CPU111はこのディジタル音声データを音声認識エンジン119に取り込む(ST9−2)。このディジタル音声データの取り込みは音声認識キー37から指が離されてオフ操作されるまで継続される。そして、CPU111が音声認識キー37のオフ操作を検知すると、音声の取り込みが終了する。
In this embodiment, the input
音声取り込み終了後、音声認識エンジン119により音声認識キー37がオン操作されている期間中に取り込んだ音声の特徴を抽出し(ST9−5)、音響辞書1134を参照して入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致するか判断する(ST9−6)。予め作成された音声特徴量と一致もしくは類似しない場合(ST9−6でNO)は音声認識を終了し(ST9−17)、音声特徴量と一致もしくは類似した場合(ST9−6でYES)は、その音声特徴量に基づいて音響辞書1134内を参照し、一致もしくは類似した音声特徴量と関連付けられて記憶されている音声パターンデータを出力する(ST9−7)。
次に、出力された音声パターンデータに基づいて音声辞書1133を参照し、この音声パターンデータと関連付けて記憶されている商品カテゴリがあるかを判断する(ST9−8)。例えば、このとき音声認識手段により出力された音声パターンデータが「anpan」及び「anman」であったとすると、この音声パターンデータと音声辞書1133内に記憶されている音声パターンデータの比較を行う(ST9−8)。音声辞書1133内を参照し、出力された音声パターンデータが音声辞書1133内の音声パターンデータに存在しなかった場合(ST9−8のNO)は、音声認識を終了する(ST9−17)。あるいは、操作者に対して「別の商品カテゴリで音声入力して下さい。」という内容のエラーメッセージの表示や、警告音を発する等の警告を行う形態にしてもよい。一方で、ST9−8において音声認識手段により、出力された音声パターンデータが音声辞書1133内に存在する場合は、(ST9−8のYES)、音声パターンデータ抽出手段1111が音声認識手段によって出力された音声パターンデータに基づいて商品カテゴリの抽出を行う(ST9−9)。例えば、前述した「anpan」及び「anman」の音声パターンデータが、参照する音声辞書1133に予め記憶されていて一致した場合は、音声パターンデータ「anpan」、「anman」と関連づいている商品カテゴリ「あんぱん」、「あんまん」の2つの商品カテゴリが候補として音声パターンデータ抽出手段1111により抽出される。
After the completion of the voice acquisition, the voice features extracted during the period when the
Next, the
次に、ST9−9にて抽出された複数の商品カテゴリ候補を商品カテゴリ候補記憶手段1141に一時記憶する(ST9−10)。ここでは、図8の商品カテゴリ候補記憶手段1141のカテゴリ候補エリア81に抽出された「あんぱん」、「あんまん」等の商品カテゴリ候補が一時記憶されている。この商品カテゴリ候補記憶手段1141に一時記憶された候補をもとに、商品読み出し手段1113が商品データ・商品カテゴリ辞書1131からこの商品カテゴリと対応して設定されている商品データを読み出す(ST9−11)。さらに、CPU111は商品データを序列制御させる際に必要となる商品販売データ処理回数情報を取得させる(ST9−12)。
Next, the plurality of product category candidates extracted in ST9-9 are temporarily stored in the product category candidate storage unit 1141 (ST9-10). Here, product category candidates such as “Anpan” and “Anman” extracted in the
次に、出力表示制御手段1161がこの商品販売データ処理回数情報に基づいて商品データに序列をつけて所望の順序に並び替える(ST9−13)。例えば、販売処理回数の多い商品データを優先的に上から順に表示させる形態が考えられる。この場合、販売データ処理回数の多い商品データ順に表示されるため、販売処理を行う可能性が高いものから表示され、効率よく操作できる。このように商品データを適宜所望の順番に並び替えた後、ディスプレイ121に表示させる(ST9−14)。なお、出力表示制御手段1161によって序列制御するための情報は商品販売データ処理回数情報に限られることはなく、例えば商品名称の50音順や、商品価格順、人気のある商品順、お奨め商品順等であってもよい。図4のように商品は中央の表示ディスプレイ36に商品データが表示される。このときの商品データの表示方法として、予め出力表示させる商品データ数を限定して表示させてもよいし、一度に全てを表示させスクロール形式にして選択可能に表示させてもよい。また、商品の名称のみを表示するだけでなく商品データの画像又は価格、売上点数等の販売情報も商品名称73と共に同時に表示させてもよい。
Next, the output display control means 1161 ranks the product data based on the product sales data processing count information and rearranges it in a desired order (ST9-13). For example, a form in which product data with a large number of sales processes is preferentially displayed in order from the top is conceivable. In this case, since the items are displayed in order of product data with the largest number of sales data processing times, the items are displayed in descending order of possibility of performing the sales processing, and can be operated efficiently. In this way, the product data is appropriately rearranged in a desired order, and then displayed on the display 121 (ST9-14). Note that the information for order control by the output display control means 1161 is not limited to product sales data processing count information. For example, the order of the product name in alphabetical order, product price order, popular product order, recommended product, etc. It may be in order. As shown in FIG. 4, the product data is displayed on the
次に、ディスプレイ121上に表示された商品データから操作者が所望のものを選択する(ST9−15)。商品データが選択された後、CPU111は商品データを販売処理し(ST9−16)、以上の操作により販売処理は終了となる(ST9−17)。
Next, the operator selects a desired item from the product data displayed on the display 121 (ST9-15). After the merchandise data is selected, the
このように本実施の形態によれば商品名や商品の外観から連想される商品カテゴリを音声入力すると、音声的に類似する複数の商品カテゴリ候補が抽出される。この商品カテゴリ候補は各商品データと対応して設定されており、複数の商品カテゴリ候補が抽出されることから音声認識時に誤認識があった場合においても、商品データの抽出漏れを防ぐことができる。また、正式な商品名を発話することなく販売処理を行うことが可能となるため操作者の負担が軽減する。さらに、ディスプレイ121上に出力表示をする際、商品販売データ処理回数情報に基づいて序列制御が行われ操作者にとって所望の形態で表示されるため、販売処理操作に不慣れな者や初心者でも容易に販売処理操作を行うことができる効果を奏する。また、音声入力のみで所望する商品候補が商品販売処理画面38に出力表示されることにより、販売処理に伴うタッチ操作を行う回数が減り、誤操作の防止を図ることができ、なおかつ入力作業時間を短縮することができるため素早く販売処理を行う効果を奏する。
As described above, according to the present embodiment, when a product category associated with the product name or the appearance of the product is input by voice, a plurality of product category candidates similar in terms of speech are extracted. This product category candidate is set corresponding to each product data, and since a plurality of product category candidates are extracted, it is possible to prevent omission of product data extraction even when there is a misrecognition during voice recognition. . In addition, since the sales process can be performed without speaking the official product name, the burden on the operator is reduced. Furthermore, when output is displayed on the
次に、第2の実施形態として音声認識を用いた商品文字列の一致又は類似による検索を商品販売データ処理装置に適用した場合について図10〜図12を用いて説明する。なお、第1の実施の形態と同じ構成要素には同一の番号を付して詳細な説明を省略する。 Next, as a second embodiment, a case where a search based on matching or similarity of product character strings using speech recognition is applied to a product sales data processing apparatus will be described with reference to FIGS. The same constituent elements as those in the first embodiment are denoted by the same reference numerals, and detailed description thereof is omitted.
まず初めに第2の実施形態の図6に示す音声辞書1133には所定の語句を発話したときの音声の特徴量を数値化した標準的な音声パターンデータが予め格納されている。この音声パターンデータは各商品名の文字列についての音声データであり、この音声辞書1133を用いて入力音声がどのような商品文字列であるかが認識される。
First, in the
商品データ・商品文字列辞書1132は、商品データと音声辞書1133に記憶されている商品データとしての商品名称の商品文字列とを関連付けて記憶する記憶手段である。この商品データ・商品文字列辞書1132のデータ内容について図10を用いて示す。このテーブルには商品データ1002とその商品データ1002と対応して設定されている商品文字列1001が記憶されている。ここでいう商品文字列とは商品データとしての商品名称の一部あるいは全部を構成する文字列のことである。この辞書に記憶されているデータとして、商品名の文字列が商品文字列エリア1001に記憶されており、次に個々の商品データ1002に割り当て設定されている商品コード1003がメニューコードエリアに記憶され、音声認識されてディスプレイ121に出力表示される商品名称73が商品名称エリアに設定されている。ここでは「食パン8枚」という商品名称73に対して「しょ」、「しょく」、「しょくぱ」、「しょくぱん」、「しょくぱんは」等の商品名称73の商品文字列が設定されており、例えば操作者が「食パン8枚」と音声で入力して「しょくぱんはち」と認識された時は「食パン8枚」が候補として該当する。また、「しょくぱん」と認識された場合は「食パン8枚」の商品名称73の他に、同様の商品文字列「しょくぱん」に対応して設定されている商品名称「食パン6枚」も候補として該当する。
The product data / product
音声パターンデータ抽出手段1111は音声認識手段により出力された音声パターンデータに基づいて音声辞書1133に記憶されている商品文字列の音声パターンデータを参照し、商品文字列の商品文字列候補を抽出する手段である。この音声パターンデータ抽出手段1111は前方一致する商品文字列の音声パターンデータを持つ商品文字列候補のみを抽出対象とするわけではなく中間、後方一致する商品文字列の音声パターンデータを持つ商品文字列候補について抽出を行ってもよい。次に、この音声パターンデータ抽出手段1111によって抽出された商品文字列候補を記憶する手段として商品文字列候補記憶手段1142がある。
The voice pattern
次に、図11は商品文字列候補記憶手段1142に記憶された商品文字列候補について示したものである。音声パターンデータ抽出手段1111により抽出された商品文字列は商品文字列候補記憶手段1142の商品文字列候補エリア1101に記憶される。続いて、商品データ読み出し手段1113が商品文字列候補記憶手段1142に記憶されている商品文字列に基づいて、この商品文字列と対応して設定されている商品文字列候補を読み出す。この記憶手段は他の辞書及び記憶手段と同様にHDD114内に設けてもよいし、サーバ内に設けてもよい。
Next, FIG. 11 shows the product character string candidates stored in the product character string
第2の実施形態の操作処理について図12を用いて説明する。第2の実施形態はST12−1〜ST12−7までは第1の実施形態のST9−1〜ST9−7と同様の処理が行われる。電源オンにより、商品販売データ処理装置が立ち上がり、CPU111は商品販売処理画面38を表示させると図3に示す音声認識を用いた商品販売処理画面38が表示される(ST12−1)。この画面の状態で、マイクロホン13から周囲の雑音の取り込み、及び音声認識キー37のオン・オフ操作により操作者が発話する音声の取り込み開始・終了が行われるが開始される(ST12−2)。そして、取り込まれたこの音声は、A/Dコンバータ118にてアナログ音声データからディジタル音声データへとA/D変換される(ST12−3)。A/D変換後のディジタル音声データはSS法により雑音処理が施される(ST12−4)。その後、CPU111が音声認識エンジン119を実行させて取り込んだ音声パターンデータの特徴抽出を行う(ST12−5)。ここで、音声辞書1133には商品名と商品文字列の音声パターンデータが関連付けて記憶されているため、ST12−2における音声データの取り込みに関して、操作者は音声入力を商品名の全部で行ってもよいし、又は商品名の一部で行ってもよい。
The operation process of the second embodiment will be described with reference to FIG. In the second embodiment, the same processes as ST9-1 to ST9-7 in the first embodiment are performed from ST12-1 to ST12-7. When the power is turned on, the merchandise sales data processing apparatus is activated, and when the
次に、入力された音声の音声特徴量と予め作成された音声特徴量を比較し一致するか判断する(ST12−6)。予め作成された音声特徴量と一致もしくは類似しない場合(ST12−6のNO)は音声認識を終了し(ST12−17)、音声特徴量と一致もしくは類似した場合(ST12−6でYES)は一致もしくは類似した音声特徴量に基づいて音響辞書内を参照し、この音声特徴量と関連付けられて記憶されている音声パターンデータを出力する(ST12−7)。
次に、出力された音声パターンデータに基づいて音声辞書1133を参照し、この音声パターンデータと関連付けて記憶されている商品文字列があるかを判断する(ST12−8)。出力された音声パターンデータと関連付けて記憶された商品文字列が存在しない場合(ST12−8のNO)は、音声認識を終了する(ST12−17)。あるいは、操作者に対して「別の商品文字列で音声入力して下さい。」という内容のエラーメッセージの表示や警告音を発する等の警告を行う形態にしてもよい。一方、出力された音声パターンデータと関連付けて記憶された商品文字列候補がある場合は(ST12−8のYES)、音声パターンデータ抽出手段1111が音声認識手段によって出力された音声パターンデータに基づいて商品文字列の抽出を行う(ST12−9)。例えば、操作者が入力した音声が「食パン」として、音声認識エンジン119により一致若しくは類似するとして出力された音声パターンデータが「shokupan」、「shoku」、「choco」とすると、これらの音声パターンデータと関連付けて記憶された「しょくぱん」、「しょく」、「ちょこ」といった商品文字列が音声パターンデータ抽出手段1111により抽出される。
Next, the voice feature quantity of the input voice is compared with the voice feature quantity created in advance to determine whether they match (ST12-6). If it does not match or resembles a previously created speech feature (NO in ST12-6), speech recognition ends (ST12-17), and if it matches or resembles a speech feature (YES in ST12-6) Or, referring to the inside of the acoustic dictionary based on the similar voice feature quantity, the voice pattern data stored in association with the voice feature quantity is output (ST12-7).
Next, the
次に、ST12−9にて抽出された商品文字列候補を商品文字列候補記憶手段1142に一時記憶する(ST12−10)。このとき、商品文字列候補は図11の商品文字列候補記憶エリア1101に記憶されている。この一時記憶された商品文字列候補をもとに、商品読み出し手段1113が商品データ・商品文字列記憶手段1132から商品文字列候補と対応して設定されている商品データを読み出す(ST12−11)。さらに読み出した商品データに関する商品販売データ処理回数情報を取得する(ST12−12)。ここで、商品販売情報は商品販売データ処理回数に関するものであるならばよい。
Next, the product character string candidates extracted in ST12-9 are temporarily stored in the product character string candidate storage unit 1142 (ST12-10). At this time, the product character string candidates are stored in the product character string
次に、CPU111はこの商品販売データ処理回数情報に基づいて出力表示制御手段1161を用いて序列をつけて所望の順序に商品データを並び替える(ST12−13)。例えば、販売処理回数の多い商品データを優先的に上から順に表示する形態が考えられる。このように商品データを適宜所望の順番に並び替えた後、ディスプレイ121に表示させる(ST12−14)。このときの表示方法として、予め出力表示させる商品データ数を限定して表示させてもよいし、また一度に全ての商品名を表示させスクロール形式にして選択可能に表示させてもよい。また、商品の名称のみを表示するだけでなく商品データの画像又は価格、売上点数等の販売情報も同時に表示させてもよい。
Next, the
次にディスプレイ121上に表示された商品データから所望の商品データを操作者が選択する(ST12−15)。選択された後、CPU111は商品データを販売処理し(ST12−16)、以上の操作により販売処理は終了となる(ST12−17)。なお、第1の実施形態のカテゴリ検索機能と第2の実施形態の商品文字列検索機能は別々に実施する必要はなく、この二つの実施形態を組み合わせて実施を行ってもよい。
Next, the operator selects desired product data from the product data displayed on the display 121 (ST12-15). After the selection, the
本発明の第2の実施形態によれば、商品名の一部を音声入力することで商品データが商品販売処理画面38上に出力されるため、商品名称73を正確に覚えていない状態でも操作を行うことができる。このように音声認識によって商品販売処理が行われるので処理操作に不慣れな操作者であっても容易に処理を行うことができる効果を奏する。また、商品名の一部あるいは全部を音声入力した際に、誤認識されたとしても音声的に類似した商品データが出力されるので商品データの抽出漏れを防ぐことができる。また、商品文字列の前方一致、中間一致、後方一致による商品データの抽出、出力表示が可能であることから操作者は商品名がうろ覚えの状態であっても販売処理を行うことが可能であり、商品名称を正しく入力する必要がないため販売処理に伴う負担を軽減することができる。
According to the second embodiment of the present invention, since the product data is output on the product
第3の実施形態として、音声認識を用いた商品データ入力装置について説明する。なお、第1、2の実施形態と同じ構成要素には同一の番号を付して詳細な説明を省略する。 As a third embodiment, a product data input device using voice recognition will be described. In addition, the same number is attached | subjected to the same component as 1st, 2 embodiment, and detailed description is abbreviate | omitted.
入力処理手段1112は、音声入力により出力表示された商品データの中から任意の商品データが選択された場合にその入力処理を行う手段である。この入力処理手段1112により入力された商品データの入力回数を記憶する手段が入力回数情報記憶手段1144である。第1の実施形態の商品販売データ処理装置は入力・登録などの処理を実行するが、第3の実施形態の商品データ入力装置は入力処理のみを実行する装置であり、この点で第1の実施形態と異なる。 The input processing means 1112 is a means for performing input processing when arbitrary product data is selected from product data output and displayed by voice input. A means for storing the number of times the product data is input by the input processing means 1112 is an input number information storage means 1144. The merchandise sales data processing apparatus of the first embodiment executes processes such as input / registration, but the merchandise data input apparatus of the third embodiment is an apparatus that executes only the input process. Different from the embodiment.
次に図13を用いて商品データ入力処理のフローチャートについて説明を行う。本実施形態のST13−1からST13−5に該当する音声入力処理から音声候補の抽出までの処理は、第1の実施形態のST9−1からST9−5の処理と同様である。また、ST13−6からST13−11までの商品カテゴリ候補を抽出する処理から抽出された商品カテゴリ候補を基に商品データをディスプレイ121上に出力・表示する処理は、第1の実施形態ST9−6からST9−11の処理と同様の手順で行う。本実施形態では商品カテゴリを音声により入力し、入力された音声の音声特徴量に基づいて音響辞書1134を参照する。そして一致もしくは類似する音声パターンデータを音声認識手段が出力する。この音声パターンデータに基づいて音声辞書1133を参照し、商品カテゴリを音声パターンデータ抽出手段1111が抽出する。抽出された商品カテゴリ候補と対応して設定されている商品データを商品カテゴリ・商品データ辞書1131から商品データ読み出し手段1113によって読み出す(ST13−1〜ST13−12)。読み出された商品データはディスプレイ121上に表示される。次に表示されている商品データに対して操作者が選択入力を行い、入力処理手段1112にて入力処理が行われ(ST13−13)、入力処理が終了される(ST13−14)。
Next, a flowchart of the product data input process will be described with reference to FIG. The processing from the speech input processing corresponding to ST13-1 to ST13-5 of this embodiment to the extraction of speech candidates is the same as the processing of ST9-1 to ST9-5 of the first embodiment. Further, the process of outputting / displaying the product data on the
本発明の第3の実施形態によれば、商品カテゴリを音声入力すると音声的に類似する商品カテゴリ候補が複数抽出される。このように複数の商品カテゴリ候補が抽出されることによって商品カテゴリ候補と対応して設定されている商品データを漏れなく表示することができる効果を奏する。また、商品データをディスプレイ121に出力表示する際は、適宜、序列制御された状態で行われるため、操作者は迅速に入力処理を行うことができる。また、その他の序列制御による効果として入力処理を行う可能性が高い商品データが優先的に表示されるので、入力処理操作回数が減少し入力処理に伴う入力ミスを防ぐことができる。
According to the third embodiment of the present invention, when a product category is input by voice, a plurality of similar product category candidates are extracted. By extracting a plurality of product category candidates in this way, there is an effect that product data set corresponding to the product category candidates can be displayed without omission. Further, when the product data is output and displayed on the
次に、第4の実施形態について説明する。なお、第1、2、3の実施形態と同じ構成要素には同一の番号を付して詳細な説明を省略する。第4の実施形態は音声により商品名の一部を入力し、その商品名の商品文字列の一致もしくは類似する商品文字列候補を抽出する。この抽出した商品文字列候補を基に商品データの抽出を行い、それを出力表示する商品データ入力装置である。 Next, a fourth embodiment will be described. In addition, the same number is attached | subjected to the same component as 1st, 2nd, 3rd embodiment, and detailed description is abbreviate | omitted. In the fourth embodiment, a part of a product name is input by voice, and a product character string candidate that matches or is similar to the product character string of the product name is extracted. This is a product data input device that extracts product data based on the extracted product character string candidates and outputs and displays it.
図14を用いて第4の実施形態の処理を説明する。ST14−1からST14−11は第2の実施例と同様の処理を行う。本実施の形態では商品名を音声により入力し、商品名の商品文字列音声データと一致若しくは類似する商品文字列候補を抽出する。この商品文字列候補と対応して設定されている商品データを商品データ読み出し手段1113によって読み出す(ST14−12)。読み出された商品データはディスプレイ121上に表示され、表示されている商品データに対して操作者が選択入力を行い、入力処理手段1112にて入力処理が行われる(ST14−13)。
The process of the fourth embodiment will be described with reference to FIG. ST14-1 to ST14-11 perform the same processing as in the second embodiment. In this embodiment, a product name is inputted by voice, and product character string candidates that match or are similar to the product character string voice data of the product name are extracted. The product data set corresponding to the product character string candidate is read by the product data reading means 1113 (ST14-12). The read product data is displayed on the
本実施の形態によれば、商品名の一部を音声入力することにより商品名の文字列候補を基に商品データ候補がディスプレイ121上に出力される。このため、入力処理が不慣れであり、正式な商品名を記憶していない操作者が装置を操作した場合も容易に素早く入力処理を行うことができる。また、入力処理を行う可能性が高い商品データが優先的に表示されるため、入力処理に伴う入力ミスを防ぐことができる。このような効果から不慣れな操作者の入力操作の支援を行うことができる効果を奏する。
According to the present embodiment, by inputting a part of the product name by voice, the product data candidate is output on the
なお、本発明は、上述した実施の形態がそのまま限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化でき、また、実施の形態に開示されている複数の構成要素の適宜な組み合わせにより種々の発明を変形できるものである。 The present invention is not limited to the above-described embodiment as it is, and can be embodied by modifying constituent elements without departing from the scope of the invention in the implementation stage, and is disclosed in the embodiment. Various inventions can be modified by appropriately combining a plurality of components.
1111 音声パターンデータ抽出手段
1112 入力処理手段
1113 商品データ読み出し手段
1114 商品販売データ処理手段
1131 商品カテゴリ・商品データ辞書
1132 商品データ・商品文字列辞書
1133 音声辞書
1134 音響辞書
1141 商品カテゴリ候補記憶手段
1142 商品文字列候補記憶手段
1143 商品販売データ処理回数情報記憶手段
1144 入力回数情報記憶手段
12 出力表示手段
1111 Voice pattern
12 Output display means
Claims (8)
前記音声パターンデータと商品文字列を関連付けて記憶した音声辞書と、
少なくとも商品名称を含んで商品を識別する商品データ、及び、この商品データと対応して設定されるとともに、前記商品名称の一部あるいは全部を構成する文字列から構成された前記商品文字列を記憶した商品データ・商品文字列辞書と、
音声を入力する音声入力手段と、
前記音響辞書を参照して、前記音声入力手段により入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致若しくは類似した音声特徴量と関連付けられて記憶された前記音声パターンデータを出力する音声認識手段と、
前記音声辞書を参照して、前記音声認識手段により出力された前記音声パターンデータに基づいて前記商品文字列を候補として抽出する音声パターンデータ抽出手段と、
前記音声パターンデータ抽出手段により抽出された前記商品文字列を商品文字列候補として記憶する商品文字列候補記憶手段と、
前記商品文字列候補と対応して設定された前記商品データを前記商品データ・商品文字列辞書から読み出す商品データ読み出し手段と、
前記商品データ読み出し手段により読み出された前記商品データを出力表示する出力表示手段と、
前記出力表示手段により出力表示された前記商品データの中から任意の前記商品データが選択されると、商品販売データ処理を行う商品販売データ処理手段と、を備えた商品販売データ処理装置であって、
前記商品データ・商品文字列辞書には、同一の商品データに対して、複数の商品文字列が設定され、
前記同一の商品データに対応して設定された前記複数の商品文字列は、
前記商品名称のうち最初の1文字を有する第一の商品文字列と、
この第一の商品文字列を全て含むとともに更に文字数が多く、前記商品名称の全ての文字列を有する第二の商品文字列と、
前記第一の商品文字列の文字数と前記第二の商品文字列の文字数との間であって、且つ、前記第一の文字列の文字数に対し連続して1文字ずつ文字数が増加する第三の商品文字列郡と、を含む
ことを特徴とする商品販売データ処理装置。 An acoustic dictionary that stores voice feature data and voice pattern data created in advance in association with each other;
A voice dictionary storing the voice pattern data and product character strings in association with each other;
Product data for identifying a product including at least a product name, and the product character string that is set in correspondence with the product data and that is composed of a character string that forms part or all of the product name Product data / product string dictionary,
Voice input means for inputting voice;
The speech pattern stored in association with the matched or similar speech feature amount by comparing the speech feature amount of the speech input by the speech input unit with a previously created speech feature amount with reference to the acoustic dictionary Voice recognition means for outputting data;
Voice pattern data extracting means for referring to the voice dictionary and extracting the product character string as a candidate based on the voice pattern data output by the voice recognition means;
Commodity character string candidate storage means for storing the commodity character string extracted by the voice pattern data extraction means as a commodity character string candidate;
Commodity data reading means for reading out the commodity data set corresponding to the commodity character string candidate from the commodity data / commodity character string dictionary;
Output display means for outputting and displaying the product data read by the product data reading means;
A product sales data processing device comprising: product sales data processing means for performing product sales data processing when any product data is selected from the product data output and displayed by the output display means. ,
In the product data / product character string dictionary , a plurality of product character strings are set for the same product data,
The plurality of product character strings set corresponding to the same product data are:
A first product string having the first one of the product names ;
Furthermore the number of characters rather multi with including all the first product string, a second product string with all strings of the product name,
A third number of characters that is between the number of characters of the first product character string and the number of characters of the second product character string and that is successively increased by one character from the number of characters of the first character string. A product sales data processing apparatus characterized by including:
を備えることを特徴とする請求項1に記載の商品販売データ処理装置。 The product sales data processing device includes: output display control means for performing output control and displaying the product data read by the product data reading means;
The merchandise sales data processing apparatus according to claim 1, further comprising:
前記出力表示制御手段が前記商品販売データ処理回数情報記憶手段に記憶された前記商品販売データ処理回数情報に基づいて前記商品データの序列制御して出力表示すること、
を特徴とする請求項2に記載の商品販売データ処理装置。 The product sales data processing means includes product sales data processing frequency information storage means for storing the number of times product sales data processing has been performed on the product data.
The output display control means controls the order of the product data based on the product sales data processing count information stored in the product sales data processing count information storage means, and outputs and displays it.
The merchandise sales data processing apparatus according to claim 2 .
前記音声パターンデータと商品文字列を関連付けて記憶した音声辞書と、
少なくとも商品名称を含んで商品を識別する商品データ、及び、この商品データと対応して設定されるとともに、前記商品名称の一部あるいは全部を構成する文字列から構成された前記商品文字列を記憶した商品データ・商品文字列辞書と、
音声を入力する音声入力手段と、
前記音響辞書を参照して、前記音声入力手段により入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致若しくは類似した音声特徴量と関連付けられて記憶された前記音声パターンデータを出力する音声認識手段と、
前記音声辞書を参照して、前記音声認識手段により出力された前記音声パターンデータに基づいて前記商品文字列を候補として抽出する音声パターンデータ抽出手段と、
前記音声パターンデータ抽出手段により抽出された前記商品文字列を商品文字列候補として記憶する商品文字列候補記憶手段と、
前記商品文字列候補と対応して設定された前記商品データを前記商品データ・商品文字列辞書から読み出す商品データ読み出し手段と、
前記商品データ読み出し手段により読み出された前記商品データを出力表示する出力表示手段と、
前記出力表示手段により出力された複数の前記商品データの中から任意の前記商品データが選択されると、入力処理を行う入力処理手段と、
を備えた商品販売データ入力装置であって、
前記商品データ・商品文字列辞書には、同一の商品データに対して、複数の商品文字列が設定され、
前記同一の商品データに対応して設定された前記複数の商品文字列は、
前記商品名称のうち最初の1文字を有する第一の商品文字列と、
この第一の商品文字列を全て含むとともに更に文字数が多く、前記商品名称の全ての文字列を有する第二の商品文字列と、
前記第一の商品文字列の文字数と前記第二の商品文字列の文字数との間であって、且つ、前記第一の文字列の文字数に対し連続して1文字ずつ文字数が増加する第三の商品文字列郡と、を含む
ことを特徴とする商品データ入力装置。 An acoustic dictionary that stores voice feature data and voice pattern data created in advance in association with each other;
A voice dictionary storing the voice pattern data and product character strings in association with each other;
Product data for identifying a product including at least a product name, and the product character string that is set in correspondence with the product data and that is composed of a character string that forms part or all of the product name Product data / product string dictionary,
Voice input means for inputting voice;
The speech pattern stored in association with the matched or similar speech feature amount by comparing the speech feature amount of the speech input by the speech input unit with a previously created speech feature amount with reference to the acoustic dictionary Voice recognition means for outputting data;
Voice pattern data extracting means for referring to the voice dictionary and extracting the product character string as a candidate based on the voice pattern data output by the voice recognition means;
Commodity character string candidate storage means for storing the commodity character string extracted by the voice pattern data extraction means as a commodity character string candidate;
Commodity data reading means for reading out the commodity data set corresponding to the commodity character string candidate from the commodity data / commodity character string dictionary;
Output display means for outputting and displaying the product data read by the product data reading means;
When any product data is selected from the plurality of product data output by the output display means, input processing means for performing input processing;
A product sales data input device comprising:
In the product data / product character string dictionary , a plurality of product character strings are set for the same product data,
The plurality of product character strings set corresponding to the same product data are:
A first product string having the first one of the product names ;
Furthermore the number of characters rather multi with including all the first product string, a second product string with all strings of the product name,
A third number of characters that is between the number of characters of the first product character string and the number of characters of the second product character string and that is successively increased by one character from the number of characters of the first character string. A product data input device, comprising:
を備えることを特徴とする請求項4に記載の商品データ入力装置。 The product data input device includes output display control means for performing output display by orderly controlling the product data read by the product data reading means,
The product data input device according to claim 4 , further comprising:
前記出力表示制御手段が前記入力回数記憶手段に記憶された入力回数情報に基づいて前記商品データの序列制御を行い表示すること、
を特徴とする請求項5に記載の商品データ入力装置。 The input data processing means has input number information storage means for storing the number of times of input of the selected product data. The product data is based on the input number information stored in the input number storage means by the output display control means. Display and control the order of
The product data input device according to claim 5 .
前記音声パターンデータと商品文字列を関連付けて記憶した音声辞書と、
少なくとも商品名称を含んで商品を識別する商品データ、及び、この商品データと対応して設定されるとともに、前記商品名称の一部あるいは全部を構成する文字列から構成された前記商品文字列を記憶した商品データ・商品文字列辞書とを備えた商品販売データ処理装置に、音声を入力する音声入力機能と、
前記音響辞書を参照して、前記音声入力手段により入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致若しくは類似した音声特徴量と関連付けられて記憶された前記音声パターンデータを出力する音声認識機能と、
出力された前記音声パターンデータに基づいて前記音声辞書を参照し、前記商品文字列を候補として抽出する商品文字列抽出機能と、
候補として抽出された前記商品文字列を記憶する商品文字列記憶機能と、
記憶された前記商品文字列と対応して設定された前記商品データを、前記商品データ・商品文字列辞書から読み出す商品データ読み出し機能と、
読み出された前記商品データを出力表示する出力表示機能と、
前記出力表示された複数の前記商品データの中から任意の前記商品データが選択されると、商品販売データを処理する商品販売データ処理機能と、
を実現させるためのプログラムであって、
前記商品データ・商品文字列辞書には、同一の商品データに対して、複数の商品文字列が設定され、
前記同一の商品データに対応して設定された前記複数の商品文字列は、
前記商品名称のうち最初の1文字を有する第一の商品文字列と、
この第一の商品文字列を全て含むとともに更に文字数が多く、前記商品名称の全ての文字列を有する第二の商品文字列と、
前記第一の商品文字列の文字数と前記第二の商品文字列の文字数との間であって、且つ、前記第一の文字列の文字数に対し連続して1文字ずつ文字数が増加する第三の商品文字列郡と、を含む
ことを特徴とするプログラム。 An acoustic dictionary that stores voice feature data and voice pattern data created in advance in association with each other;
A voice dictionary storing the voice pattern data and product character strings in association with each other;
Product data for identifying a product including at least a product name, and the product character string that is set in correspondence with the product data and that is composed of a character string that forms part or all of the product name A voice input function for inputting voice to a merchandise sales data processing apparatus equipped with the merchandise data / character string dictionary;
The speech pattern stored in association with the matched or similar speech feature amount by comparing the speech feature amount of the speech input by the speech input unit with a previously created speech feature amount with reference to the acoustic dictionary Voice recognition function to output data,
A product character string extraction function for referring to the voice dictionary based on the output voice pattern data and extracting the product character string as a candidate;
A product character string storage function for storing the product character string extracted as a candidate;
A product data read function for reading the product data set corresponding to the stored product character string from the product data / product character string dictionary;
An output display function for outputting and displaying the read product data;
A product sales data processing function for processing product sales data when any of the product data is selected from the plurality of product data output and displayed;
Is a program for realizing
In the product data / product character string dictionary , a plurality of product character strings are set for the same product data,
The plurality of product character strings set corresponding to the same product data are:
A first product string having the first one of the product names ;
Furthermore the number of characters rather multi with including all the first product string, a second product string with all strings of the product name,
A third number of characters that is between the number of characters of the first product character string and the number of characters of the second product character string and that is successively increased by one character from the number of characters of the first character string. A program characterized by including a product string group .
前記音声パターンデータと商品文字列を関連付けて記憶した音声辞書と、
少なくとも商品名称を含んで商品を識別する商品データ及びこの商品データと対応して設定されるとともに、前記商品名称の一部あるいは全部を構成する文字列から構成された前記商品文字列を記憶した商品データ・商品文字列辞書とを備えた商品データ入力装置に、音声を入力する音声入力機能と、
前記音響辞書を参照して、前記音声入力手段により入力された音声の音声特徴量と予め作成された音声特徴量を比較し、一致若しくは類似した音声特徴量と関連付けられて記憶された音声パターンデータを出力する音声認識機能と、
出力された前記音声パターンデータに基づいて前記音声辞書を参照し、前記商品文字列を候補として抽出する商品文字列抽出機能と、
候補として抽出された前記商品文字列を記憶する商品文字列記憶機能と、
記憶された前記商品文字列と対応して設定された前記商品データを、前記商品データ・商品文字列辞書から読み出す商品データ読み出し機能と、
読み出された前記商品データを出力表示する出力表示機能と、
出力された複数の前記商品データの中から任意の前記商品データが選択されると、入力処理を行う入力処理機能と、
を実現させるためのプログラムであって、
前記商品データ・商品文字列辞書には、同一の商品データに対して、複数の商品文字列が設定され、
前記同一の商品データに対応して設定された前記複数の商品文字列は、
前記商品名称のうち最初の1文字を有する第一の商品文字列と、
この第一の商品文字列を全て含むとともに更に文字数が多く、前記商品名称の全ての文字列を有する第二の商品文字列と、
前記第一の商品文字列の文字数と前記第二の商品文字列の文字数との間であって、且つ、前記第一の文字列の文字数に対し連続して1文字ずつ文字数が増加する第三の商品文字列郡と、を含む
ことを特徴とするプログラム。 An acoustic dictionary that stores voice feature data and voice pattern data created in advance in association with each other;
A voice dictionary storing the voice pattern data and product character strings in association with each other;
Product data that is set corresponding to product data including at least the product name and product data, and stores the product character string composed of character strings that constitute part or all of the product name A voice input function for inputting voice to a product data input device equipped with a data / product character string dictionary;
Refer to the acoustic dictionary, compare the voice feature quantity of the voice input by the voice input means with a voice feature quantity created in advance, and store voice pattern data associated with the matched or similar voice feature quantity Voice recognition function that outputs
A product character string extraction function for referring to the voice dictionary based on the output voice pattern data and extracting the product character string as a candidate;
A product character string storage function for storing the product character string extracted as a candidate;
A product data read function for reading the product data set corresponding to the stored product character string from the product data / product character string dictionary;
An output display function for outputting and displaying the read product data;
An input processing function for performing input processing when any of the product data is selected from the plurality of output product data;
Is a program for realizing
In the product data / product character string dictionary , a plurality of product character strings are set for the same product data,
The plurality of product character strings set corresponding to the same product data are:
A first product string having the first one of the product names ;
Furthermore the number of characters rather multi with including all the first product string, a second product string with all strings of the product name,
A third number of characters that is between the number of characters of the first product character string and the number of characters of the second product character string and that is successively increased by one character from the number of characters of the first character string. A program characterized by including a product string group .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008000892A JP5015806B2 (en) | 2008-01-08 | 2008-01-08 | Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008000892A JP5015806B2 (en) | 2008-01-08 | 2008-01-08 | Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009163528A JP2009163528A (en) | 2009-07-23 |
JP5015806B2 true JP5015806B2 (en) | 2012-08-29 |
Family
ID=40966069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008000892A Expired - Fee Related JP5015806B2 (en) | 2008-01-08 | 2008-01-08 | Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5015806B2 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6223713B2 (en) * | 2013-05-27 | 2017-11-01 | 株式会社東芝 | Electronic device, method and program |
JP6483433B2 (en) * | 2014-12-25 | 2019-03-13 | Dynabook株式会社 | System and electronic equipment |
JP6004502B2 (en) * | 2015-02-24 | 2016-10-12 | Necプラットフォームズ株式会社 | POS terminal, product information registration method, and product information registration program |
JP6868893B2 (en) * | 2017-02-14 | 2021-05-12 | 株式会社寺岡精工 | Label issuing device |
JP7115259B2 (en) * | 2018-11-30 | 2022-08-09 | コニカミノルタ株式会社 | Image forming apparatus and program |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01147325A (en) * | 1987-12-03 | 1989-06-09 | Tokyo Electric Co Ltd | Electronic charge scale |
JP2001034286A (en) * | 1999-07-22 | 2001-02-09 | Ishida Co Ltd | Article processing system |
JP2001221679A (en) * | 2000-02-08 | 2001-08-17 | Ishida Co Ltd | Commodity processor |
JP4755918B2 (en) * | 2006-02-22 | 2011-08-24 | 東芝テック株式会社 | Data input device and method, and program |
-
2008
- 2008-01-08 JP JP2008000892A patent/JP5015806B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009163528A (en) | 2009-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109493850B (en) | Growing type dialogue device | |
US9239829B2 (en) | Speech recognition device | |
US20020123894A1 (en) | Processing speech recognition errors in an embedded speech recognition system | |
US20080255835A1 (en) | User directed adaptation of spoken language grammer | |
JP3476007B2 (en) | Recognition word registration method, speech recognition method, speech recognition device, storage medium storing software product for registration of recognition word, storage medium storing software product for speech recognition | |
JP5015806B2 (en) | Merchandise sales data processing apparatus and program thereof, and merchandise data input apparatus and program thereof | |
JP2007256836A (en) | Voice recognition apparatus, voice recognition method and voice recognition program | |
JP2005055782A (en) | Data input system, handy terminal, data input method, program, and recording medium | |
WO2006054724A1 (en) | Voice recognition device and method, and program | |
CN110136689B (en) | Singing voice synthesis method and device based on transfer learning and storage medium | |
JP2016521383A (en) | Method, apparatus and computer readable recording medium for improving a set of at least one semantic unit | |
JP2015014665A (en) | Voice recognition device and method, and semiconductor integrated circuit device | |
JP4755918B2 (en) | Data input device and method, and program | |
CN113327620A (en) | Voiceprint recognition method and device | |
CN103426429B (en) | Sound control method and device | |
JP5364412B2 (en) | Search device | |
JP3825526B2 (en) | Voice recognition device | |
JP5396530B2 (en) | Speech recognition apparatus and speech recognition method | |
JP5160594B2 (en) | Speech recognition apparatus and speech recognition method | |
JPH1055196A (en) | Device and method for recognizing voice and information storage medium | |
JP6384681B2 (en) | Voice dialogue apparatus, voice dialogue system, and voice dialogue method | |
JP3588975B2 (en) | Voice input device | |
JP6641680B2 (en) | Audio output device, audio output program, and audio output method | |
KR101250897B1 (en) | Apparatus for word entry searching in a portable electronic dictionary and method thereof | |
JP6710893B2 (en) | Electronics and programs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110822 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120131 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120515 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120607 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150615 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5015806 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |