JP3212618B2 - 対話処理装置 - Google Patents
対話処理装置Info
- Publication number
- JP3212618B2 JP3212618B2 JP51547598A JP51547598A JP3212618B2 JP 3212618 B2 JP3212618 B2 JP 3212618B2 JP 51547598 A JP51547598 A JP 51547598A JP 51547598 A JP51547598 A JP 51547598A JP 3212618 B2 JP3212618 B2 JP 3212618B2
- Authority
- JP
- Japan
- Prior art keywords
- goal
- action
- user
- unit
- storage unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99932—Access augmentation or optimizing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
この発明は自然言語によるマン・マシン・インタフェ
ースに用いられる対話処理装置に関し、特に文脈情報を
用いた処理を行うことによって、ユーザとシステムとの
より自由な対話を実現する対話処理装置に関する。
ースに用いられる対話処理装置に関し、特に文脈情報を
用いた処理を行うことによって、ユーザとシステムとの
より自由な対話を実現する対話処理装置に関する。
【0002】
自然言語を用いた対話型のマン・マシン・インタフェ
ースで用いられる対話処理装置においては、ユーザの入
力に対してシステムが応答し、それに対してユーザが応
答する、という対話を繰り返すことによってユーザは目
的を達成する。このような対話処理装置において、ユー
ザとシステムがより円滑で効率のよい対話を行なうため
には、ユーザが対話の主導権を持ってシステムに動作を
要求するユーザー主導の状況と、システムが対話の主導
権を持ってユーザに要求的な応答を行い、ユーザから情
報を得るというようなシステム主導の状況とを適切に制
御する必要がある。そのためには、ユーザ入力の意図か
らシステムは適切な動作目標を設定して対話を制御でき
なければならない。
ースで用いられる対話処理装置においては、ユーザの入
力に対してシステムが応答し、それに対してユーザが応
答する、という対話を繰り返すことによってユーザは目
的を達成する。このような対話処理装置において、ユー
ザとシステムがより円滑で効率のよい対話を行なうため
には、ユーザが対話の主導権を持ってシステムに動作を
要求するユーザー主導の状況と、システムが対話の主導
権を持ってユーザに要求的な応答を行い、ユーザから情
報を得るというようなシステム主導の状況とを適切に制
御する必要がある。そのためには、ユーザ入力の意図か
らシステムは適切な動作目標を設定して対話を制御でき
なければならない。
【0003】 このような自然言語マン・マシン・インタフェース装
置に用いられる対話処理装置としては、例えば特開昭63
−153631号公報に示すものが知られている。図14はその
ような従来の対話処理装置の構成を示す図である。 図において、1は例えば、検索システムのように格納
してある情報の中から、ユーザの要求に即応した情報を
提供する情報提供システムであり、2はこの情報提供シ
ステム1より出力される出力情報である。3はユーザか
ら入力された自然言語による入力文であり、4はその自
然言語による入力文3の意味を解釈する自然言語解釈手
段である。5はその自然言語解釈手段4によって解釈さ
れた入力文3の意味に応じて、情報提供システム1への
コマンドを生成するコマンド生成手段である。6はこの
コマンド生成手段5の生成したコマンドに対応する情報
提供システム1の情報から、ユーザの注視物を取り出し
て管理し、自然言語解釈手段4における解釈に参照させ
るための話題管理手段である。7は話題管理手段6がユ
ーザの現在注視している対象物とその変遷を格納する注
視物格納手段である。
置に用いられる対話処理装置としては、例えば特開昭63
−153631号公報に示すものが知られている。図14はその
ような従来の対話処理装置の構成を示す図である。 図において、1は例えば、検索システムのように格納
してある情報の中から、ユーザの要求に即応した情報を
提供する情報提供システムであり、2はこの情報提供シ
ステム1より出力される出力情報である。3はユーザか
ら入力された自然言語による入力文であり、4はその自
然言語による入力文3の意味を解釈する自然言語解釈手
段である。5はその自然言語解釈手段4によって解釈さ
れた入力文3の意味に応じて、情報提供システム1への
コマンドを生成するコマンド生成手段である。6はこの
コマンド生成手段5の生成したコマンドに対応する情報
提供システム1の情報から、ユーザの注視物を取り出し
て管理し、自然言語解釈手段4における解釈に参照させ
るための話題管理手段である。7は話題管理手段6がユ
ーザの現在注視している対象物とその変遷を格納する注
視物格納手段である。
【0004】 このような従来の対話処理装置においては、ユーザの
入力する自然言語による入力文3に対応する情報提供シ
ステム1のコマンドにより、ユーザ主導でシステムとの
対話を行なうことができる。また、ユーザの注視してい
る事物を抽出して注視物格納手段7に格納しておき、そ
れを文脈解析で用いることによって文脈解析を簡易化
し、解釈誤りを少なくして対話を円滑にすることができ
る。
入力する自然言語による入力文3に対応する情報提供シ
ステム1のコマンドにより、ユーザ主導でシステムとの
対話を行なうことができる。また、ユーザの注視してい
る事物を抽出して注視物格納手段7に格納しておき、そ
れを文脈解析で用いることによって文脈解析を簡易化
し、解釈誤りを少なくして対話を円滑にすることができ
る。
【0005】
従来の対話処理装置は以上のように構成されているの
で、ユーザの入力した自然言語による入力文3に対応し
たコマンドを情報提供システム1にて生成し、それを実
行するだけであって、システム自身の動作目標が存在せ
ず、システム主導の対話への切り替えが行なわれないた
め、例えばシステム自身の動作に必要な情報が足りない
場合や、ユーザからの入力文3に誤りが含まれている場
合には円滑な対話が維持できないという問題点があっ
た。
で、ユーザの入力した自然言語による入力文3に対応し
たコマンドを情報提供システム1にて生成し、それを実
行するだけであって、システム自身の動作目標が存在せ
ず、システム主導の対話への切り替えが行なわれないた
め、例えばシステム自身の動作に必要な情報が足りない
場合や、ユーザからの入力文3に誤りが含まれている場
合には円滑な対話が維持できないという問題点があっ
た。
【0006】 また、自然言語入力には省略表現・指示表現が多く用
いられ、その内容を同定するためには、ユーザに省略部
分・指示部分の再入力を要求することが必要になるが、
システムが何度もユーザに確認を求める対話はユーザに
とって自由な対話とは言えず、対話の文脈から省略表現
・指示表現の補完を行なうことが必要である。このと
き、省略・指示表現されるものは必ずしもユーザの注視
している対象物のみとは限らない。また省略・指示表現
の内容は必ずしも直前の発話に現れるとは限らず、対話
の文脈中に複数の補完候補が存在する場合もある。さら
に、複数の補完候補からどれを選択するかという基準は
常に一定に定まってはおらず、対話の状況において動的
に変化する。従って、文脈情報から補完を行なうかどう
かの制御が必要となり、また補完を行なう場合には、補
完内容を選択するための基準および選択基準の制御が必
要となる。
いられ、その内容を同定するためには、ユーザに省略部
分・指示部分の再入力を要求することが必要になるが、
システムが何度もユーザに確認を求める対話はユーザに
とって自由な対話とは言えず、対話の文脈から省略表現
・指示表現の補完を行なうことが必要である。このと
き、省略・指示表現されるものは必ずしもユーザの注視
している対象物のみとは限らない。また省略・指示表現
の内容は必ずしも直前の発話に現れるとは限らず、対話
の文脈中に複数の補完候補が存在する場合もある。さら
に、複数の補完候補からどれを選択するかという基準は
常に一定に定まってはおらず、対話の状況において動的
に変化する。従って、文脈情報から補完を行なうかどう
かの制御が必要となり、また補完を行なう場合には、補
完内容を選択するための基準および選択基準の制御が必
要となる。
【0007】 しかしながら、上記特開昭63−153631号公報に示した
対話処理装置では、文脈処理において、ユーザの注視し
ている対象物のみを扱うため、例えば情報検索の条件の
省略に対する補完が行なえないという問題点があった。
対話処理装置では、文脈処理において、ユーザの注視し
ている対象物のみを扱うため、例えば情報検索の条件の
省略に対する補完が行なえないという問題点があった。
【0008】 また、そのような問題点を改善した対話処理装置とし
て、例えば特開平1−222326号公報に示される対話処理
装置も従来より知られている。この対話処理装置によれ
ば、対話が始まってからの入力文と出力文の履歴情報を
保持しておき、ユーザの入力文の意図を意図解釈ルール
に従って解釈するとき、省略された要素が存在する場合
にその履歴情報を参照することによってその省略を補完
し、ユーザの意図を判断することができる。
て、例えば特開平1−222326号公報に示される対話処理
装置も従来より知られている。この対話処理装置によれ
ば、対話が始まってからの入力文と出力文の履歴情報を
保持しておき、ユーザの入力文の意図を意図解釈ルール
に従って解釈するとき、省略された要素が存在する場合
にその履歴情報を参照することによってその省略を補完
し、ユーザの意図を判断することができる。
【0009】 しかしながら、上記のような対話処理装置では、省略
表現を対話履歴から補完する場合、その選択基準が規則
として固定されたものであるため、対話の状況に応じて
動的に選択基準を変化させることができないという問題
点があった。
表現を対話履歴から補完する場合、その選択基準が規則
として固定されたものであるため、対話の状況に応じて
動的に選択基準を変化させることができないという問題
点があった。
【0010】 この発明は上記のような課題を解決するためになされ
たもので、ユーザの意図からシステム自身の適切な動作
目的を設定して、ユーザとシステムの対話の主導権を適
切に制御できる対話処理装置を提供することを目的とし
ている。
たもので、ユーザの意図からシステム自身の適切な動作
目的を設定して、ユーザとシステムの対話の主導権を適
切に制御できる対話処理装置を提供することを目的とし
ている。
【0011】 また、この発明は、さらに、対話の文脈情報の選択基
準を対話の状況に応じて動的に制御し、ユーザの自然言
語による入力文に含まれる省略表現・指示表現に対する
文脈処理を適切に行なうことができる対話処理装置を提
供することを目的としている。
準を対話の状況に応じて動的に制御し、ユーザの自然言
語による入力文に含まれる省略表現・指示表現に対する
文脈処理を適切に行なうことができる対話処理装置を提
供することを目的としている。
【0012】
この発明に係る対話処理装置は、ユーザゴール抽出部
によって、入力文の意味表現とユーザゴール知識に規定
された入力文の意図を表すユーザゴールを、ユーザの入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの系列とからゴールフレーム生成部にてゴールフレ
ームを生成して、そのゴールフレームをゴールフレーム
記憶部に保持し、アクション実行可能性判定部が対話履
歴記憶部から意味表現を読み出して、ゴールフレーム記
憶部で処理の対象にあるゴールフレーム中のアクション
に対して、外部アプリケーションに対するアクションの
実行に必要な引数を設定して実行可能性を判定し、外部
アプリケーションに対するアクションが実行不可能であ
ればシステムゴール知識に基づいて新たなシステムゴー
ルを生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたものである。
によって、入力文の意味表現とユーザゴール知識に規定
された入力文の意図を表すユーザゴールを、ユーザの入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの系列とからゴールフレーム生成部にてゴールフレ
ームを生成して、そのゴールフレームをゴールフレーム
記憶部に保持し、アクション実行可能性判定部が対話履
歴記憶部から意味表現を読み出して、ゴールフレーム記
憶部で処理の対象にあるゴールフレーム中のアクション
に対して、外部アプリケーションに対するアクションの
実行に必要な引数を設定して実行可能性を判定し、外部
アプリケーションに対するアクションが実行不可能であ
ればシステムゴール知識に基づいて新たなシステムゴー
ルを生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたものである。
【0013】 この発明に係る対話処理装置は、ユーザゴール抽出部
から出力されるユーザゴールおよび入力文の意味表現
と、次アクション決定部から出力される意味表現とを、
対話履歴記憶部がスタックに保持し、アクション実行可
能性判定部にて入力文の意味表現からだけでは設定でき
ないアクションの引数が存在する場合に、対話履歴記憶
部のスタック要素を順次読み出してアクションの引数を
設定するようにしたものである。
から出力されるユーザゴールおよび入力文の意味表現
と、次アクション決定部から出力される意味表現とを、
対話履歴記憶部がスタックに保持し、アクション実行可
能性判定部にて入力文の意味表現からだけでは設定でき
ないアクションの引数が存在する場合に、対話履歴記憶
部のスタック要素を順次読み出してアクションの引数を
設定するようにしたものである。
【0014】 この発明に係る対話処理装置は、対話履歴記憶部にて
意味表現中の各データにスコアを与え、アクション実行
可能性判定部にて各データに与えられたスコアに応じて
アクションの引数を設定するようにしたものである。
意味表現中の各データにスコアを与え、アクション実行
可能性判定部にて各データに与えられたスコアに応じて
アクションの引数を設定するようにしたものである。
【0015】 この発明に係る対話処理装置は、対話履歴記憶部にて
意味表現中の各データに与えたスコアを時間的な関数で
制御するようにしたものである。
意味表現中の各データに与えたスコアを時間的な関数で
制御するようにしたものである。
【0016】
以下、この発明の実施の一形態を説明する。 実施の形態1. 図1はこの発明の実施の形態1による対話処理装置の
機能構成ブロックを示す図である。図において、10はユ
ーザの入力する自然言語による入力文であり、11はこの
自然言語による入力文10の意図の種類を規定するユーザ
ゴールを定めたユーザゴール知識である。12はユーザの
入力する入力文10の自然言語から、このユーザゴール知
識11を参照してユーザゴールを抽出し、入力文10の意味
表現を生成するユーザゴール抽出部であり、13はこのユ
ーザゴール抽出部12から出力されるユーザゴールおよび
意味表現と、後述する次アクション決定部21から出力さ
れる意味表現を保持する対話履歴記憶部である。14はシ
ステムの動作目標となるシステムゴールを規定するシス
テムゴール知識であり、15はユーザゴール抽出部12から
のユーザゴールに対応するシステムゴールを、そのシス
テムゴール知識14の中から決定するシステムゴール決定
部である。
機能構成ブロックを示す図である。図において、10はユ
ーザの入力する自然言語による入力文であり、11はこの
自然言語による入力文10の意図の種類を規定するユーザ
ゴールを定めたユーザゴール知識である。12はユーザの
入力する入力文10の自然言語から、このユーザゴール知
識11を参照してユーザゴールを抽出し、入力文10の意味
表現を生成するユーザゴール抽出部であり、13はこのユ
ーザゴール抽出部12から出力されるユーザゴールおよび
意味表現と、後述する次アクション決定部21から出力さ
れる意味表現を保持する対話履歴記憶部である。14はシ
ステムの動作目標となるシステムゴールを規定するシス
テムゴール知識であり、15はユーザゴール抽出部12から
のユーザゴールに対応するシステムゴールを、そのシス
テムゴール知識14の中から決定するシステムゴール決定
部である。
【0017】 16はそのシステムゴールを達成するために必要なシス
テムのアクションの系列を規定するアクション系列知識
であり、17はシステムゴール決定部15あるいは後述する
アクション実行可能性判定部19から入力されるシステム
ゴールに対して、このアクション系列知識16から対応す
るアクション系列知識を読み出し、システムゴールとア
クション系列知識の対からなるゴールフレームを生成す
るゴールフレーム生成部である。18はこのゴールフレー
ム生成部17から出力されるゴールフレームを保持するゴ
ールフレーム記憶部である。
テムのアクションの系列を規定するアクション系列知識
であり、17はシステムゴール決定部15あるいは後述する
アクション実行可能性判定部19から入力されるシステム
ゴールに対して、このアクション系列知識16から対応す
るアクション系列知識を読み出し、システムゴールとア
クション系列知識の対からなるゴールフレームを生成す
るゴールフレーム生成部である。18はこのゴールフレー
ム生成部17から出力されるゴールフレームを保持するゴ
ールフレーム記憶部である。
【0018】 19は対話履歴記憶部13から発話の意味表現を読み出
し、ゴールフレーム記憶部18で処理の対象にあるゴール
フレーム中のアクションに対して、アクションの実行に
必要な引数を設定して実行可能性を判定し、実行可能で
あればそれをアクション指令として出力し、実行不可能
の場合には新たなシステムゴールを生成してゴールフレ
ーム生成部17に出力するアクション実行可能性判定部で
ある。20はこのアクション実行可能性判定部19から出力
されたアクション指令を入力として駆動され、アクショ
ンの実行結果を出力する外部アプリケーションであり、
21はこの外部アプリケーション20の出力する実行結果に
応じて、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレームのアクション系列上で、次に実行すべきア
クションを決定するとともに、実行結果を対話履歴記憶
部13に出力する次アクション決定部である。
し、ゴールフレーム記憶部18で処理の対象にあるゴール
フレーム中のアクションに対して、アクションの実行に
必要な引数を設定して実行可能性を判定し、実行可能で
あればそれをアクション指令として出力し、実行不可能
の場合には新たなシステムゴールを生成してゴールフレ
ーム生成部17に出力するアクション実行可能性判定部で
ある。20はこのアクション実行可能性判定部19から出力
されたアクション指令を入力として駆動され、アクショ
ンの実行結果を出力する外部アプリケーションであり、
21はこの外部アプリケーション20の出力する実行結果に
応じて、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレームのアクション系列上で、次に実行すべきア
クションを決定するとともに、実行結果を対話履歴記憶
部13に出力する次アクション決定部である。
【0019】 次に動作について説明する。 ここで、図2はユーザゴール知識11の内容の一例を示
したものであり、例えば「〈名称〉〈属性名〉教えて下
さい」あるいは「〈名称〉〈属性名〉知りたいんです
が」といったユーザ発話を、共に「属性値を得たい」と
いうユーザゴールGET_AVALUEに対応付けている。なお、
〈名称〉あるいは〈属性名〉は後述するシステムのアク
ションを実行するために必要となる引数である。 ユーザゴール抽出部12はユーザによって入力文10とし
て入力される自然言語による発話、例えば「建長寺の拝
観料を教えて下さい」に対して構文解析を行い、例えば
図3に示すようなユーザゴールおよび発話の意味表現、
すなわち[ユーザゴール]:=GET_AVALUE、〈名称〉:
=建長寺、〈属性名〉:=拝観料を生成する。このよう
にユーザゴール抽出部12によって生成されたユーザゴー
ルおよび発話の意味表現は、対話履歴記憶部13に送られ
てそこに保持されるとともに、システムゴール決定部15
にも入力される。
したものであり、例えば「〈名称〉〈属性名〉教えて下
さい」あるいは「〈名称〉〈属性名〉知りたいんです
が」といったユーザ発話を、共に「属性値を得たい」と
いうユーザゴールGET_AVALUEに対応付けている。なお、
〈名称〉あるいは〈属性名〉は後述するシステムのアク
ションを実行するために必要となる引数である。 ユーザゴール抽出部12はユーザによって入力文10とし
て入力される自然言語による発話、例えば「建長寺の拝
観料を教えて下さい」に対して構文解析を行い、例えば
図3に示すようなユーザゴールおよび発話の意味表現、
すなわち[ユーザゴール]:=GET_AVALUE、〈名称〉:
=建長寺、〈属性名〉:=拝観料を生成する。このよう
にユーザゴール抽出部12によって生成されたユーザゴー
ルおよび発話の意味表現は、対話履歴記憶部13に送られ
てそこに保持されるとともに、システムゴール決定部15
にも入力される。
【0020】 なお、図4はシステムゴール知識14の内容の一例を示
すものであり、システムのゴールとして、「属性値をユ
ーザに提示する」動作を意味するGIVE_AVALUE、「デー
タベースから条件に合うものをユーザに提示する」動作
を意味するRETRIEVE_RECORDが定義されている。また、
それぞれのシステムゴールに対してユーザゴールGET_AV
ALUEあるいはGET_RECORDが対応付けられている。
すものであり、システムのゴールとして、「属性値をユ
ーザに提示する」動作を意味するGIVE_AVALUE、「デー
タベースから条件に合うものをユーザに提示する」動作
を意味するRETRIEVE_RECORDが定義されている。また、
それぞれのシステムゴールに対してユーザゴールGET_AV
ALUEあるいはGET_RECORDが対応付けられている。
【0021】 システムゴール決定部15はユーザゴール抽出部12から
入力されるユーザゴールに対応したシステムゴールを、
このシステムゴール知識14から決定して、それをゴール
フレーム生成部17に出力する。例えば、ユーザゴール抽
出部12からユーザゴールGET_AVALUEが入力されると、シ
ステムゴール決定部15はシステムゴール知識14の中から
システムゴールGIVE_AVALUEを決定して出力する。
入力されるユーザゴールに対応したシステムゴールを、
このシステムゴール知識14から決定して、それをゴール
フレーム生成部17に出力する。例えば、ユーザゴール抽
出部12からユーザゴールGET_AVALUEが入力されると、シ
ステムゴール決定部15はシステムゴール知識14の中から
システムゴールGIVE_AVALUEを決定して出力する。
【0022】 ここで、図5はアクション系列知識11の内容の一例を
示すものであり、1行目〜4行目にはシステムのアクシ
ョンが宣言されている。例えば、1行目のアクションre
trieve_avalueは2つの引数〈名称〉と〈属性名〉を持
つアクションである。このアクションの実行に必須の引
数は引数の名前の前に記号!を付与して定義する。な
お、5行目以降では、例えばシステムゴールGIVE_AVALU
Eを達成するために必要なアクションの系列が定義され
ており、最初に起動されるアクションがretrieve_avalu
eであり、その実行結果がILLEGAL_ATTRIBUTEならば次の
アクションがinform_illegal、NONEならばinform_non
e、AVALUEならばinform_avalueと定義されている。
示すものであり、1行目〜4行目にはシステムのアクシ
ョンが宣言されている。例えば、1行目のアクションre
trieve_avalueは2つの引数〈名称〉と〈属性名〉を持
つアクションである。このアクションの実行に必須の引
数は引数の名前の前に記号!を付与して定義する。な
お、5行目以降では、例えばシステムゴールGIVE_AVALU
Eを達成するために必要なアクションの系列が定義され
ており、最初に起動されるアクションがretrieve_avalu
eであり、その実行結果がILLEGAL_ATTRIBUTEならば次の
アクションがinform_illegal、NONEならばinform_non
e、AVALUEならばinform_avalueと定義されている。
【0023】 システムゴール決定部15からシステムゴールが入力さ
れると、ゴールフレーム生成部17はこのアクション系列
知識16から、そのシステムゴールに対応するアクション
系列知識を得てゴールフレームを生成する。図6は、例
えばシステムゴールGIVE_AVALUEがシステムゴール決定
部15から入力された場合に、ゴールフレーム生成部17が
生成するゴールフレームの例を示したものである。アク
ション系列知識16から得られるアクション系列知識は、
各枝にアクションの実行結果がラベル付けされた木構造
にて保持されており、最初のノードが処理の対象となる
アクション(以下、カレントアクションという)として
設定される。
れると、ゴールフレーム生成部17はこのアクション系列
知識16から、そのシステムゴールに対応するアクション
系列知識を得てゴールフレームを生成する。図6は、例
えばシステムゴールGIVE_AVALUEがシステムゴール決定
部15から入力された場合に、ゴールフレーム生成部17が
生成するゴールフレームの例を示したものである。アク
ション系列知識16から得られるアクション系列知識は、
各枝にアクションの実行結果がラベル付けされた木構造
にて保持されており、最初のノードが処理の対象となる
アクション(以下、カレントアクションという)として
設定される。
【0024】 このようにしてゴールフレーム生成部17から出力され
たゴールフレームは、例えばスタックとしてゴールフレ
ーム記憶部18に保持され、そのスタックの先頭要素のゴ
ールフレーム(以下、カレントゴールフレームという)
が以後の処理の対象となる。
たゴールフレームは、例えばスタックとしてゴールフレ
ーム記憶部18に保持され、そのスタックの先頭要素のゴ
ールフレーム(以下、カレントゴールフレームという)
が以後の処理の対象となる。
【0025】 次いで、アクション実行可能性判定部19が対話履歴記
憶部13から発話の意味表現を読み出し、ゴールフレーム
記憶部18の保持するカレントゴールフレームのカレント
アクションに対して引数の設定を行なう。例えば、図6
に示したゴールフレームのカレントアクションretrieve
_avalueに対して、対話履歴記憶部13に保持されている
図3に示す発話の意味表現から、引数〈名称〉:=建長
寺と〈属性名〉:=拝観料とを設定する。全ての必須引
数の設定が完了したカレントアクションは実行可能とな
り、アクション実行可能性判定部19からアクション指令
として外部アプリケーション20に出力される。一方、必
須引数の設定が完了しないアクションは実行不可能と判
定して、アクション実行可能性判定部19はゴールフレー
ム生成部17に、必須引数をユーザから得るためのシステ
ムゴール、例えばGET_ATTNAMEを出力する。
憶部13から発話の意味表現を読み出し、ゴールフレーム
記憶部18の保持するカレントゴールフレームのカレント
アクションに対して引数の設定を行なう。例えば、図6
に示したゴールフレームのカレントアクションretrieve
_avalueに対して、対話履歴記憶部13に保持されている
図3に示す発話の意味表現から、引数〈名称〉:=建長
寺と〈属性名〉:=拝観料とを設定する。全ての必須引
数の設定が完了したカレントアクションは実行可能とな
り、アクション実行可能性判定部19からアクション指令
として外部アプリケーション20に出力される。一方、必
須引数の設定が完了しないアクションは実行不可能と判
定して、アクション実行可能性判定部19はゴールフレー
ム生成部17に、必須引数をユーザから得るためのシステ
ムゴール、例えばGET_ATTNAMEを出力する。
【0026】 外部アプリケーション20は、例えばデータベースから
の情報検索システム、ホテル予約システム、航空券予約
システムであり、アクション実行可能性判定部19から出
力されるアクション指令を実行して実行結果を出力する
ものである。例えば、アクション実行可能性判定部19か
らアクション指令retrieve_avalue(建長寺 拝観料)
が入力されると、観光案内データベースより該当するデ
ータの検索を行い、その実行結果として、検索の条件が
不適当な場合にはILLEGAL_ATTRIBUTEを、該当するデー
タが得られない場合にはNONEを、該当するデータが得ら
れた場合にはAVALUEをそれぞれ次アクション決定部21に
出力する。また、この外部アプリケーション20は、例え
ば検索結果、予約状況をユーザに対して、合成音声やグ
ラフィカル・ユーザ・インタフェース(GUI)などによ
って提示する。
の情報検索システム、ホテル予約システム、航空券予約
システムであり、アクション実行可能性判定部19から出
力されるアクション指令を実行して実行結果を出力する
ものである。例えば、アクション実行可能性判定部19か
らアクション指令retrieve_avalue(建長寺 拝観料)
が入力されると、観光案内データベースより該当するデ
ータの検索を行い、その実行結果として、検索の条件が
不適当な場合にはILLEGAL_ATTRIBUTEを、該当するデー
タが得られない場合にはNONEを、該当するデータが得ら
れた場合にはAVALUEをそれぞれ次アクション決定部21に
出力する。また、この外部アプリケーション20は、例え
ば検索結果、予約状況をユーザに対して、合成音声やグ
ラフィカル・ユーザ・インタフェース(GUI)などによ
って提示する。
【0027】 次アクション決定部21はこの外部アプリケーション20
から出力される実行結果から、ゴールフレーム記憶部18
のアクション系列知識木の対応する枝を選択し、次アク
ションを決定してカレントアクションとする。例えば、
アクション実行可能判定部19からアクション指令retrie
ve_avalue(建長寺 拝観料)が入力され、外部アプリ
ケーション20が実行結果AVALUE:=[〈拝観料〉:=30
0]を出力する場合、次アクション決定部16は実行結果
に含まれる意味表現〈拝観料〉:=300を対話履歴記憶
部13に出力する。さらに、図6に示したアクション知識
木中のAVALUEがラベル付けされた枝を選択して次アクシ
ョンinform_avalueに決定し、それをカレントアクショ
ンとする。なお、選択する枝がカレントゴールフレーム
のアクション知識木に存在しないということは、カレン
トゴールフレームの達成するアクションが全て実行され
た場合であるので、そのような場合にはカレントゴール
フレームをゴールフレーム記憶部18から取り除く。
から出力される実行結果から、ゴールフレーム記憶部18
のアクション系列知識木の対応する枝を選択し、次アク
ションを決定してカレントアクションとする。例えば、
アクション実行可能判定部19からアクション指令retrie
ve_avalue(建長寺 拝観料)が入力され、外部アプリ
ケーション20が実行結果AVALUE:=[〈拝観料〉:=30
0]を出力する場合、次アクション決定部16は実行結果
に含まれる意味表現〈拝観料〉:=300を対話履歴記憶
部13に出力する。さらに、図6に示したアクション知識
木中のAVALUEがラベル付けされた枝を選択して次アクシ
ョンinform_avalueに決定し、それをカレントアクショ
ンとする。なお、選択する枝がカレントゴールフレーム
のアクション知識木に存在しないということは、カレン
トゴールフレームの達成するアクションが全て実行され
た場合であるので、そのような場合にはカレントゴール
フレームをゴールフレーム記憶部18から取り除く。
【0028】 アクション実行可能性判定部19はこのゴールフレーム
記憶部18のカレントアクションが変化するたびに起動さ
れ、システムゴール決定部15によって決定されたシステ
ムゴールを達成する。 このように、この実施の形態1によれば、ユーザの発
話からユーザゴールを抽出して当該ユーザゴールに応じ
てシステムゴールを決定し、そのシステムゴールを達成
するためにシステムゴールに対応したシステムのアクシ
ョン系列を実行し、また、アクションが実行できない場
合には、新たなシステムゴールを生成して、それに応じ
たアクションの実行を行なうものであるため、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御することの
できる対話処理装置が得られる効果がある。
記憶部18のカレントアクションが変化するたびに起動さ
れ、システムゴール決定部15によって決定されたシステ
ムゴールを達成する。 このように、この実施の形態1によれば、ユーザの発
話からユーザゴールを抽出して当該ユーザゴールに応じ
てシステムゴールを決定し、そのシステムゴールを達成
するためにシステムゴールに対応したシステムのアクシ
ョン系列を実行し、また、アクションが実行できない場
合には、新たなシステムゴールを生成して、それに応じ
たアクションの実行を行なうものであるため、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御することの
できる対話処理装置が得られる効果がある。
【0029】 実施の形態2. なお、上記実施の形態1では、ユーザゴール抽出部12
から出力されるユーザゴールおよび意味表現と、次アク
ション決定部21から出力される意味表現とを単純に対話
履歴記憶部13に保持し、アクション実行可能性判定部19
においてその対話履歴記憶部13から発話の意味表現を読
み出し、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレーム中のアクションに対して、アクションの実
行に必要な引数を設定して実行可能性を判定し、実行可
能であればアクション指令を出力し、実行不可能の場合
には新たなシステムゴールを生成してゴールフレーム生
成部17に出力するものについて示したが、対話履歴記憶
部13において、ユーザゴール抽出部12から出力されるユ
ーザゴールおよび意味表現と次アクション決定部21から
出力される意味表現とをスタックに保持し、さらにアク
ション実行可能性判定部19にて入力文の意味表現からだ
けでは設定できないアクションの引数が存在する場合
に、対話履歴記憶部13のスタック要素を順次読み出して
アクションの引数を設定するようにしてもよい。
から出力されるユーザゴールおよび意味表現と、次アク
ション決定部21から出力される意味表現とを単純に対話
履歴記憶部13に保持し、アクション実行可能性判定部19
においてその対話履歴記憶部13から発話の意味表現を読
み出し、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレーム中のアクションに対して、アクションの実
行に必要な引数を設定して実行可能性を判定し、実行可
能であればアクション指令を出力し、実行不可能の場合
には新たなシステムゴールを生成してゴールフレーム生
成部17に出力するものについて示したが、対話履歴記憶
部13において、ユーザゴール抽出部12から出力されるユ
ーザゴールおよび意味表現と次アクション決定部21から
出力される意味表現とをスタックに保持し、さらにアク
ション実行可能性判定部19にて入力文の意味表現からだ
けでは設定できないアクションの引数が存在する場合
に、対話履歴記憶部13のスタック要素を順次読み出して
アクションの引数を設定するようにしてもよい。
【0030】 そのようなこの発明の実施の形態2による対話処理装
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1の場合と同様に動作
する。
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1の場合と同様に動作
する。
【0031】 次にその動作について、対話履歴記憶部13およびアク
ション実行可能性判定部19の動作を中心に説明する。 ここで、図7はこの対話処理装置とユーザとの対話の
一例を示すものである。図示のように、ユーザの発話U1
「建長寺の拝観料を教えて下さい」が入力されると、上
記実施の形態1において説明したごとく、当該対話処理
装置が動作して、システムの応答S1「300円です」かそ
の外部アプリケーション20により、例えば合成音声によ
ってユーザに提示される。その後、ユーザの発話U2「円
覚寺はどうですか」が入力されると、ユーザゴール抽出
部12は図8に示すユーザゴールおよび発話の意味表現、
すなわち[ユーザコール]:=GET_AVALUE、〈名称〉:
=円覚寺を生成する。
ション実行可能性判定部19の動作を中心に説明する。 ここで、図7はこの対話処理装置とユーザとの対話の
一例を示すものである。図示のように、ユーザの発話U1
「建長寺の拝観料を教えて下さい」が入力されると、上
記実施の形態1において説明したごとく、当該対話処理
装置が動作して、システムの応答S1「300円です」かそ
の外部アプリケーション20により、例えば合成音声によ
ってユーザに提示される。その後、ユーザの発話U2「円
覚寺はどうですか」が入力されると、ユーザゴール抽出
部12は図8に示すユーザゴールおよび発話の意味表現、
すなわち[ユーザコール]:=GET_AVALUE、〈名称〉:
=円覚寺を生成する。
【0032】 このユーザゴール抽出部12から出力されたユーザゴー
ルおよび発話の意味表現、すなわち[ユーザコール]:
=GET_AVALUE、〈名称〉:=円覚寺は、ユーザの発話U1
およびシステムの応答S1に対応したユーザゴールおよび
発話の意味表現、すなわち[ユーザコール]:=GET_AV
ALUE、〈名称〉:=建長寺、〈属性名〉:=拝観料、お
よび〈拝観料〉:=300とともに、図9に示すように対
話履歴記憶部13においてスタックに保持される。 システムゴール決定部15、ゴールフレーム生成部17お
よびゴールフレーム記憶部18は上記実施の形態1の場合
と同様に動作し、それによって、カレントゴールフレー
ムは図6に示すものとなる。
ルおよび発話の意味表現、すなわち[ユーザコール]:
=GET_AVALUE、〈名称〉:=円覚寺は、ユーザの発話U1
およびシステムの応答S1に対応したユーザゴールおよび
発話の意味表現、すなわち[ユーザコール]:=GET_AV
ALUE、〈名称〉:=建長寺、〈属性名〉:=拝観料、お
よび〈拝観料〉:=300とともに、図9に示すように対
話履歴記憶部13においてスタックに保持される。 システムゴール決定部15、ゴールフレーム生成部17お
よびゴールフレーム記憶部18は上記実施の形態1の場合
と同様に動作し、それによって、カレントゴールフレー
ムは図6に示すものとなる。
【0033】 アクション実行可能性判定部19は対話履歴記憶部13か
ら発話の意味表現を読み出し、カレントアクションretr
ieve_avalueに対して引数の設定を行なう。そのとき、
必須引数〈名称〉は図9に示すスタックの先頭要素から
〈名称〉:=円覚寺と設定されるが、必須引数〈属性
名〉はこの先頭要素から設定することはできない。その
ような場合、アクション実行可能性判定部19は対話履歴
記憶部13のスタック要素を順次読み出して引数の設定を
行なう。その結果、必須引数〈属性名〉は〈属性名〉:
=拝観料と設定される。このようにして、全ての必須引
数の設定が完了すると、アクション実行可能性判定部19
はそのカレントアクションが実行可能になったものと判
断して、それをアクション指令として外部アプリケーシ
ョン20に出力する。
ら発話の意味表現を読み出し、カレントアクションretr
ieve_avalueに対して引数の設定を行なう。そのとき、
必須引数〈名称〉は図9に示すスタックの先頭要素から
〈名称〉:=円覚寺と設定されるが、必須引数〈属性
名〉はこの先頭要素から設定することはできない。その
ような場合、アクション実行可能性判定部19は対話履歴
記憶部13のスタック要素を順次読み出して引数の設定を
行なう。その結果、必須引数〈属性名〉は〈属性名〉:
=拝観料と設定される。このようにして、全ての必須引
数の設定が完了すると、アクション実行可能性判定部19
はそのカレントアクションが実行可能になったものと判
断して、それをアクション指令として外部アプリケーシ
ョン20に出力する。
【0034】 このように、この実施の形態2によれば、発話の意味
表現からだけでは設定できないアクションの引数が存在
する場合に、ユーザゴール抽出部12から出力されるユー
ザゴールおよび発話の意味表現と、次アクション決定部
21から出力される意味表現とを保持した対話履歴記憶部
13のスタック要素を、アクション実行可能性判定部19に
て順次読み出してアクションの引数設定を行うようにし
たため、ユーザの入力する自然言語発話に含まれる指示
・代名詞あるいは省略表現の補完を行なえる対話処理装
置が得られる効果がある。
表現からだけでは設定できないアクションの引数が存在
する場合に、ユーザゴール抽出部12から出力されるユー
ザゴールおよび発話の意味表現と、次アクション決定部
21から出力される意味表現とを保持した対話履歴記憶部
13のスタック要素を、アクション実行可能性判定部19に
て順次読み出してアクションの引数設定を行うようにし
たため、ユーザの入力する自然言語発話に含まれる指示
・代名詞あるいは省略表現の補完を行なえる対話処理装
置が得られる効果がある。
【0035】 実施の形態3. また、上記実施の形態2では、対話履歴記憶部13にて
ユーザゴール抽出部12から出力されるユーザゴールおよ
び意味表現と次アクション決定部21から出力される意味
表現をスタックに保持し、入力文の意味表現からだけは
設定できないアクションの引数が存在する場合、アクシ
ョン実行可能性判定部19で対話履歴記憶部13のスタック
要素を順次読み出してアクションの引数を設定するもの
について説明したが、対話履歴記憶部13において意味表
現中の各データにスコアを与え、アクション実行可能性
判定部19にて各データに与えられたスコアに応じたアク
ションの引数の設定を行うようにしてもよい。
ユーザゴール抽出部12から出力されるユーザゴールおよ
び意味表現と次アクション決定部21から出力される意味
表現をスタックに保持し、入力文の意味表現からだけは
設定できないアクションの引数が存在する場合、アクシ
ョン実行可能性判定部19で対話履歴記憶部13のスタック
要素を順次読み出してアクションの引数を設定するもの
について説明したが、対話履歴記憶部13において意味表
現中の各データにスコアを与え、アクション実行可能性
判定部19にて各データに与えられたスコアに応じたアク
ションの引数の設定を行うようにしてもよい。
【0036】 そのようなこの発明の実施の形態3による対話処理装
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1あるいは実施の形態
2の場合と同様に動作する。
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1あるいは実施の形態
2の場合と同様に動作する。
【0037】 次にその動作について、対話履歴記憶部13およびアク
ション実行可能性判定部19の動作を中心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すように、その意味表現中のデ
ータにスコアの初期値を与える。例えば、〈名称|5〉
は、〈名称〉:=円覚寺に対してスコア5が与えられて
いることを示す。しかる後に対話履歴記憶部13はそのユ
ーザゴールおよび発話の意味表現をスタックに保持す
る。
ション実行可能性判定部19の動作を中心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すように、その意味表現中のデ
ータにスコアの初期値を与える。例えば、〈名称|5〉
は、〈名称〉:=円覚寺に対してスコア5が与えられて
いることを示す。しかる後に対話履歴記憶部13はそのユ
ーザゴールおよび発話の意味表現をスタックに保持す
る。
【0038】 アクション実行可能性判定部19はこの対話履歴記憶部
13から、そのデータにスコアが与えられた発話の意味表
現を読み出して、カレントアクションretrieve_avalue
に対する引数の設定を行なう。そのときアクション実行
可能性判定部19は、意味表現のスコアがあらかじめ設定
された閾値を越える場合にのみ引数の設定を行なう。
13から、そのデータにスコアが与えられた発話の意味表
現を読み出して、カレントアクションretrieve_avalue
に対する引数の設定を行なう。そのときアクション実行
可能性判定部19は、意味表現のスコアがあらかじめ設定
された閾値を越える場合にのみ引数の設定を行なう。
【0039】 ここで、例えば、図11に示すように、スタックの先頭
要素の〈名称〉:=円覚寺に対してスコア5が、末尾要
素の〈名称〉:=建長寺および〈属性名〉:=拝観料に
対してスコア3がそれぞれ与えられているとき、閾値と
して3が設定されている場合には、カレントアクション
retrieve_avalueに対する引数は上記実施の形態2の場
合と同様に設定される。また、閾値として5が設定され
ている場合には、必須引数〈名称〉の設定は上記実施の
形態2と同様に行われるが、必須引数〈属性名〉の設定
は行われない。
要素の〈名称〉:=円覚寺に対してスコア5が、末尾要
素の〈名称〉:=建長寺および〈属性名〉:=拝観料に
対してスコア3がそれぞれ与えられているとき、閾値と
して3が設定されている場合には、カレントアクション
retrieve_avalueに対する引数は上記実施の形態2の場
合と同様に設定される。また、閾値として5が設定され
ている場合には、必須引数〈名称〉の設定は上記実施の
形態2と同様に行われるが、必須引数〈属性名〉の設定
は行われない。
【0040】 アクション実行可能性判定部19は必須引数の設定が完
了しないアクションを実行不可能と判定し、必須引数を
ユーザから得るためのシステムゴール、例えばGET_ATTN
AMEをゴールフレーム生成部17へ出力する。また、その
とき引数の設定に用いられた意味表現のスコアは一定値
だけ増加される。例えば、図11に示すスタックの〈属性
名|3〉が引数設定に用いられた場合、スコアが例えば1
だけ増加されて〈属性名|4〉となる。
了しないアクションを実行不可能と判定し、必須引数を
ユーザから得るためのシステムゴール、例えばGET_ATTN
AMEをゴールフレーム生成部17へ出力する。また、その
とき引数の設定に用いられた意味表現のスコアは一定値
だけ増加される。例えば、図11に示すスタックの〈属性
名|3〉が引数設定に用いられた場合、スコアが例えば1
だけ増加されて〈属性名|4〉となる。
【0041】 このように、この実施の形態3によれば、対話履歴記
憶部13にて意味表現中の各データにスコアを与え、アク
ション実行可能性判定部19にて各データに与えられたス
コアに応じてアクションの引数を設定するようにしたた
め、対話の状況に応じた動物な補完候補の選択が行なえ
る対話処理装置が得られる効果がある。
憶部13にて意味表現中の各データにスコアを与え、アク
ション実行可能性判定部19にて各データに与えられたス
コアに応じてアクションの引数を設定するようにしたた
め、対話の状況に応じた動物な補完候補の選択が行なえ
る対話処理装置が得られる効果がある。
【0042】 実施の形態4. また、上記実施の形態3では、意味表現中の各データ
にスコアを与えておき、そのスコアに応じてアクション
の引数設定を行うものについて説明したが、対話履歴記
憶部13において意味表現中の各データに与えたスコアを
時間的な関数で制御するようにしてもよい。そのような
この発明の実施の形態4による対話処理装置は図1に示
した実施の形態1の場合と同様に構成され、この対話履
歴記憶部13を除いた各部は実施の形態3の場合と同様に
動作する。
にスコアを与えておき、そのスコアに応じてアクション
の引数設定を行うものについて説明したが、対話履歴記
憶部13において意味表現中の各データに与えたスコアを
時間的な関数で制御するようにしてもよい。そのような
この発明の実施の形態4による対話処理装置は図1に示
した実施の形態1の場合と同様に構成され、この対話履
歴記憶部13を除いた各部は実施の形態3の場合と同様に
動作する。
【0043】 次にその動作について、対話履歴記憶部13の動作を中
心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すようにスコアの初期値5を与
え、それをスタックに保持する。このスタックには例え
ば、図12に示すように、スコア5あるいは4が与えられ
た意味表現、すなわち〈拝観料|5〉:=300と、〈名称|
4〉:=建長寺および〈属性名|4〉:=拝観料がすでに
保持されている場合、それぞれのスコア5および4を時
間的な関数を用いて変更する。この時間的な関数として
は、例えば意味表現が当該スタックに保持された時点か
ら、当該対話処理装置とユーザとの発話の回数nの関
数、S(n)=1.5nが用いられる。
心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すようにスコアの初期値5を与
え、それをスタックに保持する。このスタックには例え
ば、図12に示すように、スコア5あるいは4が与えられ
た意味表現、すなわち〈拝観料|5〉:=300と、〈名称|
4〉:=建長寺および〈属性名|4〉:=拝観料がすでに
保持されている場合、それぞれのスコア5および4を時
間的な関数を用いて変更する。この時間的な関数として
は、例えば意味表現が当該スタックに保持された時点か
ら、当該対話処理装置とユーザとの発話の回数nの関
数、S(n)=1.5nが用いられる。
【0044】 その結果、図13に示すように、当該スタックに保持さ
れている意味表現は〈拝観料|2.5〉:=300、および
〈名称|0〉:=建長寺、〈属性名|0〉:=拝観料とその
スコアが変更され、さらに、前記新たなユーザゴールお
よび意味表現、すなわち[ユーザゴール]:=GET_AVAL
UEおよび〈名称|5〉=円覚寺がそのスタックに保持され
る。 このように、この実施の形態4によれば、対話履歴記
憶部13にて意味表現中の各データに与えたスコアを時間
的な関数で制御するようにしたため、対話の状況に応じ
た動的な補完選択基準の制御が行なえる対話処理装置が
得られる効果がある。
れている意味表現は〈拝観料|2.5〉:=300、および
〈名称|0〉:=建長寺、〈属性名|0〉:=拝観料とその
スコアが変更され、さらに、前記新たなユーザゴールお
よび意味表現、すなわち[ユーザゴール]:=GET_AVAL
UEおよび〈名称|5〉=円覚寺がそのスタックに保持され
る。 このように、この実施の形態4によれば、対話履歴記
憶部13にて意味表現中の各データに与えたスコアを時間
的な関数で制御するようにしたため、対話の状況に応じ
た動的な補完選択基準の制御が行なえる対話処理装置が
得られる効果がある。
【0045】 以上のように、本発明にかかる対話処理装置は、ユー
ザの入力に対してシステムが応答し、それに対してユー
ザが応答するという対話を繰り返すことによってユーザ
が目的を達成する、自然言語を用いたマン・マシン・イ
ンタフェースに用いるのに適しており、特に、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御できる対話
処理装置として、また、ユーザの入力する自然言語発話
に含まれる指示・代名詞あるいは省略表現の補完が行な
える対話処理装置として、また、対話の状況に応じた動
的な補完候補の選択、さらにはその補完選択基準の制御
が行なえる対話処理装置として有用である。
ザの入力に対してシステムが応答し、それに対してユー
ザが応答するという対話を繰り返すことによってユーザ
が目的を達成する、自然言語を用いたマン・マシン・イ
ンタフェースに用いるのに適しており、特に、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御できる対話
処理装置として、また、ユーザの入力する自然言語発話
に含まれる指示・代名詞あるいは省略表現の補完が行な
える対話処理装置として、また、対話の状況に応じた動
的な補完候補の選択、さらにはその補完選択基準の制御
が行なえる対話処理装置として有用である。
【0046】
以上のように、この発明によれば、ユーザゴール抽出
部によって、入力文の意味表現とユーザゴール知識に規
定された入力文の意図を表すユーザゴールを、ユーザ入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの列とからゴールフレーム生成部にてゴールフレー
ムを生成して、そのゴールフレームをゴールフレーム記
憶部に保持し、アクション実行可能性判定部が対話履歴
記憶部から意味表現を読み出して、ゴールフレーム記憶
部で処理の対象にあるゴールフレーム中のアクションに
対して、外部アプリケーションに対するアクションの実
行に必要な引数を設定して実行可能性を判定し、外部ア
プリケーションに対するアクションが実行不可能であれ
ばシステムゴール知識に基づいて新たなシステムゴール
を生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたので、ユーザの意図か
らシステム自身の適切な動作目標を設定して、ユーザと
システムの対話の主導権を適切に制御する対話処理が可
能な対話処理装置を実行することができるという効果が
ある。
部によって、入力文の意味表現とユーザゴール知識に規
定された入力文の意図を表すユーザゴールを、ユーザ入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの列とからゴールフレーム生成部にてゴールフレー
ムを生成して、そのゴールフレームをゴールフレーム記
憶部に保持し、アクション実行可能性判定部が対話履歴
記憶部から意味表現を読み出して、ゴールフレーム記憶
部で処理の対象にあるゴールフレーム中のアクションに
対して、外部アプリケーションに対するアクションの実
行に必要な引数を設定して実行可能性を判定し、外部ア
プリケーションに対するアクションが実行不可能であれ
ばシステムゴール知識に基づいて新たなシステムゴール
を生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたので、ユーザの意図か
らシステム自身の適切な動作目標を設定して、ユーザと
システムの対話の主導権を適切に制御する対話処理が可
能な対話処理装置を実行することができるという効果が
ある。
【0047】 この発明によれば、ユーザゴール抽出部から出力され
るユーザゴールおよび入力文の意味表現と、次アクショ
ン決定部から出力される意味表現とを、対話履歴記憶部
がスタックに保持し、アクション実行可能性判定部にて
入力文の意味表現からだけでは設定できないアクション
の引数が存在する場合に、対話履歴記憶部のスタック要
素を順次読み出してアクションの引数を設定するように
したので、ユーザの入力する自然言語に含まれる指示・
代名詞あるいは省略表現の補完が可能になるという効果
がある。
るユーザゴールおよび入力文の意味表現と、次アクショ
ン決定部から出力される意味表現とを、対話履歴記憶部
がスタックに保持し、アクション実行可能性判定部にて
入力文の意味表現からだけでは設定できないアクション
の引数が存在する場合に、対話履歴記憶部のスタック要
素を順次読み出してアクションの引数を設定するように
したので、ユーザの入力する自然言語に含まれる指示・
代名詞あるいは省略表現の補完が可能になるという効果
がある。
【0048】 この発明によれば、対話履歴記憶部にて意味表現中の
各データにスコアを与え、アクション実行可能性判定部
にて各データに与えられたスコアに応じてアクションの
引数を設定するようにしたので、対話の状況に応じた動
的な補完候補の選択が行なえるようになるという効果が
ある。
各データにスコアを与え、アクション実行可能性判定部
にて各データに与えられたスコアに応じてアクションの
引数を設定するようにしたので、対話の状況に応じた動
的な補完候補の選択が行なえるようになるという効果が
ある。
【0049】 この発明によれば、対話履歴記憶部にて意味表現中の
各データに与えたスコアを時間的な関数で制御するよう
にしたので、対話の状況に応じた動的な補完選択基準の
制御が行なえるようになるという効果がある。 図面の簡単な説明
各データに与えたスコアを時間的な関数で制御するよう
にしたので、対話の状況に応じた動的な補完選択基準の
制御が行なえるようになるという効果がある。 図面の簡単な説明
【図1】 この発明の実施の形態1による対話処理装置
の機能ブロック構成を示す図である。
の機能ブロック構成を示す図である。
【図2】 上記実施の形態におけるユーザゴール知識を
示す図である。
示す図である。
【図3】 上記実施の形態におけるユーザゴール抽出部
によって生成される、ユーザゴールと発話の意味表現を
示す図である。
によって生成される、ユーザゴールと発話の意味表現を
示す図である。
【図4】 上記実施の形態におけるシステムゴール知識
を示す図である。
を示す図である。
【図5】 上記実施の形態におけるアクション系列知識
を示す図である。
を示す図である。
【図6】 上記実施の形態におけるゴールフレームの一
例を示す図である。
例を示す図である。
【図7】 この発明の実施の形態2による対話処理装置
におけるユーザと対話処理装置との対話の一例を示す図
である。
におけるユーザと対話処理装置との対話の一例を示す図
である。
【図8】 上記実施の形態におけるユーザゴール抽出部
によって生成される、ユーザゴールと発話の意味表現の
一例を示す図である。
によって生成される、ユーザゴールと発話の意味表現の
一例を示す図である。
【図9】 上記実施の形態における対話履歴記憶部に保
持される、ユーザゴールと発話の意味表現の一例を示す
図である。
持される、ユーザゴールと発話の意味表現の一例を示す
図である。
【図10】 この発明の実施の形態3による対話処理装
置におけるユーザゴール抽出部によって生成される、各
データにスコアを与えたユーザゴールと発話の意味表現
の一例を示す図である。
置におけるユーザゴール抽出部によって生成される、各
データにスコアを与えたユーザゴールと発話の意味表現
の一例を示す図である。
【図11】 上記実施の形態における対話履歴記憶部に
保持される、ユーザゴールと発話の意味表現の一例を示
す図である。
保持される、ユーザゴールと発話の意味表現の一例を示
す図である。
【図12】 この発明の実施の形態4による対話処理装
置における対話履歴記憶部に保持される、ユーザゴール
と発話の意味表現の一例を示す図である。
置における対話履歴記憶部に保持される、ユーザゴール
と発話の意味表現の一例を示す図である。
【図13】 上記実施の形態におけるスコアを時間的な
関数で制御した、対話履歴記憶部に保持されるユーザゴ
ールと発話の意味表現の一例を示す図である。
関数で制御した、対話履歴記憶部に保持されるユーザゴ
ールと発話の意味表現の一例を示す図である。
【図14】 従来の対話処理装置の機能ブロック構成を
示す図である。
示す図である。
10 入力文、11 ユーザゴール知識、12 ユーザゴー
ル抽出部、13 対話履歴記憶部、14 システムゴール知
識、15 システムゴール決定部、16 アクション系列知
識、17 ゴールフレーム生成部、18 ゴールフレーム記
憶部、19 アクション実行可能性判定部、20 外部アプ
リケーション、21 次アクション決定部。
ル抽出部、13 対話履歴記憶部、14 システムゴール知
識、15 システムゴール決定部、16 アクション系列知
識、17 ゴールフレーム生成部、18 ゴールフレーム記
憶部、19 アクション実行可能性判定部、20 外部アプ
リケーション、21 次アクション決定部。
フロントページの続き (56)参考文献 特開 平7−262190(JP,A) 特開 平7−261793(JP,A) 特開 平7−210391(JP,A) 特開 平6−12445(JP,A) 渡辺,外3名「ユーザの行動目標に基 づく対話管理手法」日本音響学会平成8 年秋季研究発表会講演論文集−▲I▼ −,p.5−6(平8−9−25) 渡辺,外3名「未知語を含む入力文に 対する対話管理方式の検討」日本音響学 会平成6年度春季研究発表会講演論文集 (1−7−13)(▲I▼)p.25−26 (平6−3−23) 中川,加藤「質問応答における話題管 理方式について」情報処理学会論文誌, Vol.28,No.9,1987,p.998 −1001(昭62−9−15) 加藤,中川「自然言語インタフェース システムにおける意図の把握と話題の管 理」情報処理学会論文誌,Vol.29, No.9,1988,p.815−823(昭63− 9−15) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 9/44 JICSTファイル(JOIS)
Claims (4)
- 【請求項1】ユーザの入力する自然言語による入力文の
意図の種類を規定するユーザゴールを定めたユーザゴー
ル知識を参照して、ユーザの入力する前記入力文からユ
ーザゴールを抽出し、前記入力文の意味表現を生成する
ユーザゴール抽出部と、 前記ユーザゴール抽出部から出力されるユーザゴールお
よび入力文の意味表現と、後述する次アクション決定部
から出力される意味表現とを保持する対話履歴記憶部
と、 前記ユーザゴールに対応するシステムゴールを、システ
ムの動作目標となるシステムゴールを規定するシステム
ゴール知識の中から決定するシステムゴール決定部と、 前記システムゴール決定部、あるいは後述するアクショ
ン実行可能性判定部から入力されたシステムゴールに対
して、前記システムゴールを達成するために必要なシス
テムのアクションの系列を規定するアクション系列知識
の中から対応するアクション系列知識を読み出し、シス
テムゴールとそのアクション系列知識の対からなるゴー
ルフレームを生成するゴールフレーム生成部と、 前記ゴールフレーム生成部から出力されるゴールフレー
ムを保持するゴールフレーム記憶部と、 アクション指令を入力として駆動し、アクションの実行
結果を出力する外部アプリケーションと、 前記対話履歴記憶部から意味表現を読み出し、前記ゴー
ルフレーム記憶部で処理の対象にあるゴールフレーム中
のアクションに対して、前記外部アプリケーションに対
するアクションの実行に必要な引数を設定して実行可能
性を判定し、前記外部アプリケーションに対するアクシ
ョンが実行可能であればそのアクションを前記アクショ
ン指令として出力し、実行不可能であれば前記システム
ゴール知識に基づいて新たなシステムゴールを生成して
前記ゴールフレーム生成部に出力するアクション実行可
能性判定部と、 前記外部アプリケーションの出力するアクションの実行
結果に応じて、前記ゴールフレーム記憶部で処理の対象
にあるゴールフレームのアクション系列上で、次に実行
すべきアクションを決定するとともに、前記アクション
の実行結果から得られる意味表現を前記対話履歴記憶部
に出力する次アクション決定部とを備えた対話処理装
置。 - 【請求項2】対話履歴記憶部が、ユーザゴール抽出部か
ら出力されるユーザゴールおよび入力文の意味表現と、
次アクション決定部から出力される意味表現とをスタッ
クに保持するものであり、 アクション実行可能性判定部が、ユーザの入力する自然
言語による入力文に指示・代名詞あるいは省略表現が含
まれているために、読み出した入力文の意味表現からだ
けでは設定できないアクションの引数が存在する場合
に、前記対話履歴記憶部のスタックの要素を順次読み出
し、アクションの引数を設定するものであることを特徴
とする請求項1記載の対話処理装置。 - 【請求項3】対話履歴記憶部が、意味表現中の各データ
にスコアを与えるものであり、 アクション実行可能性判定部が、前記各データに与えら
れたスコアに応じてアクションの引数を設定することを
特徴とする請求項1記載の対話処理装置。 - 【請求項4】対話履歴記憶部が、意味表現中の各データ
に与えたスコアを時間的な関数で制御することを特徴と
する請求項3記載の対話処理装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP1996/002787 WO1998013771A1 (fr) | 1996-09-26 | 1996-09-26 | Processeur interactif |
Publications (1)
Publication Number | Publication Date |
---|---|
JP3212618B2 true JP3212618B2 (ja) | 2001-09-25 |
Family
ID=14153894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51547598A Expired - Fee Related JP3212618B2 (ja) | 1996-09-26 | 1996-09-26 | 対話処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6035267A (ja) |
EP (1) | EP0863466A4 (ja) |
JP (1) | JP3212618B2 (ja) |
WO (1) | WO1998013771A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6370962B1 (ja) * | 2017-05-12 | 2018-08-08 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
JP2023083241A (ja) * | 2021-12-03 | 2023-06-15 | ソプラ株式会社 | 処理動作支援装置及びプログラム |
Families Citing this family (159)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6275788B1 (en) * | 1996-09-26 | 2001-08-14 | Mitsubishi Denki Kabushiki Kaisha | Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility |
US6144938A (en) | 1998-05-01 | 2000-11-07 | Sun Microsystems, Inc. | Voice user interface with personality |
WO2000021073A1 (en) * | 1998-10-02 | 2000-04-13 | International Business Machines Corporation | Structure skeletons for efficient voice navigation through generic hierarchical objects |
US6421655B1 (en) * | 1999-06-04 | 2002-07-16 | Microsoft Corporation | Computer-based representations and reasoning methods for engaging users in goal-oriented conversations |
JP5118280B2 (ja) * | 1999-10-19 | 2013-01-16 | ソニー エレクトロニクス インク | 自然言語インターフェースコントロールシステム |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US7047196B2 (en) * | 2000-06-08 | 2006-05-16 | Agiletv Corporation | System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery |
US20030023435A1 (en) * | 2000-07-13 | 2003-01-30 | Josephson Daryl Craig | Interfacing apparatus and methods |
US8095370B2 (en) * | 2001-02-16 | 2012-01-10 | Agiletv Corporation | Dual compression voice recordation non-repudiation system |
WO2002073598A1 (en) * | 2001-03-14 | 2002-09-19 | At & T Corp. | Method for automated sentence planning in a task classification system |
US7574362B2 (en) * | 2001-03-14 | 2009-08-11 | At&T Intellectual Property Ii, L.P. | Method for automated sentence planning in a task classification system |
US7729918B2 (en) * | 2001-03-14 | 2010-06-01 | At&T Intellectual Property Ii, Lp | Trainable sentence planning system |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7693720B2 (en) * | 2002-07-15 | 2010-04-06 | Voicebox Technologies, Inc. | Mobile systems and methods for responding to natural language speech utterance |
US20030115062A1 (en) * | 2002-10-29 | 2003-06-19 | Walker Marilyn A. | Method for automated sentence planning |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
US7620549B2 (en) | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
EP1934971A4 (en) * | 2005-08-31 | 2010-10-27 | Voicebox Technologies Inc | DYNAMIC LANGUAGE SCRIPTURE |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8073681B2 (en) | 2006-10-16 | 2011-12-06 | Voicebox Technologies, Inc. | System and method for a cooperative conversational voice user interface |
US7818176B2 (en) | 2007-02-06 | 2010-10-19 | Voicebox Technologies, Inc. | System and method for selecting and presenting advertisements based on natural language processing of voice-based input |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8140335B2 (en) | 2007-12-11 | 2012-03-20 | Voicebox Technologies, Inc. | System and method for providing a natural language voice user interface in an integrated voice navigation services environment |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US8589161B2 (en) | 2008-05-27 | 2013-11-19 | Voicebox Technologies, Inc. | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US9305548B2 (en) | 2008-05-27 | 2016-04-05 | Voicebox Technologies Corporation | System and method for an integrated, multi-modal, multi-device natural language voice services environment |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
US8326637B2 (en) * | 2009-02-20 | 2012-12-04 | Voicebox Technologies, Inc. | System and method for processing multi-modal device interactions in a natural language voice services environment |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US9171541B2 (en) * | 2009-11-10 | 2015-10-27 | Voicebox Technologies Corporation | System and method for hybrid processing in a natural language voice services environment |
WO2011059997A1 (en) | 2009-11-10 | 2011-05-19 | Voicebox Technologies, Inc. | System and method for providing a natural language content dedication service |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
DE112011100329T5 (de) | 2010-01-25 | 2012-10-31 | Andrew Peter Nelson Jerram | Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9424233B2 (en) | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US10031968B2 (en) * | 2012-10-11 | 2018-07-24 | Veveo, Inc. | Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface |
JP5835197B2 (ja) * | 2012-11-29 | 2015-12-24 | トヨタ自動車株式会社 | 情報処理システム |
CN113744733B (zh) | 2013-02-07 | 2022-10-25 | 苹果公司 | 数字助理的语音触发器 |
CN104020942A (zh) * | 2013-03-03 | 2014-09-03 | 上海能感物联网有限公司 | 汉语文本调用计算机程序运行的方法 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
AU2014233517B2 (en) | 2013-03-15 | 2017-05-25 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
FI3640938T3 (fi) | 2013-05-07 | 2024-10-04 | Adeia Guides Inc | Reaaliaikaista palautetta käyttävä inkrementaalinen puheensyöttöliittymä |
US9946757B2 (en) | 2013-05-10 | 2018-04-17 | Veveo, Inc. | Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
AU2014278592B2 (en) | 2013-06-09 | 2017-09-07 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
JP2016521948A (ja) | 2013-06-13 | 2016-07-25 | アップル インコーポレイテッド | 音声コマンドによって開始される緊急電話のためのシステム及び方法 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
JP2015052745A (ja) * | 2013-09-09 | 2015-03-19 | Necパーソナルコンピュータ株式会社 | 情報処理装置、制御方法、及びプログラム |
JP6252204B2 (ja) * | 2014-01-28 | 2017-12-27 | 富士通株式会社 | 情報処理装置、意図解析方法、およびプログラム |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
WO2016044290A1 (en) | 2014-09-16 | 2016-03-24 | Kennewick Michael R | Voice commerce |
WO2016044321A1 (en) | 2014-09-16 | 2016-03-24 | Min Tang | Integration of domain information into state transitions of a finite state transducer for natural language processing |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
CN107003999B (zh) | 2014-10-15 | 2020-08-21 | 声钰科技 | 对用户的在先自然语言输入的后续响应的系统和方法 |
US10614799B2 (en) | 2014-11-26 | 2020-04-07 | Voicebox Technologies Corporation | System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance |
US10431214B2 (en) | 2014-11-26 | 2019-10-01 | Voicebox Technologies Corporation | System and method of determining a domain and/or an action related to a natural language input |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9852136B2 (en) | 2014-12-23 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for determining whether a negation statement applies to a current or past query |
US9854049B2 (en) | 2015-01-30 | 2017-12-26 | Rovi Guides, Inc. | Systems and methods for resolving ambiguous terms in social chatter based on a user profile |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10331784B2 (en) | 2016-07-29 | 2019-06-25 | Voicebox Technologies Corporation | System and method of disambiguating natural language processing requests |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US20180114528A1 (en) * | 2016-10-26 | 2018-04-26 | IPsoft Incorporated | Systems and methods for generic flexible dialogue management |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612445A (ja) * | 1992-06-25 | 1994-01-21 | Agency Of Ind Science & Technol | 対話処理制御装置 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4688195A (en) * | 1983-01-28 | 1987-08-18 | Texas Instruments Incorporated | Natural-language interface generating system |
US4829423A (en) * | 1983-01-28 | 1989-05-09 | Texas Instruments Incorporated | Menu-based natural language understanding system |
US4624008A (en) * | 1983-03-09 | 1986-11-18 | International Telephone And Telegraph Corporation | Apparatus for automatic speech recognition |
JP2506809B2 (ja) * | 1987-08-19 | 1996-06-12 | 松下電器産業株式会社 | 日本語形態素解析装置 |
US4914590A (en) * | 1988-05-18 | 1990-04-03 | Emhart Industries, Inc. | Natural language understanding system |
JP2963463B2 (ja) * | 1989-05-18 | 1999-10-18 | 株式会社リコー | 対話型言語解析装置 |
JPH0333972A (ja) * | 1989-06-29 | 1991-02-14 | Oki Techno Syst Lab:Kk | 自然言語インタフェース装置における意味表現選択方式 |
JPH0748219B2 (ja) * | 1989-12-25 | 1995-05-24 | 工業技術院長 | 会話制御システム |
US5195172A (en) * | 1990-07-02 | 1993-03-16 | Quantum Development Corporation | System and method for representing and solving numeric and symbolic problems |
US5446891A (en) * | 1992-02-26 | 1995-08-29 | International Business Machines Corporation | System for adjusting hypertext links with weighed user goals and activities |
US5371807A (en) * | 1992-03-20 | 1994-12-06 | Digital Equipment Corporation | Method and apparatus for text classification |
US5377103A (en) * | 1992-05-15 | 1994-12-27 | International Business Machines Corporation | Constrained natural language interface for a computer that employs a browse function |
US5293584A (en) * | 1992-05-21 | 1994-03-08 | International Business Machines Corporation | Speech recognition system for natural language translation |
GB9217886D0 (en) * | 1992-08-21 | 1992-10-07 | Canon Res Ct Europe Ltd | Method and apparatus for parsing natural language |
JPH0789353B2 (ja) * | 1993-01-29 | 1995-09-27 | 日本電気株式会社 | 自然言語解析装置 |
GB2278467B (en) * | 1993-05-20 | 1998-04-01 | Canon Res Ct Europe Ltd | Apparatus and method for data processing and/or for control |
JPH07210391A (ja) * | 1994-01-24 | 1995-08-11 | Matsushita Electric Ind Co Ltd | 目的指向型マンマシン対話処理装置 |
JP3181465B2 (ja) * | 1994-03-18 | 2001-07-03 | 三菱電機株式会社 | 言語処理装置 |
JP3468572B2 (ja) * | 1994-03-22 | 2003-11-17 | 三菱電機株式会社 | 対話処理装置 |
JPH08146990A (ja) * | 1994-11-24 | 1996-06-07 | Matsushita Electric Ind Co Ltd | 自然言語対話装置 |
-
1996
- 1996-09-26 JP JP51547598A patent/JP3212618B2/ja not_active Expired - Fee Related
- 1996-09-26 WO PCT/JP1996/002787 patent/WO1998013771A1/ja not_active Application Discontinuation
- 1996-09-26 EP EP96932003A patent/EP0863466A4/en not_active Withdrawn
- 1996-09-26 US US09/043,510 patent/US6035267A/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0612445A (ja) * | 1992-06-25 | 1994-01-21 | Agency Of Ind Science & Technol | 対話処理制御装置 |
Non-Patent Citations (4)
Title |
---|
中川,加藤「質問応答における話題管理方式について」情報処理学会論文誌,Vol.28,No.9,1987,p.998−1001(昭62−9−15) |
加藤,中川「自然言語インタフェースシステムにおける意図の把握と話題の管理」情報処理学会論文誌,Vol.29,No.9,1988,p.815−823(昭63−9−15) |
渡辺,外3名「ユーザの行動目標に基づく対話管理手法」日本音響学会平成8年秋季研究発表会講演論文集−▲I▼−,p.5−6(平8−9−25) |
渡辺,外3名「未知語を含む入力文に対する対話管理方式の検討」日本音響学会平成6年度春季研究発表会講演論文集(1−7−13)(▲I▼)p.25−26(平6−3−23) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6370962B1 (ja) * | 2017-05-12 | 2018-08-08 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
JP2018194902A (ja) * | 2017-05-12 | 2018-12-06 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
JP2023083241A (ja) * | 2021-12-03 | 2023-06-15 | ソプラ株式会社 | 処理動作支援装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP0863466A4 (en) | 2005-07-20 |
WO1998013771A1 (fr) | 1998-04-02 |
US6035267A (en) | 2000-03-07 |
EP0863466A1 (en) | 1998-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3212618B2 (ja) | 対話処理装置 | |
US11869506B2 (en) | Selectively generating expanded responses that guide continuance of a human-to-computer dialog | |
US7827035B2 (en) | Speech recognition system and method | |
Seneff et al. | GALAXY-II: a reference architecture for conversational system development. | |
US6606599B2 (en) | Method for integrating computing processes with an interface controlled by voice actuated grammars | |
US6208972B1 (en) | Method for integrating computer processes with an interface controlled by voice actuated grammars | |
GB2357364A (en) | Dialog management in a conversational computer system | |
JP2004005530A (ja) | 音声対話インターフェースを利用した情報提供装置及びその方法 | |
US6275788B1 (en) | Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility | |
US7430511B1 (en) | Speech enabled computing system | |
JP2003108581A (ja) | 対話型情報検索装置および対話型情報検索方法 | |
JP2003030187A (ja) | 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム | |
Turunen et al. | Agent-based adaptive interaction and dialogue management architecture for speech applications | |
JP2009223720A (ja) | 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム | |
US12142277B2 (en) | Generating a composite response to natural language input using a trained generative model and based on responsive content from disparate content agents | |
KR102705333B1 (ko) | 프로젝트 수행내용 자동기록 방법 및 장치 | |
JPH03233676A (ja) | 会話制御方式 | |
US12141540B2 (en) | Message mapping and combination for intent classification | |
JP3525999B2 (ja) | 言語理解方法及び言語理解装置 | |
TWI836856B (zh) | 用於意圖分類之訊息映射及組合 | |
JP2004139446A (ja) | 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法 | |
JP4223841B2 (ja) | 音声対話システム及び方法 | |
JPH08235177A (ja) | 情報処理装置 | |
JPH08185412A (ja) | 文書処理方法及びその装置 | |
JPH03233677A (ja) | 会話制御方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070719 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080719 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |