[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP3212618B2 - 対話処理装置 - Google Patents

対話処理装置

Info

Publication number
JP3212618B2
JP3212618B2 JP51547598A JP51547598A JP3212618B2 JP 3212618 B2 JP3212618 B2 JP 3212618B2 JP 51547598 A JP51547598 A JP 51547598A JP 51547598 A JP51547598 A JP 51547598A JP 3212618 B2 JP3212618 B2 JP 3212618B2
Authority
JP
Japan
Prior art keywords
goal
action
user
unit
storage unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP51547598A
Other languages
English (en)
Inventor
圭輔 渡邉
明人 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Application granted granted Critical
Publication of JP3212618B2 publication Critical patent/JP3212618B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
この発明は自然言語によるマン・マシン・インタフェ
ースに用いられる対話処理装置に関し、特に文脈情報を
用いた処理を行うことによって、ユーザとシステムとの
より自由な対話を実現する対話処理装置に関する。
【0002】
【従来の技術】
自然言語を用いた対話型のマン・マシン・インタフェ
ースで用いられる対話処理装置においては、ユーザの入
力に対してシステムが応答し、それに対してユーザが応
答する、という対話を繰り返すことによってユーザは目
的を達成する。このような対話処理装置において、ユー
ザとシステムがより円滑で効率のよい対話を行なうため
には、ユーザが対話の主導権を持ってシステムに動作を
要求するユーザー主導の状況と、システムが対話の主導
権を持ってユーザに要求的な応答を行い、ユーザから情
報を得るというようなシステム主導の状況とを適切に制
御する必要がある。そのためには、ユーザ入力の意図か
らシステムは適切な動作目標を設定して対話を制御でき
なければならない。
【0003】 このような自然言語マン・マシン・インタフェース装
置に用いられる対話処理装置としては、例えば特開昭63
−153631号公報に示すものが知られている。図14はその
ような従来の対話処理装置の構成を示す図である。 図において、1は例えば、検索システムのように格納
してある情報の中から、ユーザの要求に即応した情報を
提供する情報提供システムであり、2はこの情報提供シ
ステム1より出力される出力情報である。3はユーザか
ら入力された自然言語による入力文であり、4はその自
然言語による入力文3の意味を解釈する自然言語解釈手
段である。5はその自然言語解釈手段4によって解釈さ
れた入力文3の意味に応じて、情報提供システム1への
コマンドを生成するコマンド生成手段である。6はこの
コマンド生成手段5の生成したコマンドに対応する情報
提供システム1の情報から、ユーザの注視物を取り出し
て管理し、自然言語解釈手段4における解釈に参照させ
るための話題管理手段である。7は話題管理手段6がユ
ーザの現在注視している対象物とその変遷を格納する注
視物格納手段である。
【0004】 このような従来の対話処理装置においては、ユーザの
入力する自然言語による入力文3に対応する情報提供シ
ステム1のコマンドにより、ユーザ主導でシステムとの
対話を行なうことができる。また、ユーザの注視してい
る事物を抽出して注視物格納手段7に格納しておき、そ
れを文脈解析で用いることによって文脈解析を簡易化
し、解釈誤りを少なくして対話を円滑にすることができ
る。
【0005】
【発明が解決しようとする課題】
従来の対話処理装置は以上のように構成されているの
で、ユーザの入力した自然言語による入力文3に対応し
たコマンドを情報提供システム1にて生成し、それを実
行するだけであって、システム自身の動作目標が存在せ
ず、システム主導の対話への切り替えが行なわれないた
め、例えばシステム自身の動作に必要な情報が足りない
場合や、ユーザからの入力文3に誤りが含まれている場
合には円滑な対話が維持できないという問題点があっ
た。
【0006】 また、自然言語入力には省略表現・指示表現が多く用
いられ、その内容を同定するためには、ユーザに省略部
分・指示部分の再入力を要求することが必要になるが、
システムが何度もユーザに確認を求める対話はユーザに
とって自由な対話とは言えず、対話の文脈から省略表現
・指示表現の補完を行なうことが必要である。このと
き、省略・指示表現されるものは必ずしもユーザの注視
している対象物のみとは限らない。また省略・指示表現
の内容は必ずしも直前の発話に現れるとは限らず、対話
の文脈中に複数の補完候補が存在する場合もある。さら
に、複数の補完候補からどれを選択するかという基準は
常に一定に定まってはおらず、対話の状況において動的
に変化する。従って、文脈情報から補完を行なうかどう
かの制御が必要となり、また補完を行なう場合には、補
完内容を選択するための基準および選択基準の制御が必
要となる。
【0007】 しかしながら、上記特開昭63−153631号公報に示した
対話処理装置では、文脈処理において、ユーザの注視し
ている対象物のみを扱うため、例えば情報検索の条件の
省略に対する補完が行なえないという問題点があった。
【0008】 また、そのような問題点を改善した対話処理装置とし
て、例えば特開平1−222326号公報に示される対話処理
装置も従来より知られている。この対話処理装置によれ
ば、対話が始まってからの入力文と出力文の履歴情報を
保持しておき、ユーザの入力文の意図を意図解釈ルール
に従って解釈するとき、省略された要素が存在する場合
にその履歴情報を参照することによってその省略を補完
し、ユーザの意図を判断することができる。
【0009】 しかしながら、上記のような対話処理装置では、省略
表現を対話履歴から補完する場合、その選択基準が規則
として固定されたものであるため、対話の状況に応じて
動的に選択基準を変化させることができないという問題
点があった。
【0010】 この発明は上記のような課題を解決するためになされ
たもので、ユーザの意図からシステム自身の適切な動作
目的を設定して、ユーザとシステムの対話の主導権を適
切に制御できる対話処理装置を提供することを目的とし
ている。
【0011】 また、この発明は、さらに、対話の文脈情報の選択基
準を対話の状況に応じて動的に制御し、ユーザの自然言
語による入力文に含まれる省略表現・指示表現に対する
文脈処理を適切に行なうことができる対話処理装置を提
供することを目的としている。
【0012】
【課題を解決するための手段】
この発明に係る対話処理装置は、ユーザゴール抽出部
によって、入力文の意味表現とユーザゴール知識に規定
された入力文の意図を表すユーザゴールを、ユーザの入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの系列とからゴールフレーム生成部にてゴールフレ
ームを生成して、そのゴールフレームをゴールフレーム
記憶部に保持し、アクション実行可能性判定部が対話履
歴記憶部から意味表現を読み出して、ゴールフレーム記
憶部で処理の対象にあるゴールフレーム中のアクション
に対して、外部アプリケーションに対するアクションの
実行に必要な引数を設定して実行可能性を判定し、外部
アプリケーションに対するアクションが実行不可能であ
ればシステムゴール知識に基づいて新たなシステムゴー
ルを生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたものである。
【0013】 この発明に係る対話処理装置は、ユーザゴール抽出部
から出力されるユーザゴールおよび入力文の意味表現
と、次アクション決定部から出力される意味表現とを、
対話履歴記憶部がスタックに保持し、アクション実行可
能性判定部にて入力文の意味表現からだけでは設定でき
ないアクションの引数が存在する場合に、対話履歴記憶
部のスタック要素を順次読み出してアクションの引数を
設定するようにしたものである。
【0014】 この発明に係る対話処理装置は、対話履歴記憶部にて
意味表現中の各データにスコアを与え、アクション実行
可能性判定部にて各データに与えられたスコアに応じて
アクションの引数を設定するようにしたものである。
【0015】 この発明に係る対話処理装置は、対話履歴記憶部にて
意味表現中の各データに与えたスコアを時間的な関数で
制御するようにしたものである。
【0016】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。 実施の形態1. 図1はこの発明の実施の形態1による対話処理装置の
機能構成ブロックを示す図である。図において、10はユ
ーザの入力する自然言語による入力文であり、11はこの
自然言語による入力文10の意図の種類を規定するユーザ
ゴールを定めたユーザゴール知識である。12はユーザの
入力する入力文10の自然言語から、このユーザゴール知
識11を参照してユーザゴールを抽出し、入力文10の意味
表現を生成するユーザゴール抽出部であり、13はこのユ
ーザゴール抽出部12から出力されるユーザゴールおよび
意味表現と、後述する次アクション決定部21から出力さ
れる意味表現を保持する対話履歴記憶部である。14はシ
ステムの動作目標となるシステムゴールを規定するシス
テムゴール知識であり、15はユーザゴール抽出部12から
のユーザゴールに対応するシステムゴールを、そのシス
テムゴール知識14の中から決定するシステムゴール決定
部である。
【0017】 16はそのシステムゴールを達成するために必要なシス
テムのアクションの系列を規定するアクション系列知識
であり、17はシステムゴール決定部15あるいは後述する
アクション実行可能性判定部19から入力されるシステム
ゴールに対して、このアクション系列知識16から対応す
るアクション系列知識を読み出し、システムゴールとア
クション系列知識の対からなるゴールフレームを生成す
るゴールフレーム生成部である。18はこのゴールフレー
ム生成部17から出力されるゴールフレームを保持するゴ
ールフレーム記憶部である。
【0018】 19は対話履歴記憶部13から発話の意味表現を読み出
し、ゴールフレーム記憶部18で処理の対象にあるゴール
フレーム中のアクションに対して、アクションの実行に
必要な引数を設定して実行可能性を判定し、実行可能で
あればそれをアクション指令として出力し、実行不可能
の場合には新たなシステムゴールを生成してゴールフレ
ーム生成部17に出力するアクション実行可能性判定部で
ある。20はこのアクション実行可能性判定部19から出力
されたアクション指令を入力として駆動され、アクショ
ンの実行結果を出力する外部アプリケーションであり、
21はこの外部アプリケーション20の出力する実行結果に
応じて、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレームのアクション系列上で、次に実行すべきア
クションを決定するとともに、実行結果を対話履歴記憶
部13に出力する次アクション決定部である。
【0019】 次に動作について説明する。 ここで、図2はユーザゴール知識11の内容の一例を示
したものであり、例えば「〈名称〉〈属性名〉教えて下
さい」あるいは「〈名称〉〈属性名〉知りたいんです
が」といったユーザ発話を、共に「属性値を得たい」と
いうユーザゴールGET_AVALUEに対応付けている。なお、
〈名称〉あるいは〈属性名〉は後述するシステムのアク
ションを実行するために必要となる引数である。 ユーザゴール抽出部12はユーザによって入力文10とし
て入力される自然言語による発話、例えば「建長寺の拝
観料を教えて下さい」に対して構文解析を行い、例えば
図3に示すようなユーザゴールおよび発話の意味表現、
すなわち[ユーザゴール]:=GET_AVALUE、〈名称〉:
=建長寺、〈属性名〉:=拝観料を生成する。このよう
にユーザゴール抽出部12によって生成されたユーザゴー
ルおよび発話の意味表現は、対話履歴記憶部13に送られ
てそこに保持されるとともに、システムゴール決定部15
にも入力される。
【0020】 なお、図4はシステムゴール知識14の内容の一例を示
すものであり、システムのゴールとして、「属性値をユ
ーザに提示する」動作を意味するGIVE_AVALUE、「デー
タベースから条件に合うものをユーザに提示する」動作
を意味するRETRIEVE_RECORDが定義されている。また、
それぞれのシステムゴールに対してユーザゴールGET_AV
ALUEあるいはGET_RECORDが対応付けられている。
【0021】 システムゴール決定部15はユーザゴール抽出部12から
入力されるユーザゴールに対応したシステムゴールを、
このシステムゴール知識14から決定して、それをゴール
フレーム生成部17に出力する。例えば、ユーザゴール抽
出部12からユーザゴールGET_AVALUEが入力されると、シ
ステムゴール決定部15はシステムゴール知識14の中から
システムゴールGIVE_AVALUEを決定して出力する。
【0022】 ここで、図5はアクション系列知識11の内容の一例を
示すものであり、1行目〜4行目にはシステムのアクシ
ョンが宣言されている。例えば、1行目のアクションre
trieve_avalueは2つの引数〈名称〉と〈属性名〉を持
つアクションである。このアクションの実行に必須の引
数は引数の名前の前に記号!を付与して定義する。な
お、5行目以降では、例えばシステムゴールGIVE_AVALU
Eを達成するために必要なアクションの系列が定義され
ており、最初に起動されるアクションがretrieve_avalu
eであり、その実行結果がILLEGAL_ATTRIBUTEならば次の
アクションがinform_illegal、NONEならばinform_non
e、AVALUEならばinform_avalueと定義されている。
【0023】 システムゴール決定部15からシステムゴールが入力さ
れると、ゴールフレーム生成部17はこのアクション系列
知識16から、そのシステムゴールに対応するアクション
系列知識を得てゴールフレームを生成する。図6は、例
えばシステムゴールGIVE_AVALUEがシステムゴール決定
部15から入力された場合に、ゴールフレーム生成部17が
生成するゴールフレームの例を示したものである。アク
ション系列知識16から得られるアクション系列知識は、
各枝にアクションの実行結果がラベル付けされた木構造
にて保持されており、最初のノードが処理の対象となる
アクション(以下、カレントアクションという)として
設定される。
【0024】 このようにしてゴールフレーム生成部17から出力され
たゴールフレームは、例えばスタックとしてゴールフレ
ーム記憶部18に保持され、そのスタックの先頭要素のゴ
ールフレーム(以下、カレントゴールフレームという)
が以後の処理の対象となる。
【0025】 次いで、アクション実行可能性判定部19が対話履歴記
憶部13から発話の意味表現を読み出し、ゴールフレーム
記憶部18の保持するカレントゴールフレームのカレント
アクションに対して引数の設定を行なう。例えば、図6
に示したゴールフレームのカレントアクションretrieve
_avalueに対して、対話履歴記憶部13に保持されている
図3に示す発話の意味表現から、引数〈名称〉:=建長
寺と〈属性名〉:=拝観料とを設定する。全ての必須引
数の設定が完了したカレントアクションは実行可能とな
り、アクション実行可能性判定部19からアクション指令
として外部アプリケーション20に出力される。一方、必
須引数の設定が完了しないアクションは実行不可能と判
定して、アクション実行可能性判定部19はゴールフレー
ム生成部17に、必須引数をユーザから得るためのシステ
ムゴール、例えばGET_ATTNAMEを出力する。
【0026】 外部アプリケーション20は、例えばデータベースから
の情報検索システム、ホテル予約システム、航空券予約
システムであり、アクション実行可能性判定部19から出
力されるアクション指令を実行して実行結果を出力する
ものである。例えば、アクション実行可能性判定部19か
らアクション指令retrieve_avalue(建長寺 拝観料)
が入力されると、観光案内データベースより該当するデ
ータの検索を行い、その実行結果として、検索の条件が
不適当な場合にはILLEGAL_ATTRIBUTEを、該当するデー
タが得られない場合にはNONEを、該当するデータが得ら
れた場合にはAVALUEをそれぞれ次アクション決定部21に
出力する。また、この外部アプリケーション20は、例え
ば検索結果、予約状況をユーザに対して、合成音声やグ
ラフィカル・ユーザ・インタフェース(GUI)などによ
って提示する。
【0027】 次アクション決定部21はこの外部アプリケーション20
から出力される実行結果から、ゴールフレーム記憶部18
のアクション系列知識木の対応する枝を選択し、次アク
ションを決定してカレントアクションとする。例えば、
アクション実行可能判定部19からアクション指令retrie
ve_avalue(建長寺 拝観料)が入力され、外部アプリ
ケーション20が実行結果AVALUE:=[〈拝観料〉:=30
0]を出力する場合、次アクション決定部16は実行結果
に含まれる意味表現〈拝観料〉:=300を対話履歴記憶
部13に出力する。さらに、図6に示したアクション知識
木中のAVALUEがラベル付けされた枝を選択して次アクシ
ョンinform_avalueに決定し、それをカレントアクショ
ンとする。なお、選択する枝がカレントゴールフレーム
のアクション知識木に存在しないということは、カレン
トゴールフレームの達成するアクションが全て実行され
た場合であるので、そのような場合にはカレントゴール
フレームをゴールフレーム記憶部18から取り除く。
【0028】 アクション実行可能性判定部19はこのゴールフレーム
記憶部18のカレントアクションが変化するたびに起動さ
れ、システムゴール決定部15によって決定されたシステ
ムゴールを達成する。 このように、この実施の形態1によれば、ユーザの発
話からユーザゴールを抽出して当該ユーザゴールに応じ
てシステムゴールを決定し、そのシステムゴールを達成
するためにシステムゴールに対応したシステムのアクシ
ョン系列を実行し、また、アクションが実行できない場
合には、新たなシステムゴールを生成して、それに応じ
たアクションの実行を行なうものであるため、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御することの
できる対話処理装置が得られる効果がある。
【0029】 実施の形態2. なお、上記実施の形態1では、ユーザゴール抽出部12
から出力されるユーザゴールおよび意味表現と、次アク
ション決定部21から出力される意味表現とを単純に対話
履歴記憶部13に保持し、アクション実行可能性判定部19
においてその対話履歴記憶部13から発話の意味表現を読
み出し、ゴールフレーム記憶部18で処理の対象にあるゴ
ールフレーム中のアクションに対して、アクションの実
行に必要な引数を設定して実行可能性を判定し、実行可
能であればアクション指令を出力し、実行不可能の場合
には新たなシステムゴールを生成してゴールフレーム生
成部17に出力するものについて示したが、対話履歴記憶
部13において、ユーザゴール抽出部12から出力されるユ
ーザゴールおよび意味表現と次アクション決定部21から
出力される意味表現とをスタックに保持し、さらにアク
ション実行可能性判定部19にて入力文の意味表現からだ
けでは設定できないアクションの引数が存在する場合
に、対話履歴記憶部13のスタック要素を順次読み出して
アクションの引数を設定するようにしてもよい。
【0030】 そのようなこの発明の実施の形態2による対話処理装
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1の場合と同様に動作
する。
【0031】 次にその動作について、対話履歴記憶部13およびアク
ション実行可能性判定部19の動作を中心に説明する。 ここで、図7はこの対話処理装置とユーザとの対話の
一例を示すものである。図示のように、ユーザの発話U1
「建長寺の拝観料を教えて下さい」が入力されると、上
記実施の形態1において説明したごとく、当該対話処理
装置が動作して、システムの応答S1「300円です」かそ
の外部アプリケーション20により、例えば合成音声によ
ってユーザに提示される。その後、ユーザの発話U2「円
覚寺はどうですか」が入力されると、ユーザゴール抽出
部12は図8に示すユーザゴールおよび発話の意味表現、
すなわち[ユーザコール]:=GET_AVALUE、〈名称〉:
=円覚寺を生成する。
【0032】 このユーザゴール抽出部12から出力されたユーザゴー
ルおよび発話の意味表現、すなわち[ユーザコール]:
=GET_AVALUE、〈名称〉:=円覚寺は、ユーザの発話U1
およびシステムの応答S1に対応したユーザゴールおよび
発話の意味表現、すなわち[ユーザコール]:=GET_AV
ALUE、〈名称〉:=建長寺、〈属性名〉:=拝観料、お
よび〈拝観料〉:=300とともに、図9に示すように対
話履歴記憶部13においてスタックに保持される。 システムゴール決定部15、ゴールフレーム生成部17お
よびゴールフレーム記憶部18は上記実施の形態1の場合
と同様に動作し、それによって、カレントゴールフレー
ムは図6に示すものとなる。
【0033】 アクション実行可能性判定部19は対話履歴記憶部13か
ら発話の意味表現を読み出し、カレントアクションretr
ieve_avalueに対して引数の設定を行なう。そのとき、
必須引数〈名称〉は図9に示すスタックの先頭要素から
〈名称〉:=円覚寺と設定されるが、必須引数〈属性
名〉はこの先頭要素から設定することはできない。その
ような場合、アクション実行可能性判定部19は対話履歴
記憶部13のスタック要素を順次読み出して引数の設定を
行なう。その結果、必須引数〈属性名〉は〈属性名〉:
=拝観料と設定される。このようにして、全ての必須引
数の設定が完了すると、アクション実行可能性判定部19
はそのカレントアクションが実行可能になったものと判
断して、それをアクション指令として外部アプリケーシ
ョン20に出力する。
【0034】 このように、この実施の形態2によれば、発話の意味
表現からだけでは設定できないアクションの引数が存在
する場合に、ユーザゴール抽出部12から出力されるユー
ザゴールおよび発話の意味表現と、次アクション決定部
21から出力される意味表現とを保持した対話履歴記憶部
13のスタック要素を、アクション実行可能性判定部19に
て順次読み出してアクションの引数設定を行うようにし
たため、ユーザの入力する自然言語発話に含まれる指示
・代名詞あるいは省略表現の補完を行なえる対話処理装
置が得られる効果がある。
【0035】 実施の形態3. また、上記実施の形態2では、対話履歴記憶部13にて
ユーザゴール抽出部12から出力されるユーザゴールおよ
び意味表現と次アクション決定部21から出力される意味
表現をスタックに保持し、入力文の意味表現からだけは
設定できないアクションの引数が存在する場合、アクシ
ョン実行可能性判定部19で対話履歴記憶部13のスタック
要素を順次読み出してアクションの引数を設定するもの
について説明したが、対話履歴記憶部13において意味表
現中の各データにスコアを与え、アクション実行可能性
判定部19にて各データに与えられたスコアに応じたアク
ションの引数の設定を行うようにしてもよい。
【0036】 そのようなこの発明の実施の形態3による対話処理装
置は図1に示した実施の形態1の場合と同様に構成さ
れ、これら対話履歴記憶部13およびアクション実行可能
性判定部19を除いた、ユーザゴール知識11およびユーザ
ゴール抽出部12、システムゴール知識14〜ゴールフレー
ム記憶部18、外部アプリケーション20および次アクショ
ン決定部21の各部は、実施の形態1あるいは実施の形態
2の場合と同様に動作する。
【0037】 次にその動作について、対話履歴記憶部13およびアク
ション実行可能性判定部19の動作を中心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すように、その意味表現中のデ
ータにスコアの初期値を与える。例えば、〈名称|5〉
は、〈名称〉:=円覚寺に対してスコア5が与えられて
いることを示す。しかる後に対話履歴記憶部13はそのユ
ーザゴールおよび発話の意味表現をスタックに保持す
る。
【0038】 アクション実行可能性判定部19はこの対話履歴記憶部
13から、そのデータにスコアが与えられた発話の意味表
現を読み出して、カレントアクションretrieve_avalue
に対する引数の設定を行なう。そのときアクション実行
可能性判定部19は、意味表現のスコアがあらかじめ設定
された閾値を越える場合にのみ引数の設定を行なう。
【0039】 ここで、例えば、図11に示すように、スタックの先頭
要素の〈名称〉:=円覚寺に対してスコア5が、末尾要
素の〈名称〉:=建長寺および〈属性名〉:=拝観料に
対してスコア3がそれぞれ与えられているとき、閾値と
して3が設定されている場合には、カレントアクション
retrieve_avalueに対する引数は上記実施の形態2の場
合と同様に設定される。また、閾値として5が設定され
ている場合には、必須引数〈名称〉の設定は上記実施の
形態2と同様に行われるが、必須引数〈属性名〉の設定
は行われない。
【0040】 アクション実行可能性判定部19は必須引数の設定が完
了しないアクションを実行不可能と判定し、必須引数を
ユーザから得るためのシステムゴール、例えばGET_ATTN
AMEをゴールフレーム生成部17へ出力する。また、その
とき引数の設定に用いられた意味表現のスコアは一定値
だけ増加される。例えば、図11に示すスタックの〈属性
名|3〉が引数設定に用いられた場合、スコアが例えば1
だけ増加されて〈属性名|4〉となる。
【0041】 このように、この実施の形態3によれば、対話履歴記
憶部13にて意味表現中の各データにスコアを与え、アク
ション実行可能性判定部19にて各データに与えられたス
コアに応じてアクションの引数を設定するようにしたた
め、対話の状況に応じた動物な補完候補の選択が行なえ
る対話処理装置が得られる効果がある。
【0042】 実施の形態4. また、上記実施の形態3では、意味表現中の各データ
にスコアを与えておき、そのスコアに応じてアクション
の引数設定を行うものについて説明したが、対話履歴記
憶部13において意味表現中の各データに与えたスコアを
時間的な関数で制御するようにしてもよい。そのような
この発明の実施の形態4による対話処理装置は図1に示
した実施の形態1の場合と同様に構成され、この対話履
歴記憶部13を除いた各部は実施の形態3の場合と同様に
動作する。
【0043】 次にその動作について、対話履歴記憶部13の動作を中
心に説明する。 対話履歴記憶部13はユーザゴール抽出部12から出力さ
れる、例えば図8に示すユーザゴールおよび発話の意味
表現に対して、図10に示すようにスコアの初期値5を与
え、それをスタックに保持する。このスタックには例え
ば、図12に示すように、スコア5あるいは4が与えられ
た意味表現、すなわち〈拝観料|5〉:=300と、〈名称|
4〉:=建長寺および〈属性名|4〉:=拝観料がすでに
保持されている場合、それぞれのスコア5および4を時
間的な関数を用いて変更する。この時間的な関数として
は、例えば意味表現が当該スタックに保持された時点か
ら、当該対話処理装置とユーザとの発話の回数nの関
数、S(n)=1.5nが用いられる。
【0044】 その結果、図13に示すように、当該スタックに保持さ
れている意味表現は〈拝観料|2.5〉:=300、および
〈名称|0〉:=建長寺、〈属性名|0〉:=拝観料とその
スコアが変更され、さらに、前記新たなユーザゴールお
よび意味表現、すなわち[ユーザゴール]:=GET_AVAL
UEおよび〈名称|5〉=円覚寺がそのスタックに保持され
る。 このように、この実施の形態4によれば、対話履歴記
憶部13にて意味表現中の各データに与えたスコアを時間
的な関数で制御するようにしたため、対話の状況に応じ
た動的な補完選択基準の制御が行なえる対話処理装置が
得られる効果がある。
【0045】 以上のように、本発明にかかる対話処理装置は、ユー
ザの入力に対してシステムが応答し、それに対してユー
ザが応答するという対話を繰り返すことによってユーザ
が目的を達成する、自然言語を用いたマン・マシン・イ
ンタフェースに用いるのに適しており、特に、ユーザの
意図からシステム自身の適切な動作目標を設定して、ユ
ーザとシステムの対話の主導権を適切に制御できる対話
処理装置として、また、ユーザの入力する自然言語発話
に含まれる指示・代名詞あるいは省略表現の補完が行な
える対話処理装置として、また、対話の状況に応じた動
的な補完候補の選択、さらにはその補完選択基準の制御
が行なえる対話処理装置として有用である。
【0046】
【発明の効果】
以上のように、この発明によれば、ユーザゴール抽出
部によって、入力文の意味表現とユーザゴール知識に規
定された入力文の意図を表すユーザゴールを、ユーザ入
力した自然言語による入力文から抽出して、その入力文
の意味表現を対話履歴記憶部に保持し、ユーザゴールに
対応したシステムの動作目標となるシステムゴール知識
に規定されるシステムゴールをシステムゴール決定部で
決定し、そのシステムゴールとアクション系列知識に規
定されるシステムゴールの達成に必要なシステムアクシ
ョンの列とからゴールフレーム生成部にてゴールフレー
ムを生成して、そのゴールフレームをゴールフレーム記
憶部に保持し、アクション実行可能性判定部が対話履歴
記憶部から意味表現を読み出して、ゴールフレーム記憶
部で処理の対象にあるゴールフレーム中のアクションに
対して、外部アプリケーションに対するアクションの実
行に必要な引数を設定して実行可能性を判定し、外部ア
プリケーションに対するアクションが実行不可能であれ
ばシステムゴール知識に基づいて新たなシステムゴール
を生成し、実行可能であればアクション指令を出力し
て、そのアクション指令を外部アプリケーションで実行
し、その実行結果を次アクション決定部に送って、次ア
クション決定部がその実行結果に応じてシステムの次の
アクションを決定するようにしたので、ユーザの意図か
らシステム自身の適切な動作目標を設定して、ユーザと
システムの対話の主導権を適切に制御する対話処理が可
能な対話処理装置を実行することができるという効果が
ある。
【0047】 この発明によれば、ユーザゴール抽出部から出力され
るユーザゴールおよび入力文の意味表現と、次アクショ
ン決定部から出力される意味表現とを、対話履歴記憶部
がスタックに保持し、アクション実行可能性判定部にて
入力文の意味表現からだけでは設定できないアクション
の引数が存在する場合に、対話履歴記憶部のスタック要
素を順次読み出してアクションの引数を設定するように
したので、ユーザの入力する自然言語に含まれる指示・
代名詞あるいは省略表現の補完が可能になるという効果
がある。
【0048】 この発明によれば、対話履歴記憶部にて意味表現中の
各データにスコアを与え、アクション実行可能性判定部
にて各データに与えられたスコアに応じてアクションの
引数を設定するようにしたので、対話の状況に応じた動
的な補完候補の選択が行なえるようになるという効果が
ある。
【0049】 この発明によれば、対話履歴記憶部にて意味表現中の
各データに与えたスコアを時間的な関数で制御するよう
にしたので、対話の状況に応じた動的な補完選択基準の
制御が行なえるようになるという効果がある。 図面の簡単な説明
【図1】 この発明の実施の形態1による対話処理装置
の機能ブロック構成を示す図である。
【図2】 上記実施の形態におけるユーザゴール知識を
示す図である。
【図3】 上記実施の形態におけるユーザゴール抽出部
によって生成される、ユーザゴールと発話の意味表現を
示す図である。
【図4】 上記実施の形態におけるシステムゴール知識
を示す図である。
【図5】 上記実施の形態におけるアクション系列知識
を示す図である。
【図6】 上記実施の形態におけるゴールフレームの一
例を示す図である。
【図7】 この発明の実施の形態2による対話処理装置
におけるユーザと対話処理装置との対話の一例を示す図
である。
【図8】 上記実施の形態におけるユーザゴール抽出部
によって生成される、ユーザゴールと発話の意味表現の
一例を示す図である。
【図9】 上記実施の形態における対話履歴記憶部に保
持される、ユーザゴールと発話の意味表現の一例を示す
図である。
【図10】 この発明の実施の形態3による対話処理装
置におけるユーザゴール抽出部によって生成される、各
データにスコアを与えたユーザゴールと発話の意味表現
の一例を示す図である。
【図11】 上記実施の形態における対話履歴記憶部に
保持される、ユーザゴールと発話の意味表現の一例を示
す図である。
【図12】 この発明の実施の形態4による対話処理装
置における対話履歴記憶部に保持される、ユーザゴール
と発話の意味表現の一例を示す図である。
【図13】 上記実施の形態におけるスコアを時間的な
関数で制御した、対話履歴記憶部に保持されるユーザゴ
ールと発話の意味表現の一例を示す図である。
【図14】 従来の対話処理装置の機能ブロック構成を
示す図である。
【符号の説明】
10 入力文、11 ユーザゴール知識、12 ユーザゴー
ル抽出部、13 対話履歴記憶部、14 システムゴール知
識、15 システムゴール決定部、16 アクション系列知
識、17 ゴールフレーム生成部、18 ゴールフレーム記
憶部、19 アクション実行可能性判定部、20 外部アプ
リケーション、21 次アクション決定部。
フロントページの続き (56)参考文献 特開 平7−262190(JP,A) 特開 平7−261793(JP,A) 特開 平7−210391(JP,A) 特開 平6−12445(JP,A) 渡辺,外3名「ユーザの行動目標に基 づく対話管理手法」日本音響学会平成8 年秋季研究発表会講演論文集−▲I▼ −,p.5−6(平8−9−25) 渡辺,外3名「未知語を含む入力文に 対する対話管理方式の検討」日本音響学 会平成6年度春季研究発表会講演論文集 (1−7−13)(▲I▼)p.25−26 (平6−3−23) 中川,加藤「質問応答における話題管 理方式について」情報処理学会論文誌, Vol.28,No.9,1987,p.998 −1001(昭62−9−15) 加藤,中川「自然言語インタフェース システムにおける意図の把握と話題の管 理」情報処理学会論文誌,Vol.29, No.9,1988,p.815−823(昭63− 9−15) (58)調査した分野(Int.Cl.7,DB名) G06F 17/30 G06F 9/44 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】ユーザの入力する自然言語による入力文の
    意図の種類を規定するユーザゴールを定めたユーザゴー
    ル知識を参照して、ユーザの入力する前記入力文からユ
    ーザゴールを抽出し、前記入力文の意味表現を生成する
    ユーザゴール抽出部と、 前記ユーザゴール抽出部から出力されるユーザゴールお
    よび入力文の意味表現と、後述する次アクション決定部
    から出力される意味表現とを保持する対話履歴記憶部
    と、 前記ユーザゴールに対応するシステムゴールを、システ
    ムの動作目標となるシステムゴールを規定するシステム
    ゴール知識の中から決定するシステムゴール決定部と、 前記システムゴール決定部、あるいは後述するアクショ
    ン実行可能性判定部から入力されたシステムゴールに対
    して、前記システムゴールを達成するために必要なシス
    テムのアクションの系列を規定するアクション系列知識
    の中から対応するアクション系列知識を読み出し、シス
    テムゴールとそのアクション系列知識の対からなるゴー
    ルフレームを生成するゴールフレーム生成部と、 前記ゴールフレーム生成部から出力されるゴールフレー
    ムを保持するゴールフレーム記憶部と、 アクション指令を入力として駆動し、アクションの実行
    結果を出力する外部アプリケーションと、 前記対話履歴記憶部から意味表現を読み出し、前記ゴー
    ルフレーム記憶部で処理の対象にあるゴールフレーム中
    のアクションに対して、前記外部アプリケーションに対
    するアクションの実行に必要な引数を設定して実行可能
    性を判定し、前記外部アプリケーションに対するアクシ
    ョンが実行可能であればそのアクションを前記アクショ
    ン指令として出力し、実行不可能であれば前記システム
    ゴール知識に基づいて新たなシステムゴールを生成して
    前記ゴールフレーム生成部に出力するアクション実行可
    能性判定部と、 前記外部アプリケーションの出力するアクションの実行
    結果に応じて、前記ゴールフレーム記憶部で処理の対象
    にあるゴールフレームのアクション系列上で、次に実行
    すべきアクションを決定するとともに、前記アクション
    の実行結果から得られる意味表現を前記対話履歴記憶部
    に出力する次アクション決定部とを備えた対話処理装
    置。
  2. 【請求項2】対話履歴記憶部が、ユーザゴール抽出部か
    ら出力されるユーザゴールおよび入力文の意味表現と、
    次アクション決定部から出力される意味表現とをスタッ
    クに保持するものであり、 アクション実行可能性判定部が、ユーザの入力する自然
    言語による入力文に指示・代名詞あるいは省略表現が含
    まれているために、読み出した入力文の意味表現からだ
    けでは設定できないアクションの引数が存在する場合
    に、前記対話履歴記憶部のスタックの要素を順次読み出
    し、アクションの引数を設定するものであることを特徴
    とする請求項1記載の対話処理装置。
  3. 【請求項3】対話履歴記憶部が、意味表現中の各データ
    にスコアを与えるものであり、 アクション実行可能性判定部が、前記各データに与えら
    れたスコアに応じてアクションの引数を設定することを
    特徴とする請求項1記載の対話処理装置。
  4. 【請求項4】対話履歴記憶部が、意味表現中の各データ
    に与えたスコアを時間的な関数で制御することを特徴と
    する請求項3記載の対話処理装置。
JP51547598A 1996-09-26 1996-09-26 対話処理装置 Expired - Fee Related JP3212618B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP1996/002787 WO1998013771A1 (fr) 1996-09-26 1996-09-26 Processeur interactif

Publications (1)

Publication Number Publication Date
JP3212618B2 true JP3212618B2 (ja) 2001-09-25

Family

ID=14153894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51547598A Expired - Fee Related JP3212618B2 (ja) 1996-09-26 1996-09-26 対話処理装置

Country Status (4)

Country Link
US (1) US6035267A (ja)
EP (1) EP0863466A4 (ja)
JP (1) JP3212618B2 (ja)
WO (1) WO1998013771A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6370962B1 (ja) * 2017-05-12 2018-08-08 ヤフー株式会社 生成装置、生成方法および生成プログラム
JP2023083241A (ja) * 2021-12-03 2023-06-15 ソプラ株式会社 処理動作支援装置及びプログラム

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6275788B1 (en) * 1996-09-26 2001-08-14 Mitsubishi Denki Kabushiki Kaisha Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility
US6144938A (en) 1998-05-01 2000-11-07 Sun Microsystems, Inc. Voice user interface with personality
WO2000021073A1 (en) * 1998-10-02 2000-04-13 International Business Machines Corporation Structure skeletons for efficient voice navigation through generic hierarchical objects
US6421655B1 (en) * 1999-06-04 2002-07-16 Microsoft Corporation Computer-based representations and reasoning methods for engaging users in goal-oriented conversations
JP5118280B2 (ja) * 1999-10-19 2013-01-16 ソニー エレクトロニクス インク 自然言語インターフェースコントロールシステム
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US7047196B2 (en) * 2000-06-08 2006-05-16 Agiletv Corporation System and method of voice recognition near a wireline node of a network supporting cable television and/or video delivery
US20030023435A1 (en) * 2000-07-13 2003-01-30 Josephson Daryl Craig Interfacing apparatus and methods
US8095370B2 (en) * 2001-02-16 2012-01-10 Agiletv Corporation Dual compression voice recordation non-repudiation system
WO2002073598A1 (en) * 2001-03-14 2002-09-19 At & T Corp. Method for automated sentence planning in a task classification system
US7574362B2 (en) * 2001-03-14 2009-08-11 At&T Intellectual Property Ii, L.P. Method for automated sentence planning in a task classification system
US7729918B2 (en) * 2001-03-14 2010-06-01 At&T Intellectual Property Ii, Lp Trainable sentence planning system
US7398209B2 (en) * 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7693720B2 (en) * 2002-07-15 2010-04-06 Voicebox Technologies, Inc. Mobile systems and methods for responding to natural language speech utterance
US20030115062A1 (en) * 2002-10-29 2003-06-19 Walker Marilyn A. Method for automated sentence planning
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7620549B2 (en) 2005-08-10 2009-11-17 Voicebox Technologies, Inc. System and method of supporting adaptive misrecognition in conversational speech
US7949529B2 (en) 2005-08-29 2011-05-24 Voicebox Technologies, Inc. Mobile systems and methods of supporting natural language human-machine interactions
EP1934971A4 (en) * 2005-08-31 2010-10-27 Voicebox Technologies Inc DYNAMIC LANGUAGE SCRIPTURE
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US7818176B2 (en) 2007-02-06 2010-10-19 Voicebox Technologies, Inc. System and method for selecting and presenting advertisements based on natural language processing of voice-based input
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8140335B2 (en) 2007-12-11 2012-03-20 Voicebox Technologies, Inc. System and method for providing a natural language voice user interface in an integrated voice navigation services environment
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8589161B2 (en) 2008-05-27 2013-11-19 Voicebox Technologies, Inc. System and method for an integrated, multi-modal, multi-device natural language voice services environment
US9305548B2 (en) 2008-05-27 2016-04-05 Voicebox Technologies Corporation System and method for an integrated, multi-modal, multi-device natural language voice services environment
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US8326637B2 (en) * 2009-02-20 2012-12-04 Voicebox Technologies, Inc. System and method for processing multi-modal device interactions in a natural language voice services environment
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US9171541B2 (en) * 2009-11-10 2015-10-27 Voicebox Technologies Corporation System and method for hybrid processing in a natural language voice services environment
WO2011059997A1 (en) 2009-11-10 2011-05-19 Voicebox Technologies, Inc. System and method for providing a natural language content dedication service
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
DE112011100329T5 (de) 2010-01-25 2012-10-31 Andrew Peter Nelson Jerram Vorrichtungen, Verfahren und Systeme für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9424233B2 (en) 2012-07-20 2016-08-23 Veveo, Inc. Method of and system for inferring user intent in search input in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US10031968B2 (en) * 2012-10-11 2018-07-24 Veveo, Inc. Method for adaptive conversation state management with filtering operators applied dynamically as part of a conversational interface
JP5835197B2 (ja) * 2012-11-29 2015-12-24 トヨタ自動車株式会社 情報処理システム
CN113744733B (zh) 2013-02-07 2022-10-25 苹果公司 数字助理的语音触发器
CN104020942A (zh) * 2013-03-03 2014-09-03 上海能感物联网有限公司 汉语文本调用计算机程序运行的方法
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
AU2014233517B2 (en) 2013-03-15 2017-05-25 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
FI3640938T3 (fi) 2013-05-07 2024-10-04 Adeia Guides Inc Reaaliaikaista palautetta käyttävä inkrementaalinen puheensyöttöliittymä
US9946757B2 (en) 2013-05-10 2018-04-17 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
AU2014278592B2 (en) 2013-06-09 2017-09-07 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
JP2016521948A (ja) 2013-06-13 2016-07-25 アップル インコーポレイテッド 音声コマンドによって開始される緊急電話のためのシステム及び方法
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
JP2015052745A (ja) * 2013-09-09 2015-03-19 Necパーソナルコンピュータ株式会社 情報処理装置、制御方法、及びプログラム
JP6252204B2 (ja) * 2014-01-28 2017-12-27 富士通株式会社 情報処理装置、意図解析方法、およびプログラム
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
CN110797019B (zh) 2014-05-30 2023-08-29 苹果公司 多命令单一话语输入方法
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
WO2016044290A1 (en) 2014-09-16 2016-03-24 Kennewick Michael R Voice commerce
WO2016044321A1 (en) 2014-09-16 2016-03-24 Min Tang Integration of domain information into state transitions of a finite state transducer for natural language processing
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
CN107003999B (zh) 2014-10-15 2020-08-21 声钰科技 对用户的在先自然语言输入的后续响应的系统和方法
US10614799B2 (en) 2014-11-26 2020-04-07 Voicebox Technologies Corporation System and method of providing intent predictions for an utterance prior to a system detection of an end of the utterance
US10431214B2 (en) 2014-11-26 2019-10-01 Voicebox Technologies Corporation System and method of determining a domain and/or an action related to a natural language input
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10331784B2 (en) 2016-07-29 2019-06-25 Voicebox Technologies Corporation System and method of disambiguating natural language processing requests
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US20180114528A1 (en) * 2016-10-26 2018-04-26 IPsoft Incorporated Systems and methods for generic flexible dialogue management
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612445A (ja) * 1992-06-25 1994-01-21 Agency Of Ind Science & Technol 対話処理制御装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4688195A (en) * 1983-01-28 1987-08-18 Texas Instruments Incorporated Natural-language interface generating system
US4829423A (en) * 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US4624008A (en) * 1983-03-09 1986-11-18 International Telephone And Telegraph Corporation Apparatus for automatic speech recognition
JP2506809B2 (ja) * 1987-08-19 1996-06-12 松下電器産業株式会社 日本語形態素解析装置
US4914590A (en) * 1988-05-18 1990-04-03 Emhart Industries, Inc. Natural language understanding system
JP2963463B2 (ja) * 1989-05-18 1999-10-18 株式会社リコー 対話型言語解析装置
JPH0333972A (ja) * 1989-06-29 1991-02-14 Oki Techno Syst Lab:Kk 自然言語インタフェース装置における意味表現選択方式
JPH0748219B2 (ja) * 1989-12-25 1995-05-24 工業技術院長 会話制御システム
US5195172A (en) * 1990-07-02 1993-03-16 Quantum Development Corporation System and method for representing and solving numeric and symbolic problems
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US5371807A (en) * 1992-03-20 1994-12-06 Digital Equipment Corporation Method and apparatus for text classification
US5377103A (en) * 1992-05-15 1994-12-27 International Business Machines Corporation Constrained natural language interface for a computer that employs a browse function
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
GB9217886D0 (en) * 1992-08-21 1992-10-07 Canon Res Ct Europe Ltd Method and apparatus for parsing natural language
JPH0789353B2 (ja) * 1993-01-29 1995-09-27 日本電気株式会社 自然言語解析装置
GB2278467B (en) * 1993-05-20 1998-04-01 Canon Res Ct Europe Ltd Apparatus and method for data processing and/or for control
JPH07210391A (ja) * 1994-01-24 1995-08-11 Matsushita Electric Ind Co Ltd 目的指向型マンマシン対話処理装置
JP3181465B2 (ja) * 1994-03-18 2001-07-03 三菱電機株式会社 言語処理装置
JP3468572B2 (ja) * 1994-03-22 2003-11-17 三菱電機株式会社 対話処理装置
JPH08146990A (ja) * 1994-11-24 1996-06-07 Matsushita Electric Ind Co Ltd 自然言語対話装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0612445A (ja) * 1992-06-25 1994-01-21 Agency Of Ind Science & Technol 対話処理制御装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
中川,加藤「質問応答における話題管理方式について」情報処理学会論文誌,Vol.28,No.9,1987,p.998−1001(昭62−9−15)
加藤,中川「自然言語インタフェースシステムにおける意図の把握と話題の管理」情報処理学会論文誌,Vol.29,No.9,1988,p.815−823(昭63−9−15)
渡辺,外3名「ユーザの行動目標に基づく対話管理手法」日本音響学会平成8年秋季研究発表会講演論文集−▲I▼−,p.5−6(平8−9−25)
渡辺,外3名「未知語を含む入力文に対する対話管理方式の検討」日本音響学会平成6年度春季研究発表会講演論文集(1−7−13)(▲I▼)p.25−26(平6−3−23)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6370962B1 (ja) * 2017-05-12 2018-08-08 ヤフー株式会社 生成装置、生成方法および生成プログラム
JP2018194902A (ja) * 2017-05-12 2018-12-06 ヤフー株式会社 生成装置、生成方法および生成プログラム
JP2023083241A (ja) * 2021-12-03 2023-06-15 ソプラ株式会社 処理動作支援装置及びプログラム

Also Published As

Publication number Publication date
EP0863466A4 (en) 2005-07-20
WO1998013771A1 (fr) 1998-04-02
US6035267A (en) 2000-03-07
EP0863466A1 (en) 1998-09-09

Similar Documents

Publication Publication Date Title
JP3212618B2 (ja) 対話処理装置
US11869506B2 (en) Selectively generating expanded responses that guide continuance of a human-to-computer dialog
US7827035B2 (en) Speech recognition system and method
Seneff et al. GALAXY-II: a reference architecture for conversational system development.
US6606599B2 (en) Method for integrating computing processes with an interface controlled by voice actuated grammars
US6208972B1 (en) Method for integrating computer processes with an interface controlled by voice actuated grammars
GB2357364A (en) Dialog management in a conversational computer system
JP2004005530A (ja) 音声対話インターフェースを利用した情報提供装置及びその方法
US6275788B1 (en) Interactive processing apparatus having natural language interfacing capability, utilizing goal frames, and judging action feasibility
US7430511B1 (en) Speech enabled computing system
JP2003108581A (ja) 対話型情報検索装置および対話型情報検索方法
JP2003030187A (ja) 自動通訳システム、会話学習装置、自動通訳装置及びその方法並びにそのプログラム
Turunen et al. Agent-based adaptive interaction and dialogue management architecture for speech applications
JP2009223720A (ja) 自然言語対話エージェントのためのスクリプト作成支援方法及びプログラム
US12142277B2 (en) Generating a composite response to natural language input using a trained generative model and based on responsive content from disparate content agents
KR102705333B1 (ko) 프로젝트 수행내용 자동기록 방법 및 장치
JPH03233676A (ja) 会話制御方式
US12141540B2 (en) Message mapping and combination for intent classification
JP3525999B2 (ja) 言語理解方法及び言語理解装置
TWI836856B (zh) 用於意圖分類之訊息映射及組合
JP2004139446A (ja) 日常言語コンピュータシステムで用いられる秘書エージェントシステム、秘書エージェントプログラムおよび対話プランニング方法
JP4223841B2 (ja) 音声対話システム及び方法
JPH08235177A (ja) 情報処理装置
JPH08185412A (ja) 文書処理方法及びその装置
JPH03233677A (ja) 会話制御方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070719

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080719

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees