JP2022539138A

JP2022539138A - 自然言語理解（ｎｌｕ）フレームワークを使用して意味探索を実行するシステムおよび方法

Info

Publication number: JP2022539138A
Application number: JP2021577214A
Authority: JP
Inventors: エドウィンサプガイ; アニルクマールマダマラ; オマーアニルトゥルカン; マキシムナボカ
Original assignee: ServiceNow Inc
Current assignee: ServiceNow Inc
Priority date: 2019-07-02
Filing date: 2020-07-02
Publication date: 2022-09-07
Anticipated expiration: 2040-07-02
Also published as: US20210004442A1; AU2020299384A1; JP2022538591A; AU2020299634B2; US11487945B2; AU2020299384B2; WO2021003423A1; WO2021003311A1; JP7383737B2; AU2020299608B2; JP7346609B2; AU2020299634A1; US11556713B2; KR20220025026A; US20210004537A1; AU2020299608A1; JP2022538861A; JP7420842B2; KR20220027198A; US20210004443A1

Abstract

本開示は、ユーザ発話から意味を抽出し、探索ベースの自然言語理解（ＮＬＵ）フレームワークを使用して好適に応答することが可能なエージェント自動化フレームワークを対象とする。ＮＬＵフレームワークは、所与の自然言語発話に対する複数の代替意味表現を検出することが可能な意味抽出サブシステムを含む。さらに、ＮＬＵフレームワークは、効率的かつ効果的な意味探索を提供するために、弾性信頼性閾値（たとえば、弾性ビーム幅の意味探索）、強制ダイバーシティ、および認知構造文法（ＣＣＧ）ベースの予測スコアリング機能を有効にする意味探索サブシステムを含む。したがって、開示する意味抽出サブシステムおよび意味探索サブシステムは、ＮＬＵフレームワークの性能、ドメイン特異性、推論品質、および／または効率を改善する。

Description

クロスリファレンス
本出願は、あらゆる目的で全体として参照により本明細書に組み込まれている、２０１９年７月２日に出願された「ＳＹＳＴＥＭＡＮＤＭＥＴＨＯＤＦＯＲＰＥＲＦＯＲＭＩＮＧＡＭＥＡＮＩＮＧＳＥＡＲＣＨＵＳＩＮＧＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８６４号の優先権および利益を主張する。本出願はまた、あらゆる目的で全体として参照により本明細書に組み込まれている、各々２０１９年７月２日に出願された「ＰＲＥＤＩＣＴＩＶＥＳＩＭＩＬＡＲＩＴＹＳＣＯＲＩＮＧＳＵＢＳＹＳＴＥＭＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８１７号、「ＤＥＲＩＶＩＮＧＭＵＬＴＩＰＬＥＭＥＡＮＩＮＧＲＥＰＲＥＳＥＮＴＡＴＩＯＮＳＦＯＲＡＮＵＴＴＥＲＡＮＣＥＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８２６号、および「ＰＩＮＮＩＮＧＡＲＴＩＦＡＣＴＳＦＯＲＥＸＰＡＮＳＩＯＮＯＦＳＥＡＲＣＨＫＥＹＳＡＮＤＳＥＡＲＣＨＳＰＡＣＥＳＩＮＡＮＡＴＵＲＡＬＬＡＮＧＵＡＧＥＵＮＤＥＲＳＴＡＮＤＩＮＧ（ＮＬＵ）ＦＲＡＭＥＷＯＲＫ」という名称の米国仮特許出願第６２／８６９，８１１号に関係する。

本開示は、一般に、自然言語理解（ＮＬＵ）および人工知能（ＡＩ）の分野に関し、より詳細には、ＮＬＵのためのハイブリッド学習システムに関する。

本章は、以下の説明および／または特許請求の範囲に記載する本開示の様々な態様に関係しうる様々な技術態様について、読者に紹介することを意図したものである。この議論は、本開示の様々な態様のさらなる理解を容易にするための背景情報を読者に提供することに役立つと考えられる。したがって、これらの記載はこれに鑑みて読まれるべきであり、従来技術の承認ではないことを理解されたい。

クラウドコンピューティングは、一般にインターネットを介してアクセスされるコンピューティング資源の共有に関する。特に、クラウドコンピューティングインフラストラクチャは、個人および／または企業などのユーザが、サーバ、記憶デバイス、ネットワーク、アプリケーション、および／または他のコンピューティングベースのサービスなどのコンピューティング資源の共有プールにアクセスすることを可能にする。そうすることによって、ユーザは、要求に応じて、遠隔の場所に位置するコンピューティング資源にアクセスすることが可能になり、これらの資源は、様々なコンピューティング機能（たとえば、大量のコンピューティングデータの記憶および／または処理）を実行するために使用することができる。企業および他の組織のユーザにとって、クラウドコンピューティングは、私用ネットワークインフラストラクチャの確立に高価なネットワーク機器購入または大量の時間投資などの大きな事前コストを生じることなく、クラウドコンピューティング資源へのアクセスの柔軟性を提供する。代わりに、ユーザは、クラウドコンピューティング資源を利用することによって、企業の中核機能に集中するように自身の資源を向け直すことが可能になる。

そのようなクラウドコンピューティングサービスは、クライアントインスタンスのユーザからの自然言語要求に基づいてクライアントインスタンスに伴う問題に自動的に応答するように設計されたチャットエージェントなどの仮想エージェントをホストすることができる。たとえば、ユーザは、パスワードの問題の支援のための要求を仮想エージェントへ提供することができ、仮想エージェントは、自然言語処理（ＮＬＰ）または自然言語理解（ＮＬＵ）システムの一部である。ＮＬＰは、何らかの形態の自然言語入力の処理を伴うコンピュータサイエンスおよびＡＩの一般領域である。ＮＬＰによって対処される領域の例には、言語翻訳、音声生成、解析木抽出、品詞識別などが含まれる。ＮＬＵは、ユーザ発話の理解に特別に焦点を当てたＮＬＰの下位領域である。ＮＬＵによって対処される領域の例には、質問応答（たとえば、読解力の質問）、記事要約などが含まれる。たとえば、ＮＬＵは、人間の言語（たとえば、話し言葉または書き言葉）を、下流の仮想エージェントが消費できる既知の記号セットに縮小するために、アルゴリズムを使用することができる。ＮＬＰは、概して、フリーテキストをさらに分析できるように解釈するために使用される。典型的に、ＮＬＰに対する現在の手法は深層学習に基づいており、これはプログラムの理解を改善するためにデータ内のパターンを試験および使用する一種のＡＩである。

特定のＮＬＵシステムは、認知構文文法の言語学的原理に基づいている。これらの原理のうちの１つは、発話の形状または形態が発話の意味に密接に関係するということである。したがって、ＮＬＵシステムは、ＮＬＵシステムの動作を改善するために、発話を理解する複数の有望な方法を抽出または判定することが可能であることが重要であることが現在認識されている。加えて、意図推定が難題となっているが、これはより管理しやすい探索の問題に変換することによって解決することができることが認識されている。

特定のＮＬＵシステムに伴う１つの主な問題は、探索空間内に意味整合を突き止めようとしたときの静的探索範囲である。たとえば、ＮＬＵシステムが、樹状データ構造の形態で探索空間の意味探索を実行しているとき、このシステムは、その木の端末点または葉を探すことができ、これらの端末点または葉は各々、特有の探索解または意味整合を表す。ＮＬＵシステムは、データ構造の根から開始することができ、各分岐において、定義された探索基準に基づいて、どの分岐に従うかを決定するように考慮することができる。次いで、選択された分岐を拡大することができ、探査のための次の分岐を選択するために、データ構造の対応する下位分岐に探索基準を適用することができる。このようにして、意味探索は、ＮＬＵシステムがデータ構造の葉に到達するまで進行し、選択された葉または意味整合が、結果セットを形成する。

しかし、そのような意味探索動作では、探索空間を表すデータ構造は非常に大きくなる可能性がある（たとえば、ギガバイトまたはテラバイトのサイズ）。加えて、特定の事例では、特定の探索基準は、資源使用（たとえば、処理時間、メモリ空間）の点で適用するのが高価になる可能性がある。そのような状況の場合、定義されたすべての探索基準を使用してデータ構造のすべての分岐を調査することは、非現実的または実行不可能である。したがって、ＮＬＵシステムは、一度に考慮することができる分岐の数を制限する固定のまたは静的な探索幅を適用することができ、その結果、データ構造の１つまたは複数の分岐が、考慮することから剪定または除去される。しかし、分岐は、その分岐が実際には、高いスコア、潜在的に最良の整合、葉、または意味整合を含む場合でも、探索基準が適用されたときに低いスコアを実証する可能性がある。したがって、積極的または非効果的な剪定の結果、分岐が考慮することから除去される可能性があり、したがって高スコアの解が意味探索によって突き止められない。加えて、分岐の下方探索は自己達成する傾向にあるが、これはいくつかの狭い経路に沿って深く掘ることによって探索が与えられる傾向にあることを意味する。その結果、意味探索は、深さ第１の木の探査になる方へ向かう可能性があり、これは意味探索を望ましくない形で偏らせる。したがって、意味探索動作中に、潜在的な意味整合を早すぎる段階で考慮することから剪定することを回避し、深い木の探索の問題およびそれに伴う偏りに対処するために、改善された意味探索技法が所望されていることが認識されている。

本明細書に開示する特定の実施形態の概要について、以下に記載する。これらの態様は、これらの特定の実施形態の簡単な概要を読者に提供するためにのみ提示されており、これらの態様は、本開示の範囲を限定することを意図したものではないことを理解されたい。実際には、本開示は、様々な態様を包含することができるが、そのような態様は、以下に記載されていないこともある。

本実施形態は、仮想エージェント（たとえば、チャットエージェント）によって受け取られた要求などのユーザ発話から意味を抽出し、好適にはこれらのユーザ発話に応答することが可能なエージェント自動化フレームワークを対象とする。これを行うため、エージェント自動化フレームワークは、ＮＬＵフレームワークおよび意図－実体モデルを含み、意図－実体モデルは、サンプル発話に伴う定義された意図および実体を有する。ＮＬＵフレームワークは、意図－実体モデルのサンプル発話が理解モデルを構築するための意味表現、ならびに受け取られたユーザ発話が発話意味モデルを構築するための意味表現を生成するように設計された意味抽出サブシステムを含む。加えて、開示するＮＬＵフレームワークは、発話意味モデル（探索鍵とも呼ぶ）の意味表現に対する整合を突き止めるための理解モデル（探索空間とも呼ぶ）の意味表現を探索するように設計された意味探索サブシステムを含む。したがって、本実施形態は、概して、管理しやすい探索問題に変換することによって、ＮＬＵに伴う難題に対処する。

上述した他のＮＬＵシステムの欠点に対処するために、焦点閾値（たとえば、ビーム幅）を使用して、意味探索の資源消費に関する限界または境界を確立することができることが現在認識されている。また、異なる探索基準は異なる資源消費またはコストを伴う可能性があるため、探索基準は、漸進的な探索基準予測機能に組織化されるべきであり、最初に適用された探索基準は、比較的安価かつ不正確であるが、後に適用される探索基準は、比較的高価かつ正確であることも現在認識されている。加えて、焦点閾値（たとえば、ビーム幅）は、適用されている探索基準予測機能の精度レベルに基づいて、動的に調整されることが望ましいことが現在認識されている。たとえば、焦点閾値は、適用された探索基準予測機能の精度が比較的低いときは、より低くすることができ（たとえば、動的に緩和された焦点閾値、より広いビーム幅）、適用された探索基準予測機能の精度が比較的高いときは、より高くすることができる（たとえば、動的に制限された焦点閾値、より狭いビーム幅）。これにより、低い初期探索基準予測機能スコアを有する分岐が考慮下に残ることを有効にして、潜在的に良好な意味整合の早期の損失を防止しながら、それでもなお探索動作の資源消費を低減させる。さらに、深い木の探索の問題およびそれに伴う偏りは、考慮された解が互いに十分に異なることを確実にする強制ダイバーシティを使用することによって軽減することができることが現在認識されている。加えて、開示する動的焦点閾値、漸進的な探索基準予測機能、および強制ダイバーシティは、理解モデルにおける意図－実体アーティファクトに対する第１の探索段階、およびさらなる探査に値する第１の段階からの各意図－実体アーティファクト内の後の第２の探索段階など、２つの段階で適用することができることが理解されよう。

さらに、意味探索の性能は、比較のために、発話意味モデルにおけるユーザ発話の複数の意味表現と、理解モデルにおけるサンプル発話の複数の意味表現とを有することによって強化されることが現在認識されている。さらに、特定の代替の意味表現は、意味探索中に整合を識別する確率を改善するが、意味探索はまた、明らかに誤ったまたは実質的に冗長な意味表現を探索して、追加のコンピューティング資源を消費する可能性があることも現在認識されている。したがって、意味探索を強化するために、特定の高価値の代替の発話意味表現が追求されるべきであり、コンピューティング資源の使用を制限し、ＮＬＵフレームワークの効率を改善するために、他の代替の意味表現は廃棄されるべきであることが認識されている。

上記を念頭に、本実施形態は、意図－実体モデルにおけるサンプル発話およびユーザから受け取った発話を含む発話に対する複数の意味表現を生成することが可能な意味抽出サブシステムを含むＮＬＵフレームワークを対象とする。開示する意味抽出サブシステムは、強化された柔軟性のためにプラグインを実施することができる複数の異なる構成要素を含む。特定の実施形態では、これらの構成要素は、品詞（ＰＯＳ）プラグイン、補正プラグイン、変動フィルタ（ＶＦ）プラグイン、パーサプラグイン、ならびに最終スコアリングおよびフィルタリング（ＦＳＦ）プラグインを含む。たとえば、ＰＯＳプラグインは、機械学習（ＭＬ）ベースの構成要素を含むことができ、ＭＬベースの構成要素は、発話およびＰＯＳ閾値を受け取り、そのＰＯＳ閾値に基づいて、その発話に対する潜在的ＰＯＳタギングセットを、これらのＰＯＳタギングに対応する信頼性スコアとともに生成する。補正プラグインは、潜在的ＰＯＳタギングセットを受け取り、規則ベースまたはＭＬベースの技法を適用して、潜在的ＰＯＳタギングセット内のエントリを修正または除去することができる。ＶＦプラグインは、潜在的ＰＯＳタギングセットおよび変動閾値を受け取ることができ、変動閾値に基づいて、他のエントリから十分に異ならない特定のエントリを、潜在的ＰＯＳタギングセットから除去することができる。パーサプラグインは、ＭＬベースまたは規則ベースの構成要素を含むことができ、ＭＬベースまたは規則ベースの構成要素は、潜在的ＰＯＳタギングセットを受け取り（たとえば、補正および／または変動性フィルタリング後）、潜在的ＰＯＳタギングセット内の各エントリに対するそれぞれの意味表現（たとえば、依存性解析木）および対応する信頼性スコアを生成する。ＦＳＦプラグインは、意味表現セット、ＰＯＳタギングおよび解析からの信頼性スコア、ならびにＦＳＦ閾値を受け取り、ＦＳＦ閾値に基づいて、発話に対する最終的な意味表現セットを判定することができる。

さらに、意味探索の様々な段階を実行するとき、弾性（たとえば、非静的、可変）の閾値を使用することによって、意味探索の性能を強化することができることが現在認識されている。たとえば、ユーザ発話に対する意味表現が生成され、サンプル空間にサンプル発話の意味表現が格納された後、第１の探索動作が、弾性ビーム幅のＣＣＧ形式ベースの探索を使用して、競合整合意味表現セットを識別することができる。この探索は、１群の潜在的な信頼値（たとえば、推論レベルの信頼値、モデルレベルの信頼値、アーティファクトレベルの信頼値）のうちの最小の信頼値である総最小信頼性閾値（ＡＭＣＴ）の値に基づく弾性信頼性閾値を有する。ＡＭＣＴ値は、ＣＣＧ形式ベースの探索のための動的閾値を定義する緩和されたＡＭＣＴ値をもたらすために、緩和関数によってさらに拡大される。弾性信頼性閾値を使用することによって、ＣＣＧ形式ベースの探索は、潜在的整合意味表現に、探索動作の初期比較から低信頼性スコアを受け取ることに耐える機会を与え、したがって意味表現は、探索動作の後の比較において、その信頼性スコアを増大させることができ、最後のアーティファクト（たとえば、意図および／または実体）抽出に対する最終整合意味表現セットに到達する資格を得ることができることが現在認識されている。

同様に、意味探索の他の態様も、弾性（たとえば、非静的、可変）の閾値を使用することによって強化することができる。たとえば、第２の探索動作は、弾性ビーム幅のアーティファクト内探索を使用して、弾性ビーム幅のＣＣＧ形式ベースの探索によって識別された各潜在的整合意味表現と、探索空間のうち、潜在的整合意味表現と共通の意図を共有する部分とを比較することができる。ＣＣＧ形式ベースの探索と同様に、弾性ビーム幅のアーティファクト内探索は、比較されている特定のアーティファクト（たとえば、意図または実体）に対する理解モデルにおけるアーティファクトレベルの信頼値であるモデルアーティファクト信頼性閾値（ＭＡＣＴ）の値に基づく弾性信頼性閾値を有する。ＭＡＣＴ値は、アーティファクト内探索のための動的閾値を定義する緩和されたＭＡＣＴ値をもたらすために、第２の緩和関数によってさらに拡大される。弾性信頼性閾値を使用することによって、アーティファクト内探索は、潜在的整合意味表現に、探索動作の初期比較から低信頼性スコアを受け取ることに耐える機会を与え、したがって意味表現は、探索動作の後の比較においてその信頼性スコアを増大させることができ、最後のアーティファクト（たとえば、意図および／または実体）抽出に対する最終整合意味表現セットに到達する資格を得ることができることが現在認識されている。

本開示の様々な態様は、以下の詳細な説明および図面の参照を読めば、よりよく理解されよう。

本技法の実施形態が動作することができるクラウドコンピューティングシステムの一実施形態のブロック図である。本技法の実施形態が動作することができるマルチインスタンスクラウドアーキテクチャの一実施形態のブロック図である。本技法の態様による、図１または図２に存在することができるコンピューティングシステムで利用されるコンピューティングデバイスのブロック図である。本技法の態様による、クラウドコンピューティングシステムによってホストされるクライアントインスタンスの一部であるＮＬＵフレームワークを含むエージェント自動化フレームワークの一実施形態を示す概略図である。本技法の態様による、ＮＬＵフレームワークのいくつかの部分が、クラウドコンピューティングシステムによってホストされる企業インスタンスの一部である、エージェント自動化フレームワークの代替実施形態を示す概略図である。本技法の態様による、ＮＬＵフレームワークおよび挙動エンジンフレームワークを含むエージェント自動化フレームワークが、ユーザ発話から意図および／または実体を抽出してユーザ発話に応答するプロセスの一実施形態を示す流れ図である。本技法の態様による、意味抽出サブシステムが、受け取ったユーザ発話から意味表現を生成して、発話意味モデルをもたらし、理解モデルのサンプル発話から意味表現を生成して、理解モデルもたらし、意味探索サブシステムが、発話意味モデルの意味表現と理解モデルの意味表現とを比較して、受け取ったユーザ発話からアーティファクト（たとえば、意図および実体）を抽出する、意味抽出サブシステムおよび意味探索サブシステムを含むＮＬＵフレームワークの一実施形態を示すブロック図である。本技法の態様による、ＮＬＵフレームワークの語彙サブシステム、構造サブシステム、および韻律サブシステム内で規則ベースの方法および機械学習（ＭＬ）ベースの方法の組合せを使用して、発話に対する意味表現を生成する、意味抽出サブシステムの一実施形態を示すブロック図である。本技法の態様による、発話に対して生成される発話木の一例を示す図である。本技法の態様による、意味抽出サブシステムが、受け取ったユーザ発話に基づいて発話意味モデル（探索鍵）を生成し、１つまたは複数の理解モデルに基づいて探索空間を生成し、意味探索サブシステムが、探索鍵に基づいて探索空間を探索して、ユーザ発話のアーティファクトを抽出する、プロセスの一実施形態を示す流れ図である。本技法の態様による、意味抽出サブシステムが、複数の理解モデルから探索空間を生成し、ユーザ発話の複数の意味表現を意味探索の探索鍵として生成して、ユーザ発話のアーティファクトを抽出する、一実施形態を示す情報の流れ図である。本技法の態様による、語彙サブシステムおよび構造サブシステムを含むＮＬＵフレームワークの意味抽出サブシステムが、発話の再表現および意味表現を生成する、プロセスの一実施形態を示す流れ図である。本技法の態様による、ＮＬＵフレームワークの構造サブシステムが、発話に対して異なる意味表現を生成する、プロセスの一実施形態を示す流れ図である。本技法の態様による、任意の好適な数の意味表現間の効率的な比較を有効にする数学的比較関数リストを検索するために、ＮＬＵフレームワークの意味探索サブシステム内で実施することができる、類似性スコアリングサブシステムの一実施形態を示す流れ図である。本技法の態様による、意味探索サブシステムが弾性ビーム幅のＣＣＧ形式ベースの探索を実行するプロセスの一実施形態の流れ図である。本技法の態様による、発話ベースの意味表現に整合する意味表現を識別するための関心探索部分空間を選択的に狭めるために、比較関数リストを適用する、意味探索サブシステムの一実施形態を示す概略図である。本技法の態様による、弾性ビーム幅のＣＣＧ形式ベースの探索中に使用される緩和された総最小信頼性閾値（ＡＭＣＴ）によって提供される一実施形態の有効ビーム幅を示す概略図である。本技法の態様による、意味探索サブシステムが弾性ビーム幅のアーティファクト内探索を実行するプロセスの一実施形態の流れ図である。本技法の態様による、弾性ビーム幅のアーティファクト内探索中に使用される緩和されたモデルアーティファクト信頼性閾値（ＭＡＣＴ）によって提供される一実施形態の有効ビーム幅を示す概略図である。

１つまたは複数の特有の実施形態について、以下に説明する。これらの実施形態の簡潔な説明を提供するために、実際の実施例の特徴のすべてが本明細書に説明されているとは限らない。そのようなあらゆる実際の実施例の開発において、あらゆる工学または設計計画と同様に、実施例ごとに変動しうるシステム関連および事業関連の制約への準拠などの開発者の特有の目標を実現するために、実施例に特有の多数の決定がされなければならないことを理解されたい。さらに、そのような開発努力は、複雑で時間のかかることがあるが、それにもかかわらず、本開示の利益を有する当業者にとっては、日常的な設計、製作、および製造の業務であることを理解されたい。

本明細書では、「コンピューティングシステム」または「コンピューティングデバイス」という用語は、それだけに限定されるものではないが、単一のコンピュータ、仮想マシン、仮想コンテナ、ホスト、サーバ、ラップトップ、および／もしくは移動デバイス、またはコンピューティングシステム上でもしくはコンピューティングシステムによって実行されるものとして記載した機能を実行するようにともに動作する複数の電子コンピューティングデバイスなどの電子コンピューティングデバイスを指す。本明細書では、「機械可読媒体」という用語は、１つまたは複数の命令またはデータ構造を記憶する単一の媒体または複数の媒体（たとえば、集中もしくは分散データベース、ならびに／または関連するキャッシュおよびサーバ）を含むことができる。「非一時的機械可読媒体」という用語はまた、任意の有形の媒体を含むと解釈されるものとし、そのような有形の媒体は、コンピューティングシステムによって実行するための命令の記憶、符号化、もしくは搬送が可能であり、コンピューティングシステムに、本主題の方法のうちのいずれか１つもしくは複数を実行させ、またはそのような命令によって利用されもしくはそのような命令に関連するデータ構造の記憶、符号化、もしくは搬送が可能である。したがって、「非一時的機械可読媒体」という用語は、それだけに限定されるものではないが、固体状態メモリならびに光および磁気媒体を含むと解釈されるものとする。非一時的機械可読媒体の特有の例には、それだけに限定されるものではないが、例として、半導体メモリデバイス（たとえば、消去可能プログラマブル読出し専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読出し専用メモリ（ＥＥＰＲＯＭ）、およびフラッシュメモリデバイス）、内部ハードディスクおよび取外し可能ディスク、光磁気ディスク、ならびにＣＤ－ＲＯＭおよびＤＶＤ－ＲＯＭディスクなどの磁気ディスクを含む不揮発性メモリが含まれる。

本明細書では、「アプリケーション」、「エンジン」、および「プラグイン」という用語は、特定の機能を提供するためにコンピューティングシステムの１つまたは複数のプロセッサによって実行可能な１つまたは複数のコンピュータソフトウェア命令セット（たとえば、コンピュータプログラムおよび／またはスクリプト）を指す。コンピュータソフトウェア命令は、Ｃ、Ｃ＋＋、Ｃ＃、Ｐａｓｃａｌ、Ｆｏｒｔｒａｎ、Ｐｅｒｌ、ＭＡＴＬＡＢ、ＳＡＳ、ＳＰＳＳ、ＪａｖａＳｃｒｉｐｔ、ＡＪＡＸ、およびＪＡＶＡなどの任意の好適なプログラミング言語で書くことができる。そのようなコンピュータソフトウェア命令は、データ入力およびデータ表示モジュールを有する独立したアプリケーションを含むことができる。別法として、開示するコンピュータソフトウェア命令は、分散オブジェクトにインスタンス化されたクラスとすることができる。開示するコンピュータソフトウェア命令はまた、コンポーネントソフトウェア、たとえばＪＡＶＡＢＥＡＮＳまたはＥＮＴＥＲＰＲＩＳＥＪＡＶＡＢＥＡＮＳとすることができる。加えて、開示するアプリケーションまたはエンジンは、コンピュータソフトウェア、コンピュータハードウェア、またはこれらの組合せで実施することができる。

本明細書では、「フレームワーク」という用語は、１つまたは複数の全体的な機能を実行するように協働するアプリケーションおよび／またはエンジン、および任意の他の支持データ構造、ライブラリ、モジュール、ならびに任意の他の支持機能のシステムを指す。特に、「自然言語理解フレームワーク」または「ＮＬＵフレームワーク」は、理解モデルに基づいて、自然言語発話から意味（たとえば、意図、実体、アーティファクト）を処理および導出するように設計された１群のコンピュータプログラムを含む。本明細書では、「挙動エンジン」または「ＢＥ」は、推論エージェントまたはＲＡ／ＢＥとしても知られており、会話モデルに基づいてユーザと対話するように設計された仮想エージェントなどの規則ベースのエージェントを指す。たとえば、「仮想エージェント」は、特定の会話または通信チャネルにおける自然言語要求を介してユーザと対話するように設計されたＢＥの特定の例を指すことができる。これを念頭に、「仮想エージェント」および「ＢＥ」という用語は、本明細書では区別なく使用される。特有の例として、仮想エージェントは、チャットルーム環境において自然言語要求を介してユーザと対話および応答するチャットエージェントとすることができ、またはそのようなチャットエージェントを含むことができる。仮想エージェントの他の例には、電子メール、フォーラムポスト、およびサービスチケットへの自動返信、通話などのコンテキストにおいてユーザと対話する電子メールエージェント、フォーラムエージェント、チケッティングエージェント、通話エージェントなどを含むことができる。

本明細書では、「意図」は、発話などの通信の根本的な目的に関係しうるユーザの要望または目標を指す。本明細書では、「実体」は、目的、対象、または何らかの他の意図のパラメータ化を指す。本実施形態では、特定の実体が、対応する意図のパラメータとして扱われることに留意されたい。より具体的には、特定の実体（たとえば、時間および場所）は、すべての意図に対して広範に認識および抽出することができ、他の実体は、意図に特定的であり（たとえば、購入意図に関連する商品実体）、概してそれらを定義する意図の範囲内で見られたときにのみ抽出される。本明細書では、「アーティファクト」は、集合的に、発話の意図および実体の両方を指す。本明細書では、「理解モデル」は、自然言語発話の意味を推論するためにＮＬＵフレームワークによって使用される１群のモデルである。理解モデルは、特定のトークン（たとえば、単語またはフレーズ）を特定の単語ベクトル、意図－実体モデル、実体モデル、またはこれらの組合せに関連付ける語彙モデルを含むことができる。本明細書では、「意図－実体モデル」は、特定の意図を特定のサンプル発話に関連付けるモデルを指し、意図に関連付けられた実体は、モデルのサンプル発話内の意図のパラメータとして符号化することができる。本明細書では、「エージェント」という用語は、会話チャネル内で互いに対話するコンピュータ生成ペルソナ（たとえば、チャットエージェントまたは他の仮想エージェント）を指すことができる。本明細書では、「コーパス」は、様々なユーザおよび仮想エージェント間の対話を含む捕捉された一連のソースデータを指し、対話は、１つまたは複数の好適なタイプの媒体（たとえば、ヘルプライン、チャットルーム、またはメッセージ列、電子メール列）内の通信または会話を含む。本明細書では、「発話木」は、発話の意味表現を記憶するデータ構造を指す。論じるように、発話木は、発話の構文構造を表す木構造（たとえば、依存性解析木構造）を有し、木構造のノードは、発話の意味論的意味を符号化するベクトル（たとえば、単語ベクトル、部分木ベクトル）を記憶する。

本明細書では、「ソースデータ」または「会話ログ」は、様々なエージェント間の任意の好適な捕捉された対話を含むことができ、そのような対話には、それだけに限定されるものではないが、チャットログ、電子メール列、文書、文書化ヘルプ、よくある質問（ＦＡＱ）、フォーラムエントリ、サポートチケッティングのアイテム、ヘルプライン通話の記録などが含まれる。本明細書では、「発話」は、１つまたは複数の意図を含むことができるユーザまたはエージェントによってなされた単一の自然言語発言を指す。したがって、発話は、事前に捕捉されたソースデータのコーパスの一部とすることができ、発話はまた、仮想エージェントとの対話の一部としてユーザから受け取った新しい発言とすることができる。本明細書では、「機械学習」または「ＭＬ」は、教師あり、教師なし、および半教師ありの学習技法を含む機械学習技法を使用して訓練することが可能な任意の好適な統計的な形態の人工知能を指すために使用することができる。たとえば、特定の実施形態では、ＭＬベースの技法は、人工ニューラルネットワーク（ＡＮＮ）（たとえば、ディープニューラルネットワーク（ＤＮＮ）、回帰型ニューラルネットワーク（ＲＮＮ）、再帰型ニューラルネットワーク、順伝播型ニューラルネットワーク）を使用して実施することができる。対照的に、「規則ベース」の方法および技法は、発話から意味表現を導出するために言語構造および意味論的理解の精密な判断を有効にする精度規則セットおよび手作りのオントロジの使用を指す。本明細書では、「ベクトル」（たとえば、単語ベクトル、意図ベクトル、対象ベクトル、部分木ベクトル）は、発話の一部分（たとえば、単語またはフレーズ、意図、実体、トークン）の意味論的意味の数学表現を提供する浮動小数点値の順序付きのｎ次元リスト（たとえば、３００次元リスト）（たとえば、１×ＮまたはＮ×１行列）である線形代数ベクトルを指す。本明細書では、「ドメイン特異性」は、所与のドメインおよび／または会話チャネル内の実際の会話で表される意図および実体を正確に抽出するためにシステムがどれだけ調和されるかを指す。

上述したように、コンピューティングプラットホームは、プラットホーム上で機能を実行しまたは問題に対処するためのユーザ要求に自動的に応答するように設計されたチャットエージェントまたは別の類似の仮想エージェントを含むことができる。自然言語発話からユーザの意図を導出しようとするとき、単一の発話が、その発話のトークンに対して異なる潜在的な品詞（ＰＯＳ）タギングを有することができ、これらの異なるＰＯＳタギングは、その発話の異なる形式派生を表すことが現在認識されている。その結果、単一の発話に対して複数の異なる意味表現（たとえば、発話木）を生成することができ、各意味表現は、その発話の別個の形式派生を表す。発話のすべての可能な形式派生を与えることで、十分な考慮により、ＮＬＵフレームワークの意図推定能力が改善されることが現在認識されている。しかし、発話の特定の形式派生は、すでに考慮されている他の形式にとって誤っておりまたは実質的に冗長である可能性があり、ＮＬＵフレームワークの意図推定能力を実質的に改善することなく、処理およびメモリ資源の消費を実質的に増大させる可能性があることも現在認識されている。

したがって、本実施形態は、自然言語発話に対する複数の意味表現を生成するためにＭＬベースおよび規則ベースの技法を適用する意味抽出サブシステムを含むＮＬＵフレームワークを対象とする。意味抽出サブシステムは、構造サブシステムを含み、構造サブシステムは、理解モデルのサンプル発話の複数の意味表現を生成して、探索空間を拡大することが可能であり、かつ／または受け取ったユーザ発話の複数の意味表現を生成して、探索鍵を拡大することが可能である。開示する構造サブシステムは、ＭＬベースの技法を使用して発話に対する複数の潜在的な品詞（ＰＯＳ）タギングを生成し、事前定義された閾値より大きい対応する信頼性スコアを有する潜在的ＰＯＳタギングのみが前へ進められる。開示する構造サブシステムは、規則ベースおよび／またはＭＬベースの補正技法を適用して、誤った潜在的ＰＯＳタギングを修正または削除することができる。開示する構造サブシステムはまた、変動性フィルタを適用して、事前定義された変動閾値に基づいて互いに十分に異ならない潜在的ＰＯＳタギングを削除することができる。補正および／または変動性フィルタリング後、開示する構造サブシステムは、ＭＬベースまたは規則ベースの技法を使用して、各々の残りの潜在的ＰＯＳタギングに対してそれぞれの意味表現（たとえば、発話木）を生成し、事前定義された閾値より大きい対応する信頼性スコアを有する意味表現のみが前へ進められる。最終的に、開示する構造サブシステムは、前へ進められた意味表現の信頼性スコア、ならびに対応するＰＯＳタギングの根本的な信頼性スコアを考慮する最終スコアリングおよびフィルタリングステップを適用して、最終的なスコアを生成し、事前定義された閾値を下回る最終的なスコアを有する意味表現を除去する。したがって、開示する構造サブシステムは、意味探索の探索鍵および／または探索空間のために生成される形式派生の数を効果的に拡大して、ＮＬＵフレームワークの意図推定能力を改善しながら、誤ったまたは実質的に冗長な形式派生を削除して、資源消費を低減させ、ＮＬＵフレームワークの効率を改善する。

さらに、意味探索の様々な段階を実行するとき、弾性（たとえば、非静的、可変）の閾値を使用することによって、意味探索の品質を強化することができることが現在認識されている。したがって、本実施形態は、弾性閾値を使用して意味探索動作を実行することが可能な意味探索サブシステムを含むＮＬＵフレームワークを対象とする。たとえば、ユーザ発話に対する意味表現が生成され、サンプル空間にサンプル発話の意味表現が格納された後、第１の探索動作が、弾性ビーム幅のＣＣＧ形式ベースの探索を使用して、競合整合意味表現セットを識別することができる。探索の各ＣＣＧ比較は、１群の潜在的な信頼値（たとえば、推論レベルの信頼値、モデルレベルの信頼値、アーティファクトレベルの信頼値）のうちの最小の信頼値である総最小信頼性閾値（ＡＭＣＴ）の値に基づく弾性信頼性閾値を有する。ＡＭＣＴ値は、ＣＣＧ形式ベースの探索のための動的閾値を定義する緩和されたＡＭＣＴ値をもたらすために、緩和関数によってさらに拡大される。弾性信頼性閾値を使用することによって、ＣＣＧ形式ベースの探索は、潜在的整合意味表現に、探索動作の初期比較から低信頼性スコアを受け取ることに耐える機会を与え、したがって意味表現は、探索動作の後の比較においてその信頼性スコアを増大させることができ、最後のアーティファクト（たとえば、意図および／または実体）抽出に対する最終整合意味表現セットに到達する資格を得ることができることが現在認識されている。

同様に、弾性（たとえば、非静的、可変）の閾値を使用することによって、意味探索の他の態様も強化することができる。たとえば、意味探索サブシステムによって実行される第２の探索動作は、弾性ビーム幅のアーティファクト内探索を使用して、弾性ビーム幅のＣＣＧ形式ベースの探索によって識別された各々の潜在的整合意味表現と、探索空間のうち、潜在的整合意味表現と共通の意図を共有する部分とを比較することができる。ＣＣＧ形式ベースの探索と同様に、弾性ビーム幅のアーティファクト内探索における各比較動作は、理解モデルにおけるアーティファクト（たとえば、意図または実体）に対するアーティファクトレベルの信頼値であるモデルアーティファクト信頼性閾値（ＭＡＣＴ）の値に基づく弾性信頼性閾値を有する。ＭＡＣＴ値は、アーティファクト内探索のための動的閾値を定義する緩和されたＭＡＣＴ値をもたらすために、第２の緩和関数によってさらに拡大される。弾性信頼性閾値を使用することによって、アーティファクト内探索は、潜在的整合意味表現に、探索動作の初期比較から低信頼性スコアを受け取ることに耐える機会を与え、したがって意味表現は、探索動作の後の比較においてその信頼性スコアを増大させることができ、最後のアーティファクト（たとえば、意図および／または実体）抽出に対する最終整合意味表現セットに到達する資格を得ることができることが現在認識されている。したがって、開示する意味探索サブシステムは、普通なら意味探索中に早すぎる段階で除かれうる整合意味表現をより効果的かつ包括的に識別し、ＮＬＵフレームワークの動作および性能を改善する。

上記を念頭に、以下の図は、マルチインスタンスフレームワーク内の組織へサービスを提供するために用いることができ、本手法を用いることができる、様々なタイプの概略的なシステムアーキテクチャまたは構成に関する。それに対応して、これらのシステムおよびプラットホーム例はまた、本明細書に論じる技法を実施しまたは他の形で利用することができるシステムおよびプラットホームに関することができる。図１を次に参照すると、本開示の実施形態が動作することができるクラウドコンピューティングシステム１０の一実施形態の概略図が示されている。クラウドコンピューティングシステム１０は、クライアントネットワーク１２、ネットワーク１８（たとえば、インターネット）、およびクラウドベースのプラットホーム２０を含むことができる。いくつかの実施例では、クラウドベースのプラットホーム２０は、構成管理データベース（ＣＭＤＢ）プラットホームとすることができる。一実施形態では、クライアントネットワーク１２は、それだけに限定されるものではないが、スイッチ、サーバ、およびルータを含む、様々なネットワークデバイスを有するローカルエリアネットワーク（ＬＡＮ）などのローカル私用ネットワークとすることができる。別の実施形態では、クライアントネットワーク１２は、１つまたは複数のＬＡＮ、仮想ネットワーク、データセンタ２２、および／または他の遠隔のネットワークを含みうる企業ネットワークを表す。図１に示すように、クライアントネットワーク１２は、１つまたは複数のクライアントデバイス１４Ａ、１４Ｂ、および１４Ｃに接続することが可能であり、したがってクライアントデバイスは、互いに通信しかつ／またはプラットホーム２０をホストするネットワークと通信することが可能である。クライアントデバイス１４は、全体としてモノのインターネット（ＩｏＴ）デバイスと呼ばれるコンピューティングシステムおよび／または他のタイプのコンピューティングデバイスとすることができ、そのようなデバイスは、たとえばウェブブラウザアプリケーションを介して、またはクライアントデバイス１４とプラットホーム２０との間のゲートウェイとして作用することができるエッジデバイス１６を介して、クラウドコンピューティングサービスにアクセスする。図１はまた、クライアントネットワーク１２が、プラットホーム２０、他の外部アプリケーション、データソース、およびサービスをホストするネットワークと、クライアントネットワーク１２との間のデータの通信を容易にする、管理、計測、および発見（ＭＩＤ）サーバ１７などの運営または管理デバイス、エージェント、またはサーバを含むことを示す。図１には具体的に示されていないが、クライアントネットワーク１２はまた、接続ネットワークデバイス（たとえば、ゲートウェイまたはルータ）、または顧客ファイアウォールもしくは侵入保護システムを実施するデバイスの組合せを含むことができる。

図示の実施形態では、図１は、クライアントネットワーク１２がネットワーク１８に結合されることを示す。ネットワーク１８は、クライアントデバイス１４Ａ～１４Ｃとプラットホーム２０をホストするネットワークとの間でデータを伝達するために、他のＬＡＮ、ワイドエリアネットワーク（ＷＡＮ）、インターネット、および／または他の遠隔ネットワークなどの１つまたは複数のコンピューティングネットワークを含むことができる。ネットワーク１８内のコンピューティングネットワークの各々は、電気および／または光学ドメインで動作する有線および／または無線のプログラマブルデバイスを含むことができる。たとえば、ネットワーク１８は、セルラーネットワーク（たとえば、ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅＣｏｍｍｕｎｉｃａｔｉｏｎｓ（ＧＳＭ）ベースのセルラーネットワーク）、ＩＥＥＥ８０２．１１ネットワーク、および／または他の好適な無線ベースのネットワークなどの無線ネットワークを含むことができる。ネットワーク１８はまた、伝送制御プロトコル（ＴＣＰ）およびインターネットプロトコル（ＩＰ）などの任意の数のネットワーク通信プロトコルを用いることができる。図１には明示的に示されていないが、ネットワーク１８は、ネットワーク１８を介してデータを輸送するように構成されたサーバ、ルータ、ネットワークスイッチ、および／または他のネットワークハードウェアデバイスなどの様々なネットワークデバイスを含むことができる。

図１で、プラットホーム２０をホストするネットワークは、クライアントネットワーク１２およびネットワーク１８を介してクライアントデバイス１４と通信することが可能な遠隔ネットワーク（たとえば、クラウドネットワーク）とすることができる。プラットホーム２０をホストするネットワークは、クライアントデバイス１４および／またはクライアントネットワーク１２に追加のコンピューティング資源を提供する。たとえば、プラットホーム２０をホストするネットワークを利用することによって、クライアントデバイス１４のユーザは、様々な企業、ＩＴ、および／または他の組織関連の機能のためのアプリケーションを構築および実行することが可能になる。一実施形態では、プラットホーム２０をホストするネットワークは、１つまたは複数のデータセンタ２２上で実施され、各データセンタは、異なる地理的な場所に対応することができる。データセンタ２２の各々は、複数の仮想サーバ２４（本明細書では、アプリケーションノード、アプリケーションサーバ、仮想サーバインスタンス、アプリケーションインスタンス、またはアプリケーションサーバインスタンスとも呼ぶ）を含み、各仮想サーバ２４は、単一の電子コンピューティングデバイス（たとえば、単一の物理ハードウェアサーバ）などの物理コンピューティングシステム上で実施することができ、または複数のコンピューティングデバイス（たとえば、複数の物理ハードウェアサーバ）にわたって実施することができる。仮想サーバ２４の例には、それらだけに限定されるものではないが、ウェブサーバ（たとえば、単体のＡｐａｃｈｅの導入）、アプリケーションサーバ（たとえば、単体のＪＡＶＡ仮想マシン）、および／またはデータベースサーバ（たとえば、単体の関係データベース管理システム（ＲＤＢＭＳ）カタログ）が含まれる。

プラットホーム２０内でコンピューティング資源を利用するために、ネットワークオペレータは、様々なコンピューティングインフラストラクチャを使用して、データセンタ２２を構成することを選ぶことができる。一実施形態では、データセンタ２２のうちの１つまたは複数は、サーバインスタンス２４のうちの１つが複数の顧客からの要求を取り扱って複数の顧客を担当するように、マルチテナントクラウドアーキテクチャを使用して構成される。マルチテナントクラウドアーキテクチャを有するデータセンタ２２は、複数の顧客からのデータを混ぜ合わせて記憶し、複数の顧客インスタンスが、仮想サーバ２４のうちの１つに割り当てられる。マルチテナントクラウドアーキテクチャでは、特定の仮想サーバ２４は、様々な顧客のデータおよび他の情報を区別して分離する。たとえば、マルチテナントクラウドアーキテクチャは、各顧客からデータを識別して分離するために、各顧客に対する特定の識別子を割り当てることができる。概して、マルチテナントクラウドアーキテクチャを実施すると、サーバインスタンス２４のうちの特定のサーバインスタンス２４の障害が、特定のサーバインスタンスに割り当てられたすべての顧客に対して機能停止を引き起こすなど、様々な欠点が生じる可能性がある。

別の実施形態では、データセンタ２２のうちの１つまたは複数は、すべての顧客に１つまたは複数の固有の顧客インスタンスを提供するように、マルチインスタンスクラウドアーキテクチャを使用して構成される。たとえば、マルチインスタンスクラウドアーキテクチャは、各顧客インスタンスに、独自の専用のアプリケーションサーバおよび専用のデータベースサーバを提供することができる。他の例では、マルチインスタンスクラウドアーキテクチャは、各顧客インスタンスに対して、１つまたは複数の専用のウェブサーバ、１つまたは複数の専用のアプリケーションサーバ、および１つまたは複数のデータベースサーバなど、単一の物理もしくは仮想サーバ２４、ならびに／または物理および／もしくは仮想サーバ２４の他の組合せを配備することができる。マルチインスタンスクラウドアーキテクチャでは、１つまたは複数のそれぞれのハードウェアサーバ上に、複数の顧客インスタンスを導入することができ、各顧客インスタンスには、コンピューティングメモリ、記憶、および処理電力などの物理サーバ資源の特定の部分が割り当てられる。そうすることによって、各顧客インスタンスは、固有のソフトウェアスタックを有し、それによりデータ分離、顧客がプラットホーム２０にアクセスするための比較的短いダウンタイム、および顧客によって駆動されるアップグレードスケジュールの利益が提供される。マルチインスタンスクラウドアーキテクチャ内で顧客インスタンスを実施する一例について、図２を参照して以下により詳細に論じる。

図２は、本開示の実施形態が動作することができるマルチインスタンスクラウドアーキテクチャ４０の一実施形態の概略図である。図２は、マルチインスタンスクラウドアーキテクチャ４０が、互いに地理的に分離することができる２つの（たとえば、対の）データセンタ２２Ａおよび２２Ｂに接続するクライアントネットワーク１２およびネットワーク１８を含むことを示す。図２を一例として使用すると、ネットワーク環境およびサービスプロバイダクラウドインフラストラクチャのクライアントインスタンス４２（本明細書では、クライアントインスタンス４２とも呼ぶ）が、専用の仮想サーバ（たとえば、仮想サーバ２４Ａ、２４Ｂ、２４Ｃ、および２４Ｄ）および専用のデータベースサーバ（たとえば、仮想データベースサーバ４４Ａおよび４４Ｂ）に関連付けられる（たとえば、対応されて有効にされる）。言い換えれば、仮想サーバ２４Ａ～２４Ｄならびに仮想データベースサーバ４４Ａおよび４４Ｂは、他のクライアントインスタンスによって共有されず、それぞれのクライアントインスタンス４２に特異である。図示の例では、クライアントインスタンス４２の利用可能性を促進するために、仮想サーバ２４Ａ～２４Ｄならびに仮想データベースサーバ４４Ａおよび４４Ｂは、２つの異なるデータセンタ２２Ａおよび２２Ｂに割り当てられ、したがってデータセンタ２２のうちの１つが、バックアップデータセンタとして作用する。マルチインスタンスクラウドアーキテクチャ４０の他の実施形態は、ウェブサーバなどの他のタイプの専用の仮想サーバを含むことができる。たとえば、クライアントインスタンス４２は、専用の仮想サーバ２４Ａ～２４Ｄ、専用の仮想データベースサーバ４４Ａおよび４４Ｂ、ならびに追加の専用の仮想ウェブサーバ（図２には図示せず）に関連付けることができる（たとえば、対応されて有効にされる）。

図１および図２は、それぞれクラウドコンピューティングシステム１０およびマルチインスタンスクラウドアーキテクチャ４０の特有の実施形態を示すが、本開示は、図１および図２に示す特有の実施形態に限定されるものではない。たとえば、図１は、プラットホーム２０がデータセンタを使用して実施されることを示すが、プラットホーム２０の他の実施形態は、データセンタに限定されるものではなく、他のタイプの遠隔ネットワークインフラストラクチャを利用することもできる。さらに、本開示の他の実施形態は、１つまたは複数の異なる仮想サーバを組み合わせて単一の仮想サーバにすることができ、または逆に、複数の仮想サーバを使用して、単一の仮想サーバに起因する動作を実行することもできる。たとえば、図２を一例として使用すると、仮想サーバ２４Ａ、２４Ｂ、２４Ｃ、２４Ｄおよび仮想データベースサーバ４４Ａ、４４Ｂを組み合わせて単一の仮想サーバにすることができる。さらに、本手法は、それだけに限定されるものではないが、本明細書に論じる動作のいくつかまたはすべてを実行するように構成されたマルチテナントアーキテクチャ、概略的なクライアント／サーバの実施例、および／または単一の物理プロセッサベースのデバイスを含む他のアーキテクチャまたは構成で実施することができる。同様に、実施例の議論を容易にするために、仮想サーバまたは機械を参照することがあるが、代わりに物理サーバを適宜用いることもできる。図１および図２の使用および議論は、記載および説明を容易にするための単なる例であり、これらの図に示す特有の例に本開示を限定することを意図したものではない。

理解することができるように、図１および図２に関連して論じるそれぞれのアーキテクチャおよびフレームワークは、全体にわたって、様々なタイプのコンピューティングシステム（たとえば、サーバ、ワークステーション、クライアントデバイス、ラップトップ、タブレットコンピュータ、セルラー電話など）を組み込む。完全を期すために、そのようなシステムで典型的に見られる構成要素の簡単な高レベルの概要を提供する。理解することができるように、本概要は、そのようなコンピューティングシステムで典型的な構成要素についての高レベルの概略的な考えを提供することだけを意図したものであり、論じる構成要素または議論から省略した構成要素に関して限定すると見なされるべきではない。

背景として、本手法は、図３などに示す１つまたは複数のプロセッサベースのシステムを使用して実施することができることが理解されよう。同様に、本手法で利用されるアプリケーションおよび／またはデータベースは、そのようなプロセッサベースのシステム上で記憶、利用、および／または維持することができる。理解することができるように、図３に示すそのようなシステムは、分散されたコンピューティング環境、ネットワーク化された環境、または他の複数のコンピュータを含むプラットホームもしくはアーキテクチャに存在することができる。同様に、図３に示すものなどのシステムは、本手法を実施することができる１つもしくは複数の仮想環境もしくは計算インスタンスに対応する状態、またはそのような仮想環境もしくは計算インスタンスと通信する状態で使用することができる。

これを念頭に、例示的なコンピュータシステムは、図３に示すコンピュータ構成要素のいくつかまたはすべてを含むことができる。図３は、全体として、コンピューティングシステム８０の例示的な構成要素、および１つまたは複数のバスなどに沿ったそれらの潜在的な相互接続または通信経路のブロック図を示す。図示のように、コンピューティングシステム８０は、それだけに限定されるものではないが、１つもしくは複数のプロセッサ８２、１つもしくは複数のバス８４、メモリ８６、入力デバイス８８、電源９０、ネットワークインターフェース９２、ユーザインターフェース９４、および／または本明細書に記載する機能を実行するのに有用な他のコンピュータ構成要素など、様々なハードウェア構成要素を含むことができる。

１つまたは複数のプロセッサ８２は、メモリ８６に記憶された命令を実行することが可能な１つまたは複数のマイクロプロセッサを含むことができる。追加または別法として、１つまたは複数のプロセッサ８２は、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、および／またはメモリ８６から命令を呼び出すことなく本明細書に論じる機能のいくつかもしくはすべてを実行するように設計された他のデバイスを含むことができる。

他の構成要素に対して、１つまたは複数のバス８４は、コンピューティングシステム８０の様々な構成要素間にデータおよび／または電力を提供するために、好適な電気チャネルを含む。メモリ８６は、任意の有形の非一時的コンピュータ可読記憶媒体を含むことができる。図１には単一のブロックとして示されているが、メモリ８６は、１つまたは複数の物理的な場所において、同じまたは異なるタイプの複数の物理ユニットを使用して実施することができる。入力デバイス８８は、１つまたは複数のプロセッサ８２へデータおよび／またはコマンドを入力するための構造に対応する。たとえば、入力デバイス８８は、マウス、タッチパッド、タッチスクリーン、キーボードなどを含むことができる。電源９０は、回線電力および／または電池ソースなど、コンピューティングデバイス８０の様々な構成要素の任意の好適な電源とすることができる。ネットワークインターフェース９２は、１つまたは複数のネットワーク（たとえば、通信チャネル）を介して他のデバイスと通信することが可能な１つまたは複数のトランシーバを含む。ネットワークインターフェース９２は、有線ネットワークインターフェースまたは無線ネットワークインターフェースを提供することができる。ユーザインターフェース９４は、１つまたは複数のプロセッサ８２との間で伝達されるテキストまたは画像を表示するように構成されたディスプレイを含むことができる。ディスプレイに対する追加および／または代替として、ユーザインターフェース９４は、ライト（たとえば、ＬＥＤ）、スピーカなど、ユーザと連係するための他のデバイスを含むことができる。

上記に論じたクラウドベースのプラットホーム２０は、ＮＬＵ技術を利用することができるアーキテクチャの一例を提供することを理解されたい。特に、クラウドベースのプラットホーム２０は、大規模なソースデータコーパスを含みまたは記憶することができ、そのようなコーパスは、意図－実体モデルを含む複数の出力の生成を容易にするために採掘することができる。たとえば、クラウドベースのプラットホーム２０は、特定のシステムの変更または修理のための要求、要求者と問題に対処しようとするサービス技師または管理者との間のダイアログ、チケットが最終的にどのように解決されたかについての説明などを有するチケッティングソースデータを含むことができる。次いで、生成された意図－実体モデルは、将来の要求における意図を分類するための基礎として働くことができ、ユーザからの自然言語要求に基づいてクラウドベースのプラットホーム２０内で将来の問題に自動的に対処することができる仮想エージェントに対応するように会話モデルを生成および改善するために使用することができる。したがって、本明細書に記載する特定の実施形態では、開示するエージェント自動化フレームワークは、クラウドベースのプラットホーム２０に組み込まれており、他の実施形態では、以下に論じるように、エージェント自動化フレームワークは、発話を処理するようにクラウドベースのプラットホーム２０に通信可能に結合された好適なシステムによって（クラウドベースのプラットホーム２０とは別個に）ホストおよび実行することができる。

上記を念頭に、図４Ａは、クライアントインスタンス４２に関連するエージェント自動化フレームワーク１００（本明細書では、エージェント自動化システム１００とも呼ぶ）を示す。より具体的には、図４Ａは、上記で論じたクラウドベースのプラットホーム２０を含む、サービスプロバイダクラウドインフラストラクチャの一部分の一例を示す。クラウドベースのプラットホーム２０は、クライアントインスタンス４２内で実行されるネットワークアプリケーションに（たとえば、クライアントデバイス１４Ｄのウェブブラウザを介して）ユーザインターフェースを提供するように、ネットワーク１８を介してクライアントデバイス１４Ｄに接続される。クライアントインスタンス４２は、図２に関して説明したものに類似した仮想サーバによって対応され、ここでは、クライアントインスタンス４２内で本明細書に記載する開示の機能に対応することを示すように示されている。クラウドプロバイダインフラストラクチャは概して、クライアントデバイス１４Ｄなどの複数のエンドユーザデバイスに同時に対応するように構成され、各エンドユーザデバイスは、単一のクライアントインスタンス４２と通信している。また、クラウドプロバイダインフラストラクチャは、クライアントインスタンス４２などの任意の数のクライアントインスタンスに同時に対応するように構成することができ、インスタンスの各々は、１つまたは複数のエンドユーザデバイスと通信している。上述したように、エンドユーザはまた、ウェブブラウザ内で実行されるアプリケーションを使用して、クライアントインスタンス４２と連係することができる。

図４Ａに示すエージェント自動化フレームワーク１００の実施形態は、挙動エンジン（ＢＥ）１０２、ＮＬＵフレームワーク１０４、およびデータベース１０６を含み、これらはクライアントインスタンス４２内で通信可能に結合される。ＢＥ１０２は、自然言語ユーザ要求１２２（本明細書では、ユーザ発話１２２または発話１２２とも呼ぶ）およびエージェント応答１２４（本明細書では、エージェント発話１２４とも呼ぶ）を介してクライアントデバイス１４Ｄのユーザと対話する任意の好適な数の仮想エージェントまたはペルソナをホストしまたは含むことができる。実際の実施例では、エージェント自動化フレームワーク１００は、本開示による意味抽出サブシステム、意味探索サブシステムなどを含む複数の他の好適な構成要素を含むことができることに留意されたい。

図４Ａに示す実施形態では、データベース１０６は、データベースサーバインスタンス（たとえば、図２に関して論じたデータベースサーバインスタンス４４Ａまたは４４Ｂ）、または１群のデータベースサーバインスタンスとすることができる。図示のデータベース１０６は、データベース１０６の１つまたは複数のテーブル（たとえば、関係データベーステーブル）内に、意図－実体モデル１０８、会話モデル１１０、発話コーパス１１２、および１群の規則１１４を記憶する。意図－実体モデル１０８は、特定のサンプル発話を介して、特定の意図と特定の実体との間の関連または関係を記憶する。特定の実施形態では、意図－実体モデル１０８は、設計者が好適な作成ツールを使用して作成することができる。他の実施形態では、エージェント自動化フレームワーク１００は、データベース１０６の１つまたは複数のテーブルに記憶された発話コーパス１１２および１群の規則１１４から、意図－実体モデル１０８を生成する。いくつかの実施形態では、意図－実体モデル１０８はまた、作成された技法およびＭＬ技法の組合せに基づいて判定することができる。いずれにせよ、開示する意図－実体モデル１０８は、意図および／または実体の任意の好適な組合せを、発話コーパス１１２のうちのそれぞれの発話コーパス１１２に関連付けることができることを理解されたい。以下に論じる実施形態では、意図－実体モデル１０８のサンプル発話は、理解モデルの意味表現を生成して、意味探索に対する探索空間を定義するために使用される。

図４Ａに示す実施形態では、会話モデル１１０は、意図－実体モデル１０８の意図と、概してＢＥ１０２の挙動を定義する特定の応答および／または行動との間の関連を記憶する。特定の実施形態では、会話モデル内の関連の少なくとも一部分は、設計者が、処理された発話内の特定の識別されたアーティファクトにＢＥ１０２がどのように応答することを望むかに基づいて、ＢＥ１０２の設計者によって手動で作成または事前定義される。異なる実施形態では、データベース１０６は、コンパイルモデルテンプレートデータ（たとえば、クラス互換性規則、クラスレベルスコアリング係数、木モデル比較アルゴリズム、木下位構造ベクトル化アルゴリズム）、意味表現などに関する情報を記憶するテーブルなど、意図分類に関係する他の情報を記憶する他のデータベーステーブルを含むことができることに留意されたい。

図示の実施形態では、ＮＬＵフレームワーク１０４は、ＮＬＵエンジン１１６および語彙マネージャ１１８を含む。ＮＬＵフレームワーク１０４は、任意の好適な数の他の構成要素を含むことができることが理解されよう。特定の実施形態では、ＮＬＵエンジン１１６は、発話の単語またはフレーズから単語ベクトル（たとえば、意図ベクトル、対象または実体ベクトル、部分木ベクトル）を生成すること、ならびにこれらのベクトル間の距離（たとえば、ユークリッド距離）を判定することを含む、ＮＬＵフレームワーク１０４の複数の機能を実行するように設計される。たとえば、ＮＬＵエンジン１１６は、概して、分析された発話の各意図に対して、それぞれの意図ベクトルを作り出すことが可能である。したがって、２つの意図に対してＮＬＵエンジン１１６によって作り出されたそれぞれの意図ベクトルを使用して、２つの異なる発話間の類似性測度または距離を計算することができ、類似性測度は、２つの意図間の意味の類似性の指示を提供する。

語彙マネージャ１１８（以下に論じる語彙サブシステムの一部とすることができる）は、語彙訓練中にＮＬＵフレームワーク１０４によって遭遇されなった語彙外の単語および記号に対処する。たとえば、特定の実施形態では、語彙マネージャ１１８は、エージェント自動化フレームワーク１００によって（たとえば、１群の規則１１４に基づいて）分析された発話内の単語および頭字語の同義語およびドメイン特有の意味を識別および交換することができ、それによりコンテキスト特有の発話内の意図および実体を適切に識別するように、ＮＬＵフレームワーク１０４の性能を改善することができる。加えて、自然言語の傾向に対応して、既存の単語に対する新しい用法を採用するために、特定の実施形態では、語彙マネージャ１１８は、コンテキストの変化に基づいて、他の意図または実体に以前に関連付けられた単語を別の目的で利用するように取り扱う。たとえば、語彙マネージャ１１８は、特定のクライアントインスタンスおよび／または会話チャネルからの発話のコンテキストにおいて、「バイク（ｂｉｋｅ）」という単語が、実際には自転車ではなくモータサイクルを指す状況を取り扱うことができる。

意図－実体モデル１０８および会話モデル１１０が作成された後、エージェント自動化フレームワーク１００は、ユーザ発話１２２（自然言語要求の形態）を受け取り、その要求に対処するために適当な行動をとるように設計される。たとえば、図４Ａに示す実施形態では、ＢＥ１０２は、ネットワーク１８を介して、クライアントネットワーク１２上に配置されたクライアントデバイス１４Ｄによって提出される発話１２２（たとえば、チャット通信における自然言語要求）を受け取る仮想エージェントである。ＢＥ１０２は、ＮＬＵフレームワーク１０４に発話１２２を提供し、ＮＬＵエンジン１１６は、以下に論じるＮＬＵフレームワークの様々なサブシステムとともに、意図－実体モデル１０８に基づいて発話１２２を処理し、発話内のアーティファクト（たとえば、意図および／または実体）を導出する。ＮＬＵエンジン１１６によって導出されたアーティファクト、ならびに会話モデル１１０内の関連に基づいて、ＢＥ１０２は、１つまたは複数の特定の事前定義された行動を実行する。図示の実施形態では、ＢＥ１０２はまた、たとえば受け取ったユーザ発話１２２に応答してＢＥ１０２によって実行される行動を示す応答１２４（たとえば、仮想エージェント発話１２４または確認）を、ネットワーク１８を介してクライアントデバイス１４Ｄに提供する。加えて、特定の実施形態では、発話１２２は、ＮＬＵフレームワーク１０４内の継続学習のために、データベース１０６内に記憶された発話１１２に追加することができる。

他の実施形態では、エージェント自動化フレームワーク１００および／またはＮＬＵフレームワーク１０４の１つまたは複数の構成要素は、改善された性能のために、他の方法で配置、位置決め、またはホストすることができることが理解されよう。たとえば、特定の実施形態では、ＮＬＵフレームワーク１０４の１つまたは複数の部分は、クライアントインスタンス４２とは別個であるがクライアントインスタンス４２に通信可能に結合されたインスタンス（たとえば、共有インスタンス、企業インスタンス）によってホストすることができる。そのような実施形態は、有利には、クライアントインスタンス４２のサイズを低減させ、それによりクラウドベースのプラットホーム２０の効率を改善することができることが現在認識されている。特に、特定の実施形態では、以下に論じる類似性スコアリングサブシステムの１つまたは複数の構成要素は、探索空間内の好適な整合意味表現のために改善された意味探索を有効にし、発話１２２に対するアーティファクト整合の識別を有効にするように、クライアントインスタンス４２ならびに他のクライアントインスタンスに通信可能に結合された別個のインスタンス（たとえば、企業インスタンス）によってホストすることができる。

上記を念頭に、図４Ｂは、エージェント自動化フレームワーク１００の代替実施形態を示し、この実施形態では、ＮＬＵフレームワーク１０４のいくつかの部分が、クラウドベースのプラットホーム２０によってホストされる別個の共有インスタンス（たとえば、企業インスタンス１２５）によって代わりに実行される。図示の企業インスタンス１２５は、好適なプロトコル（たとえば、好適なＲｅｐｒｅｓｅｎｔａｔｉｏｎａｌＳｔａｔｅＴｒａｎｓｆｅｒ（ＲＥＳＴ）要求／応答）を介して、任意の好適な数のクライアントインスタンスと、アーティファクトの採掘および分類に関係するデータを交換するように通信可能に結合される。したがって、図４Ｂに示す設計の場合、複数のクライアントインスタンス４２にアクセス可能な共有資源としてＮＬＵフレームワークの一部分をホストすることによって、クライアントインスタンス４２のサイズを実質的に低減させることができ（たとえば、図４Ａに示すエージェント自動化フレームワーク１００の実施形態と比較）、エージェント自動化フレームワーク１００の全体的な効率を改善することができる。

特に、図４Ｂに示すＮＬＵフレームワーク１０４は、ＮＬＵフレームワーク１０４内で別個のプロセスを実行する３つの別個の構成要素に分割される。これらの構成要素は、企業インスタンス１２５によってホストされる共有ＮＬＵ訓練部１２６と、企業インスタンス１２５によってホストされる共有ＮＬＵ注釈部１２７と、クライアントインスタンス４２によってホストされるＮＬＵ予測部１２８とを含む。図４Ａおよび図４Ｂに示す組織は、単なる例であり、本開示によれば、他の実施形態において、ＮＬＵフレームワーク１０４および／またはエージェント自動化フレームワーク１００の他の組織を使用することもできることが理解されよう。

図４Ｂに示すエージェント自動化フレームワーク１００の実施形態では、共有ＮＬＵ訓練部１２６は、クライアントインスタンス４２から発話コーパス１１２を受け取り、意味論的採掘（たとえば、意味論的解析、文法工学などを含む）を実行して、意図－実体モデル１０８の生成を容易にするように設計される。意図－実体モデル１０８が生成された後、ＢＥ１０２が、クライアントデバイス１４Ｄによって提供されるユーザ発話１２２を受け取ったとき、ＮＬＵ予測部１２８は、発話１２２の解析および注釈のために、発話１２２および意図－実体モデル１０８を共有ＮＬＵ注釈部１２７に渡す。共有ＮＬＵ注釈部１２７は、意図－実体モデル１０８に基づいて、発話１２２の意味論的解析、文法工学などを実行し、発話１２２の意味表現（たとえば、発話木）をクライアントインスタンス４２のＮＬＵ予測部１２８へ返す。次いでＮＬＵ予測部１２８は、以下により詳細に論じる発話１２２のこれらの注釈付き構造を使用して、意図－実体モデル１０８から整合する意図を識別し、したがってＢＥ１０２は、識別された意図に基づいて、１つまたは複数の行動を実行することができる。以下に論じるように、共有ＮＬＵ注釈部１２７は、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０に対応することができ、ＮＬＵ予測部は、意味探索サブシステム１５２に対応することができることが理解されよう。

図５は、挙動エンジン（ＢＥ）１０２およびＮＬＵフレームワーク１０４がエージェント自動化フレームワーク１００の一実施形態においてそれぞれの役割を実行するプロセス１４５を示す流れ図である。図示の実施形態では、ＮＬＵフレームワーク１０４は、意図－実体モデル１０８に基づいて、受け取ったユーザ発話１２２を処理し、アーティファクト１４０（たとえば、意図および／または実体）を抽出する。抽出されたアーティファクト１４０は、ＢＥ１０２によって消費可能な形式で、ユーザ発話１２２の意図および実体を表す１群の記号として実施することができる。したがって、これらの抽出されたアーティファクト１４０は、ＢＥ１０２へ提供され、ＢＥ１０２は、会話モデル１１０に基づいて、受け取ったアーティファクト１４０を処理し、受け取ったユーザ発話１２２に応答して、好適な行動１４２（たとえば、パスワードの変更、記録の作成、アイテムの購入、アカウントの閉鎖）および／または仮想エージェント発話１２４を判定する。矢印１４４によって示すように、プロセス１４５は、エージェント自動化フレームワーク１００が会話形式において同じユーザおよび／または他のユーザから追加のユーザ発話１２２を受け取ってそれに対処するとき、連続して繰り返すことができる。

図５に示すように、特定の状況では、好適な行動１４２が実行された後、さらなる行動または通信を行うことができないことが理解されよう。加えて、本明細書では、ユーザ発話１２２およびエージェント発話１２４について、書かれた会話媒体またはチャネル（たとえば、チャット、電子メール、チケッティングシステム、テキストメッセージ、フォーラムポスト）を使用して伝達されるものとして論じたが、本開示によれば、他の実施形態において、話されたユーザ発話１２２をテキストに変換し、かつ／またはテキストベースのエージェント発話１２４をスピーチに変換して、音声対話システムを有効にするために、音声－テキストおよび／またはテキスト－音声モジュールまたはプラグインを含むこともできることに留意されたい。さらに、特定の実施形態では、ユーザ発話１２２および仮想エージェント発話１２４はどちらも、エージェント自動化フレームワーク１００における新しい構造および語彙の継続学習を有効にするために、データベース１０６（たとえば、発話コーパス１１２）内に記憶することができる。

上述したように、ＮＬＵフレームワーク１０４は、ＮＬＵの難題を管理しやすい探索問題に変換するように協働する２つの１次サブシステム、すなわち意味抽出サブシステムおよび意味探索サブシステムを含む。たとえば、図６は、エージェント自動化フレームワーク１００の一実施形態におけるＮＬＵフレームワーク１０４の意味抽出サブシステム１５０および意味探索サブシステム１５２の役割を示すブロック図である。図示の実施形態では、図６の右側部分１５４は、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０が意図－実体モデル１０８を受け取るところを示し、意図－実体モデル１０８は、このモデルの様々なアーティファクトの各々に対するサンプル発話１５５を含む。意味抽出サブシステム１５０は、意図－実体モデル１０８のサンプル発話１５５の意味表現１５８（たとえば、サンプル意味表現）を含む理解モデル１５７を生成する。言い換えれば、理解モデル１５７は、以下により詳細に論じるように、意味探索サブシステム１５２による探索（たとえば、比較および整合）を有効にするために意味表現１５８（たとえば、探索鍵意味表現）を含む意図－実体モデル１０８の変換または拡大版である。したがって、図６の右側部分１５４は、概して、たとえば定期的に、予定どおりに、または意図－実体モデル１０８の更新に応答して、ユーザ発話１２２を受け取る前に実行されることが理解されよう。

図６に示す実施形態では、左側部分１５６は、意味抽出サブシステム１５０がまた、ユーザ発話１２２を受け取って処理し、少なくとも１つの意味表現１６２を有する発話意味モデル１６０（本明細書では、探索鍵１６０とも呼ぶ）を生成するところを示す。以下により詳細に論じるように、これらの意味表現１５８および１６２は、発話の文法構文構造を捕捉する形式を有するデータ構造であり、データ構造の部分木は、発話の一部分の意味論的意味を符号化する部分木ベクトルを含む。したがって、所与の発話に対して、対応する意味表現は、以下により詳細に論じるように、意味探索サブシステム１５２による探索、比較、および整合を有効にする共通の意味表現形式において、構文的意味および意味論的意味の両方を捕捉する。したがって、発話意味モデル１６０の意味表現１６２は、概して、探索鍵のように考えることができ、理解モデル１５７の意味表現１５８は、探索鍵を探すことができる探索空間を定義する。したがって、意味探索サブシステム１５２は、以下に論じるように、理解モデル１５７の意味表現１５８を探索して、発話意味モデル１６０の意味表現１６２に整合する１つまたは複数のアーティファクトを突き止め、それによって抽出されたアーティファクト１４０を生成する。

図６の意味抽出サブシステム自体は、意味表現１５８および１６２を生成するように協働するＮＬＵフレームワーク１０４の複数のサブシステムを使用する。たとえば、図７は、エージェント自動化フレームワーク１００（本明細書では、エージェント自動化システムとも呼ぶ）のＮＬＵフレームワーク１０４の意味抽出サブシステム１５０の一実施形態を示すブロック図である。意味抽出サブシステム１５０の図示の実施形態は、規則ベースの方法とＭＬベースの方法を組み合わせて使用して、発話１６８に対する発話木１６６を生成し、発話１６８は、図６に対して上記で論じたように、ユーザ発話１２２、または意図－実体モデル１０８のサンプル発話１５５のうちの１つとすることができる。より具体的には、図７は、意味抽出サブシステム１５０の実施形態が複数のベストオフブリード（ｂｅｓｔ－ｏｆ－ｂｒｅｅｄ）モデルをどのように利用することができるかを示し、そのようなモデルは、全体的なＮＬＵフレームワーク１０４に差し込むことができる規則ベースおよびＭＬベースの（たとえば、統計）モデルおよびプログラムの組合せを含む。たとえば、図示の意味抽出サブシステム１５０の差込み可能な設計により、語彙サブシステム１７０は、様々な単語またはフレーズに対する単語ベクトルを定義する任意の好適な単語ベクトル分布モデルを含むことができる。すなわち、所与の会話チャネル、言語、コンテキストなどにおいて、異なる単語分布モデルが他のモデルより優れていることが認識されているため、開示する差込み可能な設計は、意味抽出サブシステム１５０を特定の環境およびアプリケーションにカスタマイズすることを有効にする。図７に示す実施形態では、意味抽出サブシステム１５０は、ＮＬＵフレームワーク１０４の３つのプラグイン対応サブシステム、すなわち語彙サブシステム１７０、構造サブシステム１７２、および韻律サブシステム１７４を使用しており、記憶された規則１１４に従って、これらのサブシステムの様々な出力を組み合わせて、発話１６８から発話木１６６を生成する。

図７に示す意味抽出サブシステム１５０の実施形態では、語彙サブシステム１７０は、概して、意味抽出サブシステム１５０の語彙を取り扱う。したがって、図示の意味抽出サブシステム１５０は、発話の語彙の分析および抽出を有効にする複数の語彙プラグイン１７６を含む。図示の実施形態では、語彙プラグイン１７６は、学習済みの多峰性単語ベクトル分布モデル１７８、学習済みの単峰性単語ベクトル分布モデル１８０、および任意の他の好適な単語ベクトル分布モデル１８２を含む。この文脈で、「単峰性」は、各単語に対して単一のそれぞれのベクトルを有する単語ベクトル分布モデルを指し、「多峰性」は、異なる文脈で異なる意味を有しうる特定の単語（たとえば、同音異義語、多義語）に対する複数のベクトルに対応する単語ベクトル分布モデルを指す（たとえば、「バンク」は、貨幣を貯蔵する場所、貨幣自体、航空機の操縦、または河川に近い場所を指すことができる）。モデル１７８、１８０、および１８２は、言語、会話形式、会話チャネルなどの好適なパラメータに基づいて選択することができる差込み可能な１群の単語ベクトルを提供する。

たとえば、学習済みの多峰性分布モデル１７８および学習済みの単峰性分布モデル１８０は、図１２に関して以下に論じるように、教師なし学習または他の汎用のクラスタリングアルゴリズムを使用して生成された単語分布（たとえば、単語ベクトルの定義されたベクトル空間）を提供することができる。すなわち、一般に発話内で密接して使用される単語は、関係する意味を有することが多いことを認識すると、学習済みの多峰性分布モデル１７８および学習済みの単峰性分布モデル１８０は、発話（たとえば、発話コーパス１１２から）の統計的分析を実行し、次いでその単語がこれらの発話内で他の単語に対して一般にどのように使用されるかに基づいて、単語に対するベクトルを定義することによって生成することができる。したがって、これらの語彙プラグイン１７６は、ユーザ発話１２２およびサンプル発話１５５を処理するとき、語彙サブシステム１７０が、同義語、スペルを間違った単語、符号化された記号（たとえば、ウェブアドレス、ネットワーク経路、エモティコン、および絵文字）、語彙外の用語などを認識してそれに対処することを有効にする。特定の実施形態では、語彙サブシステム１７０は、以下に論じるように、記憶された規則１１４に基づいて、様々な語彙プラグイン１７６によって出力される単語ベクトルから組み合わせまたは選択して、発話木１６６のノードに対する単語ベクトルを生成することができる。さらに、単語ベクトル分布モデル１７８、１８０、および／または１８２は、図１２に関して以下に論じるように、受け取ったユーザ発話１２２上で実行される教師なし学習に基づいて、継続的に更新することができる。

図７に示す実施形態では、意味抽出サブシステム１５０の構造サブシステム１７２は、規則ベースおよびＭＬベースの構造解析プラグイン１８４の組合せを使用して、発話１６８の言語学的形状を分析する。言い換えれば、図示の構造プラグイン１８４は、発話１２２および１５５の構文および文法構造の分析および抽出を有効にする。図示の実施形態では、構造プラグイン１８４は、規則ベースのパーサ１８６、ＭＬベースのパーサ１８８（たとえば、ＤＮＮベースのパーサ、ＲＮＮベースのパーサなど）、および他の好適なパーサモデル１９０を含む。たとえば、これらの構造プラグイン１８４のうちの１つまたは複数は、発話の各単語またはフレーズに対するクラス注釈またはタギング（たとえば、動詞、主語または実体、直接目的語、修飾語などとして）を有効にする。特定の実施形態では、構造サブシステム１７２は、以下に論じるように、データベース１０６内に記憶されている１つまたは複数の規則１１４に基づいて、様々な構造プラグイン１８４によって出力される解析構造から組み合わせまたは選択することができ、発話木１６６の構造または形状を定義するために使用される。

図７に示す実施形態では、意味抽出サブシステム１５０の韻律サブシステム１７４は、規則ベースおよびＭＬベースの韻律プラグイン１９６の組合せを使用して、発話１６８の韻律を分析する。図示の韻律プラグイン１９２は、規則ベースの韻律システム１９４、ＭＬベースの韻律システム１９６、および他の好適な韻律システム１９８を含む。これらのプラグインを使用して、韻律サブシステム１７４は、韻律キューに対する発話１６８を分析し、韻律キューには、リズム（たとえば、発話のほとばしり、句読点または区切りによって示される文節などのチャットリズム）、強調（たとえば、大文字、太字、下線、星印）、焦点または注意（たとえば、特定の用語または形式の反復）などの書かれた韻律キューが含まれ、そのようなキューを使用して、たとえば意図間の境界、異なる意図に対する緊急度または相対的な重要度などを判定することができる。したがって、特定の実施形態では、韻律サブシステム１７４は、以下に論じるように、データベース１０６内に記憶されている規則１１４に基づいて、様々な韻律プラグイン１９２によって出力される韻律解析構造から組み合わせまたは選択して、発話木１６６を生成することができる。

したがって、図７に示す意味抽出サブシステム１５０の実施形態では、ＮＬＵフレームワーク１０４の語彙サブシステム１７０、構造サブシステム１７２、および韻律サブシステム１７４は、１つまたは複数の規則１１４に基づいて、発話１６８から発話木１６６を生成するように協働する。特定の実施形態では、発話１６８から発話木１６６を生成するとき、１つのサブシステム（たとえば、韻律サブシステム１７４）の出力の一部分を、別のサブシステム（たとえば、構造サブシステム１７２）への入力として提供することができることが理解されよう。意味抽出サブシステム１５０によって生成される結果の発話木１６６のデータ構造は、複数のノードを含み、各ノードは、語彙サブシステム１７０によって提供されるそれぞれの単語ベクトルに関連付けられる。さらに、これらのノードは、記憶された規則１１４に従って、構造サブシステム１７２および韻律サブシステム１７４の出力に基づいて、木構造を形成するようにともに配置および結合される。

たとえば、図８は、本手法の一実施形態によって発話１６８に対して生成される発話木１６６の一例を示す図である。上述したように、発話木１６６は、発話１６８に基づいて意味抽出サブシステム１５０によって生成されるデータ構造である。特定の実施形態では、発話意味モデル１６０の意味表現１６２および理解モデル１５７の意味表現１５８は発話木であり（または発話木から導出される）、他の実施形態では、他の解析構造を使用することもできる。図８に示す例では、発話木１６６は、「Ｉｗａｎｔｔｏｇｏｔｏｔｈｅｓｔｏｒｅｂｙｔｈｅｍａｌｌｔｏｄａｙｔｏｂｕｙａｂｌｕｅ，ｃｏｌｌａｒｅｄｓｈｉｒｔａｎｄｂｌａｃｋｐａｎｔｓａｎｄａｌｓｏｔｏｒｅｔｕｒｎｓｏｍｅｄｅｆｅｃｔｉｖｅｂａｔｔｅｒｉｅｓ．（私は今日、モールのそばの店に行って、青い襟付きのシャツと黒いズボンを買い、欠陥のある電池を返品したい。）」という例示的な発話に基づいている。図示の発話木１６６は、木構造内に配置されたノードセット２０２（たとえば、ノード２０２Ａ、２０２Ｂ、２０２Ｃ、２０２Ｄ、２０２Ｅ、２０２Ｆ、２０２Ｇ、２０２Ｈ、２０２Ｉ、２０２Ｊ、２０２Ｋ、２０２Ｌ、２０２Ｍ、２０２Ｎ、および２０２Ｐ）を含み、各ノードは、発話１６８の特定の単語またはフレーズを表す。ノード２０２の各々はまた、発話木１６６の特定の部分木を表すものとして説明することができ、部分木は、１つまたは複数のノード２０２を含むことができることに留意されたい。

上述したように、図８に示す発話木１６６の形式または形状は、韻律サブシステム１７４および構造サブシステム１７２によって判定され、例示的な発話の構文の文法的な意味を表す。より具体的には、韻律サブシステム１７４は、発話を意図セグメントに分割し、構造サブシステム１７２は、これらの意図セグメントから発話木１６６を構築する。ノード２０２の各々は、語彙サブシステム１７０によって判定されたそれぞれの単語ベクトルを記憶または参照して、発話の特定の単語またはフレーズの意味論的意味を示す。上述したように、各単語ベクトルは、発話の一部分意味論的意味の数学表現を提供する浮動小数点値の順序付きのｎ次元リスト（たとえば、３００次元リスト）（たとえば、１×ＮまたはＮ×１行列）である。

さらに、ノード２０２の各々は、構造サブシステム１７２によって、ノードによって表される単語またはフレーズに関する追加の情報で注釈が付けられる。たとえば、図８で、ノード２０２の各々は、クラスまたは品詞（ＰＯＳ）注釈を有する。特に、図８に示す例示的な発話木では、特定の部分木またはノード（たとえば、ノード２０２Ａ、２０２Ｂ、２０２Ｃ、および２０２Ｄ）は、構造サブシステム１７２によって、動詞ノードになるように注釈が付けられ、特定の部分木またはノード（たとえば、ノード２０２Ｅ、２０２Ｆ、２０２Ｇ、２０２Ｈ、２０２Ｉ、および２０２Ｊ）は、主語または目的語ノードになるように注釈が付けられ、特定の部分木またはノード（たとえば、ノード２０２Ｋ、２０２Ｌ、２０２Ｍ、２０２Ｎ、および２０２Ｐ）は、修飾語ノード（たとえば、主語修飾語ノード、目的語修飾語ノード、動詞修飾語ノード）になるように注釈が付けられる。これらのクラス注釈は、図８に示す例示的な発話木１６６のように、発話木から生成された意味表現を比較するときに、意味探索サブシステム１５２によって使用される。したがって、意味表現が生成される発話木１６６は、意図および／または実体抽出のための基礎（たとえば、最初の基礎）として働くことが理解されよう。

上述した図６を簡単に参照すると、ＮＬＵフレームワーク１０４による意味探索の性能は、ＮＬＵフレームワークが、受け取ったユーザ発話１２２の複数の代替形式を導出し、意図－実体モデル１０８のサンプル発話１５５の複数の代替形式と比較することを有効にすることによって改善することができる。たとえば、特定の実施形態では、意味探索サブシステム１５２によって実行される意味探索中、理解モデル１５７の意味表現１５８および潜在的に追加の理解モデルの意味表現を含む探索空間を定義することができる。加えて、特定の実施形態では、この探索空間は、探索されているユーザ発話１２２のＣＣＧ形式に基づいて、反復して剪定することができ、ＣＣＧ形式は、発話意味モデル１６０の意味表現１６２の構造内で捕捉される。特に、ユーザ発話１２２から導出される複数の代替意味表現を使用して、どのような他の比較可能な意味表現１５８が探索空間内に存在するかを判定することができ、比較可能でない意味表現は考慮することから削除して、探索の待ち時間および全体的なコンピューティング資源の使用を改善することができる。したがって、発話意味モデル１６０において異なるＣＣＧ形式を含むユーザ発話１２２の複数の代替意味表現１６２を有する結果、意味探索中に探索空間の劇的に異なる剪定を行い、探索空間のより包括的な意味探索を有効にすることができる。

さらに、意味探索サブシステム１５２が、発話意味モデル１６０の意味表現１６２と理解モデル１５７の意味表現１５８とを比較しているときも、意味表現１６２および１５８の複数の代替形式を有することが有利である。たとえば、特定の実施形態では、ＣＣＧ形式クラスデータベース（たとえば、データベース１０６の一部）は、複数の異なるＣＣＧ形式（たとえば、動詞誘導ＣＣＧ形式、名詞誘導ＣＣＧ形式）を記憶することができる。各ＣＣＧ形式は、意味探索サブシステム１５２が、ＣＣＧ形式を有する発話意味モデル１６０の意味表現１６２と、同じＣＣＧ形式（または異なる比較可能なＣＣＧ形式）を有する理解モデル１５７の意味表現１５８との間の類似性スコアを計算することを有効にする１群の数学関数に関連付けられる。加えて、特定の実施形態では、意味探索サブシステム１５２は、これらの数学関数を使用して、２つの比較可能な意味表現の拡大する数のノードを反復して比較することができ、ノードが考慮される順序はまた、意味表現の形式または形状に依存する。したがって、発話意味モデル１６０において異なるＣＣＧ形式を含む複数の代替意味表現１６２を有することで、異なる数学関数を使用して、異なる理解モデル１５７の意味表現１５８との異なる比較が有効になり、それにより、より包括的な意味探索も有効になる。

上記を念頭に、図９は、プロセス２５０の一実施形態を示す流れ図であり、プロセス２５０によって、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０は、受け取ったユーザ発話１２２に基づいて、発話意味モデル１６０の１つまたは複数の探索鍵を生成し、１つまたは複数の理解モデル１５７に基づいて、探索空間を生成する。プロセス２５０はまた、概して、意味探索サブシステム１５２を含み、意味探索サブシステム１５２は、探索鍵に基づいて探索空間を探索し、ユーザ発話１２２のアーティファクト１４０（たとえば、意図および／または実体）を抽出する。他の実施形態では、プロセス２５０のステップは、ＮＬＵフレームワーク１０４の他の好適な構成要素によって実行することができる。加えて、プロセス２５０は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）内に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

プロセス２５０の図示の実施形態は、意味抽出サブシステム１５０がユーザ発話１２２から発話意味モデル１６０を生成すること（ブロック２５２）から始まる。上述したように、発話意味モデル１６０は、１つまたは複数の意味表現を含み、各意味表現は、後の意味探索動作のための探索鍵として働く。発話意味モデル１６０の探索鍵の生成については、図１０～図１２に関して以下により詳細に論じる。加えて、図９に示すように、意味抽出サブシステム１５０はまた、１つまたは複数の理解モデル１５７から探索空間２５６（たとえば、コンパイル済み探索空間）を生成する（ブロック２５４）。探索空間２５６は、少なくとも１つの理解モデル１５７からの意味表現を含み、これらの意味表現は、意味探索動作中に発話意味モデル１６０の探索鍵意味表現と比較される。探索空間の生成についてもまた、図１０～図１２に関して以下により詳細に論じる。

後に、意味抽出サブシステム１５０によって準備された探索空間２５６および探索鍵１６０が、意味探索（本明細書では、「意図推定」とも呼ぶ）を実行するために、意味探索サブシステム１５２に提供され、または意味探索サブシステム１５２に利用可能にされる。図９に示す実施形態では、意味探索サブシステム１５２は、発話意味モデル１６０の探索鍵に基づいて、探索空間２５６の比較可能な意味表現の弾性ビーム幅の認知構造文法（ＣＣＧ）形式ベースの探索を実行し（ブロック２５８）、競合整合意味表現セット２６０を識別する。本明細書では、「弾性ビーム幅」、「動的ビーム幅」、または「可変ビーム幅」は、弾性（たとえば、動的、可変）の信頼性閾値に基づいて、各比較に対する可変の数の探索整合を識別するように定義された探索動作を指す。たとえば、以下に論じるように、弾性ビーム幅の探索動作は、所望の信頼性閾値を提供することができ、意味探索サブシステム１５２は、信頼性閾値を満たす可変の数の潜在的な探索整合を識別することができる。これは、静的または非弾性のビーム幅として説明することができる意味探索動作中に識別することができる潜在的な整合の静的な最大数を定義する他の意味探索の実施形態とは対照的である。加えて、以下に論じるように、特定の実施形態では、探索動作中に弾性ビーム幅（識別された潜在的な探索整合の数）を広くしまたは拡大するために、緩和関数を使用して、探索動作に関連付けられた信頼性閾値をさらに緩和することができる。たとえば、弾性ビーム幅探索の信頼性閾値は、初期値（たとえば、８０％の信頼性）を定義することができるが、緩和された信頼性閾値は、実質的により低くすることができ（たとえば、５０％の信頼性）、それにより追加の探索整合の識別を有効にすることができる。弾性ビーム幅のＣＣＧ形式ベースの探索については、図１４～図１７に関してより詳細に論じる。

図９に示す実施形態では、プロセス２５０は継続し、意味探索サブシステム１５２が、ブロック２５８で識別された競合整合意味表現セット２６０に基づいて、弾性ビーム幅のアーティファクト内探索を実行し（ブロック２６２）、最終整合意味表現セット２６４を生成する。特に、セット２６４内の各競合は、サンプル空間２５６の競合アーティファクト特有部分を探査することによってさらに精練される。たとえば、特定の意図（たとえば、「ＭｅｅｔｉｎｇＲｅｑｕｅｓｔ」）に関連付けられた意味表現が、セット２６０内の競合である場合、弾性ビーム幅のアーティファクト内探索は、サンプル空間２５６（たとえば、探索部分空間）のうち、意味表現を比較する意図の範囲に入る部分に焦点を当てる。弾性ビーム幅のアーティファクト内探索の概略的な目標は、競合整合意味表現セット２６０のアーティファクトによって定義される探索部分空間を累進的に探索することによって、ブロック２５８の弾性ビーム幅のＣＣＧ形式ベースの探索中に判定される信頼値を精練することであり、比較されている意味表現の累進的により大きい部分を考慮することによって、最終的に類似性信頼度に到達する。弾性ビーム幅のアーティファクト内探索については、図１７および図１８に関してより詳細に論じる。

図示の実施形態では、プロセス２５０は、意味探索サブシステム１５２が、最終整合意味表現セット２６４からアーティファクト１４０（たとえば、意図および／または実体）を抽出すること（ブロック２６６）によって終了する。特定の実施形態では、抽出されたアーティファクト１４０は、ユーザ発話１２２の意図および／または実体を表し、それぞれの信頼値に各々関連付けることができる（たとえば、ブロック２６２で生成され、ブロック２６６で精練される）。後に、抽出されたアーティファクト１４０、ならびにこれらのそれぞれの信頼値は、ＢＥ１０２へ提供され、ＢＥ１０２は、図５に関して論じたように、行動１４２を実行すること、および／またはエージェント発話１２４（たとえば、確認メッセージまたはさらなる情報に対するプロンプト）を提供することによって応答する。

図１０は、意味抽出サブシステム１５０が、複数の理解モデル１５７からの探索空間２５６を集め、次いで発話意味モデル１６０の探索鍵と探索空間２５６の意味表現１５８とを比較して、アーティファクト１４０を抽出する一実施形態を示す情報の流れ図である。探索空間２５６の生成に対して、意味抽出サブシステム１５０は、各々特定の目的またはドメインに適した複数の意図－実体モデル１０８など、意図－実体モデルセット２７０のサンプル発話１５５を集約することができる。上述したように、セット２７０の各意図－実体モデル１０８は、ＮＬＵフレームワーク１０４が、多くの他の好適な対話のうち、ユーザへの挨拶、会議の管理、企業の特定の製品の管理、人的資源行動の管理、および／またはユーザとの会話の終了など、ユーザとの任意の好適な自然言語対話に対して意味探索を実行するための案内を提供するサンプル発話１５５を含むことができる。サンプル発話１５５は、意味表現セット２７２を生成するように、意味抽出サブシステム１５０によって分析され、意味表現セット２７２は、それぞれの各サンプル発話１５５に可能な形式を割り当て、ならびに各サンプル発話１５５の多義表現を考慮する。意味表現セット２７２に対して、理解モデルセット２７４のうちのそれぞれの理解モデルを生成することができ、セット２７４の各理解モデルは、それぞれのモデル特有の探索空間２７６を定義する。

同様に、探索鍵の生成および利用中、意味抽出サブシステム１５０は、ユーザ発話１２２を受け取り、ユーザ発話１２２に対する意味表現セット２７８を導出する。したがって、意味抽出サブシステム１５０は、探索空間２５６と比較するために、意味表現セット２７８から発話意味モデル１６０（探索鍵）を生成する。実際には、以下により詳細に論じるように、意味探索サブシステム１５２は、探索鍵１６０を定義するセット２７８の意味表現と、探索空間２５６の意味表現１５８とを比較して、任意の好適な整合意味表現２８０を識別し、それによりＮＬＵフレームワーク１０４が、抽出されたアーティファクト１４０を識別することを有効にする。意味探索サブシステム１５２はまた、整合意味表現２８０および／またはそのアーティファクトを、添付の信頼性レベルでスコアリングして、意味表現１５８から抽出される可能性が最も高いアーティファクト１４０に対する適当なエージェント応答１２４および／または行動１４２を容易にすることができる。

上記を念頭に、図１１は、プロセス３００の一実施形態を示す流れ図であり、プロセス３００によって、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０は、元の発話３０２の再表現を生成し、次いでこれらの再表現および元の発話３０２に基づいて、意味表現セット３０４を生成する。特定の事例では、元の発話３０２は、受け取ったユーザ発話１２２とすることができ、その結果得られる意味表現セット３０４が、発話意味モデル１６０の意味表現１６２になることができ、これは本明細書では探索鍵とも呼ばれることが理解されよう。他の事例では、元の発話３０２は、探索空間２５６に格納するために使用される意図－実体モデル１０８のサンプル発話１５５のうちの１つとすることができる。図１１に示す実施形態では、プロセス３００の一部分が、ＮＬＵフレームワーク１０４の意味抽出サブシステム１５０の語彙サブシステム１７０によって実行され、別の部分が、意味抽出サブシステム１５０の構造サブシステム１７２によって実行される。他の実施形態では、プロセス３００のステップは、ＮＬＵフレームワーク１０４の他の好適な構成要素によって実行することができる。加えて、プロセス３００は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

図１１に示す実施形態では、プロセス３００は、ＮＬＵフレームワーク１０４の語彙サブシステム１７０が元の発話３０２をクレンジングすること（ブロック３０６）から始まる。たとえば、語彙サブシステム１７０は、発話の特定のトークン（たとえば、単語、フレーズ、句読点、絵文字）を修正するために、データベース１０６に記憶されている規則１１４にアクセスして適用することができる。たとえば、特定の実施形態では、クレンジングは、非テキスト要素（たとえば、エモティコン、絵文字、句読点）を元の発話３０２から除去するという規則を適用することを伴うことができる。特定の実施形態では、クレンジングは、発話内のスペル間違いまたは誤植を補正することを伴うことができる。加えて、特定の実施形態では、クレンジングは、特定のトークンを他のトークンに置換することを伴うことができる。たとえば、語彙サブシステム１７０は、時間または色に関するすべての実体が、汎用のまたは包括的な実体（たとえば、「ＴＩＭＥ」、「ＣＯＬＯＲ」）を有するという規則を適用することができる。

図１１に示す実施形態では、プロセス３００は継続し、語彙サブシステム１７０が、元の発話３０２上で語彙注入（ブロック３０８）を実行する。語彙注入は、概して、元の発話３０２の複数の再表現を導入することを伴う。たとえば、理解モデル１５７の語彙モデル３１０による指示に応じて、用語および／または術語を、より談話に適当なフレーズおよび／または用語に交換することができる。特定の実施形態では、複数のフレーズおよび／または用語を交換することができ、そのような交換の様々な順列は、元の発話３０２に基づいて、発話セット３１２を生成するために使用される。たとえば、特定の実施形態では、語彙サブシステム１７０は、理解モデル１５７の語彙モデル３１０にアクセスして、異なるトークンを有する発話の再表現を生成するために使用することができる代替の語彙を識別することができる。特有の例として、一実施形態では、語彙サブシステム１７０は、「開発者（ｄｅｖｅｌｏｐｅｒ）」に対する同義語が「従業員（ｅｍｐｌｏｙｅｅ）」であると判定することができ、「開発者」という用語が「従業員」という用語によって置換された新しい発話を生成することができる。

図１１に示す実施形態では、クレンジングおよび語彙注入後、発話セット３１２は、ＰＯＳタギングおよび解析のために構造サブシステム１７２へ提供される。発話セット３１２は、元の発話３０２またはそのクレンジングされた変種を含むことができ、ブロック３０８の語彙注入によって生成された任意の好適な数の代替の再表現発話を含むことができることが理解されよう。特定の状況では、ブロック３０８の語彙注入は、元の発話３０２の再表現を生成しないことがあり、したがって、発話セット３１２は、元の発話３０２またはそのクレンジングされた変種のみを含むことができることに留意されたい。他の実施形態では、元の発話３０２は、ブロック３０６のクレンジングまたはブロック３０８の語彙注入なく、構造サブシステム１７２へ直接提供することができる。

発話セット３１２を受け取ると、構造サブシステム１７２は、プラグインセット３１４を使用して、元の発話３０２を表す１つまたは複数の意味表現セット３０４を生成する（ブロック３１６）。他の実施形態では、プラグインセット３１４は代わりに、意味抽出サブシステム１５０またはＮＬＵフレームワーク１０４の差込み不可のアプリケーションまたはモジュールとして実施することができる。しかし、図示の構造サブシステム１７２の開示する差込み可能な設計は、ＮＬＵフレームワーク１０４がさらなる柔軟性を有することを有効にすることが現在認識されている。たとえば、プラグインセット３１４を、異なる言語または異なるドメインに対して設計（たとえば、プログラム、訓練）された別のセットに切り換えることによって、ＮＬＵフレームワーク１０４に追加の言語に対する対応を追加することができる。

図１１に示す実施形態では、構造サブシステム１７２のプラグインセット３１４は、品詞（ＰＯＳ）プラグイン３１８、１つまたは複数の補正プラグイン３２０、変動フィルタ（ＶＦ）プラグイン３２２、パーサプラグイン３５４、ならびに最終スコアリングおよびフィルタリング（ＦＳＦ）プラグイン３２６を含む。プラグイン３１４の機能については、図１２に関してより詳細に論じる。概して、ＰＯＳプラグイン３１８は、関連付けられた品詞（たとえば、動詞、名詞、形容詞、代名詞、副詞）を有する発話の各トークンのＰＯＳタギングを実行するように訓練されたＭＬベースの構成要素（たとえば、順伝播型人工ニューラルネットワーク）を含む。ＰＯＳプラグイン３１８は、発話の複数の潜在的ＰＯＳタギング、ならびに発話の各潜在的ＰＯＳタギングに対する対応する信頼性スコアを出力するように設計される。補正プラグイン３２０は、ＭＬベースの技法または規則（たとえば、データベース１０６に記憶）を適用して、ＰＯＳプラグイン３１８によって生成された潜在的ＰＯＳタギングのうち、誤っていることが分かったものを修正または除去するＰＯＳ補正プラグインを含む。ＶＦプラグイン３２２は、ＰＯＳプラグイン３１８によって生成された潜在的ＰＯＳタギングの数学的比較を適用し、互いに十分に異ならないＰＯＳタギングを除去する。パーサプラグイン３２４は、残りの候補ＰＯＳタギングの各々に対するそれぞれの意味表現、ならびに解析動作に関する対応する信頼性スコアを生成するように設計および／または訓練された規則ベースまたはＭＬベースの構成要素（たとえば、順伝播型人工ニューラルネットワーク）を含むことができる。補正プラグイン３２０はまた、ＭＬベースの技法または規則（たとえば、データベース１０６に記憶）を適用して、パーサプラグイン３２４によって生成された潜在的意味表現のうち、誤っていることが分かったものを修正または除去するパーサ補正プラグインを含む。ＦＳＦプラグイン３２６は、生成された各意味表現に対する最終的な信頼性スコアを判定し、次いで事前定義された閾値より大きい対応する最終的な信頼性スコアを有する最終的な意味表現セット３０４を出力する。

図１２は、プロセス３４０の一実施形態を示す流れ図であり、プロセス３４０によって、ＮＬＵフレームワーク１０４の構造サブシステム１７２は、発話３４４に対する複数の代替意味表現３４２を生成することができる。したがって、図１２のプロセス３４０は、図１１のブロック３１６に対応する。図１１を参照すると、発話３４４は、受け取ったユーザ発話１２２、意図－実体モデル１０８のサンプル発話１５５のうちの１つ、クレンジング（ブロック３０６）から生成された発話、または語彙注入（ブロック３０８）から生成された発話などの発話セット３１２のうちの１つとすることができ、その結果得られる意味表現３４２は、元の発話３０２の意味表現セット３０４の一部分またはすべてとすることができることが理解されよう。図１２に示す実施形態では、プロセス３４０は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

図１２に示す実施形態では、プロセス３４０は、２つの段階、すなわちＰＯＳタギング段階３４６および解析段階３４７に分割される。ＰＯＳタギング段階３４８は、構造サブシステム１７２が、潜在的ＰＯＳタギングセット３５０、ならびに各潜在的ＰＯＳタギングに対応する信頼性スコア３５２を生成するために、発話３４４のＰＯＳタギングを実行すること（ブロック３４８）から始まる。発話３４４に加えて、ＰＯＳプラグイン３１８はまた、ＰＯＳ閾値を受け取る。たとえば、ＰＯＳプラグイン３１８に、特定の信頼性レベル（たとえば、８０％）を表すＰＯＳ閾値３５４を提供することができ、したがって潜在的ＰＯＳタギングセット３５０は、ＰＯＳ閾値３５４以上の対応する信頼性スコアを有するタギングのみを含む。他の実施形態では、ＰＯＳプラグイン３１８は、追加または別法として、ＰＯＳタギング限界値（たとえば、１０）を受け取ることができ、したがって、ＰＯＳプラグイン３１８によって生成される潜在的ＰＯＳタギングの数が、ＰＯＳタギング限界値に制限される。特定の状況では、潜在的ＰＯＳタギングセット３５０は、単一のＰＯＳタギングのみを含むことができることに留意されたい。

図１２に示す実施形態では、プロセス３４０は継続し、構造サブシステム１７２は、補正プラグイン３２０を使用して、潜在的ＰＯＳタギングセット３５０の自動補正（ブロック３５６）を実行して、補正済み潜在的ＰＯＳタギングセット３５８を生成する。たとえば、上述したように、ＰＯＳプラグイン３１８は、ＭＬベースの構成要素を含むことができる。したがって、ＰＯＳプラグイン３１８は、訓練中、たとえば欠陥のある訓練データの結果、誤ったＰＯＳタギングを意図せず学習する可能性がある。したがって、補正プラグイン３２０のうちの少なくとも１つは、欠陥のあるＰＯＳタギングがプロセス３４０の残りのステップへ前方へ運ばれることを阻止するために、セット３５８から潜在的ＰＯＳタギングを修正または除去するように設計される。特定の実施形態では、補正プラグイン３２０は、トークン表面形式（たとえば、単語表面形式）が、そのトークンに対する選択されたＰＯＳタグに整合することを確実にするために、外部の字句データベース（たとえば、データベース１０６に記憶、理解モデル１５７の一部として記憶）を調査することができる。このタイプの補正は、ＰＯＳプラグイン３１８がサブワード学習モデル（たとえば、文字埋込みベースのモデル、形態素モデルなど）に基づいて訓練されているときに特に効果的でありうることが理解されよう。他の実施形態では、補正プラグイン３２０は、特定のトークンを特定のＰＯＳタグに関連付けるように訓練されたＭＬベースの構成要素（たとえば、人工ニューラルネットワーク）を含むことができる。そのような実施形態では、補正プラグイン３２０は、セット３５０内の潜在的ＰＯＳタギングの各タグに対するタギングスコアを判定することができ、所定のタギング閾値（たとえば、データベース１０６に記憶）を下回るタギングスコアを有するすべての潜在的ＰＯＳタギングを削除することができる。

たとえば、特定の実施形態では、補正プラグイン３２０は、規則ベースの補正技法を実施することができる。そのような実施形態では、補正プラグイン３２０のうちの少なくとも１つは、潜在的ＰＯＳタギングセット３５０を補正するために、開発者によって定義されデータベース１０６に記憶されている規則１１４にアクセスして適用することができる。たとえば、ＰＯＳプラグイン３１８のＭＬベースの構成要素は、トークン「ストップ（ｓｔｏｐ）」が動詞または名詞ではなく句読点を示すと、訓練中に誤って学習する可能性がある。したがって、開発者は、この誤ったＰＯＳタギングを含むセット３５０からの潜在的ＰＯＳタギングを除去するために、または誤ったＰＯＳタギングを正しいＰＯＳタギングに置き換えるようにセット３５０からの潜在的ＰＯＳタギングを修正するために、補正プラグイン３２０によって適用されるべき１つまたは複数の規則１１４を定義することができる。特定の実施形態では、補正プラグイン３２０は代わりに、これらの技法の組合せを使用して、潜在的ＰＯＳタギングセット３５０内のエントリを削除または修正することができる。

図１２に示す実施形態では、プロセス３４０のＰＯＳタギング段階３４６は、構造サブシステム１７２は、ＶＦプラグイン３２２を使用して、補正済み潜在的ＰＯＳタギングセット３５８の変動性フィルタリング（ブロック３６０）を実行することによって終了し、潜在的ＰＯＳタギングの最終ノミニーセット３６２を生成する。補正済み潜在的ＰＯＳタギングセット３５８に加えて、ＶＦプラグイン３２２はまた、補正済みセット３５８内の潜在的ＰＯＳタギングが互いにどれだけ異なるべきかを定義する変動閾値３６４を受け取る。変動性フィルタリングの目的は、補正済みセット３５８内で他の潜在的ＰＯＳタギングに類似しすぎていると考えられ、したがって達成しようとするコンピューティング資源の消費に値する十分に別個の経路を表さない潜在的ＰＯＳタギングを削除することによって、プロセス３４０ならびに後の意味探索の効率を改善することである。

変動性フィルタリングは、複数の異なる方法で実現することができる。概して、補正済みセット３５８内の２つの潜在的ＰＯＳタギングが互いにどれだけ異なるかを判定するために、タギング距離または変動性関数が使用される。変動性フィルタリングは、最小のかつ／または表面的な違いしかない意味表現につながる潜在的ＰＯＳタギング間の「浅い」違いを調査するために、意味探索が追加のコンピューティング資源を消費することを阻止または防止する。たとえば、補正済み潜在的ＰＯＳタギングセット３５８内の任意の２つのエントリに対する変動性スコアを計算することができ、変動性スコアが変動閾値３６４を下回るとき、潜在的ＰＯＳタギングのうちの１つは、十分に冗長であると考えられ、潜在的ＰＯＳタギングの最終ノミニーセット３６２内に含まれない。したがって、潜在的ＰＯＳタギングの数が比較的小さい（たとえば、１０以下）ときは、このようにして補正済みセット３５８内の各潜在的ＰＯＳタギングを比較することができる。しかし、補正済みＰＯＳタギングセット３５８内により多数の潜在的ＰＯＳタギングが存在する実施形態では、クラスタリング技法を適用することができる。たとえば、タギング距離関数を使用して、潜在的ＰＯＳタギング間のタギング距離を判定することができ、したがってこれらのタギング距離に基づいて、潜在的ＰＯＳタギングをグループにクラスタ化することができるようになる（たとえば、クラスタ間の距離を最大化すること、事前定義された数のクラスタを形成することによる）。後に、代表的な潜在的ＰＯＳタギングが、各グループから選択され（たとえば、各クラスタの質量中心の潜在的ＰＯＳタギング）、プロセス３４０内の次のステップへ進められる。本開示によれば、他の変動性フィルタリング技法を使用することもできることが理解されよう。

比較的小さい補正済みＰＯＳタギングセット３５８を有する一例では、ＶＦプラグイン３２２が、ダイバーシティベースの包含技法を使用することができる。この例では、発話３４４は、「Ｃｈａｎｇｅｍｙｐａｓｓｗｏｒｄ（私のパスワードを変更してください）」とすることができる。ブロック３４８で、ＰＯＳプラグイン３１８は、発話３４４のトークンが順に、（１）動詞の命令形、形容詞、および名詞、または（２）動詞、形容詞、および名詞、または（３）名詞、形容詞、および名詞、または（４）動詞、代名詞、および名詞であることを示す潜在的ＰＯＳタギングセット３５０を判定することができる。ブロック３５６における補正後、ＶＦプラグイン３２２は、補正済み潜在的ＰＯＳタギングセット３５８を受け取り、変動性関数を適用して、潜在的ＰＯＳタギングが互いにどれだけ異なるかを判定する。この例では、ＶＦプラグイン３２２は、補正済み潜在的ＰＯＳタギングセット３５８内の第１のエントリを考慮することによって始まる。ＶＦプラグイン３２２は、比較のための基礎がないため、第１のエントリが十分に異なり、潜在的ＰＯＳタギングの最終ノミニーセット３６２内に含まれるべきであると判定する。次に、ＶＦプラグイン３２２は、変動性関数を使用して第１のエントリと比較することによって、補正済み潜在的ＰＯＳタギングセット３５８内の第２のエントリを考慮することができる。例示的な変動性関数は、加重平均とすることができる。この例では、第１および第２のエントリが比較されるとき、第１のエントリの第１のタグ（たとえば、動詞の命令形）と、第２のエントリの第１のタグ（たとえば、動詞）とが比較される。異なるタグ比較に対する差分値を、規則１１４の一部としてデータベース１０６に記憶することができる。たとえば、データベース１０６内で、動詞と動詞の比較、名詞と名詞の比較、形容詞と形容詞の比較などに割り当てられる差分値は０とすることができ、動詞の命令形と動詞の比較に割り当てられる差分値は、０よりわずかに大きくすることができ（たとえば、０．１）、動詞と名詞の比較、動詞と形容詞の比較、名詞と形容詞の比較などに割り当てられる差分値は、１とすることができ、以下同様である。特定の実施形態では、データベース１０６は、異なるＰＯＳタグに対する加重値をさらに記憶することができ、したがって特定のＰＯＳタグ（たとえば、動詞）は、変動性関数の出力に対して、他のＰＯＳタグ（たとえば、名詞、代名詞）より大きい寄与を有する。この例では、ＰＯＳタグの重みは同等である。したがって、変動性関数は、第１のエントリと第２のエントリとの間の変動性スコアを計算することができ（たとえば、（第１のタグ間の差分に対する０．１＋第２のタグ間の差分に対する０＋第３のタグ間の差分に対する０）／（比較される３つのタグ）＝０．０３）、次いでこの変動性スコアと変動閾値３６４（たとえば、０．３）とを比較することができる。変動性スコアは変動閾値３６４を下回るため、第２のエントリは、ＰＯＳタギングの最終ノミニーセット３６２内に含まれない。このプロセスは継続し、補正済み潜在的ＰＯＳタギングセット３５８内の第３のエントリが第１のエントリと比較され（たとえば、（第１のタグ間の差分に対する１＋第２のタグ間の差分に対する０＋第３のタグ間の差分に対する０）／（比較される３つのタグ）＝０．３であり、これは０．３の変動閾値である）、第３のエントリは、潜在的ＰＯＳタギングの最終ノミニーセット３６２内に含まれる。後に、補正済み潜在的ＰＯＳタギングセット３５８内の第４のエントリが第１のエントリと比較され（たとえば、（第１のタグ間の差分に対する０．１＋第２のタグ間の差分に対する１＋第３のタグ間の差分に対する０）／（比較される３つのタグ）＝０．３３であり、これは０．３の変動閾値より大きい）、また第３のエントリとも比較され（たとえば、（第１のタグ間の差分に対する１＋第２のタグ間の差分に対する１＋第３のタグ間の差分に対する０）／（比較される３つのタグ）＝０．６６であり、これは０．３の変動閾値より大きい）、第４のエントリもまた、潜在的ＰＯＳタギングの最終ノミニーセット３６２内に含まれ、プロセス３４０において前方へ運ばれる。

図１２に示す実施形態では、解析段階３４７は、構造サブシステム１７２が、潜在的ＰＯＳタギングの最終ノミニーセット３６２から潜在的意味表現セット３６８を生成し、ならびにセット３６８における各潜在的意味表現の解析のために、対応する信頼性スコア３７０を生成するために、パーサプラグイン３２４を使用して解析推論を実行すること（ブロック３６６）から始まる。潜在的ＰＯＳタギングの最終ノミニーセット３６２に加えて、ＰＯＳプラグイン３１８はまた、データベース１０６に記憶することができる解析閾値３７２を受け取る。たとえば、パーサプラグイン３２４に、特定の信頼性レベル（たとえば、８０％）を表す解析閾値３７２を提供することができ、したがって潜在的意味表現セット３６８は、解析閾値３７２以上の対応する信頼性スコアを有する意味表現のみを含む。特定の事例では、パーサプラグイン３２４は、特定の潜在的ＰＯＳタギングに対する意味表現を生成することが可能でないことに留意されたい。

特定の実施形態では、プロセス３４０は、最終スコアリングおよびフィルタリングが実行される前に、潜在的意味表現セット３６８内のエントリを修正または除去するために、第２の自動補正ステップ（ブロック３７４）を含むことができることが理解されよう。たとえば、上述したように、パーサプラグイン３２４は、ＭＬベースの構成要素を含むことができる。したがって、パーサプラグイン３２４は、訓練中、たとえば欠陥のある訓練データの結果、誤った解析木構造の生成を意図せず学習する可能性がある。したがって、特定の実施形態では、構造サブシステム１７２は、補正プラグイン３２０の一部として、欠陥のある意味表現がプロセス３４０の残りのステップへ前方へ運ばれることを阻止するために、セット３６８から潜在的意味表現を修正または除去するように設計されたパーサ補正プラグインを含むことができる。特定の実施形態では、このパーサ補正プラグインは、特定のＰＯＳタギングを特定の解析木構造に関連付けるように訓練されたＭＬベースの構成要素（たとえば、人工ニューラルネットワーク）を含むことができる。他の実施形態では、パーサ補正プラグインは、ＰＯＳ補正プラグインに関して上記で論じたように、規則ベースの補正技法、または規則ベースおよびＭＬベースの技法の組合せを実施することができる。

図１２に示す実施形態では、プロセス３４０の解析段階３４７は、構造サブシステム１７２が、ＦＳＦプラグイン３２６を使用して、ブロック３６６でパーサプラグイン３２４によって生成された潜在的意味表現セット３６８の最終スコアリングおよびフィルタリング（ブロック３７６）を実行することによって終了する。たとえば、図１２に示すように、特定の実施形態では、ＦＳＦプラグイン３２６は、パーサプラグイン３２４によって生成された潜在的意味表現セット３６８、潜在的意味表現の各々に対応する信頼性スコア３７０、および潜在的意味表現セット３６８を生成するために使用される潜在的ＰＯＳタギングに対応する信頼性スコア３５２を受け取る。加えて、ＦＳＦプラグイン３２６はまた、ＦＳＦ閾値３７８を受け取り、ＦＳＦ閾値３７８は、データベース１０６に記憶することができる。ＦＳＦプラグイン３２６は、これらの信頼値に基づいて潜在的意味表現セット３６８内の各エントリに対する最終的（たとえば、全体的、累積的）なスコアを計算する最終スコアリング関数を定義し、ＦＳＦ閾値３７８以上の最終スコアを有する意味表現のみを前進させる。

異なる実施形態では、ＦＳＦプラグイン３２６の最終スコアリング関数は、ＰＯＳタギングからの信頼性スコア３５２と、解析からの信頼性スコア３７０とを、異なる形で組み合わせることができる。たとえば、特定の実施形態では、最終スコアリング関数は、潜在的意味表現セット３６８内の各エントリに対する信頼性スコア３５２および３７０をそれぞれ乗算および／または加算することができる。特定の実施形態では、この乗算および／または加算プロセスは、最終スコアに対するＰＯＳタギングからの信頼性スコア３５２または解析からの信頼性スコア３７０の影響を増大させるように加重することができる。特有の例として、一実施形態では、潜在的意味表現セット３６８内の意味表現の対応する最終スコアは、ＰＯＳタギングからの信頼性スコア３５２に解析からの信頼性スコア３７０を足した値の５倍とすることができる。他の実施形態では、信頼性スコア３５２および３７０は、加重平均として組み合わせることができ、各信頼性スコアに対する相対的な重みは、データベース１０６内で事前定義することができる。

例として、図１３は、ＮＬＵフレームワーク１０４の意味探索サブシステム１５２内で実施することができる類似性スコアリングサブシステム３８８の一実施形態を示す情報の流れ図である。以下に論じるように、類似性スコアリングサブシステム３８８は、数学的比較関数を検索および利用し、より高価な関数を介して任意の好適な数の意味表現を互いに反復して比較する。一例として、図１３の本実施形態は、第１の意味表現３９０および第２の意味表現３９２が探索空間２５６の意味表現１５８と比較される類似性スコアリングサブシステム３８８の機能を対象とするが、以下に論じる技法は、ＮＬＵフレームワーク１０４の各意味表現に適用可能であることを理解されたい。理解されるように、第１の意味表現３９０は、上記で論じた意味表現１６２のうちの第１の意味表現１６２に対応することができ、第２の意味表現１６４は、意味表現１６２のうちの第２の意味表現１６２に対応することができる。意味表現３９０、３９２は各々、本明細書ではユーザ発話１２２に対応するものとして主に論じた発話２６６から導出することができるが、他の実施形態では、上記で論じたサンプル発話１５５のうちの１つに対応することもできる。

概して、各意味表現３９０、３９２は、意味表現３９０、３９２の形状（たとえば、発話木構造および品詞タギング）に基づいて割り当てられた０、１つ、または複数の認知構造文法（ＣＣＧ）形式クラスに属する。言い換えれば、ＣＣＧ技法に基づいて、類似性スコアリングサブシステム３８８は、各意味表現３９０、３９２が、集合的にＣＣＧ形式にマッピング可能なノード（たとえば、単語ベクトルおよび／または単語ベクトルの組合せ）に対する品詞タグを含む形状または構造（たとえば、発話木または他の好適なメタ構造によって定義される）を有すると認識する。したがって、類似性スコアリングサブシステム３８８は、意味表現３９０、３９２の形状に基づいて探索を実行し、意味表現３９０、３９２に対するアーティファクト整合を含む好適な整合意味表現１５８を識別することができる。

図示の実施形態では、類似性スコアリングサブシステム３８８は形式クラスデータベース３９６を含み、形式クラスデータベース３９６内には形式クラステーブル３９８が含まれる。テーブルとして主に論じるが、他の実施形態では、形式クラステーブル３９８を任意の好適なデータ構造で実施することができる。いくつかの実施形態では、形式クラスデータベース３９６および形式クラステーブル３９８は、エージェント自動化フレームワーク１００のデータベース１０６内に記憶することができる。本明細書で認識されるように、形式クラステーブル３９８の各エントリ４００（たとえば、形式クラスエントリ）は、意味探索サブシステム１５２が対応する１対１の形式クラス比較（ＣＣＧ形式クラス比較とも呼ぶ）を記述する。特に、形式クラステーブル３９８は、第１の意味表現のＣＣＧ形式に関連付けられた第１の軸４０２と、第２の意味表現のＣＣＧ形式に関連付けられた第２の軸４０４とを含み、これらが比較されている。各軸のラベルは、動詞誘導フレーズ、名詞誘導フレーズなど、類似性スコアリングサブシステム３８８が対応するそれぞれのＣＣＧ形式の各々に対する形式パターンに関連付けられており、対応されるｆ_１～ｆ_ＮのＣＣＧ形式範囲内で好適な関数名によって表される。したがって、特定の意味表現に対する形式パターンは、特定の意味表現に対するＣＣＧ形式クラスのメンバーシップを定義することを理解されたい。

本実施形態では、形式クラステーブル３９８は、２つの関連付けられたＣＣＧ形式が比較可能であるかどうかを示すために、ＣＣＧ形式のうちの２つの各交差に対して、エントリ４００のうちのそれぞれのエントリ４００を含み、比較可能である場合、比較の性能に関する命令を含む。形式クラステーブル３９８は、比較されたＣＣＧ形式クラスの可能な各順列に対応する任意の好適な数のエントリ４００を含むことができることを理解されたい。特に、各々が同じＣＣＧ形式クラスに属する意味表現は、それ自体が互いに比較可能であり、形式クラステーブル３９８の中心対角線４０６に沿って各エントリ４００内に示されている以下に論じる比較関数リストによって表される。本明細書に示すように、形式クラステーブル３９８は、中心対角線４０６に沿って鏡映対称線を有し、形式クラステーブル３９８の本実施形態の比較関数が可換であることを示す。すなわち、第１の意味表現を第２の意味表現と比較することは、第２の意味表現を第１の意味表現と比較することと同じ結果をもたらす。他の実施形態では、形式クラステーブル３９８は、鏡映対称線を含まなくてもよく、したがって類似性スコアリングサブシステム３８８が、意味表現が比較されている順序または方向に基づいて、以下に論じる比較関数リストを適合させることが有効になる。特定の例として、形式クラステーブル３９８の１つのエントリ４００は、動詞誘導ＣＣＧ形式を有する意味表現を、動詞誘導ＣＣＧ形式、名詞誘導ＣＣＧ形式などを有する他の意味表現と比較することができると指定することができる。本実施形態では、類似性スコアリングサブシステム３８８は、比較のためのエントリ４００が空（たとえば、ナル、未定義）であると判定したことに応答して、１対の意味表現が比較可能でないと判定し、したがって比較可能でない意味表現間の比較を実行しない。

上述したように、類似性スコアリングサブシステム３８８の対応される各ＣＣＧ形式クラス比較に対する形式クラステーブル３９８のエントリ４００はまた、１つまたは複数の関数４１０（たとえば、比較関数）を有する数学的比較関数リスト４０８（たとえば、形式代数関数リスト、処理規則）を含み、または、類似性スコアリングサブシステム３８８を数学的比較関数リスト４０８に向ける。各数学的比較関数リスト４０８の関数４１０は、以下により詳細に説明するように、意味表現３９０、３９２の各々を探索空間２５６と比較することを有効にする累進的により高価なスコアリング関数を提供する入れ子状の関数セットである。数学的比較関数リスト４０８は、類似性スコアリングサブシステム３８８が任意の好適な数の意味表現間の類似性スコアを判定するために用いることができるベクトル代数、コサイン類似性関数、外部データベースへのクエリ、および／または任意の他の好適な数学関数もしくは数式を含むことができる。関数４１０は、数学的比較関数リスト４０８の前の機能をさらに定義することができ、または別法として前の関数４１０から完全に独立したものとすることもできることを理解されたい。いくつかの実施形態では、形式クラステーブル３９８の各エントリ４００に対する数学的比較関数リスト４０８は、言語学者またはユーザによって手動で指定されたもの、ＭＬ技法によって導出されたものなどである。

概して、数学的比較関数リスト４０８の関数４１０は各々、意味表現３９０、３９２の考慮された部分が探索空間２５６の意味表現１５８に好適に整合することに応答して、特定の閾値スコアを上回る類似性スコアを与えることによって、意味表現３９０、３９２のうちの比較可能な意味表現と探索空間２５６との間の類似性をそれぞれスコアリングする。特定の実施形態では、関数４１０は、それぞれの意味表現１５８が、対応する探索鍵意味表現３９０、３９２の重要または顕著なノードを除外したこと、またはそのようなノードに整合しないことに応答して、探索空間２５６のそれぞれの意味表現１５８に関連付けられた類似性スコアに０を割り当てることができ、または他の方法でペナルティを与えることができる。理解されるように、類似性スコアリングサブシステム３８８は、空の形式クラステーブル３９８のエントリ４００によって示されるように、形式クラスデータベース３９６の形式クラス互換性規則に基づいて、比較に好適でないＣＣＧ形式を有する別の意味表現と、意味表現を比較しない。

他の実施形態では、類似性スコアリングサブシステム３８８は、いくつかの実施形態において、比較可能でない対の意味表現に、０の類似性スコアをすぐに割り当てることができる。さらなる実施形態では、類似性スコアリングサブシステム３８８は、類似性スコアリングサブシステム３８８に、比較可能でない意味表現間の０の類似性スコアを生成させる関数４１０を有する数学的比較関数リスト４０８を実施することによって、比較を実行することができる。そのような実施形態では、数学的比較関数リスト４０８は自然に、類似性スコアリングサブシステム３８８に、意味表現３９０、３９２との比較に好適でないＣＣＧ形式を有する意味表現１５８に０またはナルの類似性スコアを割り当てさせることができるため、形式クラステーブル３９８は、形式クラステーブル３９８の各エントリ４００内に適当な数学的比較関数リスト４０８を含むことができる。

さらに、特定の実施形態では、類似性スコアリングサブシステム３８８は、発話意味モデル１６０から発話３９４の複数の感情表現の表現を受け取ることができる。たとえば、探索鍵意味表現３９０、３９２は、発話２６６に対する代替形式を表すものとして、発話意味モデル１６０内に含むことができる。概して、意味表現３９０、３９２（意味抽出サブシステム１５０によって作成され、発話意味モデル１６０内に含まれる）の各々は、発話３９４のアーティファクトに対応する好適に別個の意味表現を表す。比較可能な各対の意味表現３９０、３９２を考慮することによって、本実施形態の類似性スコアリングサブシステム３８８は、対応する抽出されたアーティファクト１４０に対してより徹底的な探索を提供するために、またはそのようなアーティファクト１４０に対してより大きい網をかけるために、発話３９４の複数の解釈を評価することができる。

図１４は、プロセス４２０の一実施形態の流れ図であり、プロセス４２０によって、意味探索サブシステム１５２は、比較関数リスト４０８を使用して探索空間２５６から整合意味表現を反復して識別する弾性ビーム幅のＣＣＧ形式ベースの探索を実行する。理解されるように、プロセス４２０は、意味探索サブシステム１５２が、発話意味モデル１６０の意味表現１６２の各々と、探索空間２５６内の多数の意味表現１５８との間の類似性を予測的に評価することを有効にする。プロセス４２０は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）内に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

プロセス４２０の図示の実施形態では、図示の実施形態の意味探索サブシステム１５２は、ｆｏｒ－ｅａｃｈループ４２２によって、発話意味モデル１６０の意味表現１６２の各々に対して反復される。意味探索サブシステム１５２は、ｆｏｒ－ｅａｃｈループの代わりに、発話意味モデル１６０の意味表現１６２の各々に対する類似性スコアの生成を有効にする任意の他の好適な処理体系を実施することができることを理解されたい。たとえば、意味探索サブシステム１５２は、別法として、ｄｏ－ｗｈｉｌｅループ、ｆｏｒループ、ｗｈｉｌｅループ、ｄｏ－ｕｎｔｉｌループなどを実施することができる。いずれにせよ、発話意味モデル１６０の意味表現１６２の各々に対して、類似性スコアリングサブシステムは、図１３に示すように、それぞれの意味表現のＣＣＧ形式を判定し（ブロック４２４）、形式クラスデータベース３９６から関連付けられた比較関数リスト４０８を検索する。プロセス４２０に対する反復パラメータを初期化することで、意味探索サブシステム１５２はまた、意味表現のＣＣＧ形式に対応する比較関数リスト４０８の第１の関数４１０を選択し（ブロック４２６）、最初に全探索空間２５６になるように、関心探索部分空間を定義する。

プロセス４２０の図示の実施形態では、意味探索サブシステム１５２は、対応する比較関数リスト４０８の第１の比較関数４１０を使用して、意味表現１６２（ユーザ発話１２２から導出される）と、探索部分空間の比較可能な意味表現１５８とを比較し（ブロック４２８）、それによって意味表現１６２と探索部分空間の比較可能な意味表現との比較に対応する類似性スコアセット４３０を生成および精練する。いくつかの実施形態では、意味探索サブシステム１５２は、比較された意味表現の意味ベクトル（たとえば、単語ベクトル、部分木ベクトル）間の距離に基づいて、類似性スコアセット４３０を判定することができる。上述したように、第１の比較関数４１０は、比較関数リスト４０８の比較関数の最小量の計算資源を消費する。したがって、意味探索サブシステム１５２は、ユーザ発話の意味表現の全体と、探索空間または理解モデル内の意味表現の全体とを包括的に比較する他の探索システムより、この初期ＣＣＧ形式探索および類似性スコアリングを急速かつ／または効率的に実行することができる。

たとえば、図１５を次に参照すると、この図は、比較関数リスト４０８を適用して探索空間２５６を好適な探索部分空間に選択的に精練する意味探索サブシステム１５２の一実施形態の概略図を示す。たとえば、第１の比較４３２中、意味探索サブシステム１５２は、第１の比較関数４１０Ａを適用して、意味表現１６２と、探索空間２５６の全体になるように初期化された探索部分空間４３４内の比較可能な意味表現１５８、またはより厳密には探索空間２５６のすべての比較可能な意味表現１５８とを比較することができる。本明細書で認識されるように、最も正確でないが最も効率的な比較関数４１０Ａをこうして適用することで、意味探索サブシステム１５２が探索空間２５６において第１回の探索を効率的に実行することが有効になる。図示の例では、第１の比較関数４１０Ａは、意味表現１６２の根ノード４３６を考慮するが、第１の比較関数４１０Ａを介して、意味表現１６２の別の好適な部分（たとえば、他のノードまたはノードの組合せ）を分析することもできることを理解されたい。

図１４に戻ると、意味探索サブシステム１５２は、探索部分空間４３４から意味表現１５８を除去または剪定し（ブロック４３８）、剪定される意味表現は、類似性スコアセット４３０内に、ＣＣＧ形式ベースの探索の弾性ビーム幅を定義する弾性または可変の閾値である緩和された総最小信頼性スコア（緩和されたＡＭＣＴ）を下回る対応する類似性スコアを有する。ＡＭＣＴおよび緩和されたＡＭＣＴの判定については、図１６に関して説明する。したがって、意味探索サブシステム１５２は、探索部分空間４３４の低減された数の意味表現１５８に対する比較関数リスト４０８の後の比較関数４１０の効率的な適用のために、探索部分空間４３４を縮小することができる。実際には、図１５に戻ると、探索部分空間４３４は、第１の比較４３２後、緩和されたＡＭＣＴを下回る類似性スコアに関連付けられた意味表現１５８を探索部分空間４３４から除去することによって狭められる（たとえば、収縮される、刈り込まれる）。

図１４のプロセス４２０に戻ると、意味探索サブシステム１５２は、ＣＣＧ形式比較（たとえば、ｆｏｒ－ｅａｃｈループ４２２の現在の反復）が継続するべきであるかどうかを判定する（ブロック４４０）。本明細書で認識されるように、意味探索サブシステム１５２は、１つまたは複数の好適な停止条件が満たされたことに基づいて、ＣＣＧ形式の比較を継続すると判定することができる。たとえば、意味探索サブシステム１５２は、すべての意味表現１５８が探索部分空間４３４から剪定されたこと（たとえば、整合がないことを示す）、意味表現１５８の閾値数が探索部分空間内に残っていること（たとえば、最も可能性が高い整合を示す）、最近適用された比較関数４１０が、その関数内に定義された埋込み停止条件が満たされたことを示すこと、比較関数リスト４０８のすべての関数が適用されたことなどに応答して、ＣＣＧ形式の比較を終了することができる。

ブロック４４０で、停止条件が満たされていないと判定したことに応答して、意味探索サブシステム１５２は、比較関数リスト４０８の次の比較関数４１０を選択する（ブロック４４２）。次いで、矢印４４４によって示すように、意味探索サブシステム１５２は、ブロック４２８へ戻り、意味表現１６２と、探索部分空間４３４の残りの比較可能な意味表現１５８とを比較する。次いで、意味探索サブシステム１５２は、比較関数リスト４０８の後のより計算的に高価な比較関数４１０を利用することによって、探索部分空間４３４の残りの比較可能な意味表現１５８に関連付けられた類似性スコアセット４３０を精練（たとえば、修正、更新）する。各比較後、意味探索サブシステム１５２は、前の反復を介して生成された類似性スコアセット４３０を精練することができ、または別法として、セット４３０の前に生成された各類似性スコアを、そのより正確な同等物に交換することができる。実際には、後の比較関数４１０の適用中にさらなる処理資源が利用されるため、類似性スコアセット４３０は概して、追加の比較関数４１０が適用されると、正確さおよび／または精度に関して改善される。類似性スコアセット４３０に基づいて、意味探索サブシステム１５２は、セット４３０のうち、緩和されたＡＭＣＴを下回るそれぞれの類似性スコアを有する意味表現１５８の探索部分空間４３４を再び剪定する（ブロック４３８）。

図１５を再び参照すると、類似性スコアセット４３０を精練し、探索部分空間４３４を剪定するために、意味探索サブシステム１５２は、第２の比較４４６中に第２の比較関数４１０Ｂを適用して、意味表現１６２と、サイズが低減された探索部分空間４３４内の残りの意味表現１５８とを比較する。したがって、意味探索サブシステム１５２は、緩和されたＡＭＣＴを満たす好適な候補のみを含むように、探索部分空間４３４をさらに縮小することができる。特定の実施形態では、各比較関数４１０は、比較された意味表現のそれぞれのノードの露出または拡大を案内する。たとえば、第１の比較関数４１０Ａは、意味表現１６２の根ノード４３６と探索部分空間４３４の意味表現１５８とを比較する単一の条項を含むことができ、第２の比較関数４１０Ｂは、意味表現１６２の拡大部分と探索部分空間４３４の意味表現１５８とを比較する１つまたは複数の条項を含むことができる。

したがって、意味探索サブシステム１５２は、所与の比較のために、累進的により正確かつ資源集約的になる比較関数４１０を、探索部分空間４３４の残存している（たとえば、ビーム内の）意味表現１５８に反復して適用する。図１４のプロセス４２０を図１５に対して継続すると、意味探索サブシステム１５２は、第３の比較４４８中に第３の比較関数４１０Ｃを実施して、意味表現１６２の一部分（たとえば、露出または考慮された部分）と、さらに剪定された探索部分空間４３４とを比較することができ、以下同様である。したがって、意味探索サブシステム１５２は、最終比較４５０中に最終比較関数４１０Ｄを実施して、意味表現１６２の全体と、さらに剪定された探索部分空間４３４とを比較するように設計され、著しく低減された数の残りの意味表現１５８の候補のために、最も計算集約的な最終比較関数４１０Ｄの実行を節約する。実際には、特定の事例では、図１５の最終比較４５０は、意味表現１６２内の利用可能な情報の全体を活用して（たとえば、すべてのノードを考慮する）、探索空間２５６から競合整合意味表現１５８を識別することができる。

したがって、図１４に戻ると、意味探索サブシステム１５２は、ブロック４４０でＣＣＧ形式比較の停止パラメータが満たされていると判定することができ、それに応答して、ｆｏｒ－ｅａｃｈループ４２２を反復して（ブロック４４１）、発話意味モデル１６０の次の意味表現１６２を処理することができる。意味表現１６２のすべてが処理された後、意味探索サブシステム１５２は、初期競合整合意味表現セット４５２を識別し、初期セット４５２の各々は、発話意味モデル１６０の特定の意味表現１６２に対する整合意味表現を含む。加えて、これらの初期競合整合意味表現セット４５２は、後の部分の意味探索中に焦点を狭めすぎることを回避するために、ダイバーシティスコアリングへ提出される。ここで論じるダイバーシティスコアリングは、上記で論じた変動性フィルタリングとは別個であることに留意されたい。

したがって、図示の実施形態では、意味探索サブシステム１５２は、すべての初期競合整合意味表現セット４５２にわたってダイバーシティスコアリングを実行し（ブロック４５４）、事前定義されたダイバーシティ閾値を下回るそれぞれのダイバーシティスコアを有するエントリを除去する。たとえば、一実施形態では、意味探索サブシステム１５２は、探索空間２５６の２つの意味表現１５８を比較し、意味表現が互いにどれだけ異なるかを示すダイバーシティスコアを返すように設計されたダイバーシティスコアリング構成要素を含むことができる。特有の例として、一実施形態では、ダイバーシティスコアリング関数は、探索空間２５６を生成するために使用された１つまたは複数の理解モデル１５７にアクセスして、どの特定の理解モデル１５７およびどの意図が、ダイバーシティスコアリングを受けている各意味表現に関連付けられているかを判定することができる。この例では、ダイバーシティスコアリング関数は、共通の意図または理解モデルを共有しない意味表現に対して、最も高い相対ダイバーシティスコア（たとえば、１）を判定し、共通の理解モデルを共有するが共通の意図は共有しない意味表現に対して、ならびに共通の意図を共有するが共通の理解モデルは共有しない意味表現に対して、より低い相対ダイバーシティスコア（たとえば、０．５）を判定し、共通の理解モデルおよび共通の意図の両方を共有する意味表現に対して、最も低い相対ダイバーシティスコア（たとえば、０）を判定することができる。

ブロック４５４のダイバーシティスコアリング中、意味探索サブシステム１５２は、初期競合整合意味表現セット４５２から、「競合バッグ」である（最終）競合整合意味表現セット２６０へ、意味表現を選択的に追加する。したがって、意味表現を最終セット２６０に追加する前に、意味表現は、ダイバーシティスコアリング関数を使用して、現在最終セット２６０に入っているあらゆる意味表現に対して測定される。最終競合意味表現セット２６０内のすべてのエントリと比較されたとき、意味表現が、事前定義されたダイバーシティ閾値を上回るダイバーシティスコアを有していない場合、この意味表現は廃棄され、最終セット２６０に追加されない。しかし、新しい競合が、すべてのバッグ内の競合と比較して、事前定義されたダイバーシティ閾値より大きいダイバーシティ測度を有する場合、この競合は最終セット２６０に追加される。特定の実施形態では、意味探索サブシステム１５２は、以下に論じるように、競合意味表現セット２６０を使用して、アーティファクト内探索を実行する。

図１６は、図１３の弾性ビーム幅のＣＣＧ形式ベースの探索の一実施形態中に使用される緩和された総最小信頼性閾値（ＡＭＣＴ）によって提供される有効ビーム幅を示す概略図である。図示の実施形態では、各円が、図１４のブロック４３８などの弾性ビーム幅のＣＣＧ形式ベースの探索の一部分中に剪定を切り抜けた意味表現４７０を表す。有効ビーム幅４７２は、緩和されたＡＭＣＴ値以上のそれぞれの信頼性スコアを有する競合整合意味表現４７０を示し、したがって探索部分空間内に保持され、かつ／または探索動作の次の比較もしくは段階へ進められる。たとえば、図１４および図１５に示すように、有効ビーム幅４７２内の意味表現１５８は、関数比較リスト４０８の後の比較関数４１０を使用して、発話意味モデル１６０の探索鍵に対して比較された探索部分空間４３４を定義することができ、またはブロック４５４でダイバーシティスコアリングへ提出される初期競合整合意味表現セット４５２内に含むことができる。図１６に示すように、緩和されたＡＭＣＴ値を下回るそれぞれの信頼性スコアを有する残りの意味表現４７０は、廃棄または除去される。

上述したように、弾性ビーム幅有効探索動作は、弾性信頼性閾値に基づいて、可変数の探索整合を識別することができる。たとえば、ＡＭＣＴ値は、総信頼性閾値セットから選択された最小の信頼性閾値である。たとえば、一実施形態では、信頼値セットは、意味探索動作に対して所望の信頼性閾値を定義するためにユーザ発話とともに提供される信頼値、特定の意図または実体に対して定義されるアーティファクトレベルの信頼性閾値などの探索空間に関連付けられた理解モデルにおいて定義される信頼値、およびＮＬＵフレームワーク１０４の構成によって定義されるデフォルト信頼値のうちの１つまたは複数を含むことができる。信頼性閾値セットの最も低いまたは最小の信頼性閾値は、ＡＭＣＴ値として選択される。したがって、弾性ビーム幅のＣＣＧ形式ベースの探索中、特定の比較を異なるＡＭＣＴ値（たとえば、異なるアーティファクトレベルの信頼性閾値による）に関連付けることができ、したがって、各比較段階において、可変の数の競合整合意味表現を識別するために、異なる有効ビーム幅が使用されることが理解されよう。

加えて、特定の実施形態では、図１３の弾性ビーム幅のＣＣＧ形式ベースの探索中に弾性ビーム幅（識別される潜在的な探索整合の数）を広くしまたは拡大するために、緩和関数を使用して、ＡＭＣＴをさらに緩和することができる。たとえば、緩和関数は、ＡＭＣＴ値を緩和されたＡＭＣＴ値に修正および拡大（たとえば、低減）するために、１つまたは複数の数学動作を定義することができ、緩和されたＡＭＣＴ値は、比較中に識別することができる潜在的整合意味表現の数に対する静的閾値または静的限界によって考慮することから除去されるはずであるより低いスコアリングの潜在的意味表現整合が保持されることを有効にする。特有の例として、ＡＭＣＴ値は、初期閾値（たとえば、７５％の信頼性）を指定することができ、緩和されたＡＭＣＴは、実質的により低くして（たとえば、５０％の信頼性）、図１７の弾性ビーム幅のアーティファクト内探索へ最終的に進めることができる追加の潜在的整合意味表現の識別を有効にすることができる。したがって、意味探索サブシステム１５２は、緩和されたＡＭＣＴ値を判定し、次いで弾性ビーム幅のＣＣＧ形式ベースの探索の比較中に、緩和されたＡＭＣＴ値を満たす可変数の潜在的整合意味表現を識別することができる。

図１７は、プロセス４８０の一実施形態の流れ図であり、プロセス４８０によって、意味探索サブシステム１５２は、競合意味表現セットに対して弾性ビーム幅のアーティファクト内探索を実行する。たとえば、特定の実施形態では、意味探索サブシステム１５２は、関心探索部分空間を、ＣＣＧ形式ベースの探索によって識別された特定の意図へさらに集中させ、発話意味モデル１６０の意味表現１６２または探索鍵と探索空間２５６の意味表現１５８との間の類似性スコアセット４３０をさらに精練するように、弾性ビーム幅のＣＣＧ形式ベースの探索によって出力される競合意味表現セット２６０に対して、弾性ビーム幅のアーティファクト内探索を実行することができる。図１７のプロセス４８０の構造は、図１４のプロセス４８０の構造に類似しており、したがって、以下の議論は、プロセス４２０および４８０間の違いに焦点を当てることが理解されよう。プロセス４８０は、図３、図４Ａ、および図４Ｂに関して上記で論じたように、好適なメモリ（たとえば、メモリ８６）内に記憶することができ、クライアントインスタンス４２または企業インスタンス１２５に関連付けられた好適なプロセッサ（たとえば、プロセッサ８２）によって実行することができる。

図１７に示す実施形態では、プロセス４８０はｆｏｒ－ｅａｃｈループ４８２を含み、ｆｏｒ－ｅａｃｈループ４８２は、競合意味表現セット２６０内の各エントリに対して反復され、各エントリに対して一連のステップを実行する。図示のように、意味探索サブシステム１５２は、ｆｏｒ－ｅａｃｈループ４８２の現在選択されている意味表現に対する意図、ＣＣＧ形式、および比較関数リスト４０８を判定する（ブロック４８４）。たとえば、意味探索サブシステム１５２は、探索空間２５６の根本的な理解モデル１５７から、意味表現の意図を検索することができる。次いで、意味探索サブシステムは、比較関数リスト４０８の第１の比較関数を選択し（ブロック４８６）、検索された意図を有する探索空間２５６の意味表現１５８のみを含むように、関心探索部分空間を定義する。

ｆｏｒ－ｅａｃｈループ４８２内のブロックの残りは、概して、図１４に関して上述したように機能する。しかし、緩和されたＡＭＣＴ値を使用するのではなく、プロセス４８０は、緩和されたモデルアーティファクト信頼性（ＭＡＣＴ）閾値に基づいて、反復して狭められた探索部分空間からの意味表現を除去または剪定する（ブロック４８８）。緩和されたＡＭＣＴと同様に、緩和されたＭＡＣＴ値は、アーティファクト内探索の弾性ビーム幅を定義する弾性または可変の閾値である。ＭＡＣＴおよび緩和されたＭＡＣＴの判定については、図１８に関して説明する。競合整合意味表現セット２６０内のエントリのアーティファクト内比較中に少なくとも１つの停止条件が満たされていると判定された後（ブロック４９０）、意味探索サブシステム１５２は、ｆｏｒ－ｅａｃｈループ４８２を反復し（ブロック４９２）、セット２６０内の次のエントリに対して、ｆｏｒ－ｅａｃｈループ４８２内のステップを実行する。セット２６０内にエントリが残っていないとき、ｆｏｒ－ｅａｃｈループ４８２は終了し、累進的に剪定された探索部分空間内に残っているあらゆる意味表現が、アーティファクト抽出のために前へ進められる最終的な整合意味表現セット２６４に追加される。

図１８は、弾性ビーム幅のアーティファクト内探索の一実施形態中に使用される緩和されたモデルアーティファクト信頼性閾値（ＭＡＣＴ）によって提供される有効ビーム幅を示す概略図である。図示の実施形態では、各円が、図１７のブロック４８８などの弾性ビーム幅のアーティファクト内探索の一部分中に剪定を切り抜けた意味表現５００を表す。有効ビーム幅５０２は、緩和されたＭＡＣＴ値以上のそれぞれの信頼性スコアを有する複数の競合整合意味表現を示し、したがって探索部分空間内に保持され、かつ／または探索動作の次の比較もしくは段階へ進められる。たとえば、図１７に示すように、有効ビーム幅内の意味表現は、関数比較リスト４０８の後の比較関数を使用して、発話意味モデル１６０の探索鍵に対して比較された探索部分空間を定義することができ、または意図／実体抽出へ提出される最終的な意味表現セット２６４内に含むことができる。緩和されたＭＡＣＴ値を下回るそれぞれの信頼性スコアを有する残りの意味表現５００は、廃棄または除去される。

上述したように、弾性ビーム幅有効探索動作は、弾性信頼性閾値に基づいて、可変数の探索整合を識別することができる。たとえば、ＭＡＣＴ値は、特定の意図または実体に対して定義されるアーティファクトレベルの信頼性閾値などの探索空間２５６に関連付けられた理解モデル１５７において定義される信頼性閾値とすることができる。加えて、特定の実施形態では、図１７の弾性ビーム幅のアーティファクト内探索中に弾性ビーム幅（識別される潜在的探索整合の数）を広くしまたは拡大する緩和関数（ＡＭＣＴを緩和するために使用される緩和関数とは別個）を使用して、ＭＡＣＴをさらに緩和することができる。たとえば、この緩和関数は、ＭＡＣＴ値を緩和されたＭＡＣＴ値へ修正および拡大（たとえば、低減）するために、１つまたは複数の数学動作を定義することができ、緩和されたＭＡＣＴ値は、比較中に識別することができる潜在的整合意味表現の数に対する静的閾値または静的限界によって考慮することから除去されるはずであるより低いスコアリングの潜在的意味表現整合を保持することを有効にする。特有の例として、ＭＡＣＴは、初期閾値（たとえば、６０％の信頼性）を定義することができ、緩和されたＭＡＣＴは、実質的により低くして（たとえば、３０％の信頼性）、意図および／または実体の抽出へ最終的に進めることができる追加の潜在的整合意味表現の識別を有効にすることができる。したがって、意味探索サブシステム１５２は、緩和されたＭＡＣＴ値を判定することができ、弾性ビーム幅のアーティファクト内探索中に、緩和されたＭＡＣＴ値を満たす可変数の潜在的整合意味表現を識別することができる。

本開示の技術的な効果は、仮想エージェント（たとえば、チャットエージェント）によって受け取られた要求などのユーザ発話から意味を抽出し、これらのユーザ発話に好適に応答することが可能なエージェント自動化フレームワークを提供することを含む。加えて、本実施形態は、所与の自然言語発話に対して複数の代替の意味表現（たとえば、発話木）を検出することが可能な構造サブシステムを有するＮＬＵフレームワークを提供する。開示する構造サブシステムは、発話の形式または形状の異なる面を検出するＭＬベースおよび規則ベースの技法の結果に対して一連の精練を適用することによって、これらの複数の意味表現を生成する。開示する構造サブシステムは、意味探索中に十分な考慮が与えられるべきである複数の有望な形式派生を考慮しながら、誤ったまたは実質上冗長な形式派生を考慮することから効果的に剪定することによって、自然言語要求の改善された意図推定を有効にする。さらに、開示する意味探索サブシステムは、意味探索の様々な段階を実行するとき、弾性（たとえば、非静的、可変）の閾値を有効にする。たとえば、弾性ビーム幅のＣＣＧ形式ベースの探索中に、緩和されたＡＭＣＴを使用することができ、弾性ビーム幅のアーティファクト内探索中に、緩和されたＭＡＣＴを使用することができる。弾性信頼性閾値を使用することによって、意味探索サブシステムは、潜在的整合意味表現に、探索動作の初期比較から低信頼性スコアを受け取ることに耐える機会を与え、したがって意味表現は、探索動作の後の比較においてその信頼性スコアを増大させることができ、最後のアーティファクト（たとえば、意図および／または実体）抽出に対する最終整合意味表現セットに到達する資格を得ることができることが現在認識されている。したがって、開示する技法は、ＮＬＵフレームワークの性能、ドメイン特異性、推論品質、および／または効率を改善する。

上述した特有の実施形態は、例として示されており、これらの実施形態は、様々な修正および代替の形態を受けることができることを理解されたい。特許請求の範囲は、開示する特定の形態に限定されることを意図したものではなく、本開示の精神および範囲内のすべての修正、均等物、および代替を包含することを意図したものであることをさらに理解されたい。

本明細書に提示および主張される技法は、本技術分野を実証可能に改善し、したがって抽象的、無形、または純粋に理論的ではない、実際的な性質の有形物および具体例に参照および適用される。さらに、本明細書の終わりに添付するいずれかの請求項が、「・・・［機能］を［実行］する手段」または「・・・［機能］を［実行］するステップ」と呼ばれる１つまたは複数の要素を含む場合、そのような要素は、米国特許法第１１２条（ｆ）に基づいて解釈されることが意図される。しかし、任意の他の形で呼ばれる要素を含む請求項の場合、そのような要素は、米国特許法第１１２条（ｆ）に基づいて解釈されるべきではないことが意図される。

Claims

エージェント自動化システムであって、
自然言語理解（ＮＬＵ）フレームワークおよび探索空間を記憶するように構成され、前記ＮＬＵフレームワークが意味抽出サブシステムおよび意味探索サブシステムを含み、前記探索空間がサンプル意味表現を含む、メモリと、
前記ＮＬＵフレームワークの命令を実行するように構成されたプロセッサとを含み、前記命令が、前記エージェント自動化システムに、
前記意味抽出サブシステムを介して、ユーザ発話から発話意味モデルを生成するステップであり、前記発話意味モデルが探索鍵意味表現セットを含む、生成するステップと、
前記発話意味モデルの前記探索鍵意味表現セットと前記探索空間の前記サンプル意味表現とを比較し、競合整合意味表現セットを選択するように、前記意味探索サブシステムを介して、弾性ビーム幅の認知構造文法（ＣＣＧ）形式ベースの探索を実行するステップと、
前記競合整合意味表現セットと前記探索空間のサンプル意味表現とを比較し、最終整合意味表現セットを選択するように、前記意味探索サブシステムを介して、弾性ビーム幅のアーティファクト内探索を実行するステップと、
前記意味探索サブシステムを介して、前記最終整合意味表現セットから前記ユーザ発話の意図、実体、またはこれらの組合せを抽出するステップとを含む行動を実行させる、システム。
前記ＮＬＵフレームワークの前記意味抽出サブシステムが、語彙サブシステムおよび構造サブシステムを含み、前記構造サブシステムが、品詞（ＰＯＳ）構成要素、補正構成要素、変動性フィルタ構成要素、パーサ構成要素、ならびに最終スコアリングおよびフィルタリング構成要素を含む、請求項１に記載のシステム。
前記発話意味モデルを生成するために、前記プロセッサが、前記ＮＬＵフレームワークの前記命令を実行するように構成され、前記命令が、前記エージェント自動化システムに、
語彙注入を実行して、前記ユーザ発話に基づいて発話セットを生成するために、前記語彙サブシステムを使用するステップであり、前記発話セットが、異なる用語、異なる術語、またはこれらの組合せを有する前記ユーザ発話および前記ユーザ発話の１つまたは複数の再表現を含む、使用するステップと、
前記発話セットの品詞（ＰＯＳ）タギングを実行して、前記発話セットから潜在的ＰＯＳタギングセットを生成するために、前記ＰＯＳ構成要素を使用するステップと、
前記潜在的ＰＯＳタギングセット内の他のＰＯＳタギングに実質的に類似している１つまたは複数のＰＯＳタギングを前記潜在的ＰＯＳタギングセットから除去するために、前記変動性フィルタ構成要素を使用するステップと、
前記潜在的ＰＯＳタギングセットから潜在的意味表現セットを生成するために、前記パーサ構成要素を使用するステップと、
前記潜在的意味表現セット内の各潜在的意味表現に対してそれぞれの最終スコアを計算し、それぞれの最終スコアに基づいて、前記潜在的意味表現セットから前記発話意味モデルの前記探索鍵意味表現セットとして潜在的意味表現を選択するために、前記最終スコアリングおよびフィルタリング構成要素を使用するステップとを含む行動を実行させる、請求項２に記載のシステム。
前記プロセッサが、前記ＮＬＵフレームワークの前記命令を実行するように構成され、前記命令が、前記エージェント自動化システムに、
前記メモリ内に記憶された少なくとも１つの理解モデルから前記探索空間を生成するステップを含む行動を実行させ、前記探索空間を生成するステップが、
語彙注入を実行して、前記少なくとも１つの理解モデルの意図－実体モデルのサンプル発話に基づいて発話セットを生成するために、前記語彙サブシステムを使用することであり、前記発話セットが、異なる用語、異なる術語、またはこれらの組合せを有する前記サンプル発話および前記ユーザ発話の１つまたは複数の再表現を含む、使用することと、
前記発話セットの品詞（ＰＯＳ）タギングを実行して、前記発話セットから潜在的ＰＯＳタギングセットを生成するために、前記ＰＯＳ構成要素を使用することと、
前記潜在的ＰＯＳタギングセット内の他のＰＯＳタギングに実質的に類似している１つまたは複数のＰＯＳタギングを前記潜在的ＰＯＳタギングセットから除去するために、前記変動性フィルタ構成要素を使用することと、
前記潜在的ＰＯＳタギングセットから潜在的意味表現セットを生成するために、前記パーサ構成要素を使用することと、
前記潜在的意味表現セット内の各潜在的意味表現に対するそれぞれの最終スコアを計算し、それぞれの最終スコアに基づいて、前記潜在的意味表現セットからサンプル空間の前記サンプル意味表現として潜在的意味表現を選択するために、前記最終スコアリングおよびフィルタリング構成要素を使用することとによって行われる、請求項２に記載のシステム。
前記弾性ビーム幅のＣＣＧ形式ベースの探索を実行するために、前記プロセッサが、前記ＮＬＵフレームワークの前記命令を実行するように構成され、前記命令が、前記エージェント自動化システムに、
前記発話意味モデルの前記探索鍵意味表現セットの各探索鍵意味表現に対して、
（Ａ）前記探索鍵意味表現に関連付けられたＣＣＧ形式および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、探索部分空間を前記探索空間の全体として定義し、
（Ｃ）前記探索鍵意味表現と前記探索空間の比較可能なサンプル意味表現とを比較し、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和された総最小信頼性閾値（ＡＭＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を初期競合整合意味表現セットに追加するステップと、
前記初期競合整合意味表現セットから前記競合整合意味表現セットとして意味表現を選択するように、前記初期競合整合意味表現セットのダイバーシティスコアリングを実行するステップとを含む行動を実行させる、請求項１に記載のシステム。
前記弾性ビーム幅のアーティファクト内探索を実行するために、前記プロセッサが、前記ＮＬＵフレームワークの前記命令を実行するように構成され、前記命令が、前記エージェント自動化システムに、
前記競合整合意味表現セットの各競合整合意味表現に対して、
（Ａ）前記競合整合意味表現に関連付けられた意図、ＣＣＧ形式、および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、前記意図を有する前記探索空間のすべてのサンプル意味表現として探索部分空間を定義し、
（Ｃ）前記競合整合意味表現と前記探索空間の比較可能なサンプル意味表現とを比較して、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和されたモデルアーティファクト信頼性閾値（ＭＡＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を前記最終整合意味表現セットに追加するステップを含む行動を実行させる、請求項１に記載のシステム。
前記サンプル意味表現および前記探索鍵意味表現が、発話木を含む、請求項１に記載のシステム。
ユーザ発話の意味探索を実行する方法であって、
前記ユーザ発話から発話意味モデルを生成するステップであり、前記発話意味モデルが探索鍵意味表現セットを含む、生成するステップと、
前記発話意味モデルの前記探索鍵意味表現セットと探索空間のサンプル意味表現とを比較し、競合整合意味表現セットを選択するように、弾性ビーム幅の認知構造文法（ＣＣＧ）形式ベースの探索を実行するステップと、
前記競合整合意味表現セットと前記探索空間のサンプル意味表現とを比較し、最終整合意味表現セットを選択するように、弾性ビーム幅のアーティファクト内探索を実行するステップと、
前記最終整合意味表現セットから前記ユーザ発話の意図、実体、またはこれらの組合せを抽出するステップとを含む、方法。
前記発話意味モデルを生成するステップが、
前記ユーザ発話に基づいて発話セットを生成するように、語彙注入を実行することであり、前記発話セットが、前記ユーザ発話および前記ユーザ発話の１つまたは複数の再表現を含む、実行することと、
前記発話セットに対する潜在的ＰＯＳタギングセットを生成するように、前記発話セットの品詞（ＰＯＳ）タギングを実行することと、
前記潜在的ＰＯＳタギングセット内の他のＰＯＳタギングに実質的に類似しているＰＯＳタギングを前記潜在的ＰＯＳタギングセットから除去するように、変動性フィルタリングを実行することと、
潜在的意味表現セットを生成するように、前記潜在的ＰＯＳタギングセットを解析することと、
前記潜在的意味表現セット内の各潜在的意味表現に対してそれぞれの最終スコアを計算し、前記潜在的意味表現セット内の各潜在的意味表現の前記それぞれの最終スコアに基づいて、前記潜在的意味表現セットから前記発話意味モデルに対する前記探索鍵意味表現セットを選択することとを含む、請求項８に記載の方法。
前記弾性ビーム幅のＣＣＧ形式ベースの探索を実行するステップが、
前記探索鍵意味表現セットの各探索鍵意味表現に対して、
（Ａ）前記探索鍵意味表現に関連付けられたＣＣＧ形式および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、探索部分空間を前記探索空間の全体として定義し、
（Ｃ）前記探索鍵意味表現と前記探索空間の比較可能なサンプル意味表現とを比較し、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和された総最小信頼性閾値（ＡＭＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を初期競合整合意味表現セットに追加するステップと、
前記初期競合整合意味表現セットから前記競合整合意味表現セットとして意味表現を選択するように、前記初期競合整合意味表現セットのダイバーシティスコアリングを実行するステップとを含む、請求項８に記載の方法。
前記緩和されたＡＭＣＴを判定するステップを含み、前記緩和されたＡＭＣＴを判定するステップが、
信頼値セットからの最小の信頼値になるようにＡＭＣＴ値を選択することであり、前記信頼値セットが、前記ユーザ発話に関連付けられた信頼値、前記探索空間に関連付けられた理解モデルにおいて定義された信頼値、またはデフォルト信頼値のうちの少なくとも１つを含む、選択することと、
前記ＡＭＣＴ値を拡大し、前記緩和されたＡＭＣＴを生成するように、緩和関数を適用することとによって行われる、請求項１０に記載の方法。
ダイバーシティスコアリングを実行するステップが、
前記初期競合整合意味表現セット内の各競合整合意味表現に関連付けられた理解モデルおよび意図を判定することと、
固有の理解モデル、固有の意図、またはこれらの組合せを有する意味表現を前記初期競合整合意味表現セットから選択することとを含む、請求項１０に記載の方法。
前記比較関数リストが、計算的に最も安価な比較関数から計算的に最も高価な比較関数へ計算コストを増大させるという点から順序が付けられている、請求項１０に記載の方法。
前記増大する計算コストの少なくとも一部分が、前記探索鍵意味表現の追加のノード、または前記探索空間の前記比較可能なサンプル意味表現の追加のノードを、前の比較関数に対して比較した結果である、請求項１３に記載の方法。
前記弾性ビーム幅のアーティファクト内探索を実行するステップが、
前記競合整合意味表現セットの各競合整合意味表現に対して、
（Ａ）前記競合整合意味表現に関連付けられた意図、ＣＣＧ形式、および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、前記意図を有する前記探索空間のすべてのサンプル意味表現として探索部分空間を定義し、
（Ｃ）前記競合整合意味表現と前記探索空間の比較可能なサンプル意味表現とを比較して、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和されたモデルアーティファクト信頼性閾値（ＭＡＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を前記最終整合意味表現セットに追加することを含む、請求項８に記載の方法。
前記緩和されたＭＡＣＴを判定するステップを含み、前記緩和されたＭＡＣＴを判定するステップが、
前記比較可能なサンプル意味表現のアーティファクトに対して理解モデルにおいて定義された最小アーティファクトレベルの信頼値になるようにＭＡＣＴ値を選択することと、
前記ＭＡＣＴ値を拡大し、前記緩和されたＭＡＣＴを生成するように、緩和関数を適用することとによって行われる、請求項１５に記載の方法。
前記抽出された意図、実体、またはこれらの組合せを挙動エンジン（ＢＥ）へ提供するステップを含み、前記ＢＥが、前記ユーザ発話の前記抽出された意図、実体、またはこれらの組合せに応答して、１つまたは複数の行動を実行する、請求項８に記載の方法。
コンピューティングシステムの１つまたは複数のプロセッサによって実行可能な自然言語理解（ＮＬＵ）フレームワークの命令を記憶する非一時的コンピュータ可読媒体であって、前記命令が、
少なくとも１つの理解モデルから探索空間を生成するための命令であり、前記探索空間がサンプル意味表現を含む、生成するための命令と、
ユーザ発話から発話意味モデルを生成するための命令であり、前記発話意味モデルが探索鍵意味表現セットを含む、生成するための命令と、
前記発話意味モデルの前記探索鍵意味表現セットと前記探索空間の前記サンプル意味表現とを比較し、競合整合意味表現セットを選択するように、弾性ビーム幅の認知構造文法（ＣＣＧ）形式ベースの探索を実行するための命令と、
前記競合整合意味表現セットと前記探索空間のサンプル意味表現とを比較し、最終整合意味表現セットを選択するように、弾性ビーム幅のアーティファクト内探索を実行するための命令と、
前記最終整合意味表現セットから前記ユーザ発話の意図、実体、またはこれらの組合せを抽出するための命令とを含む、媒体。
前記弾性ビーム幅のＣＣＧ形式ベースの探索を実行するための前記命令が、
前記探索鍵意味表現セットの各探索鍵意味表現に対して、
（Ａ）前記探索鍵意味表現に関連付けられたＣＣＧ形式および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、探索部分空間を前記探索空間の全体として定義し、
（Ｃ）前記探索鍵意味表現と前記探索空間の比較可能なサンプル意味表現とを比較して、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和された総最小信頼性閾値（ＡＭＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を初期競合整合意味表現セットに追加するための命令と、
前記初期競合整合意味表現セットから前記競合整合意味表現セットとして意味表現を選択するように、前記初期競合整合意味表現セットのダイバーシティスコアリングを実行するための命令とを含む、請求項１８に記載の媒体。
前記弾性ビーム幅のアーティファクト内探索を実行するための前記命令が、
前記競合整合意味表現セットの各競合整合意味表現に対して、
（Ａ）前記競合整合意味表現に関連付けられた意図、ＣＣＧ形式、および比較関数リストを判定し、
（Ｂ）前記比較関数リストから第１の比較関数を選択し、前記意図を有する前記探索空間のすべてのサンプル意味表現として探索部分空間を定義し、
（Ｃ）前記競合整合意味表現と前記探索空間の比較可能なサンプル意味表現とを比較して、対応する類似性スコアセットを計算または精練するために、前記選択された比較関数を使用し、
（Ｄ）緩和されたモデルアーティファクト信頼性閾値（ＭＡＣＴ）を下回る対応する類似性スコアを前記対応する類似性スコアセット内に有する意味表現を前記探索部分空間から剪定し、
（Ｅ）前記比較関数リストからの追加の比較関数が適用されるべきであると判定したことに応答して、前記比較関数リストから次の比較関数を選択し、ステップ（Ｃ）へ戻り、
（Ｆ）前記探索部分空間内に残っている前記サンプル意味表現を前記最終整合意味表現セットに追加するための命令を含む、請求項１８に記載の媒体。