JP6373243B2 - Information processing apparatus, information processing method, and information processing program - Google Patents
Information processing apparatus, information processing method, and information processing program Download PDFInfo
- Publication number
- JP6373243B2 JP6373243B2 JP2015226736A JP2015226736A JP6373243B2 JP 6373243 B2 JP6373243 B2 JP 6373243B2 JP 2015226736 A JP2015226736 A JP 2015226736A JP 2015226736 A JP2015226736 A JP 2015226736A JP 6373243 B2 JP6373243 B2 JP 6373243B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- processing apparatus
- listener
- output
- terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 225
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 22
- 239000000284 extract Substances 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 14
- 238000012217 deletion Methods 0.000 claims description 13
- 230000037430 deletion Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 230000004044 response Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000010779 crude oil Substances 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、情報処理方法および情報処理プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method, and an information processing program.
近年、用語の解説を提示する技術が知られている。例えば、このような技術では、コンテンツに含まれる用語の解説を取得してコンテンツの出力されている映像と用語の解説を合成することで、出力されている映像に対してリアルタイムに用語解説を表示する。 In recent years, techniques for presenting explanations of terms have been known. For example, in such a technology, explanations of terms included in the content are obtained, and the explanation of the terms is displayed in real time on the output video by synthesizing the explanation of the terms with the output video of the content. To do.
しかしながら、上記の従来技術では、聞き手にとって適切な用語の解説を表示することができるとは限らなかった。例えば、上記の従来技術では、コンテンツに含まれる用語の解説を画一的に取得して表示するので、聞き手にとって常識的な用語の解説を表示する場合がある。このようなことから、上記の従来技術では、聞き手にとって適切な用語の解説を表示することができるとは限らなかった。 However, in the above prior art, it is not always possible to display explanations of terms suitable for the listener. For example, in the above-described conventional technology, explanations of terms included in the content are uniformly acquired and displayed, so that explanations of terms common to the listener may be displayed. For this reason, in the above-described conventional technology, it is not always possible to display explanations of terms appropriate for the listener.
本願は、上記に鑑みてなされたものであって、聞き手にとって適切な用語の解説を表示することができる情報処理装置、情報処理方法および情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program capable of displaying an explanation of terms suitable for a listener.
本願に係る情報処理装置は、音声に関する情報を受信する受信部と、前記受信部によって受信された音声に関する情報に含まれる用語を抽出する抽出部と、前記抽出部によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する出力部とを備えたことを特徴とする。 An information processing apparatus according to the present application includes a receiving unit that receives information related to speech, an extracting unit that extracts terms included in information related to speech received by the receiving unit, and a listener among terms extracted by the extracting unit And an output unit for outputting a summary of technical terms corresponding to the.
実施形態の一態様によれば、聞き手にとって適切な用語の解説を表示することができるという効果を奏する。 According to one aspect of the embodiment, it is possible to display an explanation of terms appropriate for the listener.
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。また、以下の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, a mode for carrying out an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the information processing apparatus, the information processing method, and the information processing program according to the present application are not limited by this embodiment. Moreover, in the following embodiment, the same code | symbol is attached | subjected to the same site | part and the overlapping description is abbreviate | omitted.
〔1.実施形態〕
〔1−1.実施形態に係る提示処理〕
まず、図1を用いて、実施形態に係る提示処理の一例について説明する。図1は、実施形態に係る提示システム1による提示処理の一例を示す説明図である。提示システム1では、図1に示すように、情報処理装置100が、講演者SM(話し手の一例に相当)の講話に含まれる専門用語の要約を聴衆U1〜U2(聞き手の一例に相当)に提示する提示処理が行われる。
[1. Embodiment)
[1-1. Presentation processing according to embodiment]
First, an example of presentation processing according to the embodiment will be described with reference to FIG. Drawing 1 is an explanatory view showing an example of presentation processing by presentation system 1 concerning an embodiment. In the presentation system 1, as shown in FIG. 1, the
図1に示すように提示システム1には、話者端末10と、聴衆端末20A〜20Bと、情報提供装置50と、情報処理装置100とが含まれる。話者端末10、聴衆端末20A〜20B、情報提供装置50、情報処理装置100は、それぞれネットワークと無線または有線により通信可能に接続される。なお、以下では、聴衆端末20A〜20Bの各装置を区別なく総称する場合には、「聴衆端末20」と記載する場合がある。
As shown in FIG. 1, the presentation system 1 includes a
話者端末10は、スマートフォンや、タブレット型端末や、携帯電話機、PC(Personal Computer)や、PDA(Personal Digital Assistant)等の情報処理装置である。具体的には、話者端末10は、講話の話し手である講演者SMに所有される。例えば、話者端末10は、話し手から発せられる音声を録音する機能や、音声を認識する機能を有する。
The
聴衆端末20は、スマートフォンや、タブレット型端末や、携帯電話機、PCや、PDA等の情報処理装置である。具体的には、聴衆端末20は、講話の聞き手である聴衆U1〜U2に所有される。例えば、聴衆端末20は、専門用語の要約を画面に表示する機能を有する。
The
情報提供装置50は、各種の情報を提供するサーバ装置である。具体的には、情報提供装置50は、インターネット百科事典として用語の意味を提供する。例えば、情報提供装置50は、検索クエリを受信した場合に、かかる検索クエリに対応する用語の解説情報を送信元の装置に提供する。
The
情報処理装置100は、専門用語の要約を出力するサーバ装置である。具体的には、情報処理装置100は、まず、音声に関する情報を受信する(ステップS1)。より具体的には、情報処理装置100は、音声に関する情報として、講演者SMの講話の一部分を音声認識した音声認識結果SR1「間接金融がナッシュ均衡だったからペンディングした」を、話者端末10から受信する。
The
続いて、情報処理装置100は、受信された音声に関する情報に含まれる用語を抽出する(ステップS2)。具体的には、情報処理装置100は、受信された音声認識結果SR1に含まれる用語「間接金融」、「ナッシュ均衡」、「ペンディング」を抽出する(ステップS2)。
Subsequently, the
そして、情報処理装置100は、抽出した用語の要約を生成する(ステップS3)。具体的には、情報処理装置100は、情報提供装置50を利用して、「間接金融」、「ナッシュ均衡」、「ペンディング」の要約をそれぞれ生成する。一例としては、情報処理装置100は、検索クエリとして「間接金融」を情報提供装置50に送信する。続いて、情報処理装置100は、情報提供装置50から検索クエリの応答として「間接金融」の解説情報を受信する。そして、情報処理装置100は、受信した「間接金融」の解説情報を参照し、「間接金融」の要約Ab1「金融の一形態で融資する側と受ける側の間に間接的に資金を貸し借りする機関が存在する仕組みのこと」を生成する。同様に、情報処理装置100は、「ナッシュ均衡」の要約Ab2「ゲーム理論における非協力ゲームの解の一種であり、いくつかの解の概念の中で最も基本的な概念である。」を生成する。また、情報処理装置100は、「ペンディング」の要約Ab3「「未定」、「保留」もしくは「先送り」といった意味の外来語であるが、業界によって微妙にニュアンスが異なる場合がある。」を生成する。
Then, the
続いて、情報処理装置100は、音声に関する情報に含まれる用語として抽出された「間接金融」、「ナッシュ均衡」、「ペンディング」のうち聴衆U1に応じた専門用語の要約を、聴衆U1が有する聴衆端末20Aに対してリアルタイムに出力する(ステップS4)。ここで、聴衆U1は、「音楽」の専門家であるものとする。言い換えると、聴衆U1は、ユーザ属性として「音楽」を有するものとする。この場合、情報処理装置100は、聴衆U1に応じた専門用語として、「音楽」以外の分野に属する用語である「間接金融」、「ナッシュ均衡」、「ペンディング」の要約Ab1〜Ab3を聴衆U1が有する聴衆端末20Aに出力する。これにより、聴衆端末20Aは、図1に示すように、「間接金融」、「ナッシュ均衡」、「ペンディング」の要約Ab1〜Ab3をリアルタイムに画面に表示する。
Subsequently, in the
また、情報処理装置100は、音声に関する情報に含まれる用語として抽出された「間接金融」、「ナッシュ均衡」、「ペンディング」のうち聴衆U2に応じた専門用語の要約を、聴衆U2が有する聴衆端末20Bに対してリアルタイムに出力する(ステップS5)。ここで、聴衆U2は、「金融」および「経済」の専門家であるものとする。言い換えると、聴衆U2は、ユーザ属性として「金融」および「経済」を有するものとする。この場合、情報処理装置100は、聴衆U2に応じた専門用語として、「金融」および「経済」以外の分野に属する用語である「ペンディング」の要約を聴衆端末20Bに出力する。一方、情報処理装置100は、「金融」および「経済」の分野に属する用語である「間接金融」、「ナッシュ均衡」の要約を聴衆端末20Bに出力しない。これにより、聴衆端末20Bは、図1に示すように、「間接金融」および「ナッシュ均衡」の要約Ab1〜Ab2を表示せず、「ペンディング」の要約Ab3をリアルタイムに画面に表示する。
In addition, the
このように、実施形態に係る情報処理装置100は、音声に関する情報を受信する。また、情報処理装置100は、受信された音声に関する情報に含まれる用語を抽出する。また、情報処理装置100は、抽出された用語のうち聞き手に応じた専門用語の要約を出力する。
As described above, the
これにより、情報処理装置100は、話し手の音声に含まれる用語のうち聞き手に応じた専門用語を出力することができるので、聞き手にとって適切な用語の解説を表示することができる。例えば、情報処理装置100は、聞き手が専門外とする分野に属する用語の要約を出力することができるので、ユーザが知りたい用語の要約を表示することができる。また、情報処理装置100は、聞き手が専門とする分野に属する用語の要約を出力しないので、ユーザにとって解説が不要な用語が表示されることを防ぎ見易さを高く保つことができる。
Thus, the
なお、図1では、提示システム1に、1台の話者端末10と、2台の聴衆端末20A〜20Bと、1台の情報処理装置100とが含まれる例を示したが、提示システム1には、複数台の話者端末10や、2台に限らず複数台の聴衆端末20A〜20Bや、複数台の情報処理装置100が含まれてもよい。
Although FIG. 1 shows an example in which the presentation system 1 includes one
また、図1では、説明を簡単にするため講演者SMの講話の一部分である「間接金融がナッシュ均衡だったからペンディングした」を例として示したが、実際には講話の一部分に限らず、講話の全部分を対象とし、講話に含まれる専門用語が出現する度にかかる専門用語の要約をリアルタイムに順次表示する。 In addition, in FIG. 1, for the sake of simplicity, an example of “pending because indirect finance was Nash equilibrium”, which is a part of the lecture of the lecturer SM, is shown as an example. A summary of technical terms is displayed sequentially in real time whenever technical terms included in the lecture appear.
〔1−2.実施形態に係る情報処理装置の構成〕
次に、図2を用いて、実施形態に係る情報処理装置100の構成について説明する。図2は、実施形態に係る情報処理装置100の構成例を示す図である。図2に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[1-2. Configuration of Information Processing Device According to Embodiment]
Next, the configuration of the
(通信部110について)
通信部110は、NIC(Network Interface Card)等によって実現される。具体的には、通信部110は、ネットワークと有線または無線で接続され、ネットワークを介して、話者端末10や聴衆端末20、情報提供装置50との間で情報の送受信を行う。例えば、通信部110は、話者端末10から音声に関する情報の受信を行う。他の例では、通信部110は、聴衆端末20に対して専門用語の要約に関する情報の送信を行う。他の例では、通信部110は、情報提供装置50との間で、用語に関する情報の送信と、用語の解説情報の受信とを行う。
(About the communication unit 110)
The
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、音声情報記憶部121と、用語情報記憶部122と、ユーザ情報記憶部123とを有する。
(About the storage unit 120)
The
(音声情報記憶部121について)
音声情報記憶部121は、音声に関する情報を記憶する。具体的には、音声情報記憶部121は、話し手から発せられる音声を音声認識した音声認識結果に関する情報を記憶する。ここで、図3に、実施形態に係る音声情報記憶部121の一例を示す。図3に示すように、音声情報記憶部121は、「音声ID」および「認識結果」といった項目を有する。
(About the voice information storage unit 121)
The voice
「音声ID」は、音声に関する情報を識別するための識別情報を示す。例えば、「音声ID」には、音声ごとに個別に割り当てられる英数字等のユニークな文字列などが記憶される。「認識結果」は、音声に対して音声認識を行なった結果を示す。例えば、「認識結果」には、音声から認識された文字列などが記憶される。 “Voice ID” indicates identification information for identifying information related to voice. For example, the “voice ID” stores a unique character string such as an alphanumeric character individually assigned for each voice. “Recognition result” indicates a result of performing speech recognition on speech. For example, the “recognition result” stores a character string recognized from speech.
すなわち、図3では、音声ID「SR1」によって識別される音声を音声認識した音声認識結果は、「間接金融がナッシュ均衡だったからペンディングした」である例を示している。また、図3では、音声ID「SR2」によって識別される音声を音声認識した音声認識結果は、「米ダウ工業株30種平均、独DAX指数は、原油安の影響でともに1%強下がった」である例を示している。 That is, FIG. 3 shows an example in which the voice recognition result obtained by voice recognition of the voice identified by the voice ID “SR1” is “pending because indirect finance was Nash equilibrium”. In addition, in FIG. 3, the speech recognition result obtained by recognizing the speech identified by the speech ID “SR2” shows that “the US Dow Industrial Average of 30 species, and the German DAX index both fell slightly by 1% due to the impact of lower crude oil. An example is shown.
(用語情報記憶部122について)
用語情報記憶部122は、用語に関する情報を記憶する。具体的には、用語情報記憶部122は、音声毎に、音声に関する情報に含まれる用語に関する情報を記憶する。ここで、図4に、実施形態に係る用語情報記憶部122の一例を示す。図4に示すように、用語情報記憶部122は、「音声ID」、「用語ID」および「用語」といった項目を有する。
(Regarding the term information storage unit 122)
The term
「音声ID」は、音声に関する情報を識別するための識別情報を示す。例えば、「音声ID」には、音声ごとに個別に割り当てられる英数字等のユニークな文字列などが記憶される。「用語ID」は、音声に関する情報に含まれる用語を識別するための識別情報を示す。例えば、「用語ID」には、音声に関する情報に含まれる用語ごとに個別に割り当てられるユニークな英数字等の文字列などが記憶される。「用語」は、音声に関する情報に含まれる用語を示す。例えば、「用語」には、音声に関する情報に含まれる単語のうち固有名詞の単語などが記憶される。 “Voice ID” indicates identification information for identifying information related to voice. For example, the “voice ID” stores a unique character string such as an alphanumeric character individually assigned for each voice. “Term ID” indicates identification information for identifying a term included in the information related to voice. For example, the “term ID” stores a character string such as a unique alphanumeric character that is individually assigned to each term included in the information related to speech. “Term” indicates a term included in information related to speech. For example, in the “term”, a proper noun word among words included in information related to speech is stored.
すなわち、図4では、音声ID「SR1」によって識別される音声の音声認識結果は、用語「間接金融」、「ナッシュ均衡」および「ペンディング」を含む例を示している。また、「間接金融」の用語IDは、「W1」である例を示している。また、「ナッシュ均衡」の用語IDは、「W2」である例を示している。また、「ペンディング」の用語IDは、「W3」である例を示している。 That is, FIG. 4 shows an example in which the voice recognition result of the voice identified by the voice ID “SR1” includes the terms “indirect finance”, “Nash equilibrium”, and “pending”. Moreover, the term ID of “indirect finance” is “W1”. Moreover, the term ID of “Nash equilibrium” is “W2”. In addition, the term ID of “pending” is “W3”.
(ユーザ情報記憶部123について)
ユーザ情報記憶部123は、ユーザに関する情報を記憶する。具体的には、ユーザ情報記憶部123は、ユーザ毎に、ユーザの特徴を示すユーザ属性に関する情報を記憶する。ここで、図5に、実施形態に係るユーザ情報記憶部123の一例を示す。図5に示すように、ユーザ情報記憶部123は、「ユーザID」および「ユーザ属性」といった項目を有する。
(User information storage unit 123)
The user
「ユーザID」は、ユーザを識別するための識別情報を示す。例えば、「ユーザID」には、ユーザごとに個別に割り当てられるユニークな英数字等の文字列などが記憶される。「ユーザ属性」は、ユーザの特徴を表す属性を示す。例えば、「ユーザ属性」には、ユーザの登録情報や検索履歴、Webページの閲覧履歴、商品購入履歴、サービスの利用履歴などといった各種の情報から推定される属性が記憶される。 “User ID” indicates identification information for identifying a user. For example, the “user ID” stores a character string such as a unique alphanumeric character individually assigned to each user. “User attribute” indicates an attribute representing a feature of the user. For example, “user attributes” stores attributes estimated from various information such as user registration information, search history, Web page browsing history, product purchase history, service usage history, and the like.
すなわち、図5では、ユーザID「U1」によって識別されるユーザU1のユーザ属性は、「音楽」である例を示している。このため、ユーザU1は、他の分野と比較して、「音楽」の分野に関する知識を有すると考えられる。また、ユーザID「U2」によって識別されるユーザU2のユーザ属性は、「金融」および「経済」である例を示している。このため、ユーザU2は、他の分野と比較して、「金融」および「経済」の分野に関する知識を有すると考えられる。 That is, FIG. 5 illustrates an example in which the user attribute of the user U1 identified by the user ID “U1” is “music”. For this reason, it is considered that the user U1 has knowledge about the field of “music” as compared to other fields. Further, the user attributes of the user U2 identified by the user ID “U2” are “finance” and “economy”. For this reason, it is considered that the user U2 has knowledge regarding the fields of “finance” and “economy” as compared to other fields.
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(About the control unit 130)
The
制御部130は、図2に示すように、受信部131と、抽出部132と、生成部133と、出力部134とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図2に示した構成に限られず、後述する提示処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、図2に示した接続関係に限られず、他の接続関係であってもよい。
As illustrated in FIG. 2, the
(受信部131について)
受信部131は、音声に関する情報を受信する。具体的には、受信部131は、音声に関する情報として、話し手が発する音声を音声認識した音声認識結果を話者端末10から受信する。また、受信部131は、音声に関する情報を受信した場合に、受信した音声に関する情報を音声情報記憶部121に格納する。例えば、受信部131は、音声認識結果に個別の音声IDを付与し、音声認識結果を音声IDに対応付けて音声情報記憶部121に格納する。
(About the receiver 131)
The receiving
また、受信部131は、用語の解説情報を受信する。具体的には、受信部131は、後述する抽出部132によって抽出された用語を検索クエリとして情報提供装置50に送信した場合に、かかる検索クエリの応答として用語の解説情報を情報提供装置50から受信する。
The receiving
(抽出部132について)
抽出部132は、受信部131によって受信された音声に関する情報に含まれる用語を抽出する。具体的には、抽出部132は、音声に関する情報として話者端末10から受信した音声認識結果に含まれる用語を抽出する。例えば、抽出部132は、音声認識結果に含まれる単語のうち名詞を抽出する。一例としては、抽出部132は、音声認識結果に含まれる名詞の組み合わせのローマ字読みをインターネット百科事典等に掲載された記事名のローマ字読みと照合することで、音声認識結果に含まれる用語を抽出する。これにより、抽出部132は、表記ゆれ(例えば、数字と漢数字)によって用語の抽出を失敗することを防ぐことができる。そして、抽出部132は、抽出した用語を用語情報記憶部122に格納する。例えば、抽出部132は、抽出した用語に個別の用語IDを付与し、用語を音声IDおよび用語IDに対応付けて用語情報記憶部122に格納する。
(About the extraction unit 132)
The
(生成部133について)
生成部133は、抽出部132によって抽出された用語の要約を生成する。具体的には、生成部133は、情報提供装置50を利用して、音声に関する情報に含まれる用語の要約を生成する。例えば、生成部133は、まず、抽出部132によって抽出された用語を検索クエリとして情報提供装置50に送信する。続いて、生成部133は、送信した検索クエリの応答として用語の解説情報(例えば、Wikipedia(登録商標)において検索クエリを検索した検索結果の記事)を情報提供装置50から受信する。そして、情報処理装置100は、受信した用語の解説情報を用いて用語の要約を生成する。
(About the generator 133)
The
この点について、図6を用いて詳細に説明する。図6は、用語の要約を生成する生成処理を説明するための説明図である。図6の例では、生成部133は、用語「ナッシュ均衡」の要約Ab2を生成する。具体的には、生成部133は、図6に示すように、第1パラグラフPr1、第2パラグラフPr2および第3パラグラフPr3によって形成される解説情報Cmのうち第1パラグラフPr1を用いて用語「ナッシュ均衡」の要約Ab2を生成する。より具体的には、生成部133は、まず、解説情報Cmから第1パラグラフPr1を抽出する。続いて、生成部133は、抽出した解説情報Cmの第1パラグラフPr1から冗長な表現を削除する。例えば、生成部133は、解説情報Cmの第1パラグラフPr1の第1文目から「〜は、」に該当する部分を削除する。図6の例では、「〜」は、要約を生成する対象となる用語である「ナッシュ均衡」を意味する。また、生成部133は、解説情報Cmの第1パラグラフPr1の全体から「〜」に該当する部分を削除する。そして、生成部133は、第1パラグラフPr1の残りの文章の全体の長さを所定の範囲内に調整する。例えば、生成部133は、第1パラグラフの残りの文章の長さが所定の範囲内より長い場合には、所定の範囲内に収まるように第1パラグラフの残りの文章の一部を削除する。これにより、生成部133は、「ナッシュ均衡」の要約Ab2を生成する。一方、生成部133は、第1パラグラフの残りの文章の長さが所定の範囲内より短い場合には、例えば、第1パラグラフの残りの文章と、削除した第1パラグラフの文章とを組み合わせた要約を生成する。他の例では、生成部133は、第2パラグラフの内容を用いて第1パラグラフと同様の処理を行ない、第1パラグラフの残りの文章と第2パラグラフの残りの文章とを組み合わせた要約を生成する。そして、生成部133は、生成した用語の要約を用語情報記憶部122に格納する。例えば、生成部133は、生成した用語の要約を用語IDに対応付けて用語情報記憶部122に格納する。
This point will be described in detail with reference to FIG. FIG. 6 is an explanatory diagram for explaining a generation process for generating a summary of terms. In the example of FIG. 6, the
(出力部134について)
出力部134は、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する。具体的には、出力部134は、抽出部132によって抽出された用語が属する分野に基づいて聞き手に応じた専門用語の要約を出力する。。例えば、出力部134は、聞き手のユーザ属性に基づいて専門用語の要約を出力する。一例としては、出力部134は、ユーザ情報記憶部123を参照し、生成部133によって生成された用語の要約のうちユーザが有するユーザ属性以外の分野に属する用語の要約を、かかるユーザが有する聴衆端末20にリアルタイムに出力する。
(About the output unit 134)
The
他の例では、出力部134は、音声に関する情報に含まれる用語のうち出現頻度に基づく専門用語度が所定の閾値以上の専門用語の要約を出力する。例えば、出力部134は、専門用語度として、以下の式(1)によって表されるIDF(Inverse Document Frequency)値が所定の閾値以上の用語の要約を出力する。
In another example, the
ここで、式(1)の「N」は、インターネット百科事典が有する全記事数を示す。また、式(1)の「dfj」は、記事名が文書に出現する頻度を示す。したがって、出力部134は、出現頻度が低い用語ほど専門的な用語であると判断して要約を優先して出力する。なお、IDF値は、一例としては、Hadoopで分散処理によって計算される。
Here, “N” in the formula (1) indicates the total number of articles in the Internet encyclopedia. In addition, “df j ” in Expression (1) indicates the frequency at which the article name appears in the document. Therefore, the
ここで、出力部134は、ユーザ属性に応じて調整された専門用語度の閾値に基づいて専門用語の要約を出力してもよい。例えば、出力部134は、専門用語度が、ユーザ属性に応じて専門用語度を算出する算出式の係数の重みを変更することで調整された閾値以上の用語の要約を出力する。
Here, the
〔1−3.実施形態に係る提示処理手順〕
次に、図7を用いて、実施形態に係る提示システム1による処理の手順について説明する。図7は、実施形態に係る提示システム1による提示処理手順を示すシーケンスである。
[1-3. Presentation processing procedure according to embodiment]
Next, the procedure of processing by the presentation system 1 according to the embodiment will be described with reference to FIG. FIG. 7 is a sequence showing a presentation processing procedure by the presentation system 1 according to the embodiment.
図7に示すように、情報処理装置100は、話者端末10から音声に関する情報を受信する(ステップS101)。例えば、情報処理装置100は、音声に関する情報として、話し手が発する音声を音声認識した音声認識結果を話者端末10から受信する。そして、情報処理装置100は、音声に関する情報を受信した場合に、受信した音声に関する情報を音声情報記憶部121に格納する。
As illustrated in FIG. 7, the
続いて、情報処理装置100は、受信された音声に関する情報に含まれる用語を抽出する(ステップS102)。例えば、情報処理装置100は、音声に関する情報として話者端末10から受信した音声認識結果に含まれる用語を抽出する。そして、情報処理装置100は、抽出した用語を用語情報記憶部122に格納する。
Subsequently, the
その後、情報処理装置100は、抽出された用語を検索クエリとして情報提供装置50に送信する(ステップS103)。そして、情報処理装置100は、送信した検索クエリの応答として用語の解説情報を情報提供装置50から受信する(ステップS104)。続いて、情報処理装置100は、受信した用語の解説情報に基づいて用語の要約を生成する(ステップS105)。そして、情報処理装置100は、生成した要約を用語と対応付けて用語情報記憶部122に格納する。
Thereafter, the
続いて、情報処理装置100は、抽出された用語のうち聞き手に応じた専門用語の要約を出力する(ステップS106)。例えば、情報処理装置100は、ユーザ情報記憶部123を参照し、生成された用語の要約のうちユーザが有するユーザ属性以外の分野に属する用語の要約を、かかるユーザが有する聴衆端末20に出力する。
Subsequently, the
〔1−4.実施形態の効果〕
上述してきたように、実施形態に係る情報処理装置100は、受信部131と、抽出部132と、出力部134とを有する。受信部131は、音声に関する情報を受信する。抽出部132は、受信部131によって受信された音声に関する情報に含まれる用語を抽出する。出力部134は、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する。
[1-4. Effects of the embodiment
As described above, the
これにより、情報処理装置100は、話し手の音声に含まれる用語のうち聞き手に応じた専門用語を出力することができるので、聞き手にとって適切な用語の解説を表示することができる。例えば、情報処理装置100は、聞き手が専門外とする分野に属する用語の要約を出力することができるので、ユーザが知りたい用語の要約を表示することができる。また、情報処理装置100は、聞き手が専門とする分野に属する用語の要約を出力しないので、ユーザにとって解説が不要な用語が表示されることを防ぎ見易さを高く保つことができる。
Thus, the
また、実施形態に係る情報処理装置100において、出力部134は、抽出部132によって抽出された用語が属する分野に基づいて聞き手に応じた専門用語の要約を出力する。これにより、情報処理装置100は、聞き手にとって知識が浅い分野に属する用語の要約を聞き手に対して提示することができるので、聞き手の聴講をサポートすることができる。例えば、情報処理装置100は、聞き手に応じた用語の要約を自動的に提示することができるので、聞き手が専門用語を能動的に検索する手間を削減することができる。
In the
また、実施形態に係る情報処理装置100において、出力部134は、音声に関する情報に含まれる用語のうち出現頻度に基づく専門用語度が所定の閾値以上の専門用語の要約を出力する。これにより、情報処理装置100は、出現頻度が低い専門的な用語の要約を出力することができるので、聞き手が知らない可能性が高い用語の要約を提示することができる。例えば、情報処理装置100は、出願頻度が高い用語の要約は出力しないので、ユーザにとって見慣れた用語の要約が表示されることを防ぎ見易さを高く保つことができる。
Further, in the
また、実施形態に係る情報処理装置100において、出力部134は、聞き手のユーザ属性に基づいて専門用語の要約を出力する。これにより、情報処理装置100は、聞き手にとって知識が浅い分野に属する用語の要約を出力することができるので、聞き手が知らない可能性が高い用語の要約を提示することができる。例えば、情報処理装置100は、聞き手の専門以外の分野に属する用語の要約を出力することができるので、聞き手の聴講を支援することができる。
In the
〔2.変形例〕
上述した実施形態に係る情報処理装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の情報処理装置100の他の実施形態について説明する。
[2. (Modification)
The
〔2−1.聞き手の操作に応じた要約〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、聞き手の操作に応じた専門用語の要約を出力してもよい。
[2-1. (Summary according to the operation of the listener)
In the above embodiment, the
具体的には、情報処理装置100の出力部134は、聞き手による専門用語の要約に関する操作に基づいて専門用語の要約を出力する。言い換えると、出力部134は、専門用語の要約に対する聴衆の操作をフィードバックして専門用語の要約を出力する。例えば、出力部134は、専門用語の要約に対する聞き手の選択操作または削除操作に基づいて専門用語の要約を出力する。
Specifically, the
この点について、図8を用いて説明する。図8は、表示画面の一例を示す図である。図8に示すように、聴衆端末20は、用語の要約Abとともに、かかる用語に対応するリンクボタンLiを表示する。ここで、聴衆端末20は、聞き手によってリンクボタンLiが選択された場合に、用語に対応するインターネット百科事典の記事へ遷移する。そして、情報処理装置100は、例えば、用語に対応するリンクボタンLiを選択する選択操作の回数が多いほど専門的な用語であるとして、今後かかる用語が出現した場合に要約Abを優先して出力する。
This point will be described with reference to FIG. FIG. 8 is a diagram illustrating an example of a display screen. As shown in FIG. 8, the
なお、情報処理装置100は、リンクボタンLiを選択する選択操作の回数に限らず、各種の選択操作の回数に基づいて専門用語の要約を出力してもよい。例えば、情報処理装置100は、用語の要約に対応して表示される図示しない「役立つ」ボタンを選択する選択操作の回数が多いほど専門的な用語であるとして、今後かかる用語が出現した場合にかかる用語の要約を優先して出力してもよい。
The
他の例では、聴衆端末20は、画面に表示された要約Ab上で指を左右に素早く動かすフリック操作が行われた場合に、要約Abを表示画面から削除する。そして、情報処理装置100は、例えば、用語の要約Abを画面上から削除する削除操作の回数が多いほど専門的な用語ではないとして、今後かかる用語が出現した場合に、かかる用語の要約Abを優先して出力しない。
In another example, the
なお、情報処理装置100は、要約に対するフリック操作による削除操作に限らず、各種の操作によって実行される削除操作の回数に基づいて専門用語の要約を出力してもよい。例えば、情報処理装置100は、用語の要約に対応して表示される図示しない「削除」ボタンを選択する選択操作の回数が多いほど専門的な用語でないとして、今後かかる用語が出現した場合にかかる用語の要約を優先して出力しないようにしてもよい。
Note that the
このように、変形例に係る情報処理装置100は、聞き手による専門用語の要約に関する操作に基づいて専門用語の要約を出力する。これにより、情報処理装置100は、要約に対する聞き手の反応に応じて用語の要約を出力することができるので、聞き手にとって適切な用語の解説を表示することができる。
As described above, the
また、変形例に係る情報処理装置100は、専門用語の要約に対する聞き手の選択操作または削除操作に基づいて専門用語の要約を出力する。これにより、情報処理装置100は、聞き手が深く調べる傾向にある用語の要約を出力することができるので、聞き手が知りたい可能性が高い用語の解説を表示することができる。また、情報処理装置100は、聞き手が削除する傾向にある用語の要約を出力することができるので、聞き手にとって解説を表示しなくてもよい常識的な用語の解説が表示されてしまい見易さが損なわれることを防ぐことができる。
In addition, the
〔2−2.聞き手の操作状況を話し手に出力〕
上記の変形例では、情報処理装置100が、要約に対する聞き手の反応に応じて用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、要約に対する聞き手の操作状況を話し手に出力してもよい。
[2-2. (The listener's operation status is output to the speaker.)
In the above modification, the
具体的には、情報処理装置100の出力部134は、聞き手による専門用語の要約に関する操作状況を音声に関する情報の話し手に出力する。例えば、情報処理装置100は、要約に関する操作状況として、用語の要約に対して選択操作がなされた選択回数をかかる用語と対応付けて話者端末10にリアルタイムに出力する。他の例では、情報処理装置100は、要約に関する操作状況として、用語の要約に対して削除操作がなされた削除回数をかかる用語と対応付けて話者端末10にリアルタイムに出力する。
Specifically, the
このように、変形例に係る情報処理装置100は、聞き手による専門用語の要約に関する操作状況を音声に関する情報の話し手に出力する。これにより、情報処理装置100は、要約に対して聞き手が行った操作について話し手に通知することができるので、話し手の講演の質を向上させることができる。例えば、情報処理装置100は、用語の要約に対して選択操作がなされた回数を話し手に通知することができるので、聞き手が理解していない用語を話し手に把握させることができる。また、情報処理装置100は、用語の要約に対して削除操作がなされた回数を話し手に通知することができるので、聞き手が理解している用語を話し手に把握させることができる。このため、情報処理装置100は、用語の要約に対する操作によって効果を測定することができるので、話し手が聞き手の理解度を把握するのに役立つ情報を提供することができる。
As described above, the
〔2−3.聞き手に応じたタイミングで出力〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、聞き手に応じたタイミングで要約を出力してもよい。
[2-3. (Output at the timing according to the listener)
In the above embodiment, the
具体的には、情報処理装置100の出力部134は、聞き手の音声に関する情報における分野の知識が浅いほど高い頻度で専門用語の要約を出力する。例えば、出力部134は、聞き手が専門用語の要約を参照した回数が多いほど高い頻度で専門用語の要約を出力する。一例としては、情報処理装置100は、聞き手が用語の要約を選択して用語に対応する記事へ遷移した回数が多いほど高い頻度で用語の要約を聴衆端末20に出力する。言い換えると、情報処理装置100は、聞き手の選択回数が所定の回数より多く知識レベルが初級である場合には、専門用語が出現する度に用語の要約を出力する。一方、情報処理装置100は、聞き手の選択回数が所定の回数より少なく知識レベルが中級以上である場合には、話の最後にまとめて用語の要約を出力する。
Specifically, the
このように、変形例に係る情報処理装置100は、聞き手の音声に関する情報における分野の知識が浅いほど高い頻度で専門用語の要約を出力する。これにより、情報処理装置100は、聞き手の知識に応じて要約を出力することができるので、聞き手に合ったタイミングで要約を表示させることができる。例えば、情報処理装置100は、聞き手が初級者である場合には、専門用語が出現するとすぐに要約を提示することができる。一方、情報処理装置100は、聞き手が中級者以上である場合には、用語の要約が頻繁に出現する煩わしさを防ぐことができる。
As described above, the
また、変形例に係る情報処理装置100は、聞き手が専門用語の要約を参照した回数が多いほど高い頻度で専門用語の要約を出力する。これにより、情報処理装置100は、聞き手のレベルを高い精度で推定することができるので、聞き手に合ったタイミングで要約を提示することができる。
Further, the
〔2−4.用語ランキング〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、各種の形態で用語に関する情報を出力してもよい。
[2-4. (Term ranking)
In the above embodiment, the
具体的には、情報処理装置100の出力部134は、専門用語の要約に対する聞き手の選択回数が多い順または削除回数が少ない順に専門用語を並べた用語ランキングを出力する。例えば、情報処理装置100は、要約に対する選択回数を用語名と対応付けて昇順に並べた表を聴衆端末20に対して出力する。他の例では、情報処理装置100は、要約に対する削除回数を用語名と対応付けて降順に並べた表を聴衆端末20に対して出力する。
Specifically, the
このように、変形例に係る情報処理装置100は、専門用語の要約に対する聞き手の選択回数が多い順または削除回数が少ない順に専門用語を並べた用語ランキングを出力する。これにより、情報処理装置100は、他の用語と比較して聞き手が知らない用語を容易に把握可能な情報を提供することができるので、聞き手の利便性を向上させることができる。
As described above, the
〔2−5.グルーピング〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、各種の形態で専門用語に関する情報を出力してもよい。
[2-5. grouping〕
In the above embodiment, the
具体的には、情報処理装置100の出力部134は、抽出部132によって抽出された用語のうち聞き手に応じた専門用語をかかる専門用語が属するグループ別に出力する。例えば、情報処理装置100は、専門用語を分野別に分類した表を聴衆端末20に対して出力する。他の例では、情報処理装置100は、講話において出現した時間帯ごとに専門用語をまとめて分類した表を聴衆端末20に対して出力する。一例としては、情報処理装置100は、講話の質疑応答時間に出現した専門用語をまとめた表を聴衆端末20に対して出力する。
Specifically, the
このように、変形例に係る情報処理装置100は、抽出部132によって抽出された用語のうち聞き手に応じた専門用語をかかる専門用語が属するグループ別に出力する。これにより、情報処理装置100は、専門用語の傾向を把握させることができるので、話し手や聞き手に役立つ情報を提供することができる。
As described above, the
〔2−6.要約の量を補正〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、各種の情報に基づいて要約の量を補正してもよい。
[2-6. Correct the amount of summarization)
In the above embodiment, the
具体的には、情報処理装置100の出力部134は、聞き手による専門用語の要約に関する操作に基づいて専門用語の要約の量を補正して出力する。言い換えると、情報処理装置100は、要約に対する聞き手の操作をフィードバックして要約の文字数を補正する。例えば、情報処理装置100は、用語の記事へ遷移するリンクボタンを選択する選択操作の回数が多いほど専門的な用語であるとして要約の文字数を増やして聴衆端末20に出力する。一方、情報処理装置100は、用語の要約を削除する削除操作の回数が多いほど専門的な用語でないとして要約の文字数を減らして聴衆端末20に出力する。
Specifically, the
このように、変形例に係る情報処理装置100は、聞き手による専門用語の要約に関する操作に基づいて専門用語の要約の量を補正して出力する。これにより、情報処理装置100は、要約に対する操作結果を反映した要約を出力することができるので、聞き手にとって質の高い要約を提供することができる。
As described above, the
〔2−7.専門用語度の設定〕
上記の実施形態では、情報処理装置100が、音声に関する情報に含まれる用語のうち出現頻度に基づく専門用語度が所定の閾値以上の専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、聞き手によって設定された専門用語度の閾値に基づいて専門用語の要約を出力してもよい。
[2-7. (Defining technical terms)
In the above-described embodiment, the
この点について図9を用いて説明する。図9は、設定画面の一例を示す図である。例えば、聴衆端末20は、聞き手から設定画面へ遷移する操作を受け付けた場合に、図9に示すように、設定バーBr上でつまみBuを左右に動かすことで専門用語度の閾値が設定される設定画面を表示する。一例としては、専門用語度の閾値は、設定バーBr上のうちつまみBuが左に位置するほど低い値が設定される。一方、専門用語度の閾値は、設定バーBr上のうちつまみBuが右に位置するほど高い値が設定される。
This point will be described with reference to FIG. FIG. 9 is a diagram illustrating an example of the setting screen. For example, when the
そして、情報処理装置100は、設定バーBr上のつまみBuの位置によって設定される専門用語度の閾値に基づいて専門用語の要約を聴衆端末20に出力する。言い換えると、情報処理装置100は、聞き手によって設定された専門用語度の閾値に基づいて出力する専門用語の要約を調整する。具体的には、情報処理装置100は、設定バーBr上のうちつまみBuが左に位置するほど専門用語度の閾値が低く設定されているので多くの専門用語の要約を聴衆装置20に出力する。一方、情報処理装置100は、設定バーBr上のうちつまみBuが右に位置するほど専門用語度の閾値が高く設定されているので少なく専門用語の要約を聴衆装置20に出力する。
Then, the
このように、変形例に係る情報処理装置100は、聞き手によって設定された専門用語度の閾値に基づいて専門用語の要約を出力する。これにより、情報処理装置100は、聞き手が所望するレベル以上の専門的な用語の要約を出力することができるので、聞き手の満足度を高めることができる。
As described above, the
〔2−8.講演を選択〕
上記の実施形態では、情報処理装置100が、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、聞き手によって選択された講演の講話に含まれる専門用語の要約を出力してもよい。
[2-8. (Select a lecture)
In the above embodiment, the
この点について図10を用いて説明する。図10は、選択画面の一例を示す図である。例えば、聴衆端末20は、図10に示すように、専門用語の要約を出力可能な講演Rm1「カルテット第1講演会」、講演Rm2「カルテット第2セミナー」、講演Rm3「カルテット第3会議」を掲載したセミナー一覧を画面に表示する。ここで、聴衆端末20は、講演Rm1〜Rm3の中から聞き手によって選択された講演を受け付ける。そして、情報処理装置100は、聞き手によって選択された講演の講話に含まれる用語のうち聞き手に応じた専門用語の要約を聴衆端末20に出力する。
This point will be described with reference to FIG. FIG. 10 is a diagram illustrating an example of the selection screen. For example, as shown in FIG. 10, the
このように、変形例に係る情報処理装置100は、聞き手によって選択された講演の講話に含まれる専門用語の要約を出力する。これにより、情報処理装置100は、聞き手が所望する講演における専門用語の要約を出力することができるので、複数の講演が同時に行われている場合でも聞き手が所望する専門用語の要約を提供することができる。
In this way, the
〔2−9.パーソナライズ〕
上記の実施形態では、情報処理装置100が、聞き手のユーザ属性に基づいて専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、各種の情報に基づいて聞き手に応じた専門用語の要約を出力してもよい。
[2-9. (Personalize)
In the above embodiment, the
具体的には、情報処理装置100は、他の聞き手との間の類似性に基づいて専門用語の要約を出力する。例えば、情報処理装置100は、他のサービスなどにおける利用履歴が類似する他の聞き手が要約に対して行った選択操作に基づいて、専門用語の要約を出力する。一例としては、情報処理装置100は、類似する他の聞き手によって要約に対する選択操作が多く行われた用語の要約ほど優先して出力する。
Specifically, the
他の例では、情報処理装置100は、聞き手に対して過去に出力した専門用語の要約の履歴に基づいて、専門用語の要約を出力する。例えば、情報処理装置100は、過去に1度要約を聴衆端末20に出力したことがある用語が出現した場合には、かかる用語の要約を同一の聴衆端末20に対して出力しない。言い換えると、情報処理装置100は、同一の聞き手に対して同一の用語の要約を出力しない。
In another example, the
このように、変形例に係る情報処理装置100は、各種の情報に基づいて聞き手に応じた専門用語の要約を出力する。これにより、情報処理装置100は、聞き手に特化した用語の要約を提供することができるので、聞き手における利便性を高めることができる。
Thus, the
〔2−10.適用対象〕
上記の実施形態では、情報処理装置100が、講演者の講話に含まれる専門用語の要約を聴衆に対して出力する例を挙げて説明した。ここで、情報処理装置100は、講演に限らず、各種の発話を適用対象にしてもよい。具体的には、情報処理装置100は、知識レベルの異なる話し手と聞き手の会話に含まれる専門用語の要約を出力する。例えば、情報処理装置100は、先生が生徒に対して行う授業に含まれる専門用語の要約を出力する。他の例では、情報処理装置100は、医者が患者に対して行う診察に含まれる専門用語の要約を出力する。
[2-10. (Applicable)
In the above embodiment, the
また、情報処理装置100は、語学学習を用途として適用してもよい。例えば、情報処理装置100は、まず、英語によってなされる発話を音声認識した音声認識結果を話者端末10から受信する。続いて、情報処理装置100は、受信した音声認識結果を英語から日本語に翻訳する。そして、情報処理装置100は、日本語に翻訳した音声認識結果を日本人の聴衆が有する聴衆端末20に送信する。
The
また、上記の実施形態では、情報処理装置100は、スマートフォンに対して専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、スマートフォンに限らず、タブレット端末やPCなど各種の端末装置に対して専門用語の要約を出力してもよい。
Further, in the above-described embodiment, the
このように、変形例に係る情報処理装置100は、各種の発話を適用対象にする。これにより、情報処理装置100は、講演に限らず各種の発話に含まれる専門用語の要約や日本語訳を聞き手に提供することができる。
As described above, the
〔2−11.話し手と聞き手との間の知識差に基づいて専門用語の要約を出力〕
上記の実施形態では、抽出部132によって抽出された用語のうち聞き手に応じた専門用語の要約を出力する例を挙げて説明した。ここで、情報処理装置100は、話し手と聞き手との間の知識差を判断基準として採用してもよい。
[2-11. A summary of terminology is output based on the knowledge difference between the speaker and the listener)
In the above embodiment, an example has been described in which a summary of technical terms corresponding to the listener among the terms extracted by the
具体的には、情報処理装置100の出力部134は、音声に関する情報の話し手と聞き手との間の知識差に基づいて専門用語の要約を出力する。例えば、情報処理装置100は、話し手が話す講話のテーマや分野などにおける聞き手と話し手の知識レベルをそれぞれ設定する。一態様としては、知識レベルは、話し手や聞き手から受け付けたレベルが設定されてもよいし、行動履歴やプロフィールに基づいて設定されてもよい。そして、情報処理装置100は、聞き手と話し手の知識レベルの差分に基づいて専門用語の要約を出力する。一例としては、情報処理装置100は、知識レベルの差分が高いほど専門用語度の所定の閾値を低く設定することで専門用語の要約を相対的に多く出力する。
Specifically, the
他の例では、情報処理装置100は、話し手のユーザ属性と聞き手のユーザ属性とに基づいて専門用語の要約を出力する。一例としては、情報処理装置100は、話し手のユーザ属性と聞き手のユーザ属性とが異なる場合に、専門用語度の所定の閾値を調整して専門用語の要約を出力する。一態様としては、情報処理装置100は、話し手のユーザ属性と聞き手のユーザ属性との間の類似度が低いほど専門用語度の所定の閾値を低く設定することで専門用語の要約を相対的に多く出力する。
In another example, the
このように、変形例に係る情報処理装置100は、音声に関する情報の話し手と聞き手との間の知識差に基づいて専門用語の要約を出力する。これにより、情報処理装置100は、話し手と聞き手の知識差を考慮して専門用語の要約を出力することができるので、聞き手の聴講を支援することができる。例えば、情報処理装置100は、話し手の専門分野と聞き手の専門分野が異なるほど多くの要約を出力することができるので、聞き手が用語の理解不足で話についていけなくなることを防ぐことができる。
As described above, the
〔3.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[3. Others]
In addition, among the processes described in the above embodiment, all or part of the processes described as being automatically performed can be performed manually, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the document and drawings can be arbitrarily changed unless otherwise specified.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured.
例えば、図2に示した音声情報記憶部121や用語情報記憶部122、ユーザ情報記憶部123は、情報処理装置100が保持せずに、ストレージサーバ等に保持されてもよい。この場合、情報処理装置100は、ストレージサーバにアクセスすることで、音声に関する情報や、用語に関する情報、ユーザに関する情報を取得する。
For example, the audio
また、情報処理装置100は、出力処理は行わず、抽出処理や生成処理のみを行う情報処理装置であってもよい。この場合、情報処理装置は、出力部134を有しない。そして、出力部134を有する出力装置が、情報処理装置100によって生成された専門用語の要約を聴衆端末20に対して出力する。
Further, the
また、上記の実施形態では、サーバ装置である情報処理装置100が用語の要約を生成して聴衆端末20に出力する例を挙げたが、話者端末10が用語の要約を生成して出力してもよい。この場合、例えば、話者端末10は、受信部131、抽出部132、生成部133および出力部134に相当する機能を有する。そして、話者端末10は、まず、音声に関する情報を受信する。続いて、話者端末10は、受信された音声に関する情報に含まれる用語を抽出する。そして、話者端末10は、抽出された用語のうち聞き手に応じた専門用語の要約を聴衆端末20に出力する。
In the above embodiment, the
また、上記の実施形態では、聴衆端末20が用語の要約を生成して出力してもよい。この場合、例えば、聴衆端末20は、受信部131、抽出部132、生成部133および出力部134に相当する機能を有する。そして、聴衆端末20は、まず、音声に関する情報を受信する。続いて、聴衆端末20は、受信された音声に関する情報に含まれる用語を抽出する。そして、聴衆端末20は、抽出された用語のうち聞き手に応じた専門用語の要約を画面に表示する。
In the above embodiment, the
また、上記の実施形態では、話者端末10が講演者の講話の音声認識を行なう例を示したが、話者端末10に限らずサーバ(例えば、情報処理装置100)が音声認識を行なってもよい。この場合、例えば、情報処理装置100は、講演者の講話を録音した音声データ等を話者端末10から取得する。続いて、情報処理装置100は、取得した音声データの音声認識を実行する。その後、情報処理装置100は、音声認識結果に含まれる用語を抽出する。そして、情報処理装置100は、抽出した用語のうち聞き手に応じた専門用語の要約を出力する。
In the above embodiment, the
また、上述してきた実施形態に係る情報処理装置100は、例えば図11に示すような構成のコンピュータ1000によって実現される。以下、情報処理装置100を例に挙げて説明する。図11は、情報処理装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、およびメディアインターフェイス(I/F)1700を有する。
Further, the
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
The
HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、ネットワークNを介して他の機器へ送信する。
The
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。
The
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disk)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
The
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
For example, when the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の概要の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. It is possible to implement the present invention in other forms with improvements.
また、上述した情報処理装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
In addition, the
また、特許請求の範囲に記載した「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受信部は、受信手段や受信回路に読み替えることができる。 Further, “section (module, unit)” described in the claims can be read as “means”, “circuit”, and the like. For example, the receiving unit can be read as receiving means or a receiving circuit.
1 提示システム
10 話者端末
20 聴衆端末
50 情報提供装置
100 情報処理装置
121 音声情報記憶部
122 用語情報記憶部
123 ユーザ情報記憶部
131 受信部
132 抽出部
133 生成部
134 出力部
DESCRIPTION OF SYMBOLS 1
Claims (14)
前記受信部によって受信された音声に関する情報に含まれる用語を抽出する抽出部と、
前記抽出部によって抽出された用語のうち聞き手に応じた専門用語の要約を聞き手に応じたタイミングで出力し、前記聞き手による前記専門用語の要約に関する操作状況を前記話し手が発話している間に出力する出力部と
を備えたことを特徴とする情報処理装置。 A receiver that receives information about the speech that is the speaker's utterance ;
An extraction unit that extracts terms included in the information about the voice received by the reception unit;
A summary of technical terms corresponding to the listener among the terms extracted by the extraction unit is output at a timing according to the listener, and an operation status related to the summary of the technical terms by the listener is output while the speaker is speaking. An information processing apparatus, comprising:
前記抽出部によって抽出された用語が属する分野に基づいて前記聞き手に応じた専門用語の要約を出力する
ことを特徴とする請求項1に記載の情報処理装置。 The output unit is
The information processing apparatus according to claim 1, wherein a summary of technical terms corresponding to the listener is output based on a field to which the term extracted by the extraction unit belongs.
前記音声に関する情報に含まれる用語のうち出現頻度に基づく専門用語度が所定の閾値以上の専門用語の要約を出力する
ことを特徴とする請求項1または2に記載の情報処理装置。 The output unit is
The information processing apparatus according to claim 1 or 2, wherein a summary of technical terms having a technical term degree based on an appearance frequency among terms included in the information related to the speech is a predetermined threshold or more is output.
前記聞き手のユーザ属性に基づいて前記専門用語の要約を出力する
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to claim 1, wherein a summary of the technical term is output based on a user attribute of the listener.
前記聞き手による前記専門用語の要約に関する操作に基づいて前記専門用語の要約を出力する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to claim 1, wherein the summary of the technical terms is output based on an operation related to the summary of the technical terms by the listener.
前記専門用語の要約に対する前記聞き手の選択操作または削除操作に基づいて前記専門用語の要約を出力する
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to claim 1, wherein the technical term summary is output based on a selection operation or a deletion operation of the listener with respect to the technical term summary.
前記聞き手の前記音声に関する情報における分野の知識が浅いほど高い頻度で前記専門用語の要約を出力する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to any one of claims 1 to 6 , wherein a summary of the technical term is output at a higher frequency as the field knowledge in the information about the voice of the listener is shallower.
前記聞き手が前記専門用語の要約を参照した回数が多いほど高い頻度で前記専門用語の要約を出力する
ことを特徴とする請求項1〜7のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to any one of claims 1-7, characterized in that the listener is a summary of the technical terms frequently as the number of times of referring to the summary of the terminology.
前記専門用語の要約に対する前記聞き手の選択回数が多い順または削除回数が少ない順に前記専門用語を並べた用語ランキングを出力する
ことを特徴とする請求項1〜8のいずれか一つに記載の情報処理装置。 The output unit is
The information according to any one of claims 1 to 8 , wherein a term ranking in which the technical terms are arranged in descending order of selection frequency or deletion frequency in the technical term summary is output. Processing equipment.
前記抽出部によって抽出された用語のうち聞き手に応じた専門用語を当該専門用語が属するグループ別に出力する
ことを特徴とする請求項1〜9のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to any one of claims 1 to 9 , wherein a technical term corresponding to a listener among the terms extracted by the extraction unit is output for each group to which the technical term belongs.
前記聞き手による前記専門用語の要約に関する操作に基づいて前記専門用語の要約の量を補正して出力する
ことを特徴とする請求項1〜10のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to any one of claims 1-10, characterized in that outputs the corrected amount of summary of the terminology based on operation relating to summary of the technical terms by the listener.
前記音声に関する情報の話し手と前記聞き手との間の知識差に基づいて前記専門用語の要約を出力する
ことを特徴とする請求項1〜11のいずれか一つに記載の情報処理装置。 The output unit is
The information processing apparatus according to any one of claims 1 to 11, characterized that a summary of the terminology based on knowledge difference between the listener and the speaker of the information about the voice.
話し手の発話である音声に関する情報を受信する受信工程と、
前記受信工程によって受信された音声に関する情報に含まれる用語を抽出する抽出工程と、
前記抽出工程によって抽出された用語のうち聞き手に応じた専門用語の要約を聞き手に応じたタイミングで出力し、前記聞き手による前記専門用語の要約に関する操作状況を前記話し手が発話している間に出力する出力工程と
を含んだことを特徴とする情報処理方法。 An information processing method executed by an information processing apparatus,
A receiving process for receiving information about the speech that is the speaker's utterance ;
An extraction step of extracting terms included in the information about the voice received by the reception step;
A summary of technical terms corresponding to the listener among the terms extracted in the extraction step is output at a timing according to the listener, and an operation status related to the summary of the technical terms by the listener is output while the speaker is speaking. An information processing method characterized by including an output step.
前記受信手順によって受信された音声に関する情報に含まれる用語を抽出する抽出手順と、
前記抽出手順によって抽出された用語のうち聞き手に応じた専門用語の要約を聞き手に応じたタイミングで出力し、前記聞き手による前記専門用語の要約に関する操作状況を前記話し手が発話している間に出力する出力手順と
をコンピュータに実行させることを特徴とする情報処理プログラム。 A receiving procedure for receiving information about the voice of the speaker ,
An extraction procedure for extracting terms included in the information about the voice received by the reception procedure;
A summary of technical terms corresponding to the listener among the terms extracted by the extraction procedure is output at a timing according to the listener, and an operation status regarding the summary of the technical terms by the listener is output while the speaker is speaking. An information processing program for causing a computer to execute an output procedure.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015226736A JP6373243B2 (en) | 2015-11-19 | 2015-11-19 | Information processing apparatus, information processing method, and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015226736A JP6373243B2 (en) | 2015-11-19 | 2015-11-19 | Information processing apparatus, information processing method, and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017097488A JP2017097488A (en) | 2017-06-01 |
JP6373243B2 true JP6373243B2 (en) | 2018-08-15 |
Family
ID=58816881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015226736A Active JP6373243B2 (en) | 2015-11-19 | 2015-11-19 | Information processing apparatus, information processing method, and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6373243B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7068999B2 (en) * | 2018-12-17 | 2022-05-17 | ヤフー株式会社 | Information processing equipment, information processing methods and information processing programs |
JP7109737B2 (en) * | 2020-09-30 | 2022-08-01 | 株式会社カプコン | System, Server and Program |
JP7126282B1 (en) | 2021-06-29 | 2022-08-26 | クェスタ株式会社 | INFORMATION PROVIDING DEVICE, INFORMATION PROVIDING METHOD AND PROGRAM |
CN113657082A (en) * | 2021-08-18 | 2021-11-16 | 北京百度网讯科技有限公司 | Display method and display device |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3861702B2 (en) * | 2002-01-29 | 2006-12-20 | セイコーエプソン株式会社 | Electronic information providing method and system, and computer program |
JP2005196572A (en) * | 2004-01-08 | 2005-07-21 | Japan Science & Technology Agency | Summary making method of multiple documents |
JP2006079156A (en) * | 2004-09-07 | 2006-03-23 | Seiko Epson Corp | Display control system, equipment management device, display unit, equipment management program and display control program, and display control method |
JP2009042968A (en) * | 2007-08-08 | 2009-02-26 | Nec Corp | Information selection system, information selection method, and program for information selection |
JP2012003666A (en) * | 2010-06-21 | 2012-01-05 | Konica Minolta Business Technologies Inc | Presentation support device |
JP2012208630A (en) * | 2011-03-29 | 2012-10-25 | Mizuho Information & Research Institute Inc | Speech management system, speech management method and speech management program |
EP2869546B1 (en) * | 2013-10-31 | 2018-12-26 | Alcatel Lucent | Method and system for providing access to auxiliary information |
-
2015
- 2015-11-19 JP JP2015226736A patent/JP6373243B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017097488A (en) | 2017-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11762926B2 (en) | Recommending web API's and associated endpoints | |
US20210081611A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
US11573954B1 (en) | Systems and methods for processing natural language queries for healthcare data | |
Keuleers et al. | Megastudies, crowdsourcing, and large datasets in psycholinguistics: An overview of recent developments | |
JP6515624B2 (en) | Method of identifying lecture video topics and non-transitory computer readable medium | |
US8332208B2 (en) | Information processing apparatus, information processing method, and program | |
US9767186B2 (en) | Retrieving a specific sentence from a document | |
JP6087333B2 (en) | Information providing system, information providing method, and program | |
US11586689B2 (en) | Electronic apparatus and controlling method thereof | |
JP6345577B2 (en) | Information providing system, information providing method, program, and data structure | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
JP6373243B2 (en) | Information processing apparatus, information processing method, and information processing program | |
US20190155954A1 (en) | Cognitive Chat Conversation Discovery | |
US9922644B2 (en) | Analysis of professional-client interactions | |
JP2020113156A (en) | Device, program and method for generating dialog scenario including adjective utterance corresponding to characteristicness | |
JP5942052B1 (en) | Data analysis system, data analysis method, and data analysis program | |
US20140059070A1 (en) | Non-transitory computer readable medium, information search apparatus, and information search method | |
JP6988715B2 (en) | Answer text selection device, method, and program | |
JP6900334B2 (en) | Video output device, video output method and video output program | |
JP5277090B2 (en) | Link creation support device, link creation support method, and program | |
US12118313B2 (en) | Information processing device, information processing method, and computer program product | |
JP7131518B2 (en) | Electronic device, pronunciation learning method, server device, pronunciation learning processing system and program | |
CN113407815B (en) | Method and device for generating scene theme | |
JP5856905B2 (en) | Theme extraction device and program thereof | |
WO2023073886A1 (en) | Information processing system, information processing device, information processing method, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170609 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20170609 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20170619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170810 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171026 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180619 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6373243 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |