[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

JP2021067830A - 議事録作成システム - Google Patents

議事録作成システム Download PDF

Info

Publication number
JP2021067830A
JP2021067830A JP2019193392A JP2019193392A JP2021067830A JP 2021067830 A JP2021067830 A JP 2021067830A JP 2019193392 A JP2019193392 A JP 2019193392A JP 2019193392 A JP2019193392 A JP 2019193392A JP 2021067830 A JP2021067830 A JP 2021067830A
Authority
JP
Japan
Prior art keywords
minutes
voice recognition
server
recognition text
vote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019193392A
Other languages
English (en)
Other versions
JP6795668B1 (ja
Inventor
剛 大濱
Takeshi Ohama
剛 大濱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Cash Machine Co Ltd
Original Assignee
Japan Cash Machine Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Cash Machine Co Ltd filed Critical Japan Cash Machine Co Ltd
Priority to JP2019193392A priority Critical patent/JP6795668B1/ja
Application granted granted Critical
Publication of JP6795668B1 publication Critical patent/JP6795668B1/ja
Publication of JP2021067830A publication Critical patent/JP2021067830A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供する。【解決手段】議事録作成システム1は、音声認識部とおよび情報処理部を備えたサーバ100と端末200で構成される。サーバ100の音声認識部は、マイク270で取得した音声を認識し、サーバ100の情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。【選択図】図1

Description

本発明は、議事録作成システムに関する。
「音声を入力する音声入力手段と、音声入力手段から入力された音声を蓄積する音声蓄積手段と、音声蓄積手段に蓄積された音声の話者や発言内容を解析する音声解析手段と、音声解析手段によって解析された音声の話者や発言内容から議事録を生成する議事録作成手段と、議事録作成手段によって生成された議事録を表示する議事録表示手段と、議事録作成手段で生成された議事録を編集する議事録編集手段とを有しており、議事録編集手段は、議事録表示手段による議事録表示に基づいて、議事録作成手段で生成された議事録を編集可能となっていることを特徴とする議事録作成装置」が過去に提案されている(例えば、特開2001−325250公報等参照)。
特開2001−325250公報
上述のとおり、特許文献1の議事録作成装置は、会議中に取得した音声をテキスト化して自動的に議事録を作成している。しかし、会議中に取得した発言内容の全てから議事録が作成されるため、不必要な発言や削除すべき発言等も議事録として残ってしまう。かかる場合、議事録の閲覧者が会議の要点を容易に把握できなくなり、会議参加者が自由に意見を言えなくなる懸念がある。
本発明の課題は、議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供することである。
本発明の第1局面に係る議事録作成システムは、音声認識部および情報処理部を備える。音声認識部は、マイクで取得した音声を認識する。情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。
この議事録作成システムでは、情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができ、延いては議事録の閲覧者が会議の要点を容易に把握できるようにすることができる。
本発明の第2局面に係る議事録作成システムは第1局面に係る議事録作成システムであって、表示部をさらに備える。表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。
この議事録作成システムでは、表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。例えば、端末(例えば、パーソナルコンピュータ、タブレット端末、スマートフォン等)のディスプレイの右側に音声認識テキストを表示し、端末のディスプレイの左側に議事録を表示することで、音声認識テキスト内のどの内容が選択されて議事録が作成されているかを確認することができる。このため、この議事録作成システムでは、音声認識テキスト内の議事録に残すべき内容が選択されていないことを見落とさないようにすることができる。
本発明の第3局面に係る議事録作成システムは第1局面または第2局面に係る議事録作成システムであって、情報処理部は、音声認識テキスト内の内容毎に1または複数のユーザによる第1投票を受け付け、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎に1または複数のユーザ(例えば、会議参加者等)による第1投票を受け付けて、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。例えば、会議参加者のうち権限のある1人による投票を受け付け、投票された音声認識テキスト内の内容から議事録を作成するようにすることができる。また、例えば、複数の会議参加者それぞれによる投票を受け付けて、会議参加者のうち3人以上に投票された場合に、投票された音声認識テキスト内の内容から議事録を作成するようにすることもできる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができる。
本発明の第4局面に係る議事録作成システムは第3局面に係る議事録作成システムであって、情報処理部は、音声認識テキスト内の内容毎にユーザの第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎にユーザ(例えば、会議参加者等)の第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。例えば、企業の会議において、議事録に残すべきと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長の投票は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
本発明の第5局面に係る議事録作成システムは第3局面または第4局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザによる第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容(つまり、ユーザが議事録に残すべきと判断した内容)毎にユーザ(議事録に残す投票をしたユーザや、議事録に残す投票をしていないユーザ)による第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。例えば、会議参加者等の投票によって議事録に残すべきと判断された内容があったとしても、「議事録に残す投票をしたが意見が変わった会議参加者等」や「その内容を議事録に残すべきではないと判断する会議参加者等」が居る場合がある。そして、これらの会議参加者等による投票を受け付けて、所定値以上の得票を獲得した内容を議事録に含めないようにすることができる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができる。
本発明の第6局面に係る議事録作成システムは第5局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。例えば、企業の会議において、議事録に残すべきではないと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
本発明の第7局面に係る議事録作成システムは第1局面から第6局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。例えば、AI(Artificial Intelligence)による学習を利用して生成した学習モデルを用いることで、音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
本発明の第8局面に係る議事録作成システムは第1局面から第7局面のいずれか1局面に係る議事録作成システムであって、選択部をさらに備える。選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をする。また、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。
この議事録作成システムでは、選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をし、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。そして、選択されたキーワード辞書に登録されているキーワードが音声認識テキスト内の内容に含まれている場合、その音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
本発明の第9局面に係る議事録作成システムは第1局面から第8局面のいずれか1局面に係る議事録作成システムであって、音声認識部は、認識した音声がいずれの話者から発せられたかを特定する。また、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。
この議事録作成システムでは、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。このため、この議事録作成システムでは、音声認識テキスト内および議事録内において、どのユーザ(例えば、会議参加者等)による発言であるかを特定することができる。
本発明の第10局面に係る議事録作成システムは第1局面から第9局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。
この議事録作成システムでは、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。このため、この議事録作成システムでは、例えば、多言語(少なくとも2つの言語以上)による会議が行われる場合に、ユーザ(例えば、会議参加者等)は、各ユーザの言語に翻訳された音声認識テキストおよび議事録を確認することができ、延いては多言語による会議を円滑に進めることができる。
本発明の第11局面に係る議事録作成システムは第1局面から第10局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。
この議事録作成システムでは、情報処理部は、議事録における音声認識テキスト内の内容の一部または全部を選択して議事録から削除することができる。つまり、議事録に残すべきではない内容(例えば、企業において、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録として作成されていた場合に、その内容を削除することができる。このため、この議事録作成システムでは、作成された議事録から情報漏洩等が起きることを防ぐことができる。
本発明の第12局面に係る議事録作成システムは第1局面から第11局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録から音声データを生成することができる。
この議事録作成システムでは、情報処理部は、議事録から音声データを生成することができる。このため、この議事録作成システムでは、会議参加者等は、視覚で確認しなくても会議の内容を把握することができる。
本発明の第1実施形態に係る議事録作成システムの全体構成を示すイメージ図である。 本発明の第1実施形態に係る端末のキーワードによる議事録作成時の画面推移を示すイメージ図である。 本発明の第1実施形態に係る端末のユーザ投票による議事録作成時の画面推移を示すイメージ図である。 本発明の第1実施形態に係る端末の削除指示による画面推移を示すイメージ図である。 本発明の実施形態に係るサーバの構成を示すブロック図である。 本発明の第1実施形態に係る第1照合テーブルを示すイメージ図である。 本発明の第1実施形態に係る第2照合テーブルを示すイメージ図である。 本発明の実施形態に係る端末の構成を示すブロック図である。 本発明の第1実施形態に係る議事録作成システムの処理の流れを示すフローチャートである。 本発明の実施形態に係る議事録作成システムの機能構成を示すブロック図である。 本発明の第2実施形態に係る議事録作成システムの全体構成を示すイメージ図である。 本発明の第1実施形態に係る端末の変形例(E)適用時のユーザ投票による議事録作成時の画面推移を示すイメージ図である。
−第1実施形態−
<本発明の第1実施形態に係る議事録作成システム1の全体構成例>
本発明の第1実施形態に係る議事録作成システム1の全体構成について説明する。本発明の第1実施形態に係る議事録作成システム1は、例えば、1つの会議室において会議が行われる場合に使用されるものであって、図1に示されるように、主たる装置として、サーバ100および端末200等から構成されている。以下、これらの構成要素について詳述する。
1.サーバ
まず、本発明の第1実施形態に係る議事録作成システム1を構成するサーバ100の構成の一態様について説明する。サーバ100は、インターネットに接続され、会議参加者等の音声の認識結果を音声認識テキスト232として出力し、音声認識テキスト232内で選択した内容から議事録233を作成するサービス等を提供する。サーバ100は、図5に示されるように、主たる構成要素として、CPU(Central Processing Unit)110、メモリ120、操作部140および通信インターフェイス150を含む。
(1)CPU
CPU110は、メモリ120に記憶されているプログラムを実行することによって、サーバ100の各部を制御する。例えば、CPU110は、メモリ120に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。
(2)メモリ
メモリ120は、各種のRAM(Random Access Memory)、各種のROM(Read Only Memory)等であり、サーバ100に内包されているものであってもよいし、サーバ100の各種インターフェイスに着脱可能なものであってもよいし、サーバ100からアクセス可能な他の装置の記録媒体であってもよい。メモリ120は、CPU110によって実行されるプログラムや、CPU110によるプログラムの実行により生成されたデータ、入力されたデータ、その他の第1実施形態に係るサービスに利用されるデータベース等を記憶する。
具体的には、メモリ120は、図6および図7に示されるような第1照合テーブル121および第2照合テーブル122を記憶する。第1照合テーブル121は、使用される各マイクに、そのマイクの使用者名を関連付けている。第2照合テーブル122は、各会議参加者等に、重み係数を関連付けている。ここで、重み係数は、各会議参加者の投票(後述)に対して重み付け処理をする際に用いられるものである。例えば、図7に示されるような第2照合テーブル122を参照して重み付け処理をすることで、「田中」による投票は3人分の投票とされ、「佐藤」の投票は2人分の投票とされる。なお、サービスの管理者等は、第1照合テーブル121および第2照合テーブル122に新しいデータを追加したり、第1照合テーブル121および第2照合テーブル122に格納されているデータを変更することができる。
また、メモリ120は、キーワード辞書も記憶する。キーワード辞書は、例えば、企業内で選定した単語や用語(日付、時間または金額等の変数も含まれる)を登録したもの等であり、音声認識テキスト232のうち特定のキーワードを含んでいる音声認識テキスト232内の内容から議事録233を作成するために用いられる。なお、キーワード辞書内の単語や用語は、必要に応じて追加および変更されてメモリ120に記憶されてもよいし、新しいキーワード辞書が、必要に応じて追加されてメモリ120に記憶されてもよい。
また、メモリ120は、AI(Artificial Intelligence)を利用して生成した学習モデルも記憶する。ここで、学習モデルは、音声認識テキスト232と議事録233との関係性に基づく学習により生成されたもの等である。なお、必要に応じて、学習モデルの再学習が行われてメモリ120に記憶されてもよい。
(3)操作部
操作部140は、サービスの管理者等の命令を受け付けて、当該命令をCPU110に入力する。
(4)通信インターフェイス
通信インターフェイス150は、CPU110からのデータを、インターネット、キャリア網、ルータ等を介して、端末200等の他の装置に送信する。逆に、通信インターフェイス150は、インターネット、キャリア網、ルータ等を介して端末200等の他の装置からのデータを受信して、CPU110に受け渡す。
2.端末
次に、本発明の第1実施形態に係る議事録作成システム1を構成する端末200の一態様について説明する。端末200は、会議参加者等に使用され、主に、会議参加者等の音声を取得し、取得した音声データをサーバ100に送信したり、サーバ100から送信された音声認識結果等を受信して表示するためのものである。本発明の第1実施形態に係る議事録作成システム1おいて、端末200は、パーソナルコンピュータやタブレット端末やスマートフォン等である。また、端末200は、ルータやインターネットやキャリア網等を介して、サーバ100が提供する各種のサービスを利用可能である。端末200は、図8に示されるように、主たる構成要素として、CPU210、メモリ220、ディスプレイ230、操作部240、通信インターフェイス250、スピーカ260、マイク270およびプロジェクタ280等を含む。
(1)CPU
CPU210は、メモリ220あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、端末200の各部を制御する。
(2)メモリ
メモリ220は、各種のRAMや、各種のROM等である。メモリ220は、CPU210によって実行されるプログラムや、CPU210によるプログラムの実行により生成されたデータ、入力されたデータ、サーバ100から受信したデータ、操作部240を介して入力されたデータ等を記憶する。
(3)ディスプレイ
ディスプレイ230は、CPU210からの信号に基づいて、テキスト、画像、映像等を表示する。例えば、CPU210は、通信インターフェイス250を介してサーバ100から送られてくるデータ基づいて、図2〜4に示されるような音声認識テキスト232および議事録233を同時にディスプレイ230に表示する。なお、ディスプレイ230は、タッチパネル機能を有していてもよい。
(4)操作部
操作部240は、マウス、キーボード、ボタンおよびタッチパネル等であり、ユーザからの各種命令をCPU210に入力する。
(5)通信インターフェイス
通信インターフェイス250は、無線LAN通信あるいは有線LAN等の通信モジュールである。通信インターフェイス250は、サーバ100等の他の装置との間でデータの送受信を仲介する。例えば、CPU210は、操作部240を介したキーワード辞書選択命令、その他の各種の入力情報を、通信インターフェイス250を介してサーバ100に送信したり、通信インターフェイス250を介してサーバ100から受信したデータに基づいてディスプレイ230に図2〜4に示されるような画面を表示したりする。
(6)スピーカ
スピーカ260は、CPU210からの信号に基づいて、音声を出力する。なお、音声を出力する機器は、スピーカ260に限定されていない。つまり、ヘッドホン、イヤホンまたはヘッドセット等の機器が用いられてもよい。
(7)マイク
マイク270は、会議参加者等の音声を取得する。マイク270は、有線接続または無線接続によって端末200に接続される。なお、ここで、マイク270は会議参加者数と同じ数だけ用意され、会議参加者1人に1つのマイクが用意されることが好ましい。
(8)プロジェクタ
プロジェクタ280は、図1に示されるように、ディスプレイ230に表示されている画面をスクリーンに映し出し、ディスプレイ230に表示されている画面を会議参加者が共有できるようにする場合に用いられる。
<本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要>
ここでは、図9を参照して、本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要について説明する。まず、会議参加者(会議主催者を含む)等は、会議が始まる前に、第1照合テーブル121(図6参照)および第2照合テーブル122(図7参照)を作成しておく。第1照合テーブル121および第2照合テーブル122は、サーバ100において作成されてサーバ100のメモリ120に記憶されてもよいし、端末200において作成されて通信インターフェイス150を介してサーバ100のメモリ120に記憶されてもよい。
また、会議参加者等は、キーワードによる議事録作成(後述)を選択する場合に備えて、会議が始まる前に端末200を用いてキーワード辞書を選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からのキーワード辞書の選択結果を受け付け、サーバ100のメモリ120に格納されているキーワード辞書を選択する。これによって、選択されたキーワード辞書を基に議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つのキーワード辞書だけを選択してもよいし、複数のキーワード辞書を選択してもよい。また、会議参加者等は、会議中にキーワード辞書を切り換えるために改めてキーワード辞書の選択を行うことができる。なお、会議参加者等は、キーワードによる議事録作成を選択しない場合、キーワード辞書の選択をしてなくてもよい。
また、会議参加者等は、AIによる議事録作成(後述)を選択する場合に備えて、端末200を用いて会議が始まる前に学習モデルを選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの学習モデルの選択結果を受け付け、サーバ100のメモリ120に格納されている学習モデルを選択する。これによって、選択された学習モデルを基にAIで議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つの学習モデルだけを選択してもよいし、複数の学習モデルを選択してもよい。また、会議参加者等は、会議中に学習モデルを切り換えるために改めて学習モデルの選択を行うことができる。なお、会議参加者等は、AIによる議事録作成を選択しない場合、学習モデルの選択をしてなくてもよい。
まず、会議参加者等は、会議が始まる前に端末200を用いて、図2(B)、図3(B)および図4に示されるような会議開催情報238(例えば、開催日時、開催場所、会議参加者名等)の入力を行う(ステップS102)。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの入力情報を受け付けて、会議開催情報238を記憶する。なお、この会議開催情報238は、議事録233を作成する処理(後述)が実行された際に、議事録233の一部として出力される。
会議が始まると、会議参加者毎に用意されたマイク270が、会議参加者の音声を取得する(ステップS104)。また、端末200は、会議参加者の音声が取得された後、会議参加者の音声を取得したマイク270の識別情報を、取得した音声データとともに端末200の通信インターフェイス250を介してサーバ100に送信する。
次に、サーバ100のCPU110は、受信したマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名(マイク270の使用者名)を特定する(ステップS106)。例えば、図6に示されるように、受信したマイク270の識別情報が「マイクA」である場合、サーバ100のCPU110は、取得した音声を発した会議参加者を「田中」と特定する。
次に、サーバ100のCPU110は、取得した音声の内容を認識する(ステップS108)。
次に、サーバ100のCPU110は、「会議参加者名の特定結果」および「音声の内容の認識結果」を音声認識テキスト232として出力する(ステップS110)。なお、ここで、サーバ100のCPU110は、会議参加者等が切り替わる度に音声認識テキスト232を出力してもよいし、会議参加者等の音声の内容の認識結果に応じて(例えば、会議参加者等の音声の内容の認識結果が「。」で区切られる度に)音声認識テキスト232を出力してもよい。
次に、サーバ100のCPU110は、図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bにはキーワードによる議事録作成ボタン234、AIによる議事録作成ボタン235、チェックボックス237、音声認識テキスト232等が表示される。なお、ここで、エリア231Aは特許請求の範囲に記載の「第2のエリア」に相当し、エリア231Bは特許請求の範囲に記載の「第1のエリア」に相当する。音声認識テキスト232は、時系列順に並べられて表示され、チェックボックス237は、各音声認識テキスト232の左側に隣接するように配設されている。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、Webページ231を端末200に送信する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、音声認識テキスト232を表示する(ステップS112)。なお、Webページ231ではなく議事録作成用のアプリケーション画面が、サーバ100のCPU110によって作成され、端末200のディスプレイ230に表示させてもよい。また、Webページ231は、端末200のプロジェクタ280によってスクリーンに映し出されて会議参加者に共有される。
次に、議事録233の作成を開始する場合(ステップS114にてYESである場合)、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成命令および議事録作成方法の選択結果を受け付け(ステップS116)、選択された議事録作成方法に基づいて議事録233を作成する処理を実行する。なお、議事録233を作成する処理は、会議の終了後に実行されてもよいし、会議中に実行されてもよい。
議事録233をまだ作成しない場合(ステップS114にてNOである場合)、ステップS102〜ステップS112の処理が繰り返される。
−ステップS118における処理−
図9に示されるように「キーワードによる議事録作成」が選ばれた場合、サーバ100のCPU110は、キーワード辞書を基に議事録233を自動的に作成する。より詳細には、会議参加者等は、図2に示されるように、マウスポインタ240Aを用いて「キーワードによる議事録作成ボタン234」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成する。例えば、キーワード辞書に「売上」「B社」が登録されている場合、サーバ100のCPU110は、図2に示されるように、「売上」「B社」を含んでいる破線で囲まれた音声認識テキスト232を自動的に選択する。そして、サーバ100のCPU110は、図2に示されるように、選択した音声認識テキスト232から議事録233を自動的に作成する。
−ステップS120における処理−
図9に示されるように「AIによる議事録作成」が選ばれた場合(サーバ100のCPU110がステップS120の処理を実行する場合)、サーバ100のCPU110は、学習モデルに基づいてAIで議事録233を自動的に作成する。より詳細には、会議参加者等は、マウスポインタ240Aを用いて「AIによる議事録作成ボタン235」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基に音声認識テキスト232を選択して議事録233をAIで自動的に作成する。
−ステップS122における処理−
図9に示されるように「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、会議参加者等の投票を基に議事録233を作成する。より詳細には、各会議参加者等は、図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とし、「佐藤」による投票は2人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。なお、自身の名前の欄のチェックボックス237を選択した各会議参加者等がマウスポインタ240Aを用いて同じチェックボックス237をもう一度選択した場合、議事録233に残すべきと判断した音声認識テキスト232に対する投票を取り消す処理が行われてもよい。そして、この取り消し処理によってその音声認識テキスト232の得票が所定値以上から所定値未満になった場合、議事録233に残されていたその音声認識テキスト232は議事録233から削除されてもよい。
また、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票をさらに受け付ける。言い換えれば、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すべきではないと判断する会議参加者等の投票をさらに受け付ける。なお、説明の便宜上、議事録233に残すための投票をした会議参加者等を「第1会議参加者等」と称し、議事録233に残す投票をした会議参加者等(第1会議参加者等)以外の会議参加者等を「第2会議参加者等」と称する。まず、サーバ100のCPU110は、例えば、第1会議参加者等の投票によって議事録233に残すべきと判断された各音声認識テキスト232の側に投票者切換ボタンを表示させる。そして、マウスポインタ240Aを用いて投票者切換ボタンが選ばれると、サーバ100のCPU110は、その音声認識テキスト232において、第2会議参加者等からの投票を受け付ける状態になる。例えば、議事録233に残すべきと判断された音声認識テキスト232の1つにおいて、「佐藤」および「鈴木」が第1会議参加者等であり、「田中」が第2会議参加者等である場合、「田中」からの投票を受け付ける状態になる。そして、第2会議参加者等は、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、その音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を議事録233に含めないようにする。なお、上述の通り、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。
そして、ステップS118、S120またはS122のいずれかの処理が終わると、サーバ100のCPU110は、作成した議事録233を表示するためにWebページ231を更新する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、議事録233を表示する(ステップS124)。
そして、他の議事録作成方法(キーワードによる議事録作成、AIによる議事録作成およびユーザ投票による議事録作成のうち、まだ選ばれていない議事録作成方法)をさらに選ぶ場合(ステップS126にてYESである場合)、サーバ100のCPU110は、ステップS116からの処理を繰り返す。なお、他の議事録作成方法がさらに選ばれた場合であっても、他の議事録作成方法と先の議事録作成方法との両方によって選択された音声認識テキスト232は、重複して議事録233に残されない。例えば、先にステップS116においてキーワード選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択されて議事録233に残されたとする。そして、次にステップS116においてAI選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択された場合であっても、この音声認識テキスト232は重複して議事録233に残されない。
他の議事録作成方法をさらに選ばない場合(ステップS126においてNOである場合)、サーバ100のCPU110は、会議を終了させるための入力情報(例えば、会議参加者等が会議終了ボタン(図示せず)を選んだという情報)を端末200から受け付けて今回の処理を終了し、会議が継続する場合はステップS104からの処理を繰り返す。
なお、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。例えば、会議参加者等は、端末200の操作部240等を用いて、Webページ231内の音声認識テキスト232の内容の一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、音声認識テキスト232を修正する。そして、サーバ100のCPU110は、Webページ231を更新し、端末200は、修正内容が反映されたWebページ231を端末200のディスプレイ230に表示する。
なお、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。例えば、会議参加者等は、図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行う。図4では、議事録233において「鈴木」が発言した内容の一部である「えーっと」が選択されている。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除する。そして、サーバ100のCPU110は、Webページ231を更新する。端末200は、図4に示されるように、選択された内容の削除が反映されたWebページ231を端末200のディスプレイ230に表示する。
また、例えば、「議事録233」と「議事録233から削除された内容」との関係性等に基づいて、AIを利用して生成されたモデルを用いて、議事録233の内容の一部または全部が自動的に削除されてもよい。
以上の通り、本発明の第1実施形態に係る議事録作成システム1は、全体として、図10の機能ブロック図に示すように、入力装置200Aと、音声認識部100Aと、情報処理部100Bと、選択部100Cと、表示部200B等を有する。
そして、入力装置200Aは、例えば、端末200の操作部240、端末200のマイク270等である。音声認識部100Aは、例えば、サーバ100のCPU110がメモリ120のプログラム(図9のステップS106〜S108等の処理を実行するためのプログラム)を実行することによって実現される。情報処理部100Bは、例えば、サーバ100のCPU110がメモリ120のプログラム(図9のステップS110〜S122等の処理を実行するためのプログラム)を実行することによって実現される。選択部100Cは、例えば、端末200の操作部240介したキーワード辞書選択命令を受け付けたサーバ100のCPU110がメモリ120のプログラムを実行することによって実現される。表示部200Bは、例えば、端末200のディスプレイ230等である。
<本発明の第1実施形態に係る議事録作成システム1の特徴>
(1)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bには音声認識テキスト232が表示される。そして、議事録233は、選択された音声認識テキスト232の内容から作成されている。このため、この議事録作成システム1では、議事録233の閲覧者が会議の要点を容易に把握することができる。また、どの音声認識テキスト232が選択されて議事録233が作成されているかを確認することができ、議事録233に残すべき音声認識テキスト232が選択されていないことを見落とさないようにすることができる。
(2)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、この議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
(3)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基にAIで音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、本発明の第1実施形態に係る議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
(4)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第1会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、サーバ100のCPU110は、第1会議参加者等によって議事録233に残すべきと判断された音声認識テキスト232において、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を議事録233に含めないようにする。このため、この議事録作成システム1では、影響力のある人物等の意思を反映させやすくすることができると共に、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録233を作成することができる。
(5)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、「取得した音声を発した会議参加者名」および「取得した音声の認識結果」を音声認識テキスト232として出力する。そして、この音声認識テキスト232から議事録233が作成される。このため、この議事録作成システム1では、音声認識テキスト232内および議事録233内に示された発言がどの会議参加者等による発言であるかを特定することができる。
(6)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。このため、この議事録作成システム1では、音声の認識結果に誤りがある場合、その認識結果を修正することで正しい結果を会議参加者等に伝えることができ、延いては音声の誤った認識結果から議事録233が作成されることを防止することができる。
(7)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。つまり、議事録233に残すべきではない内容(例えば、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録233として作成されていた場合に、当該内容を削除することができる。このため、この議事録作成システム1では、作成された議事録233から情報漏洩等が起きることを防ぐことができる。
<変形例>
(A)
本発明の第1実施形態に係る議事録作成システム1のサーバ100や端末200等の各装置の役割の一部または全部を他の装置が実行してもよい。例えば、図10に示される音声認識部100A、情報処理部100Bおよび選択部100Cが、端末200や他の装置によって実現されてもよい。あるいは、端末200のCPU210がメモリ220のプログラムを実行することによって、図9に示される処理の一部または全部が実現されてもよい。サーバ100のCPU110が、端末200から送信された音声データ受信し、音声の内容を認識して認識結果を音声認識テキスト232として出力していたが、例えば、端末200のCPU210が、音声の内容を認識して認識結果を音声認識テキスト232として出力してもよい。かかる場合、端末200は、端末200の通信インターフェイス250を介して音声認識テキスト232をサーバ100に送信することになる。なお、図9に示される処理の一部または全部を実行するためのプログラムを、端末200がインターネット等を介してダウンロード可能であることが好ましい。
(B)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、端末200のマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名を特定していた。しかし、例えば、会議参加者の声紋データをあらかじめサーバ100のメモリ120等に記憶しておき、サーバ100のCPU110が、取得した音声を声紋データと照合して声紋認証を行い、取得した音声を発した会議参加者名(マイク270の使用者名)を認識してもよい。
(C)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、選択された議事録作成方法に基づいて議事録233を作成する処理を実行していた。しかし、サーバ100のCPU110は、取得した音声の音量を認識し、その音声の音量が所定値以上である場合にその音声の内容を議事録233に含めてもよい。
(D)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、重み付け処理をしていた。しかし、サーバ100のCPU110は、各会議参加者等の投票を受け付けても、重み付け処理をしなくてもよい。
(E)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、各会議参加者等が、図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票していた。しかし、会議参加者等のうち権限のある者を1人選任し、権限のある者のみが、議事録233に残すべきと判断した音声認識テキスト232を選択してもよい。かかる場合、図12に示されるように、各音声認識テキスト232の左側に隣接するようにラジオボタン236が配設され、権限のある者は、ラジオボタン236を選択することで、議事録233に残すべきと判断した音声認識テキスト232を選択して議事録233を作成するとよい。なお、各音声認識テキスト232の左側にラジオボタン236およびチェックボックス237が配設され、「権限のある者のみがラジオボタン236を選択する方法」および「各会議参加者等がチェックボックス237を選択する方法」の両方によって議事録233として残す音声認識テキスト232が決められてもよい。例えば、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票していない場合、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票している場合、その投票による得票が所定値以上であるか所定値未満であるかにかかわらず、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において権限のある者がラジオボタン236を選択していない場合、各会議参加者がチェックボックス237を選択して投票し、その投票による得票が所定値以上であればその音声認識テキスト232は議事録233として残される。また、権限のある者は、議事録233に残すべきと判断した音声認識テキスト232を議事録233にドラッグアンドドロップすることで議事録233を作成してもよい。
(F)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行っていた。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除していた。しかし、サーバ100のCPU110は、選択された内容の削除の可否を投票によって受け付けてもよい。そして、サーバ100のCPU110は、得票が所定値以上である場合、選択された内容を削除する。なお、サーバ100のCPU110は、投票受け付けた際に、所定の重み係数に従って各投票を重み付け処理してもよい。
(G)
本発明の第1実施形態に係る議事録作成システム1において、会議参加者等の話し方の癖、会議参加者等の方言、会議の議題、企業内や業界内でのみで使用される用語(例えば、社内用語、業界用語等)等に対応した音声認識を行うための音声認識辞書がサーバ100のメモリ120に記憶されてもよい。かかる場合、サーバ100のCPU110は、AIによる学習を利用することによって、音声認識辞書を基に、取得した音声の内容を認識する。これによって、取得した音声の内容の認識結果の精度を向上させることができる。
(H)
本発明の第1実施形態に係る議事録作成システム1において、企業内や業界内のみで使用される用語を一般的な用語に変換するための変換辞書がサーバ100のメモリ120に記憶されてもよい。これによって、企業内や業界内のみで使用される用語を知らない者が議事録233を閲覧しても会議の内容を理解することができ、変形例(I)に記載の翻訳処理時に翻訳結果の精度を向上させることができる。
(I)
本発明の第1実施形態に係る議事録作成システム1は、多言語(少なくとも2つ以上の言語)が用いられる場合であっても適用することができる。まず、会議参加者が発した音声の言語で出力された音声認識テキスト232が、1つのWebページ231内のエリア231Bに表示される。次に、音声認識テキスト232が、会議参加者が発した音声の言語以外の1または複数の言語に翻訳され、翻訳結果が、会議参加者が発した音声の言語以外の言語毎に翻訳テキストとして出力される。そして、会議参加者が発した音声の言語以外の言語毎にWebページ231が作成されて、各Webページ231内のエリア231Bに各翻訳テキストが表示される。つまり、会議で用いられる言語の数だけWebページ231が作成されて、各Webページ231が端末200に並べられて表示されることになる。このため、会議参加者等は、多言語による会議であっても、各会議参加者等の言語で議事録233を確認することができる。なお、音声認識テキスト232を取得した音声以外の言語に翻訳する処理は、サーバ100のCPU110によって行われるとよい。かかる場合、会議参加者等は、使用されるマイク毎にそのマイクの使用者名に加えてそのマイクの使用者の言語等を格納した照合テーブル(図示せず)を会議前に作成しておくとよい。これによって、会議参加者が発した音声の言語(例えば、日本語)を認識することができると共に、会議参加者が発した音声の言語を他のどの言語(例えば、英語、中国語等)に翻訳するかを認識することができる。
また、かかる場合、会議参加者等は、翻訳テキストの内容の一部または全部を必要に応じて修正してもよい。例えば、会議参加者等は、端末200の操作部240等を用いて、翻訳テキストの一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、翻訳テキストを修正する。これによって、誤った翻訳結果から議事録233が作成されることを防止することができる。
さらに、かかる場合、サーバ100のメモリ120は、会議の議題に適した翻訳を行うための翻訳辞書(用語、対訳データ、文章データ等)を記憶してもよい。翻訳辞書は、例えば、化学分野における専門用語に重点を置いたもの、企業や業界における専門用語重点を置いたもの等である。なお、翻訳辞書内の用語は、随時追加および変更されてメモリ120に記憶されてもよいし、新しい翻訳辞書が追加されてメモリ120に記憶されてもよい。そして、会議参加者等は、会議が始まる前に、会議の議題に適した翻訳を行うための翻訳辞書の選択を行うことになる。かかる場合、AIを利用することによって、選択された翻訳辞書を基に、翻訳処理が実行される。なお、会議参加者等は、1つの翻訳辞書だけを選択してもよいし、複数の翻訳辞書を選択してもよい。会議参加者等は、複数の翻訳辞書を選択する場合に翻訳辞書毎に優先度を設定してもよく、設定された優先度の順に翻訳処理が実行される。また、会議参加者等は、会議中であっても会議の議題が変更される場合に、翻訳辞書を切り換えるために改めて翻訳辞書の選択を行ってもよい。
(J)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、作成された議事録233から音声合成により音声データを生成してもよい。これによって、会議参加者等は、端末200(例えば、パーソナルコンピュータやタブレット端末やスマートフォン)のスピーカ260やデジタルオーディオプレーヤー等から出力される音声を聞くことで、視覚で確認しなくても会議の内容を把握することができる。
(K)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」をさらに受け付けていた。そして、サーバ100のCPU110は、その投票による得票が所定値以上である音声認識テキスト232を議事録233に含めないようにしていた。しかし、サーバ100のCPU110は、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」だけでなく、「議事録233に残すための投票をした会議参加者等の投票」も受け付けてもよい。これは、一度は議事録233に残すための投票をしたが議事録233に残すべきではないという考えに変わった会議参加者等からの投票を受け付けるためである。
−第2実施形態−
上記の第1実施形態に係る議事録作成システム1は、1つの会議室において会議が行われる場合に使用されるものであった。しかし、上記の技術は、例えば、図11に示されるようなウェブ会議が行われる場合であっても適用することができる。ただし、本発明の第2実施形態に係る議事録作成システム2において、端末200は、各会議参加者に1つずつ用意されており、プロジェクタ280を含まなくてもよい。本発明の第2実施形態に係る議事録作成システム2において、図11に示される各端末200が、上記の第1実施形態に係る議事録作成システム1にて説明したWebページ231を表示する。
なお、第2実施形態に係る議事録作成システム2において、上記の変形例(A)〜(K)が適用されてもよい。ただし、変形例(I)が適用される場合、会議参加者等が使用している各端末200は、会議で用いられる言語の数だけ作成されたWebページ231を並べて表示しなくてもよく、1つのWebページ231だけを表示するとよい。例えば、「日本語」を話す会議参加者等が使用している端末200には、「日本語」による自身の音声認識テキスト232と、「日本語以外の言語(例えば、英語)」を話す会議参加者の音声認識テキスト232を「日本語」に翻訳した翻訳テキストとが表示されたWebページ231が表示されればよい。
さらに、変形例(I)が適用される場合、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、修正中であることが各端末200に表示されてもよい。例えば、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、「修正されている音声認識テキスト232に対応する翻訳テキスト」または「修正されている翻訳テキストに対応する音声認識テキスト232または翻訳テキスト」の横に通知マークが表示されるとよい。そして、修正が完了すると、通知マークが表示されなくなるとよい。
100 :サーバ
110 :CPU(音声認識部、情報処理部、選択部)
100A:音声認識部
100B:情報処理部
100C:選択部
200 :端末
200A:入力装置
200B:表示部
230 :ディスプレイ(表示部)
232 :音声認識テキスト
233 :議事録
270 :マイク
本発明は、議事録作成システムに関する。
「音声を入力する音声入力手段と、音声入力手段から入力された音声を蓄積する音声蓄積手段と、音声蓄積手段に蓄積された音声の話者や発言内容を解析する音声解析手段と、音声解析手段によって解析された音声の話者や発言内容から議事録を生成する議事録作成手段と、議事録作成手段によって生成された議事録を表示する議事録表示手段と、議事録作成手段で生成された議事録を編集する議事録編集手段とを有しており、議事録編集手段は、議事録表示手段による議事録表示に基づいて、議事録作成手段で生成された議事録を編集可能となっていることを特徴とする議事録作成装置」が過去に提案されている(例えば、特開2001−325250公報等参照)。
特開2001−325250公報
上述のとおり、特許文献1の議事録作成装置は、会議中に取得した音声をテキスト化して自動的に議事録を作成している。しかし、会議中に取得した発言内容の全てから議事録が作成されるため、不必要な発言や削除すべき発言等も議事録として残ってしまう。かかる場合、議事録の閲覧者が会議の要点を容易に把握できなくなり、会議参加者が自由に意見を言えなくなる懸念がある。
本発明の課題は、議事録の閲覧者が会議の要点を容易に把握することができる議事録を作成することができる議事録作成システムを提供することである。
本発明の第1局面に係る議事録作成システムは、音声認識部および情報処理部を備える。音声認識部は、マイクで取得した音声を認識する。情報処理部は、音声の認識結果を音声認識テキストとして出力し、音声認識テキスト内で選択した内容から議事録を作成する。そして、情報処理部は、音声認識テキスト内の内容毎に1または複数のユーザによる第1投票を受け付け、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎に1または複数のユーザ(例えば、会議参加者等)による第1投票を受け付けて、ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する。例えば、会議参加者のうち権限のある1人による投票を受け付け、投票された音声認識テキスト内の内容から議事録を作成するようにすることができる。また、例えば、複数の会議参加者それぞれによる投票を受け付けて、会議参加者のうち3人以上に投票された場合に、投票された音声認識テキスト内の内容から議事録を作成するようにすることもできる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができ、延いては議事録の閲覧者が会議の要点を容易に把握できるようにすることができる。
本発明の第2局面に係る議事録作成システムは第1局面に係る議事録作成システムであって、表示部をさらに備える。表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。
この議事録作成システムでは、表示部は、音声認識テキストを第1のエリアに表示し、議事録を第2のエリアに表示する。例えば、端末(例えば、パーソナルコンピュータ、タブレット端末、スマートフォン等)のディスプレイの右側に音声認識テキストを表示し、端末のディスプレイの左側に議事録を表示することで、音声認識テキスト内のどの内容が選択されて議事録が作成されているかを確認することができる。このため、この議事録作成システムでは、音声認識テキスト内の議事録に残すべき内容が選択されていないことを見落とさないようにすることができる。
本発明の第3局面に係る議事録作成システムは第1局面または第2局面に係る議事録作成システムであって、情報処理部は、音声認識テキスト内の内容毎にユーザの第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキスト内の内容毎にユーザ(例えば、会議参加者等)の第1投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を選択して議事録を作成する。例えば、企業の会議において、議事録に残すべきと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長の投票は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
本発明の第4局面に係る議事録作成システムは第1局面から第3局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザによる第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容(つまり、ユーザが議事録に残すべきと判断した内容)毎にユーザ(議事録に残す投票をしたユーザや、議事録に残す投票をしていないユーザ)による第2投票をさらに受け付け、ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない。例えば、会議参加者等の投票によって議事録に残すべきと判断された内容があったとしても、「議事録に残す投票をしたが意見が変わった会議参加者等」や「その内容を議事録に残すべきではないと判断する会議参加者等」が居る場合がある。そして、これらの会議参加者等による投票を受け付けて、所定値以上の得票を獲得した内容を議事録に含めないようにすることができる。このため、この議事録作成システムでは、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録を作成することができる。
本発明の第5局面に係る議事録作成システムは第4局面に係る議事録作成システムであって、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。
この議事録作成システムでは、情報処理部は、ユーザの第1投票によって所定値以上の得票を獲得した内容毎にユーザの第2投票を受け付けて重み付けをし、重み付けされたユーザの投票による得票が所定値以上である内容を議事録に含めない。例えば、企業の会議において、議事録に残すべきではないと判断した内容に投票する場合、部長の投票は3人分であるとみなし、課長は2人分であるとみなすようにすることができる。このため、この議事録作成システムでは、影響力のある人物等の意思を反映させやすくすることができる。
本発明の第6局面に係る議事録作成システムは第1局面から第5局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。
この議事録作成システムでは、情報処理部は、音声認識テキストと議事録との関係性に基づく学習により生成されたモデルを用いて音声認識テキスト内の内容を選択して議事録を作成する。例えば、AI(Artificial Intelligence)による学習を利用して生成した学習モデルを用いることで、音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
本発明の第7局面に係る議事録作成システムは第1局面から第6局面のいずれか1局面に係る議事録作成システムであって、選択部をさらに備える。選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をする。また、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。
この議事録作成システムでは、選択部は、キーワードをあらかじめ登録したキーワード辞書の選択をし、情報処理部は、選択部で選択されたキーワード辞書に登録されたキーワードが含まれている音声認識テキスト内の内容を選択して議事録を作成する。そして、選択されたキーワード辞書に登録されているキーワードが音声認識テキスト内の内容に含まれている場合、その音声認識テキスト内の内容が自動的に選択されて議事録が作成される。このため、この議事録作成システムでは、手間をかけることなく議事録を作成することができる。
本発明の第8局面に係る議事録作成システムは第1局面から第7局面のいずれか1局面に係る議事録作成システムであって、音声認識部は、音声の音量を認識する。情報処理部は、音量が閾値以上であった音声認識テキスト内の内容を選択して議事録を作成する。
本発明の第9局面に係る議事録作成システムは第1局面から第8局面のいずれか1局面に係る議事録作成システムであって、音声認識部は、認識した音声がいずれの話者から発せられたかを特定する。また、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。
この議事録作成システムでは、情報処理部は、話者の名前を付して音声の認識結果を音声認識テキストとして出力する。このため、この議事録作成システムでは、音声認識テキスト内および議事録内において、どのユーザ(例えば、会議参加者等)による発言であるかを特定することができる。
本発明の第10局面に係る議事録作成システムは第1局面から第9局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。
この議事録作成システムでは、情報処理部は、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。このため、この議事録作成システムでは、例えば、多言語(少なくとも2つの言語以上)による会議が行われる場合に、ユーザ(例えば、会議参加者等)は、各ユーザの言語に翻訳された音声認識テキストおよび議事録を確認することができ、延いては多言語による会議を円滑に進めることができる。
本発明の第11局面に係る議事録作成システムは第10局面に係る議事録作成システムであって、情報処理部は、AI(Artificial Intelligence)を利用して生成された機械学習モデルを用いて、翻訳辞書を基に、音声認識テキストおよび議事録を音声の言語以外の言語に翻訳することが可能である。
本発明の第12局面に係る議事録作成システムは第1局面から第11局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。
この議事録作成システムでは、情報処理部は、議事録における音声認識テキスト内の内容の一部または全部を選択して議事録から削除することができる。つまり、議事録に残すべきではない内容(例えば、企業において、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録として作成されていた場合に、その内容を削除することができる。このため、この議事録作成システムでは、作成された議事録から情報漏洩等が起きることを防ぐことができる。
本発明の第13局面に係る議事録作成システムは第12局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、議事録における音声認識テキスト内の内容を選択して議事録から削除することができる。
本発明の第14局面に係る議事録作成システムは第1局面から第13局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、議事録から音声データを生成することができる。
この議事録作成システムでは、情報処理部は、議事録から音声データを生成することができる。このため、この議事録作成システムでは、会議参加者等は、視覚で確認しなくても会議の内容を把握することができる。
本発明の第15局面に係る議事録作成システムは第1局面から第14局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、音声認識辞書を基に、音声を認識する。
本発明の第16局面に係る議事録作成システムは第1局面から第15局面のいずれか1局面に係る議事録作成システムであって、情報処理部は、AIを利用して生成された機械学習モデルを用いて、変換辞書を基に、音声認識テキスト内の第1用語(例えば、企業内や業界内のみで使用される用語)を第2用語(例えば、一般的に使用される用語)に変換する。
本発明の第1実施形態に係る議事録作成システムの全体構成を示すイメージ図である。 本発明の第1実施形態に係る端末のキーワードによる議事録作成時の画面推移を示すイメージ図である。 本発明の第1実施形態に係る端末のユーザ投票による議事録作成時の画面推移を示すイメージ図である。 本発明の第1実施形態に係る端末の削除指示による画面推移を示すイメージ図である。 本発明の実施形態に係るサーバの構成を示すブロック図である。 本発明の第1実施形態に係る第1照合テーブルを示すイメージ図である。 本発明の第1実施形態に係る第2照合テーブルを示すイメージ図である。 本発明の実施形態に係る端末の構成を示すブロック図である。 本発明の第1実施形態に係る議事録作成システムの処理の流れを示すフローチャートである。 本発明の実施形態に係る議事録作成システムの機能構成を示すブロック図である。 本発明の第2実施形態に係る議事録作成システムの全体構成を示すイメージ図である。 本発明の第1実施形態に係る端末の変形例(E)適用時のユーザ投票による議事録作成時の画面推移を示すイメージ図である。
−第1実施形態−
<本発明の第1実施形態に係る議事録作成システム1の全体構成例>
本発明の第1実施形態に係る議事録作成システム1の全体構成について説明する。本発明の第1実施形態に係る議事録作成システム1は、例えば、1つの会議室において会議が行われる場合に使用されるものであって、図1に示されるように、主たる装置として、サーバ100および端末200等から構成されている。以下、これらの構成要素について詳述する。
1.サーバ
まず、本発明の第1実施形態に係る議事録作成システム1を構成するサーバ100の構成の一態様について説明する。サーバ100は、インターネットに接続され、会議参加者等の音声の認識結果を音声認識テキスト232として出力し、音声認識テキスト232内で選択した内容から議事録233を作成するサービス等を提供する。サーバ100は、図5に示されるように、主たる構成要素として、CPU(Central Processing Unit)110、メモリ120、操作部140および通信インターフェイス150を含む。
(1)CPU
CPU110は、メモリ120に記憶されているプログラムを実行することによって、サーバ100の各部を制御する。例えば、CPU110は、メモリ120に格納されているプログラムを実行し、各種のデータを参照することによって、後述する各種の処理を実行する。
(2)メモリ
メモリ120は、各種のRAM(Random Access Memory)、各種のROM(Read Only Memory)等であり、サーバ100に内包されているものであってもよいし、サーバ100の各種インターフェイスに着脱可能なものであってもよいし、サーバ100からアクセス可能な他の装置の記録媒体であってもよい。メモリ120は、CPU110によって実行されるプログラムや、CPU110によるプログラムの実行により生成されたデータ、入力されたデータ、その他の第1実施形態に係るサービスに利用されるデータベース等を記憶する。
具体的には、メモリ120は、図6および図7に示されるような第1照合テーブル121および第2照合テーブル122を記憶する。第1照合テーブル121は、使用される各マイクに、そのマイクの使用者名を関連付けている。第2照合テーブル122は、各会議参加者等に、重み係数を関連付けている。ここで、重み係数は、各会議参加者の投票(後述)に対して重み付け処理をする際に用いられるものである。例えば、図7に示されるような第2照合テーブル122を参照して重み付け処理をすることで、「田中」による投票は3人分の投票とされ、「佐藤」の投票は2人分の投票とされる。なお、サービスの管理者等は、第1照合テーブル121および第2照合テーブル122に新しいデータを追加したり、第1照合テーブル121および第2照合テーブル122に格納されているデータを変更することができる。
また、メモリ120は、キーワード辞書も記憶する。キーワード辞書は、例えば、企業内で選定した単語や用語(日付、時間または金額等の変数も含まれる)を登録したもの等であり、音声認識テキスト232のうち特定のキーワードを含んでいる音声認識テキスト232内の内容から議事録233を作成するために用いられる。なお、キーワード辞書内の単語や用語は、必要に応じて追加および変更されてメモリ120に記憶されてもよいし、新しいキーワード辞書が、必要に応じて追加されてメモリ120に記憶されてもよい。
また、メモリ120は、AI(Artificial Intelligence)を利用して生成した学習モデルも記憶する。ここで、学習モデルは、音声認識テキスト232と議事録233との関係性に基づく学習により生成されたもの等である。なお、必要に応じて、学習モデルの再学習が行われてメモリ120に記憶されてもよい。
(3)操作部
操作部140は、サービスの管理者等の命令を受け付けて、当該命令をCPU110に入力する。
(4)通信インターフェイス
通信インターフェイス150は、CPU110からのデータを、インターネット、キャリア網、ルータ等を介して、端末200等の他の装置に送信する。逆に、通信インターフェイス150は、インターネット、キャリア網、ルータ等を介して端末200等の他の装置からのデータを受信して、CPU110に受け渡す。
2.端末
次に、本発明の第1実施形態に係る議事録作成システム1を構成する端末200の一態様について説明する。端末200は、会議参加者等に使用され、主に、会議参加者等の音声を取得し、取得した音声データをサーバ100に送信したり、サーバ100から送信された音声認識結果等を受信して表示するためのものである。本発明の第1実施形態に係る議事録作成システム1おいて、端末200は、パーソナルコンピュータやタブレット端末やスマートフォン等である。また、端末200は、ルータやインターネットやキャリア網等を介して、サーバ100が提供する各種のサービスを利用可能である。端末200は、図8に示されるように、主たる構成要素として、CPU210、メモリ220、ディスプレイ230、操作部240、通信インターフェイス250、スピーカ260、マイク270およびプロジェクタ280等を含む。
(1)CPU
CPU210は、メモリ220あるいは外部の記憶媒体に記憶されているプログラムを実行することによって、端末200の各部を制御する。
(2)メモリ
メモリ220は、各種のRAMや、各種のROM等である。メモリ220は、CPU210によって実行されるプログラムや、CPU210によるプログラムの実行により生成されたデータ、入力されたデータ、サーバ100から受信したデータ、操作部240を介して入力されたデータ等を記憶する。
(3)ディスプレイ
ディスプレイ230は、CPU210からの信号に基づいて、テキスト、画像、映像等を表示する。例えば、CPU210は、通信インターフェイス250を介してサーバ100から送られてくるデータ基づいて、図2〜4に示されるような音声認識テキスト232および議事録233を同時にディスプレイ230に表示する。なお、ディスプレイ230は、タッチパネル機能を有していてもよい。
(4)操作部
操作部240は、マウス、キーボード、ボタンおよびタッチパネル等であり、ユーザからの各種命令をCPU210に入力する。
(5)通信インターフェイス
通信インターフェイス250は、無線LAN通信あるいは有線LAN等の通信モジュールである。通信インターフェイス250は、サーバ100等の他の装置との間でデータの送受信を仲介する。例えば、CPU210は、操作部240を介したキーワード辞書選択命令、その他の各種の入力情報を、通信インターフェイス250を介してサーバ100に送信したり、通信インターフェイス250を介してサーバ100から受信したデータに基づいてディスプレイ230に図2〜4に示されるような画面を表示したりする。
(6)スピーカ
スピーカ260は、CPU210からの信号に基づいて、音声を出力する。なお、音声を出力する機器は、スピーカ260に限定されていない。つまり、ヘッドホン、イヤホンまたはヘッドセット等の機器が用いられてもよい。
(7)マイク
マイク270は、会議参加者等の音声を取得する。マイク270は、有線接続または無線接続によって端末200に接続される。なお、ここで、マイク270は会議参加者数と同じ数だけ用意され、会議参加者1人に1つのマイクが用意されることが好ましい。
(8)プロジェクタ
プロジェクタ280は、図1に示されるように、ディスプレイ230に表示されている画面をスクリーンに映し出し、ディスプレイ230に表示されている画面を会議参加者が共有できるようにする場合に用いられる。
<本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要>
ここでは、図9を参照して、本発明の第1実施形態に係る議事録作成システム1の利用方法および情報処理概要について説明する。まず、会議参加者(会議主催者を含む)等は、会議が始まる前に、第1照合テーブル121(図6参照)および第2照合テーブル122(図7参照)を作成しておく。第1照合テーブル121および第2照合テーブル122は、サーバ100において作成されてサーバ100のメモリ120に記憶されてもよいし、端末200において作成されて通信インターフェイス150を介してサーバ100のメモリ120に記憶されてもよい。
また、会議参加者等は、キーワードによる議事録作成(後述)を選択する場合に備えて、会議が始まる前に端末200を用いてキーワード辞書を選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からのキーワード辞書の選択結果を受け付け、サーバ100のメモリ120に格納されているキーワード辞書を選択する。これによって、選択されたキーワード辞書を基に議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つのキーワード辞書だけを選択してもよいし、複数のキーワード辞書を選択してもよい。また、会議参加者等は、会議中にキーワード辞書を切り換えるために改めてキーワード辞書の選択を行うことができる。なお、会議参加者等は、キーワードによる議事録作成を選択しない場合、キーワード辞書の選択をしてなくてもよい。
また、会議参加者等は、AIによる議事録作成(後述)を選択する場合に備えて、端末200を用いて会議が始まる前に学習モデルを選択する。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの学習モデルの選択結果を受け付け、サーバ100のメモリ120に格納されている学習モデルを選択する。これによって、選択された学習モデルを基にAIで議事録233を作成する処理(後述)を実行することができる。なお、ここで、会議参加者等は、1つの学習モデルだけを選択してもよいし、複数の学習モデルを選択してもよい。また、会議参加者等は、会議中に学習モデルを切り換えるために改めて学習モデルの選択を行うことができる。なお、会議参加者等は、AIによる議事録作成を選択しない場合、学習モデルの選択をしてなくてもよい。
まず、会議参加者等は、会議が始まる前に端末200を用いて、図2(B)、図3(B)および図4に示されるような会議開催情報238(例えば、開催日時、開催場所、会議参加者名等)の入力を行う(ステップS102)。そして、サーバ100のCPU110が、サーバ100の通信インターフェイス150を介して端末200からの入力情報を受け付けて、会議開催情報238を記憶する。なお、この会議開催情報238は、議事録233を作成する処理(後述)が実行された際に、議事録233の一部として出力される。
会議が始まると、会議参加者毎に用意されたマイク270が、会議参加者の音声を取得する(ステップS104)。また、端末200は、会議参加者の音声が取得された後、会議参加者の音声を取得したマイク270の識別情報を、取得した音声データとともに端末200の通信インターフェイス250を介してサーバ100に送信する。
次に、サーバ100のCPU110は、受信したマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名(マイク270の使用者名)を特定する(ステップS106)。例えば、図6に示されるように、受信したマイク270の識別情報が「マイクA」である場合、サーバ100のCPU110は、取得した音声を発した会議参加者を「田中」と特定する。
次に、サーバ100のCPU110は、取得した音声の内容を認識する(ステップS108)。
次に、サーバ100のCPU110は、「会議参加者名の特定結果」および「音声の内容の認識結果」を音声認識テキスト232として出力する(ステップS110)。なお、ここで、サーバ100のCPU110は、会議参加者等が切り替わる度に音声認識テキスト232を出力してもよいし、会議参加者等の音声の内容の認識結果に応じて(例えば、会議参加者等の音声の内容の認識結果が「。」で区切られる度に)音声認識テキスト232を出力してもよい。
次に、サーバ100のCPU110は、図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bにはキーワードによる議事録作成ボタン234、AIによる議事録作成ボタン235、チェックボックス237、音声認識テキスト232等が表示される。なお、ここで、エリア231Aは特許請求の範囲に記載の「第2のエリア」に相当し、エリア231Bは特許請求の範囲に記載の「第1のエリア」に相当する。音声認識テキスト232は、時系列順に並べられて表示され、チェックボックス237は、各音声認識テキスト232の左側に隣接するように配設されている。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、Webページ231を端末200に送信する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、音声認識テキスト232を表示する(ステップS112)。なお、Webページ231ではなく議事録作成用のアプリケーション画面が、サーバ100のCPU110によって作成され、端末200のディスプレイ230に表示させてもよい。また、Webページ231は、端末200のプロジェクタ280によってスクリーンに映し出されて会議参加者に共有される。
次に、議事録233の作成を開始する場合(ステップS114にてYESである場合)、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成命令および議事録作成方法の選択結果を受け付け(ステップS116)、選択された議事録作成方法に基づいて議事録233を作成する処理を実行する。なお、議事録233を作成する処理は、会議の終了後に実行されてもよいし、会議中に実行されてもよい。
議事録233をまだ作成しない場合(ステップS114にてNOである場合)、ステップS102〜ステップS112の処理が繰り返される。
−ステップS118における処理−
図9に示されるように「キーワードによる議事録作成」が選ばれた場合、サーバ100のCPU110は、キーワード辞書を基に議事録233を自動的に作成する。より詳細には、会議参加者等は、図2に示されるように、マウスポインタ240Aを用いて「キーワードによる議事録作成ボタン234」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成する。例えば、キーワード辞書に「売上」「B社」が登録されている場合、サーバ100のCPU110は、図2に示されるように、「売上」「B社」を含んでいる破線で囲まれた音声認識テキスト232を自動的に選択する。そして、サーバ100のCPU110は、図2に示されるように、選択した音声認識テキスト232から議事録233を自動的に作成する。
−ステップS120における処理−
図9に示されるように「AIによる議事録作成」が選ばれた場合(サーバ100のCPU110がステップS120の処理を実行する場合)、サーバ100のCPU110は、学習モデルに基づいてAIで議事録233を自動的に作成する。より詳細には、会議参加者等は、マウスポインタ240Aを用いて「AIによる議事録作成ボタン235」を選ぶ(例えば、クリックする)。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基に音声認識テキスト232を選択して議事録233をAIで自動的に作成する。
−ステップS122における処理−
図9に示されるように「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、会議参加者等の投票を基に議事録233を作成する。より詳細には、各会議参加者等は、図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とし、「佐藤」による投票は2人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。なお、自身の名前の欄のチェックボックス237を選択した各会議参加者等がマウスポインタ240Aを用いて同じチェックボックス237をもう一度選択した場合、議事録233に残すべきと判断した音声認識テキスト232に対する投票を取り消す処理が行われてもよい。そして、この取り消し処理によってその音声認識テキスト232の得票が所定値以上から所定値未満になった場合、議事録233に残されていたその音声認識テキスト232は議事録233から削除されてもよい。
また、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票をさらに受け付ける。言い換えれば、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、議事録233に残すべきではないと判断する会議参加者等の投票をさらに受け付ける。なお、説明の便宜上、議事録233に残すための投票をした会議参加者等を「第1会議参加者等」と称し、議事録233に残す投票をした会議参加者等(第1会議参加者等)以外の会議参加者等を「第2会議参加者等」と称する。まず、サーバ100のCPU110は、例えば、第1会議参加者等の投票によって議事録233に残すべきと判断された各音声認識テキスト232の側に投票者切換ボタンを表示させる。そして、マウスポインタ240Aを用いて投票者切換ボタンが選ばれると、サーバ100のCPU110は、その音声認識テキスト232において、第2会議参加者等からの投票を受け付ける状態になる。例えば、議事録233に残すべきと判断された音声認識テキスト232の1つにおいて、「佐藤」および「鈴木」が第1会議参加者等であり、「田中」が第2会議参加者等である場合、「田中」からの投票を受け付ける状態になる。そして、第2会議参加者等は、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、その音声認識テキスト232に投票する。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理を行う。重み付け処理では、例えば、「田中」による投票は3人分の投票とする。そして、サーバ100のCPU110は、得票が所定値以上(例えば、3人以上)である音声認識テキスト232を議事録233に含めないようにする。なお、上述の通り、重み付け係数および得票の所定値は、会議が始まる前にあらかじめ設定されていることが好ましい。
そして、ステップS118、S120またはS122のいずれかの処理が終わると、サーバ100のCPU110は、作成した議事録233を表示するためにWebページ231を更新する。そして、端末200は、Webページ231を端末200のディスプレイ230に表示することによって、議事録233を表示する(ステップS124)。
そして、他の議事録作成方法(キーワードによる議事録作成、AIによる議事録作成およびユーザ投票による議事録作成のうち、まだ選ばれていない議事録作成方法)をさらに選ぶ場合(ステップS126にてYESである場合)、サーバ100のCPU110は、ステップS116からの処理を繰り返す。なお、他の議事録作成方法がさらに選ばれた場合であっても、他の議事録作成方法と先の議事録作成方法との両方によって選択された音声認識テキスト232は、重複して議事録233に残されない。例えば、先にステップS116においてキーワード選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択されて議事録233に残されたとする。そして、次にステップS116においてAI選択が選ばれて、「田中:1週目の売り上げが・・・」という音声認識テキスト232が選択された場合であっても、この音声認識テキスト232は重複して議事録233に残されない。
他の議事録作成方法をさらに選ばない場合(ステップS126においてNOである場合)、サーバ100のCPU110は、会議を終了させるための入力情報(例えば、会議参加者等が会議終了ボタン(図示せず)を選んだという情報)を端末200から受け付けて今回の処理を終了し、会議が継続する場合はステップS104からの処理を繰り返す。
なお、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。例えば、会議参加者等は、端末200の操作部240等を用いて、Webページ231内の音声認識テキスト232の内容の一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、音声認識テキスト232を修正する。そして、サーバ100のCPU110は、Webページ231を更新し、端末200は、修正内容が反映されたWebページ231を端末200のディスプレイ230に表示する。
なお、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。例えば、会議参加者等は、図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行う。図4では、議事録233において「鈴木」が発言した内容の一部である「えーっと」が選択されている。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除する。そして、サーバ100のCPU110は、Webページ231を更新する。端末200は、図4に示されるように、選択された内容の削除が反映されたWebページ231を端末200のディスプレイ230に表示する。
また、例えば、「議事録233」と「議事録233から削除された内容」との関係性等に基づいて、AIを利用して生成されたモデルを用いて、議事録233の内容の一部または全部が自動的に削除されてもよい。
以上の通り、本発明の第1実施形態に係る議事録作成システム1は、全体として、図10の機能ブロック図に示すように、入力装置200Aと、音声認識部100Aと、情報処理部100Bと、選択部100Cと、表示部200B等を有する。
そして、入力装置200Aは、例えば、端末200の操作部240、端末200のマイク270等である。音声認識部100Aは、例えば、サーバ100のCPU110がメモリ120のプログラム(図9のステップS106〜S108等の処理を実行するためのプログラム)を実行することによって実現される。情報処理部100Bは、例えば、サーバ100のCPU110がメモリ120のプログラム(図9のステップS110〜S122等の処理を実行するためのプログラム)を実行することによって実現される。選択部100Cは、例えば、端末200の操作部240介したキーワード辞書選択命令を受け付けたサーバ100のCPU110がメモリ120のプログラムを実行することによって実現される。表示部200Bは、例えば、端末200のディスプレイ230等である。
<本発明の第1実施形態に係る議事録作成システム1の特徴>
(1)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、図2〜4に示されるようなWebページ231を作成する。Webページ231は、エリア231Aおよびエリア231Bから構成されている。エリア231Aには議事録233が表示され、エリア231Bには音声認識テキスト232が表示される。そして、議事録233は、選択された音声認識テキスト232の内容から作成されている。このため、この議事録作成システム1では、議事録233の閲覧者が会議の要点を容易に把握することができる。また、どの音声認識テキスト232が選択されて議事録233が作成されているかを確認することができ、議事録233に残すべき音声認識テキスト232が選択されていないことを見落とさないようにすることができる。
(2)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択したキーワード辞書に登録されているキーワードが含まれている音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、この議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
(3)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、会議が始まる前に選択した学習モデルを基にAIで音声認識テキスト232を選択して議事録233を自動的に作成することができる。このため、本発明の第1実施形態に係る議事録作成システム1では、手間をかけることなく議事録233を作成することができる。
(4)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各第1会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を選択し、選択した音声認識テキスト232から議事録233を作成する。また、サーバ100のCPU110は、第1会議参加者等によって議事録233に残すべきと判断された音声認識テキスト232において、サーバ100の通信インターフェイス150を介して、各第2会議参加者等の投票を端末200から受け付け、第2照合テーブル122を参照して重み付け処理をする。そして、サーバ100のCPU110は、得票が所定値以上である音声認識テキスト232を議事録233に含めないようにする。このため、この議事録作成システム1では、影響力のある人物等の意思を反映させやすくすることができると共に、会議中に取得した発言内容のうち不必要な発言内容を除外した(必要な発言内容のみを残した)議事録233を作成することができる。
(5)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、「取得した音声を発した会議参加者名」および「取得した音声の認識結果」を音声認識テキスト232として出力する。そして、この音声認識テキスト232から議事録233が作成される。このため、この議事録作成システム1では、音声認識テキスト232内および議事録233内に示された発言がどの会議参加者等による発言であるかを特定することができる。
(6)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、音声認識テキスト232が出力された後に、必要に応じて音声認識テキスト232の内容の一部または全部を修正することができる。このため、この議事録作成システム1では、音声の認識結果に誤りがある場合、その認識結果を修正することで正しい結果を会議参加者等に伝えることができ、延いては音声の誤った認識結果から議事録233が作成されることを防止することができる。
(7)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、議事録233が作成された後に、必要に応じて議事録233の内容の一部または全部を削除することができる。つまり、議事録233に残すべきではない内容(例えば、一定の役職以上の人にのみ共有されている情報、企業秘密情報等)が選択されて議事録233として作成されていた場合に、当該内容を削除することができる。このため、この議事録作成システム1では、作成された議事録233から情報漏洩等が起きることを防ぐことができる。
<変形例>
(A)
本発明の第1実施形態に係る議事録作成システム1のサーバ100や端末200等の各装置の役割の一部または全部を他の装置が実行してもよい。例えば、図10に示される音声認識部100A、情報処理部100Bおよび選択部100Cが、端末200や他の装置によって実現されてもよい。あるいは、端末200のCPU210がメモリ220のプログラムを実行することによって、図9に示される処理の一部または全部が実現されてもよい。サーバ100のCPU110が、端末200から送信された音声データ受信し、音声の内容を認識して認識結果を音声認識テキスト232として出力していたが、例えば、端末200のCPU210が、音声の内容を認識して認識結果を音声認識テキスト232として出力してもよい。かかる場合、端末200は、端末200の通信インターフェイス250を介して音声認識テキスト232をサーバ100に送信することになる。なお、図9に示される処理の一部または全部を実行するためのプログラムを、端末200がインターネット等を介してダウンロード可能であることが好ましい。
(B)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、端末200のマイク270の識別情報を第1照合テーブル121に照合して、取得した音声を発した会議参加者名を特定していた。しかし、例えば、会議参加者の声紋データをあらかじめサーバ100のメモリ120等に記憶しておき、サーバ100のCPU110が、取得した音声を声紋データと照合して声紋認証を行い、取得した音声を発した会議参加者名(マイク270の使用者名)を認識してもよい。
(C)
本発明の第1実施形態に係る議事録作成システム1では、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの議事録作成方法の選択結果を受け付け、選択された議事録作成方法に基づいて議事録233を作成する処理を実行していた。しかし、サーバ100のCPU110は、取得した音声の音量を認識し、その音声の音量が所定値以上である場合にその音声の内容を議事録233に含めてもよい。
(D)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して、各会議参加者等の投票を端末200から受け付け、重み付け処理をしていた。しかし、サーバ100のCPU110は、各会議参加者等の投票を受け付けても、重み付け処理をしなくてもよい。
(E)
本発明の第1実施形態に係る議事録作成システム1では、ステップS116にて「ユーザ投票による議事録作成」が選ばれた場合、各会議参加者等が、図3に示されるように、マウスポインタ240Aを用いて自身の名前の欄のチェックボックス237を選択することで、議事録233に残すべきと判断した音声認識テキスト232に投票していた。しかし、会議参加者等のうち権限のある者を1人選任し、権限のある者のみが、議事録233に残すべきと判断した音声認識テキスト232を選択してもよい。かかる場合、図12に示されるように、各音声認識テキスト232の左側に隣接するようにラジオボタン236が配設され、権限のある者は、ラジオボタン236を選択することで、議事録233に残すべきと判断した音声認識テキスト232を選択して議事録233を作成するとよい。なお、各音声認識テキスト232の左側にラジオボタン236およびチェックボックス237が配設され、「権限のある者のみがラジオボタン236を選択する方法」および「各会議参加者等がチェックボックス237を選択する方法」の両方によって議事録233として残す音声認識テキスト232が決められてもよい。例えば、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票していない場合、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において各会議参加者等がチェックボックス237を選択して投票している場合、その投票による得票が所定値以上であるか所定値未満であるかにかかわらず、権限のある者がラジオボタン236を選択すればその音声認識テキスト232は議事録233として残される。また、ある音声認識テキスト232において権限のある者がラジオボタン236を選択していない場合、各会議参加者がチェックボックス237を選択して投票し、その投票による得票が所定値以上であればその音声認識テキスト232は議事録233として残される。また、権限のある者は、議事録233に残すべきと判断した音声認識テキスト232を議事録233にドラッグアンドドロップすることで議事録233を作成してもよい。
(F)
本発明の第1実施形態に係る議事録作成システム1では、会議参加者等は、図4に示されるように、マウスポインタ240Aを用いて、Webページ231内の議事録233の内容の一部または全部を選択し、選択した内容の削除指示を行っていた。そして、サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの削除指示を受け付け、選択された内容を削除していた。しかし、サーバ100のCPU110は、選択された内容の削除の可否を投票によって受け付けてもよい。そして、サーバ100のCPU110は、得票が所定値以上である場合、選択された内容を削除する。なお、サーバ100のCPU110は、投票受け付けた際に、所定の重み係数に従って各投票を重み付け処理してもよい。
(G)
本発明の第1実施形態に係る議事録作成システム1において、会議参加者等の話し方の癖、会議参加者等の方言、会議の議題、企業内や業界内でのみで使用される用語(例えば、社内用語、業界用語等)等に対応した音声認識を行うための音声認識辞書がサーバ100のメモリ120に記憶されてもよい。かかる場合、サーバ100のCPU110は、AIによる学習を利用することによって、音声認識辞書を基に、取得した音声の内容を認識する。これによって、取得した音声の内容の認識結果の精度を向上させることができる。
(H)
本発明の第1実施形態に係る議事録作成システム1において、企業内や業界内のみで使用される用語を一般的な用語に変換するための変換辞書がサーバ100のメモリ120に記憶されてもよい。これによって、企業内や業界内のみで使用される用語を知らない者が議事録233を閲覧しても会議の内容を理解することができ、変形例(I)に記載の翻訳処理時に翻訳結果の精度を向上させることができる。
(I)
本発明の第1実施形態に係る議事録作成システム1は、多言語(少なくとも2つ以上の言語)が用いられる場合であっても適用することができる。まず、会議参加者が発した音声の言語で出力された音声認識テキスト232が、1つのWebページ231内のエリア231Bに表示される。次に、音声認識テキスト232が、会議参加者が発した音声の言語以外の1または複数の言語に翻訳され、翻訳結果が、会議参加者が発した音声の言語以外の言語毎に翻訳テキストとして出力される。そして、会議参加者が発した音声の言語以外の言語毎にWebページ231が作成されて、各Webページ231内のエリア231Bに各翻訳テキストが表示される。つまり、会議で用いられる言語の数だけWebページ231が作成されて、各Webページ231が端末200に並べられて表示されることになる。このため、会議参加者等は、多言語による会議であっても、各会議参加者等の言語で議事録233を確認することができる。なお、音声認識テキスト232を取得した音声以外の言語に翻訳する処理は、サーバ100のCPU110によって行われるとよい。かかる場合、会議参加者等は、使用されるマイク毎にそのマイクの使用者名に加えてそのマイクの使用者の言語等を格納した照合テーブル(図示せず)を会議前に作成しておくとよい。これによって、会議参加者が発した音声の言語(例えば、日本語)を認識することができると共に、会議参加者が発した音声の言語を他のどの言語(例えば、英語、中国語等)に翻訳するかを認識することができる。
また、かかる場合、会議参加者等は、翻訳テキストの内容の一部または全部を必要に応じて修正してもよい。例えば、会議参加者等は、端末200の操作部240等を用いて、翻訳テキストの一部または全部を選択し、選択した内容の修正指示を行う。サーバ100のCPU110は、サーバ100の通信インターフェイス150を介して端末200からの修正指示を受け付け、翻訳テキストを修正する。これによって、誤った翻訳結果から議事録233が作成されることを防止することができる。
さらに、かかる場合、サーバ100のメモリ120は、会議の議題に適した翻訳を行うための翻訳辞書(用語、対訳データ、文章データ等)を記憶してもよい。翻訳辞書は、例えば、化学分野における専門用語に重点を置いたもの、企業や業界における専門用語重点を置いたもの等である。なお、翻訳辞書内の用語は、随時追加および変更されてメモリ120に記憶されてもよいし、新しい翻訳辞書が追加されてメモリ120に記憶されてもよい。そして、会議参加者等は、会議が始まる前に、会議の議題に適した翻訳を行うための翻訳辞書の選択を行うことになる。かかる場合、AIを利用することによって、選択された翻訳辞書を基に、翻訳処理が実行される。なお、会議参加者等は、1つの翻訳辞書だけを選択してもよいし、複数の翻訳辞書を選択してもよい。会議参加者等は、複数の翻訳辞書を選択する場合に翻訳辞書毎に優先度を設定してもよく、設定された優先度の順に翻訳処理が実行される。また、会議参加者等は、会議中であっても会議の議題が変更される場合に、翻訳辞書を切り換えるために改めて翻訳辞書の選択を行ってもよい。
(J)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、作成された議事録233から音声合成により音声データを生成してもよい。これによって、会議参加者等は、端末200(例えば、パーソナルコンピュータやタブレット端末やスマートフォン)のスピーカ260やデジタルオーディオプレーヤー等から出力される音声を聞くことで、視覚で確認しなくても会議の内容を把握することができる。
(K)
第1実施形態に係る議事録作成システム1において、サーバ100のCPU110は、議事録233に残すべきと判断された音声認識テキスト232において、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」をさらに受け付けていた。そして、サーバ100のCPU110は、その投票による得票が所定値以上である音声認識テキスト232を議事録233に含めないようにしていた。しかし、サーバ100のCPU110は、「議事録233に残すための投票をした会議参加者等以外の会議参加者等の投票」だけでなく、「議事録233に残すための投票をした会議参加者等の投票」も受け付けてもよい。これは、一度は議事録233に残すための投票をしたが議事録233に残すべきではないという考えに変わった会議参加者等からの投票を受け付けるためである。
−第2実施形態−
上記の第1実施形態に係る議事録作成システム1は、1つの会議室において会議が行われる場合に使用されるものであった。しかし、上記の技術は、例えば、図11に示されるようなウェブ会議が行われる場合であっても適用することができる。ただし、本発明の第2実施形態に係る議事録作成システム2において、端末200は、各会議参加者に1つずつ用意されており、プロジェクタ280を含まなくてもよい。本発明の第2実施形態に係る議事録作成システム2において、図11に示される各端末200が、上記の第1実施形態に係る議事録作成システム1にて説明したWebページ231を表示する。
なお、第2実施形態に係る議事録作成システム2において、上記の変形例(A)〜(K)が適用されてもよい。ただし、変形例(I)が適用される場合、会議参加者等が使用している各端末200は、会議で用いられる言語の数だけ作成されたWebページ231を並べて表示しなくてもよく、1つのWebページ231だけを表示するとよい。例えば、「日本語」を話す会議参加者等が使用している端末200には、「日本語」による自身の音声認識テキスト232と、「日本語以外の言語(例えば、英語)」を話す会議参加者の音声認識テキスト232を「日本語」に翻訳した翻訳テキストとが表示されたWebページ231が表示されればよい。
さらに、変形例(I)が適用される場合、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、修正中であることが各端末200に表示されてもよい。例えば、音声認識テキスト232または翻訳テキストの内容の一部または全部が修正されている際、「修正されている音声認識テキスト232に対応する翻訳テキスト」または「修正されている翻訳テキストに対応する音声認識テキスト232または翻訳テキスト」の横に通知マークが表示されるとよい。そして、修正が完了すると、通知マークが表示されなくなるとよい。
100 :サーバ
110 :CPU(音声認識部、情報処理部、選択部)
100A:音声認識部
100B:情報処理部
100C:選択部
200 :端末
200A:入力装置
200B:表示部
230 :ディスプレイ(表示部)
232 :音声認識テキスト
233 :議事録
270 :マイク

Claims (12)

  1. マイクで取得した音声を認識する音声認識部と、
    前記音声の認識結果を音声認識テキストとして出力し、前記音声認識テキスト内で選択した内容から議事録を作成する情報処理部と
    を備える、議事録作成システム。
  2. 前記音声認識テキストを第1のエリアに表示し、前記議事録を第2のエリアに表示する表示部をさらに備える、
    請求項1に記載の議事録作成システム。
  3. 前記情報処理部は、前記音声認識テキスト内の内容毎に1または複数のユーザによる第1投票を受け付け、前記ユーザの第1投票によって所定値以上の得票を獲得した内容を選択して議事録を作成する、
    請求項1または2に記載の議事録作成システム。
  4. 前記情報処理部は、前記音声認識テキスト内の内容毎に前記ユーザの第1投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を選択して議事録を作成する、
    請求項3に記載の議事録作成システム。
  5. 前記情報処理部は、前記ユーザの第1投票によって所定値以上の得票を獲得した内容毎に前記ユーザによる第2投票をさらに受け付け、前記ユーザの第2投票によって所定値以上の得票を獲得した内容を議事録に含めない、
    請求項3または4に記載の議事録作成システム。
  6. 前記情報処理部は、前記ユーザの第1投票によって所定値以上の得票を獲得した内容毎に前記ユーザの第2投票を受け付けて重み付けをし、重み付けされた前記ユーザの投票による得票が所定値以上である内容を議事録に含めない、
    請求項5に記載の議事録作成システム。
  7. 前記情報処理部は、前記音声認識テキストと前記議事録との関係性に基づく学習により生成されたモデルを用いて前記音声認識テキスト内の内容を選択して議事録を作成する、
    請求項1から6に記載の議事録作成システム。
  8. キーワードをあらかじめ登録したキーワード辞書の選択をする選択部をさらに備え、
    前記情報処理部は、前記選択部で選択されたキーワード辞書に登録されたキーワードが含まれている前記音声認識テキスト内の内容を選択して議事録を作成する、
    請求項1から7に記載の議事録作成システム。
  9. 前記音声認識部は、認識した前記音声がいずれの話者から発せられたかを特定し、
    前記情報処理部は、前記話者の名前を付して前記音声の認識結果を音声認識テキストとして出力する、
    請求項1から8に記載の議事録作成システム。
  10. 前記情報処理部は、前記音声認識テキストおよび前記議事録を前記音声の言語以外の言語に翻訳することが可能である、
    請求項1から9のいずれか1項に記載の議事録作成システム。
  11. 前記情報処理部は、前記議事録における前記音声認識テキスト内の内容を選択して前記議事録から削除することができる、
    請求項1から10のいずれか1項に記載の議事録作成システム。
  12. 前記情報処理部は、前記議事録から音声データを生成することができる、
    請求項1から11のいずれか1項に記載の議事録作成システム。
JP2019193392A 2019-10-24 2019-10-24 議事録作成システム Active JP6795668B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019193392A JP6795668B1 (ja) 2019-10-24 2019-10-24 議事録作成システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019193392A JP6795668B1 (ja) 2019-10-24 2019-10-24 議事録作成システム

Publications (2)

Publication Number Publication Date
JP6795668B1 JP6795668B1 (ja) 2020-12-02
JP2021067830A true JP2021067830A (ja) 2021-04-30

Family

ID=73544748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019193392A Active JP6795668B1 (ja) 2019-10-24 2019-10-24 議事録作成システム

Country Status (1)

Country Link
JP (1) JP6795668B1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102430112B1 (ko) * 2022-03-28 2022-08-05 (주) 아하 회의록을 자동으로 작성하는 방법 및 그를 이용한 전자칠판
JP2022188810A (ja) * 2021-06-10 2022-12-22 Scalably株式会社 情報処理装置及び情報処理プログラム
JP7215770B1 (ja) 2021-09-30 2023-01-31 エピックベース株式会社 情報処理システム、プログラム及び情報処理方法
WO2023157963A1 (ja) * 2022-02-21 2023-08-24 ピクシーダストテクノロジーズ株式会社 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7284204B2 (ja) * 2021-03-03 2023-05-30 ソフトバンク株式会社 情報処理装置、情報処理方法及び情報処理プログラム
CN114928713B (zh) * 2022-07-18 2022-10-21 广州市保伦电子有限公司 一种用户远程视频会议的语音分析系统

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206825A (ja) * 1989-02-06 1990-08-16 Meidensha Corp 議事録作成装置
JP2002099530A (ja) * 2000-09-22 2002-04-05 Sharp Corp 議事録作成装置及び方法並びにこれを用いた記憶媒体
JP2004213260A (ja) * 2002-12-27 2004-07-29 Csk Corp 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法
JP2007233075A (ja) * 2006-03-01 2007-09-13 Murata Mach Ltd 議事録作成装置
WO2008050649A1 (fr) * 2006-10-23 2008-05-02 Nec Corporation Système, procédé et programme de récapitulation de contenu
JP2015015632A (ja) * 2013-07-05 2015-01-22 株式会社リコー 議事録生成装置、議事録生成方法、議事録生成プログラムおよび通信会議システム
WO2016163028A1 (ja) * 2015-04-10 2016-10-13 株式会社東芝 発言提示装置、発言提示方法およびプログラム
JP2018092365A (ja) * 2016-12-02 2018-06-14 株式会社アドバンスト・メディア 情報処理システム、情報処理装置、情報処理方法及びプログラム
US20190028520A1 (en) * 2017-07-21 2019-01-24 Fiduciary.ai Inc. Ai mediated conference monitoring and document generation
JP2019061594A (ja) * 2017-09-28 2019-04-18 株式会社野村総合研究所 会議支援システムおよび会議支援プログラム
JP2019139572A (ja) * 2018-02-13 2019-08-22 キヤノン株式会社 会議システム、要約装置、会議システムの制御方法、要約装置の制御方法、並びにプログラム

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02206825A (ja) * 1989-02-06 1990-08-16 Meidensha Corp 議事録作成装置
JP2002099530A (ja) * 2000-09-22 2002-04-05 Sharp Corp 議事録作成装置及び方法並びにこれを用いた記憶媒体
JP2004213260A (ja) * 2002-12-27 2004-07-29 Csk Corp 発話文取得装置、属性付与装置、文書作成装置、発話文取得プログラム、属性付与プログラム、文書作成プログラムおよび情報処理方法
JP2007233075A (ja) * 2006-03-01 2007-09-13 Murata Mach Ltd 議事録作成装置
WO2008050649A1 (fr) * 2006-10-23 2008-05-02 Nec Corporation Système, procédé et programme de récapitulation de contenu
JP2015015632A (ja) * 2013-07-05 2015-01-22 株式会社リコー 議事録生成装置、議事録生成方法、議事録生成プログラムおよび通信会議システム
WO2016163028A1 (ja) * 2015-04-10 2016-10-13 株式会社東芝 発言提示装置、発言提示方法およびプログラム
JP2018092365A (ja) * 2016-12-02 2018-06-14 株式会社アドバンスト・メディア 情報処理システム、情報処理装置、情報処理方法及びプログラム
US20190028520A1 (en) * 2017-07-21 2019-01-24 Fiduciary.ai Inc. Ai mediated conference monitoring and document generation
JP2019061594A (ja) * 2017-09-28 2019-04-18 株式会社野村総合研究所 会議支援システムおよび会議支援プログラム
JP2019139572A (ja) * 2018-02-13 2019-08-22 キヤノン株式会社 会議システム、要約装置、会議システムの制御方法、要約装置の制御方法、並びにプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
三浦 寛也、外1名: "議事録生成技術に関するサーベイ", 言語・音声理解と対話処理研究会資料,SIG−SLUD−B507−06, JPN7020002148, 21 July 2017 (2017-07-21), pages 34 - 38, ISSN: 0004310675 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022188810A (ja) * 2021-06-10 2022-12-22 Scalably株式会社 情報処理装置及び情報処理プログラム
JP7215770B1 (ja) 2021-09-30 2023-01-31 エピックベース株式会社 情報処理システム、プログラム及び情報処理方法
WO2023053940A1 (ja) * 2021-09-30 2023-04-06 エピックベース株式会社 情報処理システム、プログラム及び情報処理方法
JP2023051656A (ja) * 2021-09-30 2023-04-11 エピックベース株式会社 情報処理システム、プログラム及び情報処理方法
WO2023157963A1 (ja) * 2022-02-21 2023-08-24 ピクシーダストテクノロジーズ株式会社 情報処理装置、情報処理方法、及びプログラム
JP7399413B1 (ja) * 2022-02-21 2023-12-18 ピクシーダストテクノロジーズ株式会社 情報処理装置、情報処理方法、及びプログラム
KR102430112B1 (ko) * 2022-03-28 2022-08-05 (주) 아하 회의록을 자동으로 작성하는 방법 및 그를 이용한 전자칠판
KR102446681B1 (ko) * 2022-03-28 2022-09-26 (주) 아하 회의록의 주제를 자동으로 결정하여 회의록을 작성하는 방법 및 그 전자칠판
KR102446682B1 (ko) * 2022-03-28 2022-09-26 (주) 아하 다양한 언어로 진행되는 회의에서 회의록을 자동으로 작성하는 방법 및 그 전자칠판
KR102446683B1 (ko) * 2022-03-28 2022-09-26 (주) 아하 인공지능 기반의 음성인식으로 참여자를 특정하고 회의록을 자동으로 작성하는 방법 및 그 전자칠판

Also Published As

Publication number Publication date
JP6795668B1 (ja) 2020-12-02

Similar Documents

Publication Publication Date Title
JP6795668B1 (ja) 議事録作成システム
US11699456B2 (en) Automated transcript generation from multi-channel audio
CN205647778U (zh) 一种智能会议系统
EP2157571A2 (en) Automatic answering device, automatic answering system, conversation scenario editing device, conversation server, and automatic answering method
US20020046206A1 (en) Method and apparatus for interpretation
JP7229821B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP2009140467A (ja) 編集可能な個人辞書を提供して活用する方法及びシステム
JP2013250931A (ja) 情報取得システム、プログラム、サーバ、情報取得方法
JP6648876B1 (ja) 会話制御プログラム、会話制御方法および情報処理装置
US20050209859A1 (en) Method for aiding and enhancing verbal communication
JP2009122839A (ja) 電子会議支援システム
JP6091690B1 (ja) 議会運営支援システム及び議会運営支援方法
JP7417272B2 (ja) 端末装置、サーバ装置、配信方法、学習器取得方法、およびプログラム
JP2008011272A (ja) 会議システム及び制御方法、並びにプログラム及び記憶媒体
JP2019145944A (ja) 音響出力システム、音響出力方法及びプログラム
Yeratziotis et al. Making social media applications inclusive for deaf end-users with access to sign language
Walter-Tscharf Multi-tenant Cloud SaaS Application for a meeting to task transition via deep learning models
WO2020241701A1 (ja) コミュニケーション管理装置
JP7284204B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN111324719A (zh) 用于法律咨询的模糊识别系统
US11605139B1 (en) Method of collating, abstracting, and delivering worldwide viewpoints
JP7163968B2 (ja) サーバ装置、会議支援システム、会議支援方法及びプログラム
JP7169031B1 (ja) プログラム、情報処理装置、情報処理システム、情報処理方法、情報処理端末
JP7344612B1 (ja) プログラム、会話要約装置、および会話要約方法
JP2020042471A (ja) 情報共有支援装置、情報共有支援方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200521

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200521

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200624

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200728

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201112

R150 Certificate of patent or registration of utility model

Ref document number: 6795668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250