JP6511189B1 - 情報処理システムおよび文字起こし方法 - Google Patents
情報処理システムおよび文字起こし方法 Download PDFInfo
- Publication number
- JP6511189B1 JP6511189B1 JP2018204832A JP2018204832A JP6511189B1 JP 6511189 B1 JP6511189 B1 JP 6511189B1 JP 2018204832 A JP2018204832 A JP 2018204832A JP 2018204832 A JP2018204832 A JP 2018204832A JP 6511189 B1 JP6511189 B1 JP 6511189B1
- Authority
- JP
- Japan
- Prior art keywords
- data
- section
- voice data
- voice
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013518 transcription Methods 0.000 title claims abstract description 72
- 230000035897 transcription Effects 0.000 title claims abstract description 72
- 230000010365 information processing Effects 0.000 title claims description 15
- 238000000034 method Methods 0.000 title description 10
- 238000011156 evaluation Methods 0.000 claims description 37
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000007726 management method Methods 0.000 description 28
- 238000012986 modification Methods 0.000 description 15
- 230000004048 modification Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
Images
Landscapes
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (6)
- 文字起こしの対象の音声が録音された対象音声データを記憶する第1記憶部と、
ダミーの音声が録音されたダミー音声データを記憶する第2記憶部と、
前記対象音声データを複数の区間に係る複数の区間音声データに分割する分割部と、
前記複数の区間音声データの少なくとも1つと前記ダミー音声データの組を外部装置へ提供する提供部と、
前記複数の区間音声データの少なくとも1つをもとに文字起こししたテキストデータと、前記ダミー音声データをもとに文字起こししたテキストデータとを受け付ける受付部と、
前記受付部が受け付けたテキストデータのうち、前記複数の区間音声データの少なくとも1つをもとに文字起こししたテキストデータを用いて、前記対象の音声を文字起こししたテキストデータを生成する生成部と、
前記ダミー音声データに録音された予め定められた音声の内容を示すテキストデータを記憶する第3記憶部と、
評価部と、
を備え、
前記提供部は、1つの外部装置に対して異なる対象音声データを起原とする複数の区間音声データを提供する場合、同じ組織に関する異なる対象音声データを起原とする複数の区間音声データを提供することより、異なる組織に関する異なる対象音声データを起原とする複数の区間音声データを提供することを優先し、
前記評価部は、前記第3記憶部に記憶されたテキストデータと、前記受付部が受け付けた、前記ダミー音声データを文字起こししたテキストデータとを比較することにより、文字起こしを行った主体を評価し、
前記提供部は、前記評価部による或る主体に対する評価値が所定の閾値より低い場合、前記或る主体に対して提供した区間音声データを他の主体へ提供することにより、その区間音声データの文字起こしを前記或る主体に代えて前記他の主体へ依頼することを特徴とする情報処理システム。 - 前記分割部は、前記対象音声データにおける1つの区間の終了位置を決定する場合、予め定められた区間の最大長以内で音量が所定の閾値未満の時点を、前記終了位置として決定することを特徴とする請求項1に記載の情報処理システム。
- 前記提供部は、前記外部装置が複数存在する場合、1つの外部装置に対して、前記複数の区間音声データのうち一部の区間音声データと前記ダミー音声データの組を提供することを特徴とする請求項1または2に記載の情報処理システム。
- 複数の対象音声データのうち少なくとも1つの対象音声データを変換することにより、前記複数の対象音声データの声質を均質化させる変換部をさらに備えることを特徴とする請求項1から3のいずれかに記載の情報処理システム。
- 前記分割部は、前記対象音声データを分割して、第1区間に係る第1区間音声データと、前記第1区間の直後の第2区間に係る第2区間音声データを生成する場合、前記第1区間の一部と、前記第2区間の一部を重複させることを特徴とする請求項1から4のいずれかに記載の情報処理システム。
- 文字起こしの対象の音声が録音された対象音声データと、ダミーの音声が録音されたダミー音声データと、前記ダミー音声データに録音された予め定められた音声の内容を示すダミー音声テキストデータとを記憶する情報処理システムが、
前記対象音声データを複数の区間に係る複数の区間音声データに分割するステップと、
前記複数の区間音声データの少なくとも1つと前記ダミー音声データの組を外部装置へ提供するステップと、
前記複数の区間音声データの少なくとも1つをもとに文字起こししたテキストデータと、前記ダミー音声データをもとに文字起こししたテキストデータの両方を受け付けるステップと、
受け付けたテキストデータのうち、前記複数の区間音声データの少なくとも1つをもとに文字起こししたテキストデータを用いて、前記対象の音声を文字起こししたテキストデータを生成するステップと、
を実行し、
前記提供するステップは、1つの外部装置に対して異なる対象音声データを起原とする複数の区間音声データを提供する場合、同じ組織に関する異なる対象音声データを起原とする複数の区間音声データを提供することより、異なる組織に関する異なる対象音声データを起原とする複数の区間音声データを提供することを優先し、
前記情報処理システムが、
予め記憶されたダミー音声テキストデータと、前記受け付けるステップで受け付けられた、前記ダミー音声データを文字起こししたテキストデータとを比較することにより、文字起こしを行った主体を評価するステップと、
前記評価するステップにて或る主体に対する評価値が所定の閾値より低い場合、前記或る主体に対して提供した区間音声データを他の主体へ提供することにより、その区間音声データの文字起こしを前記或る主体に代えて前記他の主体へ依頼するステップと、をさらに実行することを特徴とする文字起こし方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204832A JP6511189B1 (ja) | 2018-10-31 | 2018-10-31 | 情報処理システムおよび文字起こし方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204832A JP6511189B1 (ja) | 2018-10-31 | 2018-10-31 | 情報処理システムおよび文字起こし方法 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019072482A Division JP7106124B2 (ja) | 2019-04-05 | 2019-04-05 | 情報処理システムおよび文字起こし方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP6511189B1 true JP6511189B1 (ja) | 2019-05-15 |
JP2020072367A JP2020072367A (ja) | 2020-05-07 |
Family
ID=66530677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018204832A Active JP6511189B1 (ja) | 2018-10-31 | 2018-10-31 | 情報処理システムおよび文字起こし方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6511189B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021181451A1 (ja) * | 2020-03-09 | 2021-09-16 | 日本電気株式会社 | 音声認識装置、制御方法、及びプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008107624A (ja) * | 2006-10-26 | 2008-05-08 | Kddi Corp | 文字起こしシステム |
JP5092720B2 (ja) * | 2007-12-04 | 2012-12-05 | 富士通株式会社 | 商品説明内容書き起こし支援プログラム、装置、および、方法。 |
JP5184071B2 (ja) * | 2007-12-27 | 2013-04-17 | 株式会社エヌ・ティ・ティ・データ | 書き起こしテキスト作成支援装置、書き起こしテキスト作成支援プログラム、及び書き起こしテキスト作成支援方法 |
JP4958120B2 (ja) * | 2009-02-24 | 2012-06-20 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 支援装置、支援プログラム、および支援方法 |
JP5646568B2 (ja) * | 2012-09-24 | 2014-12-24 | ヤフー株式会社 | 作業評価指標生成装置 |
JP6430137B2 (ja) * | 2014-03-25 | 2018-11-28 | 株式会社アドバンスト・メディア | 音声書起支援システム、サーバ、装置、方法及びプログラム |
JP2017090716A (ja) * | 2015-11-11 | 2017-05-25 | 株式会社フュートレック | 書き起こしテキスト作成支援システム、書き起こしテキスト作成支援方法及び書き起こしテキスト作成支援プログラム |
-
2018
- 2018-10-31 JP JP2018204832A patent/JP6511189B1/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021181451A1 (ja) * | 2020-03-09 | 2021-09-16 | 日本電気株式会社 | 音声認識装置、制御方法、及びプログラム |
JPWO2021181451A1 (ja) * | 2020-03-09 | 2021-09-16 | ||
JP7501610B2 (ja) | 2020-03-09 | 2024-06-18 | 日本電気株式会社 | 音声認識装置、制御方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020072367A (ja) | 2020-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11417343B2 (en) | Automatic speaker identification in calls using multiple speaker-identification parameters | |
CN103455592B (zh) | 一种问答方法、装置及系统 | |
US9047868B1 (en) | Language model data collection | |
US11521642B2 (en) | Systems and methods for classification and rating of calls based on voice and text analysis | |
CN105957515A (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
CN110289015B (zh) | 一种音频处理方法、装置、服务器、存储介质及系统 | |
US8868419B2 (en) | Generalizing text content summary from speech content | |
JP6511189B1 (ja) | 情報処理システムおよび文字起こし方法 | |
JP4250938B2 (ja) | コミュニケーション支援方法およびコミュニケーションサーバ | |
US11488604B2 (en) | Transcription of audio | |
JP7106124B2 (ja) | 情報処理システムおよび文字起こし方法 | |
JP2019220067A (ja) | 会議システム、会議サーバ及びプログラム | |
KR20160056104A (ko) | 사용자 음색 분석 장치 및 음색 분석 방법 | |
CN113438374B (zh) | 智能外呼处理方法、装置、设备及存储介质 | |
CN112597374B (zh) | 一种互联网信息资源的分配方法及装置 | |
CN114188041B (zh) | 以远程对话方式完成医患业务的医疗系统 | |
López Gambino et al. | Testing strategies for bridging time-to-content in spoken dialogue Systems | |
JP6993034B1 (ja) | コンテンツ再生方法、及びコンテンツ再生システム | |
JPH07199989A (ja) | 音声認識装置 | |
WO2023119521A1 (ja) | 可視化情報生成装置、可視化情報生成方法、及びプログラム | |
JP7389070B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
CN110489738B (zh) | 一种信息处理方法、电子设备及计算机存储介质 | |
JP7503939B2 (ja) | 情報処理装置、プログラム、および情報処理方法 | |
JP2002304194A (ja) | 音声及び/又は口形状入力のためのシステム、方法、プログラム | |
TWI767498B (zh) | 整合機器學習的跨通路人工智慧對話式平台及其運作方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181101 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20181101 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511189 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |