JP6470097B2 - 通訳装置、方法およびプログラム - Google Patents
通訳装置、方法およびプログラム Download PDFInfo
- Publication number
- JP6470097B2 JP6470097B2 JP2015087637A JP2015087637A JP6470097B2 JP 6470097 B2 JP6470097 B2 JP 6470097B2 JP 2015087637 A JP2015087637 A JP 2015087637A JP 2015087637 A JP2015087637 A JP 2015087637A JP 6470097 B2 JP6470097 B2 JP 6470097B2
- Authority
- JP
- Japan
- Prior art keywords
- machine translation
- translation result
- words
- result
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title description 24
- 238000013519 translation Methods 0.000 claims description 144
- 238000004364 calculation method Methods 0.000 claims description 38
- 238000012545 processing Methods 0.000 claims description 19
- 230000006870 function Effects 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000033772 system development Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/055—Time compression or expansion for synchronising with other signals, e.g. video signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Description
図1に例示されるように、第1の実施形態に係る通訳装置100は、音声入力部101と、音声認識部102と、機械翻訳部103と、単語数算出部104と、省略文生成部105と、出力部106と、制御部107とを備える。通訳装置100は、制御部107によって各部の動作が制御される。
101・・・音声入力部
102・・・音声認識部
103・・・機械翻訳部
104・・・単語数算出部
105・・・省略文生成部
106・・・出力部
107・・・制御部
Claims (10)
- 入力された発話音声に音声認識処理を行うことによって音声認識結果を生成する音声認識部と、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成する翻訳部と、
前記機械翻訳結果が生成された第1の時刻と当該機械翻訳結果よりも過去に生成された他の機械翻訳結果に関する出力が終了する第2の時刻とに基づいて、0個以上の単語数を算出する算出部と、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成する生成部と
を具備する、通訳装置。 - 前記算出部は、前記機械翻訳結果が生成されてから前記他の機械翻訳結果に関する出力が終了するまでの遅延時間に基づいて、前記単語数を算出する、請求項1に記載の通訳装置。
- 前記算出部は、前記機械翻訳結果に含まれる総単語数に応じた時間長と、前記発話音声の入力が終了した第3の時刻と、当該発話音声の入力が終了してから前記省略文の出力が終了するまでの許容遅延時間とにさらに基づいて、前記単語数を算出する、請求項1に記載の通訳装置。
- 前記生成部は、情報の新旧および予め用意された単語リストの少なくとも1つに基づく単語の重要度を用いて、前記機械翻訳結果から省略される単語を決定する、請求項1に記載の通訳装置。
- 入力された発話音声に音声認識処理を行うことによって音声認識結果を生成する音声認識部と、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成する翻訳部と、
前記発話音声の入力が継続した時間長と、前記機械翻訳結果に含まれる総単語数に応じた時間長とに基づいて、0個以上の単語数を算出する算出部と、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成する生成部と
を具備する、通訳装置。 - 前記生成部は、情報の新旧および予め用意された単語リストの少なくとも1つに基づく単語の重要度を用いて、前記機械翻訳結果から省略される単語を決定する、請求項5に記載の通訳装置。
- 入力された発話音声に音声認識処理を行うことによって音声認識結果を生成することと、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成することと、
前記機械翻訳結果が生成された第1の時刻と当該機械翻訳結果よりも過去に生成された他の機械翻訳結果に関する出力が終了する第2の時刻とに基づいて、0個以上の単語数を算出することと、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成することと
を具備する、通訳方法。 - コンピュータを、
入力された発話音声に音声認識処理を行うことによって音声認識結果を生成する手段と、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成する手段と、
前記機械翻訳結果が生成された第1の時刻と当該機械翻訳結果よりも過去に生成された他の機械翻訳結果に関する出力が終了する第2の時刻とに基づいて、0個以上の単語数を算出する手段と、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成する手段
として機能させる、通訳プログラム。 - 入力された発話音声に音声認識処理を行うことによって音声認識結果を生成することと、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成することと、
前記発話音声の入力が継続した時間長と、前記機械翻訳結果に含まれる総単語数に応じた時間長とに基づいて、0個以上の単語数を算出することと、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成することと
を具備する、通訳方法。 - コンピュータを、
入力された発話音声に音声認識処理を行うことによって音声認識結果を生成する手段と、
前記音声認識結果を第1の言語から第2の言語に機械翻訳することによって機械翻訳結果を生成する手段と、
前記発話音声の入力が継続した時間長と、前記機械翻訳結果に含まれる総単語数に応じた時間長とに基づいて、0個以上の単語数を算出する手段と、
少なくとも前記単語数の単語を前記機械翻訳結果から省略することによって、前記発話音声に対応付けて出力される省略文を生成する手段
として機能させる、通訳プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015087637A JP6470097B2 (ja) | 2015-04-22 | 2015-04-22 | 通訳装置、方法およびプログラム |
US15/064,965 US9588967B2 (en) | 2015-04-22 | 2016-03-09 | Interpretation apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015087637A JP6470097B2 (ja) | 2015-04-22 | 2015-04-22 | 通訳装置、方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016206929A JP2016206929A (ja) | 2016-12-08 |
JP6470097B2 true JP6470097B2 (ja) | 2019-02-13 |
Family
ID=57146852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015087637A Active JP6470097B2 (ja) | 2015-04-22 | 2015-04-22 | 通訳装置、方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9588967B2 (ja) |
JP (1) | JP6470097B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9946712B2 (en) * | 2013-06-13 | 2018-04-17 | Google Llc | Techniques for user identification of and translation of media |
JP2017167805A (ja) | 2016-03-16 | 2017-09-21 | 株式会社東芝 | 表示支援装置、方法およびプログラム |
KR102449875B1 (ko) | 2017-10-18 | 2022-09-30 | 삼성전자주식회사 | 음성 신호 번역 방법 및 그에 따른 전자 장치 |
US11361168B2 (en) | 2018-10-16 | 2022-06-14 | Rovi Guides, Inc. | Systems and methods for replaying content dialogue in an alternate language |
CN110085252A (zh) * | 2019-03-28 | 2019-08-02 | 体奥动力(北京)体育传播有限公司 | 赛事制作中心集中控制系统的声画延时调整方法 |
US20220284196A1 (en) * | 2019-08-23 | 2022-09-08 | Sony Group Corporation | Electronic device, method and computer program |
KR20210032809A (ko) * | 2019-09-17 | 2021-03-25 | 삼성전자주식회사 | 동시 통역 방법 및 장치 |
US11295081B1 (en) * | 2019-09-27 | 2022-04-05 | Amazon Technologies, Inc. | Systems, methods, and apparatuses for controlling output length in neural machine translation |
KR102390187B1 (ko) * | 2020-05-27 | 2022-04-25 | 네이버 주식회사 | 회의보조용 번역 도구를 위한 방법 및 시스템 |
CN111753558B (zh) * | 2020-06-23 | 2022-03-04 | 北京字节跳动网络技术有限公司 | 视频翻译方法和装置、存储介质和电子设备 |
KR20230067321A (ko) * | 2021-11-09 | 2023-05-16 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0785242B2 (ja) * | 1993-02-09 | 1995-09-13 | 日本電気株式会社 | 機械翻訳方式 |
JPH08212228A (ja) | 1995-02-02 | 1996-08-20 | Sanyo Electric Co Ltd | 要約文作成装置および要約音声作成装置 |
JP2758851B2 (ja) | 1995-03-28 | 1998-05-28 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 自動翻訳装置及び自動通訳装置 |
JP3059398B2 (ja) | 1997-03-04 | 2000-07-04 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 自動通訳装置 |
US6279018B1 (en) | 1998-12-21 | 2001-08-21 | Kudrollis Software Inventions Pvt. Ltd. | Abbreviating and compacting text to cope with display space constraint in computer software |
JP3946916B2 (ja) * | 1999-10-12 | 2007-07-18 | 東芝ソリューション株式会社 | 翻訳システムおよび記録媒体 |
JP2001175280A (ja) | 1999-12-17 | 2001-06-29 | Nippon Hoso Kyokai <Nhk> | 字幕表示装置および字幕制御用記憶媒体 |
US7035804B2 (en) * | 2001-04-26 | 2006-04-25 | Stenograph, L.L.C. | Systems and methods for automated audio transcription, translation, and transfer |
CN1894740B (zh) * | 2003-12-12 | 2012-07-04 | 日本电气株式会社 | 信息处理系统、信息处理方法以及信息处理用程序 |
JP4852918B2 (ja) | 2005-07-22 | 2012-01-11 | 富士ゼロックス株式会社 | 翻訳装置、翻訳方法およびプログラム |
US7860719B2 (en) * | 2006-08-19 | 2010-12-28 | International Business Machines Corporation | Disfluency detection for a speech-to-speech translation system using phrase-level machine translation with weighted finite state transducers |
JP4271224B2 (ja) * | 2006-09-27 | 2009-06-03 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム |
JP4481972B2 (ja) * | 2006-09-28 | 2010-06-16 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム |
US8090570B2 (en) * | 2006-10-26 | 2012-01-03 | Mobile Technologies, Llc | Simultaneous translation of open domain lectures and speeches |
US9128926B2 (en) * | 2006-10-26 | 2015-09-08 | Facebook, Inc. | Simultaneous translation of open domain lectures and speeches |
US20080300852A1 (en) * | 2007-05-30 | 2008-12-04 | David Johnson | Multi-Lingual Conference Call |
US20080300872A1 (en) * | 2007-05-31 | 2008-12-04 | Microsoft Corporation | Scalable summaries of audio or visual content |
US9547642B2 (en) * | 2009-06-17 | 2017-01-17 | Empire Technology Development Llc | Voice to text to voice processing |
JP5014449B2 (ja) | 2010-02-26 | 2012-08-29 | シャープ株式会社 | 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム |
US9798722B2 (en) * | 2013-02-27 | 2017-10-24 | Avaya Inc. | System and method for transmitting multiple text streams of a communication in different languages |
KR20140121516A (ko) * | 2013-04-05 | 2014-10-16 | 이현철 | 실시간 통역 자막 제공 시스템 및 방법 |
JP2015060332A (ja) * | 2013-09-18 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
JP6235280B2 (ja) | 2013-09-19 | 2017-11-22 | 株式会社東芝 | 音声同時処理装置、方法およびプログラム |
JP2015153408A (ja) * | 2014-02-19 | 2015-08-24 | 株式会社リコー | 翻訳システム、翻訳処理装置、及び翻訳処理プログラム |
JP2016057986A (ja) | 2014-09-11 | 2016-04-21 | 株式会社東芝 | 音声翻訳装置、方法およびプログラム |
JP6334354B2 (ja) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | 機械翻訳装置、方法およびプログラム |
-
2015
- 2015-04-22 JP JP2015087637A patent/JP6470097B2/ja active Active
-
2016
- 2016-03-09 US US15/064,965 patent/US9588967B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9588967B2 (en) | 2017-03-07 |
US20160314116A1 (en) | 2016-10-27 |
JP2016206929A (ja) | 2016-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6470097B2 (ja) | 通訳装置、方法およびプログラム | |
EP3387646B1 (en) | Text-to-speech processing system and method | |
JP6471074B2 (ja) | 機械翻訳装置、方法及びプログラム | |
US9202466B2 (en) | Spoken dialog system using prominence | |
US8626510B2 (en) | Speech synthesizing device, computer program product, and method | |
KR20220038514A (ko) | 엔드-투-엔드 모델들에서 교차-언어 음성 인식을 위한 음소-기반 컨텍스트화 | |
JP6580882B2 (ja) | 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム | |
JP6235280B2 (ja) | 音声同時処理装置、方法およびプログラム | |
JP2016061970A (ja) | 音声対話装置、方法およびプログラム | |
JPWO2009081895A1 (ja) | 音声認識システム、音声認識方法、および音声認識用プログラム | |
JP2016062357A (ja) | 音声翻訳装置、方法およびプログラム | |
JP2013152365A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
CN110599998A (zh) | 一种语音数据生成方法及装置 | |
JP2020154076A (ja) | 推論器、学習方法および学習プログラム | |
JP2013025763A (ja) | 書き起こし支援システムおよび書き起こし支援方法 | |
JP6552999B2 (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JPWO2020036195A1 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
US20190088258A1 (en) | Voice recognition device, voice recognition method, and computer program product | |
JP5293478B2 (ja) | 音声認識用の閾値管理プログラム、音声認識用の閾値管理方法、音声認識装置 | |
JP5334716B2 (ja) | 文字情報提示制御装置及びプログラム | |
KR20150027465A (ko) | 외국어 고유명사에 대한 다중 발음열 생성 방법 및 장치 | |
Bansal et al. | Study of speech recognition system based on transformer and connectionist temporal classification models for low resource language | |
WO2021059968A1 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
WO2016151692A1 (ja) | タグ付与支援装置、方法およびプログラム | |
JP5871781B2 (ja) | 言語モデル作成装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180205 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190117 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6470097 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |