RU2012149444A - Создание заметок с использованием голосового потока - Google Patents
Создание заметок с использованием голосового потока Download PDFInfo
- Publication number
- RU2012149444A RU2012149444A RU2012149444/08A RU2012149444A RU2012149444A RU 2012149444 A RU2012149444 A RU 2012149444A RU 2012149444/08 A RU2012149444/08 A RU 2012149444/08A RU 2012149444 A RU2012149444 A RU 2012149444A RU 2012149444 A RU2012149444 A RU 2012149444A
- Authority
- RU
- Russia
- Prior art keywords
- text
- text block
- block
- user
- stream
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract 15
- 238000006243 chemical reaction Methods 0.000 claims abstract 7
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
1. Способ обеспечения создания заметок с использованием голосового потока, содержащий этапы, на которых:записывают аудиопоток, ассоциированный с по меньшей мере одним говорящим;преобразуют аудиопоток в по меньшей мере один текстовый блок;принимают по меньшей мере один ввод текста от пользователя;определяют, ассоциирован ли этот по меньшей мере один ввод текста от пользователя с упомянутым по меньшей мере одним текстовым блоком, ив ответ на определение того, что по меньшей мере один ввод текста от пользователя ассоциирован с по меньшей мере одним текстовым блоком, отображают упомянутый по меньшей мере один текстовый блок для пользователя в качестве рекомендуемого.2. Способ по п.1, в котором при преобразовании аудиопотока в по меньшей мере один текстовый блок:выполняют преобразование речи в текст в отношении аудиопотока иидентифицируют по меньшей мере одну границу текстового блока согласно по меньшей мере одному из следующего: граница фразы, граница предложения и граница по времени.3. Способ по п.1, дополнительно содержащий этапы, на которых:принимают выбор отображенного по меньшей мере одного текстового блока от пользователя; ивставляют отображенный по меньшей мере один текстовый блок в электронный документ.4. Способ по п.1, дополнительно содержащий этапы, на которых:идентифицируют множество текстовых блоков, полученных посредством преобразования, которые по меньшей мере частично совпадают с упомянутым по меньшей мере одним вводом текста, иотображают упомянутое множество текстовых блоков, полученных посредством преобразования, для пользователя в качестве выбираемого списка.5. Способ по п.4, в котором кажд
Claims (10)
1. Способ обеспечения создания заметок с использованием голосового потока, содержащий этапы, на которых:
записывают аудиопоток, ассоциированный с по меньшей мере одним говорящим;
преобразуют аудиопоток в по меньшей мере один текстовый блок;
принимают по меньшей мере один ввод текста от пользователя;
определяют, ассоциирован ли этот по меньшей мере один ввод текста от пользователя с упомянутым по меньшей мере одним текстовым блоком, и
в ответ на определение того, что по меньшей мере один ввод текста от пользователя ассоциирован с по меньшей мере одним текстовым блоком, отображают упомянутый по меньшей мере один текстовый блок для пользователя в качестве рекомендуемого.
2. Способ по п.1, в котором при преобразовании аудиопотока в по меньшей мере один текстовый блок:
выполняют преобразование речи в текст в отношении аудиопотока и
идентифицируют по меньшей мере одну границу текстового блока согласно по меньшей мере одному из следующего: граница фразы, граница предложения и граница по времени.
3. Способ по п.1, дополнительно содержащий этапы, на которых:
принимают выбор отображенного по меньшей мере одного текстового блока от пользователя; и
вставляют отображенный по меньшей мере один текстовый блок в электронный документ.
4. Способ по п.1, дополнительно содержащий этапы, на которых:
идентифицируют множество текстовых блоков, полученных посредством преобразования, которые по меньшей мере частично совпадают с упомянутым по меньшей мере одним вводом текста, и
отображают упомянутое множество текстовых блоков, полученных посредством преобразования, для пользователя в качестве выбираемого списка.
5. Способ по п.4, в котором каждый из множества текстовых блоков, полученных посредством преобразования, отображается в выбираемом списке в хронологическом порядке.
6. Способ по п.5, в котором каждый из множества текстовых блоков, полученных посредством преобразования, отображается в выбираемом списке в обратном хронологическом порядке.
7. Машиночитаемый носитель, который хранит набор инструкций, которыми при их исполнении выполняется способ обеспечения создания заметок с использованием голосового потока, причем способ, осуществляемый посредством данного набора инструкций, содержит этапы, на которых:
записывают голосовой поток в буфер;
преобразуют голосовой поток в текстовый поток;
идентифицируют по меньшей мере один текстовый блок, ассоциированный с текстовым потоком;
принимают ввод текста в электронный документ от пользователя;
определяют, является ли ввод текста по меньшей мере частично совпадающим с этим по меньшей мере одним текстовым блоком;
в ответ на определение того, что ввод текста по меньшей мере частично совпадает с по меньшей мере одним текстовым блоком, отображают данный по меньшей мере один текстовый блок для пользователя в качестве выбираемого элемента;
принимают выбор отображенного по меньшей мере одного текстового блока от пользователя; и
вставляют упомянутый по меньшей мере один текстовый блок в электронный документ.
8. Машиночитаемый носитель по п.7, в котором способ дополнительно содержит этап, на котором:
идентифицируют множество текстовых блоков, ассоциированных с текстовым потоком, причем каждый из множества текстовых блоков идентифицируется согласно по меньшей мере одной границе, причем эта по меньшей мере одна граница содержит по меньшей мере одно из следующего: пауза в записанном голосовом потоке, граница предложения, связующее слово в текстовом потоке и граница фразы.
9. Машиночитаемый носитель по п.8, в котором способ дополнительно содержит этапы, на которых:
отображают каждый из множества текстовых блоков, которые по меньшей мере частично совпадают с вводом текста, для пользователя в виде списка выбираемых элементов;
принимают второй ввод текста от пользователя; и
удаляют из списка выбираемых элементов любые из отображаемого множества текстовых блоков, которые даже по меньшей мере частично не совпадают со вторым вводом текста.
10. Система для обеспечения создания заметок с использованием голосового потока, содержащая:
запоминающее устройство; и
процессор, соединенный с запоминающим устройством, причем процессор выполнен с возможностью:
записывать речевой поток в буфер, причем буфер содержит объем памяти в запоминающем устройстве, достаточный для хранения конфигурируемого периода времени записанного речевого потока,
преобразовывать записанный речевой поток, сохраненный в буфере, в соответствующий текстовый поток, содержащий множество слов,
ассоциировать метаданные, содержащие временную отметку, с каждым из этого множества слов,
идентифицировать по меньшей мере один текстовый блок в соответствующем текстовом потоке, причем этот по меньшей мере один текстовый блок содержит по меньшей мере одно из следующего: пауза, граница предложения, связующее слово и граница фразы,
принимать ввод текста в электронный документ от пользователя системы,
определять, является ли ввод текста по меньшей мере частично совпадающим с упомянутым по меньшей мере одним текстовым блоком, причем этот по меньшей мере один текстовый блок представляет собой наиболее недавно идентифицированный текстовый блок в соответствующем текстовом потоке,
в ответ на определение того, что ввод текста по меньшей мере частично совпадает с упомянутым по меньшей мере одним текстовым блоком, отображать этот по меньшей мере один текстовый блок в качестве рекомендуемого текстового блока для пользователя системы,
определять, является ли ввод текста по меньшей мере частично совпадающим с по меньшей мере одним вторым идентифицированным текстовым блоком,
в ответ на определение того, что ввод текста по меньшей мере частично совпадает с по меньшей мере одним вторым идентифицированным текстовым блоком, отображать по меньшей мере один второй текстовый блок в качестве второго рекомендуемого текстового блока для пользователя системы,
принимать выбор по меньшей мере одного из упомянутого по меньшей мере одного текстового блока и по меньшей мере одного второго текстового блока от пользователя системы,
вставлять выбранный по меньшей мере один из упомянутого по меньшей мере одного текстового блока и по меньшей мере одного второго текстового блока в электронный документ, и
отображать по меньшей мере один третий текстовый блок в качестве третьего рекомендуемого текстового блока, причем по меньшей мере один третий текстовый блок представляет собой последовательно более поздний текстовый блок по отношению к выбранному по меньшей мере одному из упомянутого по меньшей мере одного текстового блока и по меньшей мере одного второго текстового блока.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/758,353 | 2010-04-12 | ||
US12/785,353 US9236047B2 (en) | 2010-05-21 | 2010-05-21 | Voice stream augmented note taking |
PCT/US2011/034665 WO2011146227A2 (en) | 2010-05-21 | 2011-04-29 | Voice stream augmented note taking |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012149444A true RU2012149444A (ru) | 2014-05-27 |
RU2571608C2 RU2571608C2 (ru) | 2015-12-20 |
Family
ID=44973213
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012149444/08A RU2571608C2 (ru) | 2010-05-21 | 2011-04-29 | Создание заметок с использованием голосового потока |
Country Status (6)
Country | Link |
---|---|
US (1) | US9236047B2 (ru) |
EP (1) | EP2572355B1 (ru) |
CN (1) | CN102906735B (ru) |
RU (1) | RU2571608C2 (ru) |
TW (1) | TWI543150B (ru) |
WO (1) | WO2011146227A2 (ru) |
Families Citing this family (157)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7518196B2 (en) | 2005-02-23 | 2009-04-14 | Intel Corporation | Field effect transistor with narrow bandgap source and drain regions and method of fabrication |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US8954329B2 (en) * | 2011-05-23 | 2015-02-10 | Nuance Communications, Inc. | Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8645825B1 (en) | 2011-08-31 | 2014-02-04 | Google Inc. | Providing autocomplete suggestions |
US9223769B2 (en) | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
KR101919008B1 (ko) * | 2012-02-24 | 2018-11-19 | 삼성전자주식회사 | 정보 제공 방법 및 이를 위한 이동 단말기 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US8798996B2 (en) * | 2012-03-05 | 2014-08-05 | Coupons.Com Incorporated | Splitting term lists recognized from speech |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR101939253B1 (ko) * | 2012-05-21 | 2019-01-16 | 엘지전자 주식회사 | 음성 녹음 중에 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기 |
KR101897774B1 (ko) * | 2012-05-21 | 2018-09-12 | 엘지전자 주식회사 | 녹음된 음성의 탐색을 용이하게 하는 방법 및 이를 구현한 전자기기 |
US10431235B2 (en) * | 2012-05-31 | 2019-10-01 | Elwha Llc | Methods and systems for speech adaptation data |
US20130325449A1 (en) | 2012-05-31 | 2013-12-05 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US9899040B2 (en) * | 2012-05-31 | 2018-02-20 | Elwha, Llc | Methods and systems for managing adaptation data |
US8843371B2 (en) | 2012-05-31 | 2014-09-23 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US20130325451A1 (en) * | 2012-05-31 | 2013-12-05 | Elwha LLC, a limited liability company of the State of Delaware | Methods and systems for speech adaptation data |
US9495966B2 (en) | 2012-05-31 | 2016-11-15 | Elwha Llc | Speech recognition adaptation systems based on adaptation data |
US9305565B2 (en) * | 2012-05-31 | 2016-04-05 | Elwha Llc | Methods and systems for speech adaptation data |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
KR102380145B1 (ko) | 2013-02-07 | 2022-03-29 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
CN104143331B (zh) | 2013-05-24 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种添加标点的方法和系统 |
CN104142915B (zh) * | 2013-05-24 | 2016-02-24 | 腾讯科技(深圳)有限公司 | 一种添加标点的方法和系统 |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101749009B1 (ko) | 2013-08-06 | 2017-06-19 | 애플 인크. | 원격 디바이스로부터의 활동에 기초한 스마트 응답의 자동 활성화 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9910840B2 (en) | 2015-04-03 | 2018-03-06 | Microsoft Technology Licensing, Llc | Annotating notes from passive recording with categories |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) * | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10121474B2 (en) * | 2016-02-17 | 2018-11-06 | Microsoft Technology Licensing, Llc | Contextual note taking |
US9813783B2 (en) * | 2016-04-01 | 2017-11-07 | Intel Corporation | Multi-camera dataset assembly and management with high precision timestamp requirements |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US20180101599A1 (en) * | 2016-10-08 | 2018-04-12 | Microsoft Technology Licensing, Llc | Interactive context-based text completions |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
RU2648572C1 (ru) * | 2017-01-12 | 2018-03-26 | Общество с ограниченной ответственностью "Инвестиционная группа "Коперник" | Алгоритм поиска в компьютерных системах и базах данных |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN109285548A (zh) * | 2017-07-19 | 2019-01-29 | 阿里巴巴集团控股有限公司 | 信息处理方法、系统、电子设备、和计算机存储介质 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10719222B2 (en) * | 2017-10-23 | 2020-07-21 | Google Llc | Method and system for generating transcripts of patient-healthcare provider conversations |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
KR102413616B1 (ko) | 2019-07-09 | 2022-06-27 | 구글 엘엘씨 | 온-디바이스 음성 인식 모델 트레이닝을 위한 텍스트 세그먼트의 온-디바이스 음성 합성 |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11404049B2 (en) | 2019-12-09 | 2022-08-02 | Microsoft Technology Licensing, Llc | Interactive augmentation and integration of real-time speech-to-text |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN114449333B (zh) * | 2020-10-30 | 2023-09-01 | 华为终端有限公司 | 视频笔记生成方法及电子设备 |
EP4221169A1 (en) * | 2022-01-31 | 2023-08-02 | Koa Health B.V. Sucursal en España | System and method for monitoring communication quality |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6377965B1 (en) * | 1997-11-07 | 2002-04-23 | Microsoft Corporation | Automatic word completion system for partially entered data |
US6252947B1 (en) * | 1999-06-08 | 2001-06-26 | David A. Diamond | System and method for data recording and playback |
US7149970B1 (en) * | 2000-06-23 | 2006-12-12 | Microsoft Corporation | Method and system for filtering and selecting from a candidate list generated by a stochastic input method |
KR100381013B1 (ko) | 2000-12-18 | 2003-04-26 | 한국전자통신연구원 | 음성인식기를 이용한 자막 입력장치 및 그 방법과 그 기록매체 |
US7117442B1 (en) | 2001-02-01 | 2006-10-03 | International Business Machines Corporation | Efficient presentation of database query results through audio user interfaces |
US20020107896A1 (en) * | 2001-02-02 | 2002-08-08 | Abraham Ronai | Patent application drafting assistance tool |
US7089188B2 (en) | 2002-03-27 | 2006-08-08 | Hewlett-Packard Development Company, L.P. | Method to expand inputs for word or document searching |
US7415667B2 (en) * | 2003-01-31 | 2008-08-19 | Ricoh Company, Ltd. | Generating augmented notes and synchronizing notes and document portions based on timing information |
US9710819B2 (en) * | 2003-05-05 | 2017-07-18 | Interactions Llc | Real-time transcription system utilizing divided audio chunks |
US7542971B2 (en) * | 2004-02-02 | 2009-06-02 | Fuji Xerox Co., Ltd. | Systems and methods for collaborative note-taking |
SE0402650D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
JP4218758B2 (ja) | 2004-12-21 | 2009-02-04 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕生成装置、字幕生成方法、及びプログラム |
US20070116199A1 (en) * | 2005-11-17 | 2007-05-24 | Juha Arrasvuori | Method, mobile device, system and software for establishing an audio note journal |
JP4158937B2 (ja) | 2006-03-24 | 2008-10-01 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 字幕修正装置 |
US7756708B2 (en) | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
CN101188110B (zh) | 2006-11-17 | 2011-01-26 | 陈健全 | 提高文本和语音匹配效率的方法 |
CN101013421B (zh) | 2007-02-02 | 2012-06-27 | 清华大学 | 基于规则的汉语基本块自动分析方法 |
US8549441B2 (en) | 2007-06-15 | 2013-10-01 | Microsoft Corporation | Presenting and navigating content having varying properties |
WO2009029865A1 (en) * | 2007-08-31 | 2009-03-05 | Google Inc. | Automatic correction of user input |
JP5243886B2 (ja) | 2008-08-11 | 2013-07-24 | 旭化成株式会社 | 字幕出力装置、字幕出力方法及びプログラム |
US8768705B2 (en) * | 2009-10-27 | 2014-07-01 | Cisco Technology, Inc. | Automated and enhanced note taking for online collaborative computing sessions |
-
2010
- 2010-05-21 US US12/785,353 patent/US9236047B2/en active Active
-
2011
- 2011-04-13 TW TW100112854A patent/TWI543150B/zh not_active IP Right Cessation
- 2011-04-29 RU RU2012149444/08A patent/RU2571608C2/ru active
- 2011-04-29 WO PCT/US2011/034665 patent/WO2011146227A2/en active Application Filing
- 2011-04-29 CN CN201180025007.3A patent/CN102906735B/zh active Active
- 2011-04-29 EP EP11783936.5A patent/EP2572355B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9236047B2 (en) | 2016-01-12 |
EP2572355A4 (en) | 2013-11-06 |
RU2571608C2 (ru) | 2015-12-20 |
EP2572355B1 (en) | 2018-06-27 |
US20110288863A1 (en) | 2011-11-24 |
WO2011146227A3 (en) | 2012-04-05 |
EP2572355A2 (en) | 2013-03-27 |
CN102906735B (zh) | 2016-08-10 |
WO2011146227A2 (en) | 2011-11-24 |
CN102906735A (zh) | 2013-01-30 |
TW201203222A (en) | 2012-01-16 |
TWI543150B (zh) | 2016-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2012149444A (ru) | Создание заметок с использованием голосового потока | |
US8909525B2 (en) | Interactive voice recognition electronic device and method | |
CA2768214A1 (en) | Commands directed at displayed text | |
GB201205790D0 (en) | Transcription of speech | |
EA201001587A1 (ru) | Система интерактивной книги и способ ее использования | |
WO2013052330A3 (en) | Interactive text editing | |
MX340907B (es) | Dispositivo para extraer informacion a partir de un dialogo. | |
WO2009111721A3 (en) | Voice recognition grammar selection based on context | |
EP2487584A3 (en) | Operation method for memo function and portable terminal supporting the same | |
US20110320205A1 (en) | Electronic book reader | |
WO2009092096A3 (en) | Method and system for situational language interpretation | |
EP2690567A3 (en) | Method for managing data and an electronic device thereof | |
KR101567449B1 (ko) | 음성인식에 기반한 애니메이션 재생이 가능한 전자책 단말기 및 그 방법 | |
JP2004199696A5 (ru) | ||
JP2016122344A5 (ru) | ||
US20120035919A1 (en) | Voice recording device and method thereof | |
CN103123644A (zh) | 声音数据检索系统及用于该系统的程序 | |
EP2081126A3 (en) | Information processing system, information processing apparatus, information processing program and recording medium | |
RU2008128440A (ru) | Способ и устройство для доступа к цифровому файлу из набора цифровых файлов | |
JP2014135543A5 (ja) | 予定に係る音声メモ蓄積方法 | |
US20140376885A1 (en) | Method for playing video file and electronic device using the same | |
JP2015148758A (ja) | 音声対話システム及び音声対話方法 | |
WO2008108061A1 (ja) | 言語処理システム、言語処理方法、言語処理プログラムおよび記録媒体 | |
CN102956125A (zh) | 云端数码语音教学录音系统 | |
GB2430058A (en) | A system and method for retrieving information and a system and method for storing information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HZ9A | Changing address for correspondence with an applicant |