TW200407710A - Dialog control for an electric apparatus - Google Patents
Dialog control for an electric apparatus Download PDFInfo
- Publication number
- TW200407710A TW200407710A TW092112722A TW92112722A TW200407710A TW 200407710 A TW200407710 A TW 200407710A TW 092112722 A TW092112722 A TW 092112722A TW 92112722 A TW92112722 A TW 92112722A TW 200407710 A TW200407710 A TW 200407710A
- Authority
- TW
- Taiwan
- Prior art keywords
- user
- anthropomorphic
- component
- camera
- patent application
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 claims description 2
- 241001137251 Corvidae Species 0.000 claims 1
- 229910052729 chemical element Inorganic materials 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
- Selective Calling Equipment (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Description
200407710 玖、發明說明: 技術領域 本發明揭示-種包括用於拾取及辨識語音訊號之構件之 裝置,以及一種讓使用者與一電氣裝置通信之方法。 已知之語音辨識構件可將所拾取之聲學語音訊號指定給 對應語詞或對應語詞序列。語音辨識系統通常與語音合成 相、'.“,作控制電氣裝置之對話系統。與使用者之對話 可作為操作該電氣裝置之唯一介面。亦可將語音輸入甚至 輸出作多種溝通方式當中的一種。 先前技術 美國專利第US-A-6,1 1 8,888號描述了一種控制裝置以及 一種控制電氣裝置(譬如電腦)或娛樂電子領域所用裝置之 方法。為控制該裝置,使用者有權支配複數個輸入設備。 孩等設備為機械輸入設備(譬如鍵盤或滑鼠)以及語音辨識 設備。此外’該控制裝置包括一攝影機,其可拾取使用者 的手勢及擬態’並可將其處理後作為進一步的輸入訊號。 與使用者之溝通係以對話形式實現,其中該系統具有複數 個模式可供支配,以向使用者傳送資訊。其包括語音合成 及吾首輸出。尤其亦包括擬人化圖像,譬如人、人臉或動 物的圖像。該圖像係以電腦圖形的形式在顯示幕上顯示給 使用者。 儘管目前對話系統已用於各種特殊應用,譬如電話資訊 系統,但在諸如家用領域内之控制電氣裝置、娛樂電子等 其他領域之應用則仍然未獲廣泛認可。 85329 200407710 發明内容 本發明之一項目的係提供一 — 禮包括拾取構件以用於辨識 語晋訊號之裝置,以及一種和 > #作—電氣裝置之方法,該電 氣裝置讓使用者可藉由注立松庄τ 一 、 田%曰控制輕鬆操作該裝置。 藉由如申凊專利範圍第1项壯 、 /、 k且以及如申請專利範圍 第π項之方法可實現本目的。其 定義了本發明之較佳具體實施例 根據本發明之裝置包括一可機^ 他申請專利範圍附屬項則 〇 械地移動之擬人化元件。 其為該裝置之H,該裝置係作為使用者之擬人化對話 夥伴。該種擬人化元件之具體實施可能差異很大。譬如, 其可為可藉由馬達相對於電氣裝置之固定外殼移動之外殼 的邛刀。關键在於該擬人化元件具有一使用者可辨識無 疾(A側。若此前側朝向該使用者,他將感覺到該裝置是 "注意傾聽π的,即其可接收語音指令。 根據本發明,該裝置包括用於判定使用者位置之構件。 此可經由諸如聲音或光學感應器來實現。該擬人化元件之 運動構件係被控制以使該擬人化元件之前側朝向該使用者 之位置。如此使得使用者始終感覺該裝置準備”聆聽”他講 話0 根據本發明之另一項具體實施例,該擬人化元件包括_ 擬人化圖像◦此不僅可為一人或動物之圖像、亦可為一虛 幻角色(譬如機器人)之圖像。較易被接受的為人臉之圖像。 其可為寫實或象徵性的圖像,譬如其中僅顯示出眼、鼻、 口等之輪廓。 85329 -6- 200407710 該裝置最好亦包括供給語音訊號之構件。語音辨識對於 控制電氣裝置的確尤其重要,然而,回答、確認、查詢等 亦可以語音輸出構件實現。語音輸出可包括再現預存的語 音訊號,以及真實的語音合成。可以語音輸出構件實現一 完整的對話控制。亦可與使用者對話,以實現為其提供娛 樂之目的。 根據本發明之另一項具體實施例,該裝置包括複數個麥 克風及/或至少一個攝影機。語音訊號由一單一麥克風即可 拾取。然而,當使用複數個麥克風時,一方面可達成一拾 取模式,另一方面亦可藉由通過複數個麥克風接收使用者 之語音訊號來查明使用者位置。可以一攝影機來觀察該裝 置之環境。藉由對應的影像處理,亦可根據所拾取之影像 判定使用者之位置。麥克風、攝影機及/或用於供給語音訊 號之揚聲器可安排在可機械地移動之該擬人化元件上。譬 如,對於一人頭形式之擬人化元件,可在眼部區域内安置 兩架攝影機,在嘴部位置安置一揚聲器,以及靠近耳部位 置安置兩個麥克風。 最好係配備用以辨識使用者之構件。此係可藉由譬如評 估所拾取之影像訊號(視覺或臉部辨識)或藉由評估所拾取 之聲音訊號(語音辨識)來實現。因而該裝置可從該裝置環境 内的若干人中判定當前使用者,並使該擬人化元件面向該 使用者。 可以多種不同方式配置該運動構件以機械地移動該擬人 化元件。譬如,該等構件可為電動馬達或液壓調整構件。 85329 200407710 亦可藉由該運動構件以移動該擬人化元件。然而,該擬人 化7L件最好僅可相對於一固定部分轉動。舉例而言,在本 例中’其可圍繞一水平及/或垂直軸轉動。 根據本發明之装置可形成電氣裝置之一部分,諸如用於 娱樂電子之裝置(譬如電視、音訊及/或視訊之播放裝置,等 等)°在本例中,該裝置代表該裝置之使用者介面。此外, 該裝置亦可包括其他作業構件(鍵盤等)。或者,根據本發明 之裝置亦可為一獨立裝置,作為控制一或多個獨立電氣裝 置足控制裝置。在本例中,待控制之該等裝置具有一電氣 控制終端機(譬如無線終端機或合適之控制匯流排),經由該 終端機’該裝置根據所接收之使用者語音指令來控制該裝 置。 根據本發明之裝置可特別地作為使用者之資料存儲及/ 或查沟系統之介面。為此,該裝置包括内部資料記憶體, 或該裝置係經由諸如電腦網路或網際網路與一外部資料記 憶體連接。使用者可在對話時存儲資料(譬如電話號碼、備 :&錄等等)或査詢貧料(譬如時間、新聞、最新電視節目表等 等)。 此外,與使用者之對話亦可用於調整該裝置自身之參數 ,以及改變其組態。 當配有提供聲音訊號之揚聲器以及拾取該等訊號之麥克 風時,即可提供具有干擾抑制的訊號處理,即處理所拾取 聲音訊號之方式可抑制部分來自揚聲器之聲音訊號。當揚 聲器及麥克風在空間上相鄰排列,譬如排列在該擬人化元 85329 件上時,此點尤為有利。 除上述利用該裝置 使用者進行對話,以服=子裳置外’亦可將其用於與 ^ # ^ , 力万他目的,諸如資訊、娛樂或 向使用者發出指示。根櫨 、 備有可藉以進行對⑽ 月之另-項具體實施例,配 時,^^❹者發出指示㈣話構件。此 時,對活万式最好既可給 之回答。該等指示可為複又可拾取使用者 物件提問,譬如外語詞彙,並 卞白 答(如外語中+ 一致毛 /、中扣不(如—語詞之定義)及回 〜PQ D§])均相對較短。對話係在使用者與該擬 化:件,間進行’且可採取視覺及/或音訊方式實施。 本發明提出一種可能有 件(諸如外語詞彙)存错ϋ自万法’即將一組學習物 果)存储起來,其中對於每個學習物件存儲至 V —個問題(譬如定義)、一 安 個a衣(i如詞彙)以及最近一次 -使用者k問後或該使用者正確回答提問後所經歷時間之 -種量龍。在對話中,逐個選取並提問學習物件 係向該使用者提問,而將使用者之回答與存儲之答案比較 。待k出作為問題之學習物件之選取係考慮到所存儲之計 時量測值,即自悬折_、A 乂丄斗丄、、 目取近, 人針對孩物件提問後所經過的時間 經由(譬如)—適宜之學習模式來實現,該模式具有假 錯料。此外,㈣時間量測值外,在選取時 亦可將相關性程度納人考量,來評估每個學習物件。 結合下列具體實施例’將更清楚的瞭解本發明之這些及 其它方面。 85329 200407710 圖1係控制裝置10以及受此裝置控制之裝置12的方塊圖 。控制裝f1G之㈣為針對使用者之擬人化元件14。麥克 風揚耳1 8及針對使用者位置之位置感應器(此處為攝 影機此形式)㈣在擬人化元件14上。此料件共同構成 一機械罕兀22。該擬人化元件u以及機械單元22藉由馬達 24圍、'兀垂直軸轉動。—中央控制單元%經由—驅動電路 28控制該馬達24。她人化元件14係一獨立機械單元。其 具有使用纟可辨識無誤之一前側。麥克風]6、揚聲器㈣ 及攝影機20排列在擬人化元件14上,朝向此前側之方向。 孩麥克風16提供聲音訊號。此訊號由拾取系統3〇拾取, 並由語首辨識單元32處理。該語音辨識結果,即指定給拾 取之耸首訊號之語詞序列,被傳送至中央控制單元%。 為中央控制單元26亦控制一語音合成單元34,其經由_ 發聲單元3 6及揚聲器1 8提供合成語音説號。 该攝景> 機20所拾取之影像由該影像處理單元3 8處理。該 象處理單元38根據攝影機20提供之影像訊號判定使用者 之位且。该位置寅说被傳送至該中央控制單元2 $。 忒機械單元2 2係作為一使用者介面,該中央控制單元2 6 經由該機械單元接收來自使用者之輸入(麥克風丨6、語音辨 哉單元32),並回答使用者(語音合成單元34、揚聲器18)。 在本例中,該控制單元1 0係用於控制一電氣裝置1 2,璧如 —娛樂電子領域所用裝置。 圖1中僅象徵性地表示出該控制裝置1 〇之功能性單元。不 同單元,譬如中央控制單元26、語音辨識單元32及影像處 85329 -10 - 200407710 理單元3 8,在一且歸尚 t 、 “睹笑杈中可以獨立群組方式存在。同樣 地’亦可以純粹軟體 — 卜 乃式/目、她琢寺早凡,其中可藉由在一 中央早兀上執行余 式不㈢現禝數個或所有該等單元之功能 性。 该寺早兀在命門 \ -j- 二间上不必彼此或與該機械單元22相鄭。該 機械單元22,亦即耘、, 乂 f但並非必要排列在此元上 人化元件14以及來力m r 克風16、揚聲器]8和感應器2〇,可與控 制裝置]0之其餘部分分班 __ 刀開女且,且僅經由線路或無線連接 與之進行訊號連接。 =作中’轉制裝置1Q不斷探查其鄰近是否有使用者 曰判疋使用者位置後,該中央控制單7t26即控制馬達24 ,令擬人化元件10之前側朝向該使用者。 奋亥;5^像處理早元3 8 ~ 二 、 亚包括面邵辨識。當該攝影機20提供 複數個人之影像時,係葬由、、 、 r 你稭由面邯辨識來判疋誰為系統已知 之使用者。然後令兮I > 7 d k人化兀件14朝向該使用者。當配 有複數個麥克風時,i以 、b 、 万式處理該等麥克風發出之訊 號,以便祕已知使用者位置方向上之拾取模式。 此外,料設定該影像處理單元38之實施方式,使其可 "理解’’攝影機2 0所於取夕遍奸口口 叮心取&機械早元22附近之景象。接著, 可將相應景象指定給若干預先定義之狀態。譬如,以此方 式’该中央#制單元26可得知房間内是有—人或有多人。 該單元亦可辨識及指認使用者的行為,即:諸如該使用者 是正注視該機械軍& 9 9 > 士 & 錢早7L22m或是正與他人交談。藉由 評估所辨識之狀態,可顯著改進辨識能力。譬如,可避免 85329 -11 - 200407710 將兩人間之部分對話錯誤地理解為語音指令。 與使用者對話時,該中央控制單元會判定其輸入,並相 應地fe制該裝置1 2。可以如下方式對話,來控制聲音再生 裝置12之音量: -使用者改變其位置並面向該擬人化元件14。藉由馬達 24的不斷引導該擬人化元件14,令其前側朝向該使用者。 為此,根據判定之使用者位置,藉由裝置1〇之中央控制單 元26控制驅動電路28 ; 使用者發出語音指令,譬如"電視音量"。麥克風1 6拾 取4 ^曰扣令,並由語音辨識單元3 2進行辨識; 中央控制單元26作出反應,經由語音合成單元34以揚 常器18提問:”升高或降低?,,: 使用者發出浯首指令"降低"。辨識語音訊號後,中央 控制單元26控制裝置12,使音量降低。 圖2係具有整合式控制裝置之電氣裝置40的透視圖。該圖 ^ ^工制衣置1 0之擬人化元件14,該元件可圍繞一 垂直轴相對於m裝置4Q之固定外殼42轉動。在此實例中, 該擬人化元件且古 、 一 ’烏平矩形之形狀。攝影機20及揚聲器18 目^示' 係位y{印丨 抑 ^ 4上。兩麥克風16係排列在側面。機械 早元2 2係精由_1民、去 ’建(未顯示)轉動,使得前側始終指向使用 者方向。 /、/、l貝施例(未顯示)中,圖1之裝置1 〇並非用於控 制裝置12,而# 、… '、於進行對話,其目的在指示使用者。中 央控制單元2 61彳f — 订—可供使用者學習外語之學習程式。記 85329 -12 - 200407710 =:=::_件。該等物件係個別資料組,每組 (在該語言中出現之頻率)之評估1」、“狀關聯性 料紀錄φ、 ^ 里、心以及自最近提出資 3中义問畸後經過時間之時間量測值。 匕時在逐個選取並提問之數據★己錄中$ 習單 ^-己塚中執行該對話之學 白早兀。在此情況下,給予使 ,^ x J考一#曰不,即以光學顧示 或’耳首播放資料記錄中存儲 键…人 么者《…拾取使用者藉由(譬如) 鍵|的輪入,且較佳地由麥克 i人i 士门斤 次啟動自動語晋辨識32 知取〜回谷,並將其與已存答案(詞彙 告知答案是不判# A T i I存儲。使用者被 。木疋口刦疋為正確。若复鸯 正確答案,納曰、… 使用者會被告知 咨拉、,„ & f新回合又機會。如此處理 貝枓屺錄後,所存最近一次接 設為零。 人挺問後<計時獲得更新,即重 k後,選取並查詢下一資料記錄。 藉由一記憶模型選取待杳詢 d又貝枓1己錄。以公式 P(k) = exp(-t(k)*r(c(k)))表示一筒 川衣 間早吕己憶模型,豆中P(k)代表 !人知曉學習物件k之機率’叫代表指數函數、,雜表自 ^迎提問以來之時間,e(k)代表物件之學習級別,轉 :係學習級別之特定錯誤率。t可表示時間。亦可在學習步 #中給疋時間t。學習級別可以 1 U 1通且万式來足義。一 可仃模式係給被答對N次之物件泛|彻M σϊ 忏又母個^^〇指定一相應級 別。至於錯誤率,可假設一適宜 、 、、 〜口疋值,或選擇一通宜 I初始值,並以一種梯度演算法調整。 才曰示足目的係最大化知識的度量。 ,^ 規又此知識度Τ為整 85329 -13 - 200407710 :!習Π之部分,為使用者知曉,1以相關性量測值來 ΓΓ二=髮物件k之問題令機娜)成為因而,為 I 4心’應在每—步中提問知識機率為P(k)最低 模量測警刚、^ ::,可在母步後計算知識度量並顯示給使料。將該方 、、、化*以邊使用者盡可能廣泛地獲取當前學習物件組 j4 11由使用良好之記憶模型,可依此達成有效之學 習策略。 可對上逑對活式查詢進行多種修改及進一步改良。譬如 問碭(疋義)可具有複數個正確答案(詞彙)。譬如,可考 慮,用所存相關性量測值來強調更為相關(更常則之語詞 :如,相應學習物件組可包括數千個語詞。該等可為譬 如卞白物件’即給足用途(譬如文學、商冑、技術領域等等) 之具體詞彙。 、’心〜,本發明涉及一種包括用於拾取及辨識語音訊號之 構件的裝置,以及一種與一電氣裝置溝通之方法。該裝置 包括一可機械地移動之擬人化元件。判定使用者位置,且 居擬人化元件(其可包括諸如一人臉之圖像)之移動方式可 使其七側指向該使用者位置之方向。麥克風、揚聲器及/或 才砰影機可排列在該擬人化元件上。使用者可與該裝置進行 語音對話’其中該裝置為擬人化元件之形式。可根據使用 者語晋輸入控制一電氣裝置。亦可為實現指示使用者之目 的而進行使用者與該擬人化元件之對話。 85329 -14- 200407710 在圖式中。 圖1係一控制裝置之元件方塊圖; 圖2係包括一控制裝置之電氣裝置的透視圖。 圖式代表符號說明 10 控 制 裝 置 12 裝 置 14 擬 人 化 元 件 16 麥 克 風 18 揚 聲 器 20 攝 影 機 22 機 械 早 元 24 馬 達 26 中 央 控 制 單 元 28 驅 動 電 路 30 拾取 系 統 32 語 音 辨 Ί线 單 元 34 語 晋合成 單 元 36 發 聲 單 元 38 影 像 處 理 口口 早 元 40 裝 置 42 固 定 機 殼 44 前 側 -15 - 85329
Claims (1)
- 200407710 拾、申請專利範圍: 1. 一種裝置,其包括: -用於拾取及辨識語音訊號(30、32)之構件,及 ‘ -具有一前側(44)之一擬人化元件(14),以及用於機械 地移動該擬人化元件(14)之運動構件(24),其中: -配置有用於判定使用者位置之構件(3 8);及 -控制該運動構件(24)之方式使得該擬人化元件(14) 之箾側(4 4)指向該使用者位置之方向。 2·如申請專利範圍第1項之裝置,其中配置有提供語音訊籲 號之構件(34、36、18)。 3.如莉述申請專利範圍中任一項之裝置,其中該擬人化元 件(14)包括一擬人化圖像,尤其係一人臉之圖像。 4 ·如前述申請專利範圍中任一項之裝置,其中: 配備有複數個之麥克風(16)及/或至少一個攝影機 (20); 居麥克風(16)及/或該攝影機(2 〇)較佳地配置於該擬 人化元件(14)上。 鲁 5. 如前述申請專利範圍中任一項之裝置,其中配備有用於 識別至少一個使用者之構件。 6. 如前述申請專利範圍中任一項之裝置,其中該運動構件 (24)使該擬人化元件(14)可圍繞至少一個軸轉動。 7. 如说述申請專利範圍中任一項之裝置,其中配備有至少 一個外邵電氣裝置(12),其係由該等語音訊號所控制。 8. 如前述申請專利範圍中任一項之裝置,其中: 85329 -配備有至少—伽ra、λ 個用於提供音響訊號之揚聲哭 _配備有至少—個阳' 每耳,及 及其中: 個用於拾取音響訊號之麥克風(16);以 -配備有用於虛: 、里所拾取之該等音響訊號之一祧_ 理單元(30),复φ如、、 處 %& /、 Q $源於該揚聲器(18)所發出聲 唬(訊號係受到抑制。 耳曰讯 9.如前述申請專利笳 Λ , 中j 一項之裝置,其中配備有用於 為‘不使用者之目的摄 及/或藉聲立m τ “义構件,對話中係以視覺 或一失古 、'、&予該使用者指並藉由-键盤及/ 或一 4克風拾取該使用者之回答。 1 0.如申請專利範圍第9 士 甘b、 η ^ ^ 1,其中孩對話構件包括存 儲一套學習物件之構件,其中·· -對於每個學f物件存儲至少—條指示、—個答案以 及使用者處理該指示所用時間之一项量測值及 構件之形成方式使得可藉由指示該使用者並 斯^亥使用者之艾奮盒邮六 , 木舁所存儲答案比較來選擇並查詢學 習物件;且其中 -在選取學習㈣時考細所㈣之量測值。 ].一種在使用者與電氣裝置叫之間通信的方法,其中包 栝· -判定一使用者之位置; -移動-擬人化元件(14),使得該擬人化元件(14)之前 側(4 4)指向該使用者之方向;以及 _拾取並處理該使用者之語音訊號。 200407710 1 2.如申請專利範圍第1 1項之方法,其中係根據所拾取之該 等語音訊號以控制該電氣裝置(1 2)。 85329
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10221490 | 2002-05-14 | ||
DE10249060A DE10249060A1 (de) | 2002-05-14 | 2002-10-22 | Dialogsteuerung für elektrisches Gerät |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200407710A true TW200407710A (en) | 2004-05-16 |
TWI280481B TWI280481B (en) | 2007-05-01 |
Family
ID=29421506
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW092112722A TWI280481B (en) | 2002-05-14 | 2003-05-09 | A device for dialog control and a method of communication between a user and an electric apparatus |
Country Status (10)
Country | Link |
---|---|
US (1) | US20050159955A1 (zh) |
EP (1) | EP1506472A1 (zh) |
JP (1) | JP2005525597A (zh) |
CN (1) | CN100357863C (zh) |
AU (1) | AU2003230067A1 (zh) |
BR (1) | BR0304830A (zh) |
PL (1) | PL372592A1 (zh) |
RU (1) | RU2336560C2 (zh) |
TW (1) | TWI280481B (zh) |
WO (1) | WO2003096171A1 (zh) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005101259A1 (en) * | 2004-04-13 | 2005-10-27 | Philips Intellectual Property & Standards Gmbh | Method and system for sending an audio message |
KR20070029794A (ko) | 2004-07-08 | 2007-03-14 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 유저와 시스템 사이에 통신을 하기 위한 방법 및 시스템 |
US8689135B2 (en) | 2005-08-11 | 2014-04-01 | Koninklijke Philips N.V. | Method of driving an interactive system and user interface system |
WO2007017796A2 (en) | 2005-08-11 | 2007-02-15 | Philips Intellectual Property & Standards Gmbh | Method for introducing interaction pattern and application functionalities |
US7697827B2 (en) | 2005-10-17 | 2010-04-13 | Konicek Jeffrey C | User-friendlier interfaces for a camera |
US8467672B2 (en) * | 2005-10-17 | 2013-06-18 | Jeffrey C. Konicek | Voice recognition and gaze-tracking for a camera |
WO2007063447A2 (en) * | 2005-11-30 | 2007-06-07 | Philips Intellectual Property & Standards Gmbh | Method of driving an interactive system, and a user interface system |
JP2010206451A (ja) * | 2009-03-03 | 2010-09-16 | Panasonic Corp | カメラ付きスピーカ、信号処理装置、およびavシステム |
JP5263092B2 (ja) | 2009-09-07 | 2013-08-14 | ソニー株式会社 | 表示装置および制御方法 |
US9197736B2 (en) * | 2009-12-31 | 2015-11-24 | Digimarc Corporation | Intuitive computing methods and systems |
WO2011082332A1 (en) | 2009-12-31 | 2011-07-07 | Digimarc Corporation | Methods and arrangements employing sensor-equipped smart phones |
CN102298443B (zh) * | 2011-06-24 | 2013-09-25 | 华南理工大学 | 结合视频通道的智能家居语音控制系统及其控制方法 |
CN102572282A (zh) * | 2012-01-06 | 2012-07-11 | 鸿富锦精密工业(深圳)有限公司 | 智能追踪装置 |
EP2699022A1 (en) * | 2012-08-16 | 2014-02-19 | Alcatel Lucent | Method for provisioning a person with information associated with an event |
US9311640B2 (en) | 2014-02-11 | 2016-04-12 | Digimarc Corporation | Methods and arrangements for smartphone payments and transactions |
FR3011375B1 (fr) | 2013-10-01 | 2017-01-27 | Aldebaran Robotics | Procede de dialogue entre une machine, telle qu'un robot humanoide, et un interlocuteur humain, produit programme d'ordinateur et robot humanoide pour la mise en œuvre d'un tel procede |
CN104898581B (zh) * | 2014-03-05 | 2018-08-24 | 青岛海尔机器人有限公司 | 一种全息智能中控系统 |
EP2933070A1 (en) | 2014-04-17 | 2015-10-21 | Aldebaran Robotics | Methods and systems of handling a dialog with a robot |
JP6739907B2 (ja) * | 2015-06-18 | 2020-08-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 機器特定方法、機器特定装置及びプログラム |
JP6516585B2 (ja) * | 2015-06-24 | 2019-05-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 制御装置、その方法及びプログラム |
TW201707471A (zh) * | 2015-08-14 | 2017-02-16 | Unity Opto Technology Co Ltd | 自動控制指向性喇叭及其燈具 |
TWI603626B (zh) * | 2016-04-26 | 2017-10-21 | 音律電子股份有限公司 | 揚聲裝置、其控制方法及播放控制系統 |
WO2018190099A1 (ja) * | 2017-04-10 | 2018-10-18 | ヤマハ株式会社 | 音声提供装置、音声提供方法及びプログラム |
TWI671635B (zh) * | 2018-04-30 | 2019-09-11 | 仁寶電腦工業股份有限公司 | 分離式移動智能系統及其操作方法與基座裝置 |
EP3685718A1 (en) * | 2019-01-24 | 2020-07-29 | Millo Appliances, UAB | Kitchen worktop-integrated food blending and mixing system |
JP7026066B2 (ja) * | 2019-03-13 | 2022-02-25 | 株式会社日立ビルシステム | 音声案内システム及び音声案内方法 |
US11380094B2 (en) | 2019-12-12 | 2022-07-05 | At&T Intellectual Property I, L.P. | Systems and methods for applied machine cognition |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK0956552T3 (da) * | 1995-12-04 | 2002-11-04 | Jared C Bernstein | Fremgangsmåde og anordninger til kombinerede informationer fra talesignaler med henblik på adaptiv interaktion til undervisnings- og testformål |
US6118888A (en) * | 1997-02-28 | 2000-09-12 | Kabushiki Kaisha Toshiba | Multi-modal interface apparatus and method |
IL120855A0 (en) * | 1997-05-19 | 1997-09-30 | Creator Ltd | Apparatus and methods for controlling household appliances |
US6077085A (en) * | 1998-05-19 | 2000-06-20 | Intellectual Reserve, Inc. | Technology assisted learning |
WO1999067067A1 (fr) * | 1998-06-23 | 1999-12-29 | Sony Corporation | Robot et systeme de traitement d'information |
JP4036542B2 (ja) * | 1998-09-18 | 2008-01-23 | 富士通株式会社 | エコーキャンセラ |
JP2001157976A (ja) * | 1999-11-30 | 2001-06-12 | Sony Corp | ロボット制御装置およびロボット制御方法、並びに記録媒体 |
AU4449801A (en) * | 2000-03-24 | 2001-10-03 | Creator Ltd. | Interactive toy applications |
JP4480843B2 (ja) * | 2000-04-03 | 2010-06-16 | ソニー株式会社 | 脚式移動ロボット及びその制御方法、並びに、脚式移動ロボット用相対移動測定センサ |
GB0010034D0 (en) * | 2000-04-26 | 2000-06-14 | 20 20 Speech Limited | Human-machine interface apparatus |
JP4296714B2 (ja) * | 2000-10-11 | 2009-07-15 | ソニー株式会社 | ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム |
US20020150869A1 (en) * | 2000-12-18 | 2002-10-17 | Zeev Shpiro | Context-responsive spoken language instruction |
-
2003
- 2003-05-09 JP JP2004504098A patent/JP2005525597A/ja not_active Withdrawn
- 2003-05-09 CN CNB038108135A patent/CN100357863C/zh not_active Expired - Fee Related
- 2003-05-09 EP EP03722909A patent/EP1506472A1/en not_active Withdrawn
- 2003-05-09 RU RU2004136294/09A patent/RU2336560C2/ru not_active IP Right Cessation
- 2003-05-09 BR BR0304830-6A patent/BR0304830A/pt not_active IP Right Cessation
- 2003-05-09 TW TW092112722A patent/TWI280481B/zh not_active IP Right Cessation
- 2003-05-09 US US10/513,945 patent/US20050159955A1/en not_active Abandoned
- 2003-05-09 PL PL03372592A patent/PL372592A1/xx not_active Application Discontinuation
- 2003-05-09 AU AU2003230067A patent/AU2003230067A1/en not_active Abandoned
- 2003-05-09 WO PCT/IB2003/001816 patent/WO2003096171A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
RU2336560C2 (ru) | 2008-10-20 |
JP2005525597A (ja) | 2005-08-25 |
TWI280481B (en) | 2007-05-01 |
EP1506472A1 (en) | 2005-02-16 |
PL372592A1 (en) | 2005-07-25 |
AU2003230067A1 (en) | 2003-11-11 |
WO2003096171A1 (en) | 2003-11-20 |
US20050159955A1 (en) | 2005-07-21 |
BR0304830A (pt) | 2004-08-17 |
CN100357863C (zh) | 2007-12-26 |
CN1653410A (zh) | 2005-08-10 |
RU2004136294A (ru) | 2005-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW200407710A (en) | Dialog control for an electric apparatus | |
US8723984B2 (en) | Selective sound source listening in conjunction with computer interactive processing | |
JP3670180B2 (ja) | 補聴器 | |
US11803579B2 (en) | Apparatus, systems and methods for providing conversational assistance | |
CN110035250A (zh) | 音频处理方法、处理设备、终端及计算机可读存储介质 | |
JP2019220848A (ja) | データ処理装置、データ処理方法及びプログラム | |
JP2007050461A (ja) | ロボット制御システム、ロボット装置、およびロボット制御方法 | |
EP3684076B1 (en) | Accelerometer-based selection of an audio source for a hearing device | |
US20210409876A1 (en) | Method for Adjusting a Hearing Aid Device and System for Carrying Out the Method | |
JP6798258B2 (ja) | 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム | |
JP7087804B2 (ja) | コミュニケーション支援装置、コミュニケーション支援システム及び通信方法 | |
JP2015192332A (ja) | 状況把握用ユニット | |
KR20030024904A (ko) | 스피치-제어 수단 및 스피치-제어 수단의 기능을테스트하는 테스트 수단을 구비한 장치 | |
US20230351261A1 (en) | Learning data generating device, learning data generating method, learning device, learning method, data structure, information processor, and acoustic treatment device | |
JP7286303B2 (ja) | 会議支援システム及び会議用ロボット | |
KR20040107523A (ko) | 전기 장치에 대한 대화 제어 | |
CN112820265A (zh) | 一种语音合成模型训练方法和相关装置 | |
Okuno et al. | Realizing audio-visually triggered ELIZA-like non-verbal behaviors | |
Okuno et al. | Realizing personality in audio-visually triggered non-verbal behaviors | |
CN114203148A (zh) | 模拟语音播放方法、装置、电子设备及存储介质 | |
JP2007030050A (ja) | ロボット制御装置、ロボット制御システム、ロボット装置、およびロボット制御方法 | |
JP2005123959A (ja) | 高臨場感通信会議装置 | |
WO2024185334A1 (ja) | 情報処理装置、および情報処理方法、並びにプログラム | |
US20240107257A1 (en) | Relocation of sound components in spatial audio content | |
US20230306828A1 (en) | Apparatus, method and computer program for identifying acoustic events, in particular acoustic information and/or warning signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |