[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

TW200407710A - Dialog control for an electric apparatus - Google Patents

Dialog control for an electric apparatus Download PDF

Info

Publication number
TW200407710A
TW200407710A TW092112722A TW92112722A TW200407710A TW 200407710 A TW200407710 A TW 200407710A TW 092112722 A TW092112722 A TW 092112722A TW 92112722 A TW92112722 A TW 92112722A TW 200407710 A TW200407710 A TW 200407710A
Authority
TW
Taiwan
Prior art keywords
user
anthropomorphic
component
camera
patent application
Prior art date
Application number
TW092112722A
Other languages
English (en)
Other versions
TWI280481B (en
Inventor
Martin Oerder
Original Assignee
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from DE10249060A external-priority patent/DE10249060A1/de
Application filed by Koninkl Philips Electronics Nv filed Critical Koninkl Philips Electronics Nv
Publication of TW200407710A publication Critical patent/TW200407710A/zh
Application granted granted Critical
Publication of TWI280481B publication Critical patent/TWI280481B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

200407710 玖、發明說明: 技術領域 本發明揭示-種包括用於拾取及辨識語音訊號之構件之 裝置,以及一種讓使用者與一電氣裝置通信之方法。 已知之語音辨識構件可將所拾取之聲學語音訊號指定給 對應語詞或對應語詞序列。語音辨識系統通常與語音合成 相、'.“,作控制電氣裝置之對話系統。與使用者之對話 可作為操作該電氣裝置之唯一介面。亦可將語音輸入甚至 輸出作多種溝通方式當中的一種。 先前技術 美國專利第US-A-6,1 1 8,888號描述了一種控制裝置以及 一種控制電氣裝置(譬如電腦)或娛樂電子領域所用裝置之 方法。為控制該裝置,使用者有權支配複數個輸入設備。 孩等設備為機械輸入設備(譬如鍵盤或滑鼠)以及語音辨識 設備。此外’該控制裝置包括一攝影機,其可拾取使用者 的手勢及擬態’並可將其處理後作為進一步的輸入訊號。 與使用者之溝通係以對話形式實現,其中該系統具有複數 個模式可供支配,以向使用者傳送資訊。其包括語音合成 及吾首輸出。尤其亦包括擬人化圖像,譬如人、人臉或動 物的圖像。該圖像係以電腦圖形的形式在顯示幕上顯示給 使用者。 儘管目前對話系統已用於各種特殊應用,譬如電話資訊 系統,但在諸如家用領域内之控制電氣裝置、娛樂電子等 其他領域之應用則仍然未獲廣泛認可。 85329 200407710 發明内容 本發明之一項目的係提供一 — 禮包括拾取構件以用於辨識 語晋訊號之裝置,以及一種和 > #作—電氣裝置之方法,該電 氣裝置讓使用者可藉由注立松庄τ 一 、 田%曰控制輕鬆操作該裝置。 藉由如申凊專利範圍第1项壯 、 /、 k且以及如申請專利範圍 第π項之方法可實現本目的。其 定義了本發明之較佳具體實施例 根據本發明之裝置包括一可機^ 他申請專利範圍附屬項則 〇 械地移動之擬人化元件。 其為該裝置之H,該裝置係作為使用者之擬人化對話 夥伴。該種擬人化元件之具體實施可能差異很大。譬如, 其可為可藉由馬達相對於電氣裝置之固定外殼移動之外殼 的邛刀。關键在於該擬人化元件具有一使用者可辨識無 疾(A側。若此前側朝向該使用者,他將感覺到該裝置是 "注意傾聽π的,即其可接收語音指令。 根據本發明,該裝置包括用於判定使用者位置之構件。 此可經由諸如聲音或光學感應器來實現。該擬人化元件之 運動構件係被控制以使該擬人化元件之前側朝向該使用者 之位置。如此使得使用者始終感覺該裝置準備”聆聽”他講 話0 根據本發明之另一項具體實施例,該擬人化元件包括_ 擬人化圖像◦此不僅可為一人或動物之圖像、亦可為一虛 幻角色(譬如機器人)之圖像。較易被接受的為人臉之圖像。 其可為寫實或象徵性的圖像,譬如其中僅顯示出眼、鼻、 口等之輪廓。 85329 -6- 200407710 該裝置最好亦包括供給語音訊號之構件。語音辨識對於 控制電氣裝置的確尤其重要,然而,回答、確認、查詢等 亦可以語音輸出構件實現。語音輸出可包括再現預存的語 音訊號,以及真實的語音合成。可以語音輸出構件實現一 完整的對話控制。亦可與使用者對話,以實現為其提供娛 樂之目的。 根據本發明之另一項具體實施例,該裝置包括複數個麥 克風及/或至少一個攝影機。語音訊號由一單一麥克風即可 拾取。然而,當使用複數個麥克風時,一方面可達成一拾 取模式,另一方面亦可藉由通過複數個麥克風接收使用者 之語音訊號來查明使用者位置。可以一攝影機來觀察該裝 置之環境。藉由對應的影像處理,亦可根據所拾取之影像 判定使用者之位置。麥克風、攝影機及/或用於供給語音訊 號之揚聲器可安排在可機械地移動之該擬人化元件上。譬 如,對於一人頭形式之擬人化元件,可在眼部區域内安置 兩架攝影機,在嘴部位置安置一揚聲器,以及靠近耳部位 置安置兩個麥克風。 最好係配備用以辨識使用者之構件。此係可藉由譬如評 估所拾取之影像訊號(視覺或臉部辨識)或藉由評估所拾取 之聲音訊號(語音辨識)來實現。因而該裝置可從該裝置環境 内的若干人中判定當前使用者,並使該擬人化元件面向該 使用者。 可以多種不同方式配置該運動構件以機械地移動該擬人 化元件。譬如,該等構件可為電動馬達或液壓調整構件。 85329 200407710 亦可藉由該運動構件以移動該擬人化元件。然而,該擬人 化7L件最好僅可相對於一固定部分轉動。舉例而言,在本 例中’其可圍繞一水平及/或垂直軸轉動。 根據本發明之装置可形成電氣裝置之一部分,諸如用於 娱樂電子之裝置(譬如電視、音訊及/或視訊之播放裝置,等 等)°在本例中,該裝置代表該裝置之使用者介面。此外, 該裝置亦可包括其他作業構件(鍵盤等)。或者,根據本發明 之裝置亦可為一獨立裝置,作為控制一或多個獨立電氣裝 置足控制裝置。在本例中,待控制之該等裝置具有一電氣 控制終端機(譬如無線終端機或合適之控制匯流排),經由該 終端機’該裝置根據所接收之使用者語音指令來控制該裝 置。 根據本發明之裝置可特別地作為使用者之資料存儲及/ 或查沟系統之介面。為此,該裝置包括内部資料記憶體, 或該裝置係經由諸如電腦網路或網際網路與一外部資料記 憶體連接。使用者可在對話時存儲資料(譬如電話號碼、備 :&錄等等)或査詢貧料(譬如時間、新聞、最新電視節目表等 等)。 此外,與使用者之對話亦可用於調整該裝置自身之參數 ,以及改變其組態。 當配有提供聲音訊號之揚聲器以及拾取該等訊號之麥克 風時,即可提供具有干擾抑制的訊號處理,即處理所拾取 聲音訊號之方式可抑制部分來自揚聲器之聲音訊號。當揚 聲器及麥克風在空間上相鄰排列,譬如排列在該擬人化元 85329 件上時,此點尤為有利。 除上述利用該裝置 使用者進行對話,以服=子裳置外’亦可將其用於與 ^ # ^ , 力万他目的,諸如資訊、娛樂或 向使用者發出指示。根櫨 、 備有可藉以進行對⑽ 月之另-項具體實施例,配 時,^^❹者發出指示㈣話構件。此 時,對活万式最好既可給 之回答。該等指示可為複又可拾取使用者 物件提問,譬如外語詞彙,並 卞白 答(如外語中+ 一致毛 /、中扣不(如—語詞之定義)及回 〜PQ D§])均相對較短。對話係在使用者與該擬 化:件,間進行’且可採取視覺及/或音訊方式實施。 本發明提出一種可能有 件(諸如外語詞彙)存错ϋ自万法’即將一組學習物 果)存储起來,其中對於每個學習物件存儲至 V —個問題(譬如定義)、一 安 個a衣(i如詞彙)以及最近一次 -使用者k問後或該使用者正確回答提問後所經歷時間之 -種量龍。在對話中,逐個選取並提問學習物件 係向該使用者提問,而將使用者之回答與存儲之答案比較 。待k出作為問題之學習物件之選取係考慮到所存儲之計 時量測值,即自悬折_、A 乂丄斗丄、、 目取近, 人針對孩物件提問後所經過的時間 經由(譬如)—適宜之學習模式來實現,該模式具有假 錯料。此外,㈣時間量測值外,在選取時 亦可將相關性程度納人考量,來評估每個學習物件。 結合下列具體實施例’將更清楚的瞭解本發明之這些及 其它方面。 85329 200407710 圖1係控制裝置10以及受此裝置控制之裝置12的方塊圖 。控制裝f1G之㈣為針對使用者之擬人化元件14。麥克 風揚耳1 8及針對使用者位置之位置感應器(此處為攝 影機此形式)㈣在擬人化元件14上。此料件共同構成 一機械罕兀22。該擬人化元件u以及機械單元22藉由馬達 24圍、'兀垂直軸轉動。—中央控制單元%經由—驅動電路 28控制該馬達24。她人化元件14係一獨立機械單元。其 具有使用纟可辨識無誤之一前側。麥克風]6、揚聲器㈣ 及攝影機20排列在擬人化元件14上,朝向此前側之方向。 孩麥克風16提供聲音訊號。此訊號由拾取系統3〇拾取, 並由語首辨識單元32處理。該語音辨識結果,即指定給拾 取之耸首訊號之語詞序列,被傳送至中央控制單元%。 為中央控制單元26亦控制一語音合成單元34,其經由_ 發聲單元3 6及揚聲器1 8提供合成語音説號。 该攝景> 機20所拾取之影像由該影像處理單元3 8處理。該 象處理單元38根據攝影機20提供之影像訊號判定使用者 之位且。该位置寅说被傳送至該中央控制單元2 $。 忒機械單元2 2係作為一使用者介面,該中央控制單元2 6 經由該機械單元接收來自使用者之輸入(麥克風丨6、語音辨 哉單元32),並回答使用者(語音合成單元34、揚聲器18)。 在本例中,該控制單元1 0係用於控制一電氣裝置1 2,璧如 —娛樂電子領域所用裝置。 圖1中僅象徵性地表示出該控制裝置1 〇之功能性單元。不 同單元,譬如中央控制單元26、語音辨識單元32及影像處 85329 -10 - 200407710 理單元3 8,在一且歸尚 t 、 “睹笑杈中可以獨立群組方式存在。同樣 地’亦可以純粹軟體 — 卜 乃式/目、她琢寺早凡,其中可藉由在一 中央早兀上執行余 式不㈢現禝數個或所有該等單元之功能 性。 该寺早兀在命門 \ -j- 二间上不必彼此或與該機械單元22相鄭。該 機械單元22,亦即耘、, 乂 f但並非必要排列在此元上 人化元件14以及來力m r 克風16、揚聲器]8和感應器2〇,可與控 制裝置]0之其餘部分分班 __ 刀開女且,且僅經由線路或無線連接 與之進行訊號連接。 =作中’轉制裝置1Q不斷探查其鄰近是否有使用者 曰判疋使用者位置後,該中央控制單7t26即控制馬達24 ,令擬人化元件10之前側朝向該使用者。 奋亥;5^像處理早元3 8 ~ 二 、 亚包括面邵辨識。當該攝影機20提供 複數個人之影像時,係葬由、、 、 r 你稭由面邯辨識來判疋誰為系統已知 之使用者。然後令兮I > 7 d k人化兀件14朝向該使用者。當配 有複數個麥克風時,i以 、b 、 万式處理該等麥克風發出之訊 號,以便祕已知使用者位置方向上之拾取模式。 此外,料設定該影像處理單元38之實施方式,使其可 "理解’’攝影機2 0所於取夕遍奸口口 叮心取&機械早元22附近之景象。接著, 可將相應景象指定給若干預先定義之狀態。譬如,以此方 式’该中央#制單元26可得知房間内是有—人或有多人。 該單元亦可辨識及指認使用者的行為,即:諸如該使用者 是正注視該機械軍& 9 9 > 士 & 錢早7L22m或是正與他人交談。藉由 評估所辨識之狀態,可顯著改進辨識能力。譬如,可避免 85329 -11 - 200407710 將兩人間之部分對話錯誤地理解為語音指令。 與使用者對話時,該中央控制單元會判定其輸入,並相 應地fe制該裝置1 2。可以如下方式對話,來控制聲音再生 裝置12之音量: -使用者改變其位置並面向該擬人化元件14。藉由馬達 24的不斷引導該擬人化元件14,令其前側朝向該使用者。 為此,根據判定之使用者位置,藉由裝置1〇之中央控制單 元26控制驅動電路28 ; 使用者發出語音指令,譬如"電視音量"。麥克風1 6拾 取4 ^曰扣令,並由語音辨識單元3 2進行辨識; 中央控制單元26作出反應,經由語音合成單元34以揚 常器18提問:”升高或降低?,,: 使用者發出浯首指令"降低"。辨識語音訊號後,中央 控制單元26控制裝置12,使音量降低。 圖2係具有整合式控制裝置之電氣裝置40的透視圖。該圖 ^ ^工制衣置1 0之擬人化元件14,該元件可圍繞一 垂直轴相對於m裝置4Q之固定外殼42轉動。在此實例中, 該擬人化元件且古 、 一 ’烏平矩形之形狀。攝影機20及揚聲器18 目^示' 係位y{印丨 抑 ^ 4上。兩麥克風16係排列在側面。機械 早元2 2係精由_1民、去 ’建(未顯示)轉動,使得前側始終指向使用 者方向。 /、/、l貝施例(未顯示)中,圖1之裝置1 〇並非用於控 制裝置12,而# 、… '、於進行對話,其目的在指示使用者。中 央控制單元2 61彳f — 订—可供使用者學習外語之學習程式。記 85329 -12 - 200407710 =:=::_件。該等物件係個別資料組,每組 (在該語言中出現之頻率)之評估1」、“狀關聯性 料紀錄φ、 ^ 里、心以及自最近提出資 3中义問畸後經過時間之時間量測值。 匕時在逐個選取並提問之數據★己錄中$ 習單 ^-己塚中執行該對話之學 白早兀。在此情況下,給予使 ,^ x J考一#曰不,即以光學顧示 或’耳首播放資料記錄中存儲 键…人 么者《…拾取使用者藉由(譬如) 鍵|的輪入,且較佳地由麥克 i人i 士门斤 次啟動自動語晋辨識32 知取〜回谷,並將其與已存答案(詞彙 告知答案是不判# A T i I存儲。使用者被 。木疋口刦疋為正確。若复鸯 正確答案,納曰、… 使用者會被告知 咨拉、,„ & f新回合又機會。如此處理 貝枓屺錄後,所存最近一次接 設為零。 人挺問後<計時獲得更新,即重 k後,選取並查詢下一資料記錄。 藉由一記憶模型選取待杳詢 d又貝枓1己錄。以公式 P(k) = exp(-t(k)*r(c(k)))表示一筒 川衣 間早吕己憶模型,豆中P(k)代表 !人知曉學習物件k之機率’叫代表指數函數、,雜表自 ^迎提問以來之時間,e(k)代表物件之學習級別,轉 :係學習級別之特定錯誤率。t可表示時間。亦可在學習步 #中給疋時間t。學習級別可以 1 U 1通且万式來足義。一 可仃模式係給被答對N次之物件泛|彻M σϊ 忏又母個^^〇指定一相應級 別。至於錯誤率,可假設一適宜 、 、、 〜口疋值,或選擇一通宜 I初始值,並以一種梯度演算法調整。 才曰示足目的係最大化知識的度量。 ,^ 規又此知識度Τ為整 85329 -13 - 200407710 :!習Π之部分,為使用者知曉,1以相關性量測值來 ΓΓ二=髮物件k之問題令機娜)成為因而,為 I 4心’應在每—步中提問知識機率為P(k)最低 模量測警刚、^ ::,可在母步後計算知識度量並顯示給使料。將該方 、、、化*以邊使用者盡可能廣泛地獲取當前學習物件組 j4 11由使用良好之記憶模型,可依此達成有效之學 習策略。 可對上逑對活式查詢進行多種修改及進一步改良。譬如 問碭(疋義)可具有複數個正確答案(詞彙)。譬如,可考 慮,用所存相關性量測值來強調更為相關(更常則之語詞 :如,相應學習物件組可包括數千個語詞。該等可為譬 如卞白物件’即給足用途(譬如文學、商冑、技術領域等等) 之具體詞彙。 、’心〜,本發明涉及一種包括用於拾取及辨識語音訊號之 構件的裝置,以及一種與一電氣裝置溝通之方法。該裝置 包括一可機械地移動之擬人化元件。判定使用者位置,且 居擬人化元件(其可包括諸如一人臉之圖像)之移動方式可 使其七側指向該使用者位置之方向。麥克風、揚聲器及/或 才砰影機可排列在該擬人化元件上。使用者可與該裝置進行 語音對話’其中該裝置為擬人化元件之形式。可根據使用 者語晋輸入控制一電氣裝置。亦可為實現指示使用者之目 的而進行使用者與該擬人化元件之對話。 85329 -14- 200407710 在圖式中。 圖1係一控制裝置之元件方塊圖; 圖2係包括一控制裝置之電氣裝置的透視圖。 圖式代表符號說明 10 控 制 裝 置 12 裝 置 14 擬 人 化 元 件 16 麥 克 風 18 揚 聲 器 20 攝 影 機 22 機 械 早 元 24 馬 達 26 中 央 控 制 單 元 28 驅 動 電 路 30 拾取 系 統 32 語 音 辨 Ί线 單 元 34 語 晋合成 單 元 36 發 聲 單 元 38 影 像 處 理 口口 早 元 40 裝 置 42 固 定 機 殼 44 前 側 -15 - 85329

Claims (1)

  1. 200407710 拾、申請專利範圍: 1. 一種裝置,其包括: -用於拾取及辨識語音訊號(30、32)之構件,及 ‘ -具有一前側(44)之一擬人化元件(14),以及用於機械 地移動該擬人化元件(14)之運動構件(24),其中: -配置有用於判定使用者位置之構件(3 8);及 -控制該運動構件(24)之方式使得該擬人化元件(14) 之箾側(4 4)指向該使用者位置之方向。 2·如申請專利範圍第1項之裝置,其中配置有提供語音訊籲 號之構件(34、36、18)。 3.如莉述申請專利範圍中任一項之裝置,其中該擬人化元 件(14)包括一擬人化圖像,尤其係一人臉之圖像。 4 ·如前述申請專利範圍中任一項之裝置,其中: 配備有複數個之麥克風(16)及/或至少一個攝影機 (20); 居麥克風(16)及/或該攝影機(2 〇)較佳地配置於該擬 人化元件(14)上。 鲁 5. 如前述申請專利範圍中任一項之裝置,其中配備有用於 識別至少一個使用者之構件。 6. 如前述申請專利範圍中任一項之裝置,其中該運動構件 (24)使該擬人化元件(14)可圍繞至少一個軸轉動。 7. 如说述申請專利範圍中任一項之裝置,其中配備有至少 一個外邵電氣裝置(12),其係由該等語音訊號所控制。 8. 如前述申請專利範圍中任一項之裝置,其中: 85329 -配備有至少—伽ra、λ 個用於提供音響訊號之揚聲哭 _配備有至少—個阳' 每耳,及 及其中: 個用於拾取音響訊號之麥克風(16);以 -配備有用於虛: 、里所拾取之該等音響訊號之一祧_ 理單元(30),复φ如、、 處 %& /、 Q $源於該揚聲器(18)所發出聲 唬(訊號係受到抑制。 耳曰讯 9.如前述申請專利笳 Λ , 中j 一項之裝置,其中配備有用於 為‘不使用者之目的摄 及/或藉聲立m τ “义構件,對話中係以視覺 或一失古 、'、&予該使用者指並藉由-键盤及/ 或一 4克風拾取該使用者之回答。 1 0.如申請專利範圍第9 士 甘b、 η ^ ^ 1,其中孩對話構件包括存 儲一套學習物件之構件,其中·· -對於每個學f物件存儲至少—條指示、—個答案以 及使用者處理該指示所用時間之一项量測值及 構件之形成方式使得可藉由指示該使用者並 斯^亥使用者之艾奮盒邮六 , 木舁所存儲答案比較來選擇並查詢學 習物件;且其中 -在選取學習㈣時考細所㈣之量測值。 ].一種在使用者與電氣裝置叫之間通信的方法,其中包 栝· -判定一使用者之位置; -移動-擬人化元件(14),使得該擬人化元件(14)之前 側(4 4)指向該使用者之方向;以及 _拾取並處理該使用者之語音訊號。 200407710 1 2.如申請專利範圍第1 1項之方法,其中係根據所拾取之該 等語音訊號以控制該電氣裝置(1 2)。 85329
TW092112722A 2002-05-14 2003-05-09 A device for dialog control and a method of communication between a user and an electric apparatus TWI280481B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10221490 2002-05-14
DE10249060A DE10249060A1 (de) 2002-05-14 2002-10-22 Dialogsteuerung für elektrisches Gerät

Publications (2)

Publication Number Publication Date
TW200407710A true TW200407710A (en) 2004-05-16
TWI280481B TWI280481B (en) 2007-05-01

Family

ID=29421506

Family Applications (1)

Application Number Title Priority Date Filing Date
TW092112722A TWI280481B (en) 2002-05-14 2003-05-09 A device for dialog control and a method of communication between a user and an electric apparatus

Country Status (10)

Country Link
US (1) US20050159955A1 (zh)
EP (1) EP1506472A1 (zh)
JP (1) JP2005525597A (zh)
CN (1) CN100357863C (zh)
AU (1) AU2003230067A1 (zh)
BR (1) BR0304830A (zh)
PL (1) PL372592A1 (zh)
RU (1) RU2336560C2 (zh)
TW (1) TWI280481B (zh)
WO (1) WO2003096171A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005101259A1 (en) * 2004-04-13 2005-10-27 Philips Intellectual Property & Standards Gmbh Method and system for sending an audio message
KR20070029794A (ko) 2004-07-08 2007-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 유저와 시스템 사이에 통신을 하기 위한 방법 및 시스템
US8689135B2 (en) 2005-08-11 2014-04-01 Koninklijke Philips N.V. Method of driving an interactive system and user interface system
WO2007017796A2 (en) 2005-08-11 2007-02-15 Philips Intellectual Property & Standards Gmbh Method for introducing interaction pattern and application functionalities
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8467672B2 (en) * 2005-10-17 2013-06-18 Jeffrey C. Konicek Voice recognition and gaze-tracking for a camera
WO2007063447A2 (en) * 2005-11-30 2007-06-07 Philips Intellectual Property & Standards Gmbh Method of driving an interactive system, and a user interface system
JP2010206451A (ja) * 2009-03-03 2010-09-16 Panasonic Corp カメラ付きスピーカ、信号処理装置、およびavシステム
JP5263092B2 (ja) 2009-09-07 2013-08-14 ソニー株式会社 表示装置および制御方法
US9197736B2 (en) * 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
WO2011082332A1 (en) 2009-12-31 2011-07-07 Digimarc Corporation Methods and arrangements employing sensor-equipped smart phones
CN102298443B (zh) * 2011-06-24 2013-09-25 华南理工大学 结合视频通道的智能家居语音控制系统及其控制方法
CN102572282A (zh) * 2012-01-06 2012-07-11 鸿富锦精密工业(深圳)有限公司 智能追踪装置
EP2699022A1 (en) * 2012-08-16 2014-02-19 Alcatel Lucent Method for provisioning a person with information associated with an event
US9311640B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods and arrangements for smartphone payments and transactions
FR3011375B1 (fr) 2013-10-01 2017-01-27 Aldebaran Robotics Procede de dialogue entre une machine, telle qu'un robot humanoide, et un interlocuteur humain, produit programme d'ordinateur et robot humanoide pour la mise en œuvre d'un tel procede
CN104898581B (zh) * 2014-03-05 2018-08-24 青岛海尔机器人有限公司 一种全息智能中控系统
EP2933070A1 (en) 2014-04-17 2015-10-21 Aldebaran Robotics Methods and systems of handling a dialog with a robot
JP6739907B2 (ja) * 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム
JP6516585B2 (ja) * 2015-06-24 2019-05-22 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 制御装置、その方法及びプログラム
TW201707471A (zh) * 2015-08-14 2017-02-16 Unity Opto Technology Co Ltd 自動控制指向性喇叭及其燈具
TWI603626B (zh) * 2016-04-26 2017-10-21 音律電子股份有限公司 揚聲裝置、其控制方法及播放控制系統
WO2018190099A1 (ja) * 2017-04-10 2018-10-18 ヤマハ株式会社 音声提供装置、音声提供方法及びプログラム
TWI671635B (zh) * 2018-04-30 2019-09-11 仁寶電腦工業股份有限公司 分離式移動智能系統及其操作方法與基座裝置
EP3685718A1 (en) * 2019-01-24 2020-07-29 Millo Appliances, UAB Kitchen worktop-integrated food blending and mixing system
JP7026066B2 (ja) * 2019-03-13 2022-02-25 株式会社日立ビルシステム 音声案内システム及び音声案内方法
US11380094B2 (en) 2019-12-12 2022-07-05 At&T Intellectual Property I, L.P. Systems and methods for applied machine cognition

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0956552T3 (da) * 1995-12-04 2002-11-04 Jared C Bernstein Fremgangsmåde og anordninger til kombinerede informationer fra talesignaler med henblik på adaptiv interaktion til undervisnings- og testformål
US6118888A (en) * 1997-02-28 2000-09-12 Kabushiki Kaisha Toshiba Multi-modal interface apparatus and method
IL120855A0 (en) * 1997-05-19 1997-09-30 Creator Ltd Apparatus and methods for controlling household appliances
US6077085A (en) * 1998-05-19 2000-06-20 Intellectual Reserve, Inc. Technology assisted learning
WO1999067067A1 (fr) * 1998-06-23 1999-12-29 Sony Corporation Robot et systeme de traitement d'information
JP4036542B2 (ja) * 1998-09-18 2008-01-23 富士通株式会社 エコーキャンセラ
JP2001157976A (ja) * 1999-11-30 2001-06-12 Sony Corp ロボット制御装置およびロボット制御方法、並びに記録媒体
AU4449801A (en) * 2000-03-24 2001-10-03 Creator Ltd. Interactive toy applications
JP4480843B2 (ja) * 2000-04-03 2010-06-16 ソニー株式会社 脚式移動ロボット及びその制御方法、並びに、脚式移動ロボット用相対移動測定センサ
GB0010034D0 (en) * 2000-04-26 2000-06-14 20 20 Speech Limited Human-machine interface apparatus
JP4296714B2 (ja) * 2000-10-11 2009-07-15 ソニー株式会社 ロボット制御装置およびロボット制御方法、記録媒体、並びにプログラム
US20020150869A1 (en) * 2000-12-18 2002-10-17 Zeev Shpiro Context-responsive spoken language instruction

Also Published As

Publication number Publication date
RU2336560C2 (ru) 2008-10-20
JP2005525597A (ja) 2005-08-25
TWI280481B (en) 2007-05-01
EP1506472A1 (en) 2005-02-16
PL372592A1 (en) 2005-07-25
AU2003230067A1 (en) 2003-11-11
WO2003096171A1 (en) 2003-11-20
US20050159955A1 (en) 2005-07-21
BR0304830A (pt) 2004-08-17
CN100357863C (zh) 2007-12-26
CN1653410A (zh) 2005-08-10
RU2004136294A (ru) 2005-05-27

Similar Documents

Publication Publication Date Title
TW200407710A (en) Dialog control for an electric apparatus
US8723984B2 (en) Selective sound source listening in conjunction with computer interactive processing
JP3670180B2 (ja) 補聴器
US11803579B2 (en) Apparatus, systems and methods for providing conversational assistance
CN110035250A (zh) 音频处理方法、处理设备、终端及计算机可读存储介质
JP2019220848A (ja) データ処理装置、データ処理方法及びプログラム
JP2007050461A (ja) ロボット制御システム、ロボット装置、およびロボット制御方法
EP3684076B1 (en) Accelerometer-based selection of an audio source for a hearing device
US20210409876A1 (en) Method for Adjusting a Hearing Aid Device and System for Carrying Out the Method
JP6798258B2 (ja) 生成プログラム、生成装置、制御プログラム、制御方法、ロボット装置及び通話システム
JP7087804B2 (ja) コミュニケーション支援装置、コミュニケーション支援システム及び通信方法
JP2015192332A (ja) 状況把握用ユニット
KR20030024904A (ko) 스피치-제어 수단 및 스피치-제어 수단의 기능을테스트하는 테스트 수단을 구비한 장치
US20230351261A1 (en) Learning data generating device, learning data generating method, learning device, learning method, data structure, information processor, and acoustic treatment device
JP7286303B2 (ja) 会議支援システム及び会議用ロボット
KR20040107523A (ko) 전기 장치에 대한 대화 제어
CN112820265A (zh) 一种语音合成模型训练方法和相关装置
Okuno et al. Realizing audio-visually triggered ELIZA-like non-verbal behaviors
Okuno et al. Realizing personality in audio-visually triggered non-verbal behaviors
CN114203148A (zh) 模拟语音播放方法、装置、电子设备及存储介质
JP2007030050A (ja) ロボット制御装置、ロボット制御システム、ロボット装置、およびロボット制御方法
JP2005123959A (ja) 高臨場感通信会議装置
WO2024185334A1 (ja) 情報処理装置、および情報処理方法、並びにプログラム
US20240107257A1 (en) Relocation of sound components in spatial audio content
US20230306828A1 (en) Apparatus, method and computer program for identifying acoustic events, in particular acoustic information and/or warning signals

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees