TWI474317B - 訊號處理裝置以及訊號處理方法 - Google Patents
訊號處理裝置以及訊號處理方法 Download PDFInfo
- Publication number
- TWI474317B TWI474317B TW101124391A TW101124391A TWI474317B TW I474317 B TWI474317 B TW I474317B TW 101124391 A TW101124391 A TW 101124391A TW 101124391 A TW101124391 A TW 101124391A TW I474317 B TWI474317 B TW I474317B
- Authority
- TW
- Taiwan
- Prior art keywords
- voice
- signal
- recognition system
- voice recognition
- audio
- Prior art date
Links
- 238000003672 processing method Methods 0.000 title claims description 18
- 238000001514 detection method Methods 0.000 claims description 79
- 230000005236 sound signal Effects 0.000 claims description 42
- 230000006870 function Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W52/00—Power management, e.g. TPC [Transmission Power Control], power saving or power classes
- H04W52/02—Power saving arrangements
- H04W52/0209—Power saving arrangements in terminal devices
- H04W52/0251—Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
- H04W52/0254—Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity detecting a user operation or a tactile contact or a motion of the device
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Description
本發明提供一種訊號處理裝置以及訊號處理方法,尤指一種透過一語音偵測單元來控制一語音辨識系統是否對一聲音訊號進行語音辨識的訊號處理裝置以及相關的訊號處理方法。
於語音指令功能中,核心工作是先將錄製之聲音訊號進行語音辨識,接著於辨識出指令之後,基於所辨識的指令來決定系統(例如電腦系統)應執行之相對應動作。例如,當系統透過語音辨識後獲得一開啟網頁瀏覽器之指令,則系統便開啟網頁瀏覽器。又例如系統處於省電模式(例如休眠狀態)下,透過語音辨識後獲得一喚醒系統之指令,則系統便脫離省電模式(休眠狀態)而回到正常模式(正常操作狀態)。
為了使進行系統語音辨識時沒有遺漏關鍵之語音訊號,系統可能以麥克風持續不斷地收音,並且將收錄並數位化之訊號持續進行語音辨識。然而,此收音過程往往使得錄製之待辨識之訊號包含過多非語音之期間。
此語音辨識的工作一般是以軟體程式執行,若持續將所有麥克風收音之訊號送與此語音辨識系統進行運算,但收音期間內之訊號
中卻未曾出現過關鍵之語音訊號,將會造成無謂的電能耗費而無法順應節能/省電潮流,若語音辨識系統是設置於行動裝置中,則會降低行動裝置的電池續航能力。
傳統上為了避免持續進行語音辨識之額外功率消耗,或是節省語音辨識前所需的暫存空間,可能會要求使用者在使用語音辨識之前以手動方式(例如按壓按鍵)來發送/觸發一語音起始指令,使用者並在語音輸入完畢之後,以手動方式(例如按壓按鍵)來發送一語音結束指令。因此,語音辨識系統只需要針對語音起始指令和語音結束指令之期間進行聲音訊號之語音辨識即可。
然而,由於使用者需要手動地控制語音辨識的啟用與關閉,因此,必須在使用者本身得以觸及系統之按鍵的情形下才能順利控制語音辨識的啟用與關閉,所以,這樣的語音辨識控制機制對於使用者而言並非十分便利,再者,當上述之語音辨識控制機制應用於語音喚醒系統之功能時,則可能由於使用者無法直接觸及系統之按鍵,故無法以語音起始指令及語音結束指令來達成節電效果,因此只能以持續收音、錄製,並持續進行語音辨識之方式,才能提供語音喚醒功能。
本發明目的之一在於提供一種透過一語音偵測單元來控制一語音辨識系統是否對一聲音訊號進行語音辨識的訊號處理裝置以及相
關的訊號處理方法,以解決上述問題。
依據本發明之實施例,其揭露一種訊號處理裝置。該訊號處理裝置包含有一語音辨識系統以及一語音偵測單元。該語音偵測單元耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識。
依據本發明之實施例,其另揭露一種訊號處理方法。該訊號處理方法包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識。
本發明是藉由運用語音偵測單元作為先期判斷,以篩選出不可能為語音訊號之部分,此部份已判定為非語音訊號之期間,故系統可以不進行語音辨識;而當語音偵測單元表示可能為語音訊號之期間,則需要進一步透過語音辨識系統來進行語音辨識,以決定系統的後續動作。因此,當本發明之語音辨識控制機制應用於語音喚醒系統之功能時,則可以於系統處於省電模式(休眠狀態)下致能語音偵測單元來偵測所收錄之聲音訊號是否為語音訊號,若語音偵測單元判斷所收錄之聲音訊號並非語音訊號,則系統會繼續處於省電模式(休眠狀態)下,另一方面,若語音偵測單元判斷所收錄之聲音訊號為語音訊號,則語音辨識系統會被致能來判斷所收錄之聲音
訊號中是否存在一系統喚醒指令。因語音偵測單元可以簡單架構實現,即使全時開啟運作亦不影響全系統之節能效益,而因語音偵測單元可以篩選排除不可能為語音訊號之期間,故可避免語音辨識系統無謂之電能耗費,進而達成節能功效。此外,因為不需由使用者以手動方式來標示語音起始及語音結束之期間,故即使使用者無法直接觸及系統按鍵,亦可透過語音偵測單元的輔助而達成語音喚醒的目。
本發明的主要概念在於結合語音偵測(voice activity detection)與語音辨識(speech recognition),因此,一語音偵測單元會依據收錄之聲音特性,經過連續之運算與判斷來推估該收錄之聲音訊號是否可能為語音訊號。另外,語音辨識系統會依據語音偵測單元之判斷結果,決定是否對收錄之聲音訊號進行語音辨識之工作,由於語音偵測可以篩選排除不可能為語音訊號之期間,故使得語音辨識系統無謂之電能耗費,進而達成節能功效。進一步的細節將於下詳述。
請參照第1圖,第1圖是本發明訊號處理裝置之一實施例的功能方塊示意圖。訊號處理裝置100包含一訊號收集(signal collection)單元102、一語音辨識系統104以及一語音偵測單元106,其中語音偵測單元106耦接於訊號收集單元102與語音辨識系統104,以及訊號收集單元102耦接於語音辨識系統104。於一實作方式中,訊號收集單元102、語音辨識系統104以及語音偵測單元106均是由
硬體來加以實作,因此訊號收集單元102、語音辨識系統104以及語音偵測單元106可個別地控制操作狀態,故可達到較佳的節電功效,然而,此僅作為範例說明,而非本發明的限制條件,舉例來說,只要是採用本發明所揭示之透過語音偵測來輔助語音辨識的運作,均落入本發明的範疇。
於本發明的第一種應用(例如語音喚醒功能)中,只有當訊號收集單元102與語音辨識系統104均處於一省電模式(例如休眠狀態)時,語音偵測單元106才會被致能。假若訊號收集單元102與語音辨識系統104因為關機或休眠的指令而由一正常模式進入一省電模式,則語音偵測單元106此時會被致能來開始執行語音偵測的操作。一聲音訊號(audio signal)S_IN會輸入至語音偵測單元106,而語音偵測單元106便會即時地偵測聲音訊號S_IN是否為一語音訊號(voice signal),並輸出一語音偵測結果VAD至語音辨識系統104。語音偵測結果VAD可作為語音辨識系統104之一致能訊號,舉例來說,當語音偵測單元106判斷聲音訊號S_IN並非為語音訊號時,VAD=0,因此語音辨識系統104仍持續處於省電模式,而當語音偵測單元106判斷聲音訊號S_IN為語音訊號時,則VAD=1,因此語音辨識系統104便會離開省電模式並回到正常模式。此外,訊號收集單元102亦可由語音偵測結果VAD來控制是否離開省電模式並回到正常模式。透過語音偵測結果VAD的輔助,只有在語音偵測單元106判斷聲音訊號S_IN為語音訊號時,語音辨識系統104才會對訊號收集單元102所收錄之聲音訊號S_IN進行語音辨識的處理,由
於語音辨識系統104於省電模式中會關閉大部分的內部電路,因此可達到節電的目的。
另一方面,當語音辨識系統104對聲音訊號S_IN進行語音辨識的處理而判斷聲音訊號S_IN挾帶一預定指令資訊CMD(例如一系統喚醒指令),則語音辨識系統104會輸出預定指令資訊CMD(例如系統喚醒指令)至後端的系統,舉例來說,訊號處理裝置100係為一應用裝置的一部份,則語音辨識系統104可輸出預定指令資訊CMD(例如系統喚醒指令)至該應用裝置之一控制器(例如處理器),因此,該應用裝置之該控制器便會基於所接收到的預定指令資訊CMD(例如系統喚醒指令)來執行相對應的操作(例如讓該應用裝置開機或全速運行)。另一方面,若語音辨識系統104判斷聲音訊號S_IN並未挾帶任何預定指令資訊CMD(例如系統喚醒指令),則表示目前的聲音訊號S_IN可能被語音偵測單元106誤判為語音訊號,或者目前的聲音訊號S_IN雖然是語音訊號,但是並非是跟系統喚醒有關的語音指令,故訊號收集單元102與語音辨識系統104會再次進入省電模式以有效地節電。
請一併參照第1圖與第2圖,第2圖是第1圖所示之訊號處理裝置100於第一種應用(例如語音喚醒功能)中的範例操作的流程圖。假若可以獲得大致上相同的結果,則步驟不一定要遵照第2圖所示之順序來執行。第1圖所示之訊號處理裝置100所採用之訊號處理方法可簡單歸納如下。
步驟202:使用訊號處理裝置100的應用裝置會全速運行。此時,訊號收集單元102與語音辨識系統104均處於正常模式,而語音偵測單元106此時並沒有被致能。
步驟204:訊號收集單元102與語音辨識系統104處於省電模式。
步驟206:語音偵測單元106會致能,並偵測聲音訊號S_IN是否為語音訊號來產生語音偵測結果VAD。
步驟208:語音偵測結果VAD是否指示聲音訊號S_IN為語音訊號(亦即VAD=1)?若是,則執行步驟210;否則,回到步驟204,故訊號收集單元102與語音辨識系統104仍繼續處於省電模式(步驟204),且語音偵測單元106仍繼續偵測聲音訊號S_IN是否為語音訊號(步驟206)。
步驟210:語音偵測單元106無需致能而被關閉。
步驟212:訊號收集單元102與語音辨識系統104會被喚醒而由省電模式回到正常模式。
步驟214:訊號收集單元102開始將聲音訊號S_IN記錄至一儲存裝置(例如記憶體),例如可透過直接記憶體存取(direct memory access,DMA)的技術來將所接收之聲音訊號S_IN寫入至儲存裝置,以及語音辨識系統104開始對訊號收集單元102所收錄的聲音訊號S_IN進行語音辨識,來判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如系統喚醒指令)。
步驟216:聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如系
統喚醒指令)?若是,則執行步驟218;否則,回到步驟204,故訊號收集單元102與語音辨識系統104會再次進入省電模式(步驟204),且語音偵測單元106會再次致能來偵測聲音訊號S_IN是否為語音訊號(步驟206)。
步驟218:該應用裝置基於預定指令資訊CMD(例如系統喚醒指令)而全速運行。
由於熟習技藝者基於上述的相關說明即可輕易地瞭解各個步驟的操作細節,故進一步的說明便在此省略以求簡潔。
於本發明的第二種應用中,當訊號收集單元102與語音辨識系統104均處於一正常模式(例如正常操作狀態)時,語音偵測單元106一併會被致能。聲音訊號S_IN會分別輸入至語音偵測單元106與訊號收集單元102,因此,訊號收集單元102會儲存聲音訊號S_IN以供語音辨識系統104進行語音辨識之用,同時,語音偵測單元106會一併偵測聲音訊號S_IN是否為語音訊號,並輸出語音偵測結果VAD至語音辨識系統104。語音偵測結果VAD可作為語音辨識系統104是否執行語音辨識操作的控制訊號,舉例來說,當語音偵測單元106判斷聲音訊號S_IN並非為語音訊號時,VAD=0,因此語音辨識系統104並不會對聲音訊號S_IN進行語音辨識的處理,雖然語音辨識系統104操作於正常模式而不會關閉內部電路,不過,由於語音辨識系統104沒有對聲音訊號S_IN進行語音辨識的處理,故語音辨識系統104此時僅會有最低功耗,故仍可達到節電的
目的,另一方面,當語音偵測單元106判斷聲音訊號S_IN為語音訊號時,則VAD=1,因此語音辨識系統104便會對聲音訊號S_IN進行語音辨識的處理。簡而言之,透過語音偵測結果VAD的輔助,只有在語音偵測單元106判斷聲音訊號S_IN為語音訊號時,處於正常模式中的語音辨識系統104才會對訊號收集單元102所收錄之聲音訊號S_IN進行語音辨識的處理,並判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令),因此亦可達到節電的目的。
請一併參照第1圖與第3圖,第3圖是第1圖所示之訊號處理裝置100於第二種應用中的範例操作的流程圖。假若可以獲得大致上相同的結果,則步驟不一定要遵照第3圖所示之順序來執行。第1圖所示之訊號處理裝置100所採用之訊號處理方法可簡單歸納如下。
步驟302:使用訊號處理裝置100的應用裝置會全速運行。此時,訊號收集單元102與語音辨識系統104均處於正常模式,且語音偵測單元106此時會被致能。
步驟304:訊號收集單元102將聲音訊號S_IN記錄至一儲存裝置(例如記憶體),例如可透過直接記憶體存取的技術來將所接收之聲音訊號S_IN寫入至儲存裝置,以及語音偵測單元106偵測聲音訊號S_IN是否為語音訊號來產生語音偵測結果VAD。
步驟306:語音偵測結果VAD是否指示聲音訊號S_IN為語音訊號(亦即VAD=1)?若是,則執行步驟308;否則,回到步驟304。
步驟308:語音辨識系統104對訊號收集單元102所收錄的聲音訊號S_IN進行語音辨識,來判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令)。
步驟310:聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令)?若是,則執行步驟312;否則,回到步驟304。
步驟312:該應用裝置基於預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令)而執行相對應的操作。
由於熟習技藝者基於上述的相關說明即可輕易地瞭解各個步驟的操作細節,故進一步的說明便在此省略以求簡潔。
如上所述,語音偵測單元106是用來偵測聲音訊號是否為語音訊號,而評估之聲音特性可能有單元訊框時間內之過零率、單元訊框時間內之平均能量、頻率範圍內之單元訊框時間內之峰值振幅,或是以線性預估(LP)分析頻譜取得之頻譜包絡線等等。於本實施例中,語音偵測單元106可利用一個或多個判斷條件來決定語音偵測結果VAD。舉例來說,語音偵測單元106可採用以下所述之複數種判斷條件的各種組合來決定語音偵測結果VAD為1或0:
判斷條件(1):聲音訊號S_IN包含有一目前聲音訊框,以及語音偵測單元106會比較該目前聲音訊框之平均能量EV_C與一臨界值TH1;判斷條件(2):聲音訊號S_IN包含有至少一先前聲音訊框與一目前聲音訊框,以及語音偵測單元106會依據該至少一先前聲音訊框之平均能量來決定一訊號能量趨勢值EV_T,計算該目前聲音訊框之平均能量EV_C與訊號能量趨勢值EV_T之一差值D1(亦即D1=|EV_C-EV_T|),並比較差值D1與一臨界值TH2;判斷條件(3):聲音訊號S_IN包含有複數個聲音訊框,以及語音偵測單元106會比較該複數個聲音訊框中被判斷為不包含語音訊號之連續聲音訊框的個數N與一臨界值TH3;以及判斷條件(4):聲音訊號S_IN包含有一先前聲音訊框與一目前聲音訊框,以及語音偵測單元106會計算該目前聲音訊框之平均能量EV_C與該先前聲音訊框之平均能量EV_P的一差值D2(亦即D2=|EV_C-EV_P|),並比較差值D2與一臨界值TH4。
請參閱第4圖,第4圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第一實施例的流程圖。假若可以獲得大致上相同的結果,則步驟不一定要遵照第4圖所示之順序來執行。語音偵測單元106決定語音偵測結果VAD的操作可簡單歸納如下。
步驟402:檢查判斷條件(1)來判斷目前聲音訊框之平均能量EV_C是否小於臨界值TH1(亦即EV_C<TH1)以偵測聲音能量
是否過低。若是,則執行步驟404;否則執行步驟406;步驟404:由於聲音能量過低,因此判定該目前聲音訊框不可能是語音訊號,故設定VAD=0。
步驟406:檢查判斷條件(2)來判斷差值D1是否小於臨界值TH2(亦即D1<TH2)以偵測平均能量相較於短時間的能量趨勢是否變動很大。若是,則執行步驟410;否則執行步驟408;步驟408:由於該目前聲音訊框之平均能量EV_C與短時間內之訊號能量趨勢無明顯差異,因此判定該目前聲音訊框不可能是語音訊號,故設定VAD=0。
步驟410:檢查判斷條件(3)來判斷個數N是否大於臨界值TH3(亦即N>TH3)以偵測先前是否已持續維持無聲達一段很長時間。若是,則執行步驟414;否則執行步驟412。
步驟412:由於先前尚未持續維持無聲達一段很長時間,因此判定目前聲音訊框是語音訊號,故設定VAD=1。
步驟414:檢查判斷條件(4)來判斷差值D2是否大於臨界值TH4(亦即D2>TH4)以偵測兩連續聲音訊框的平均能量變化是否很大。若是,則執行步驟418;否則執行步驟416。
步驟416:由於兩連續聲音訊框的平均能量變化並非很大,因此判定目前聲音訊框不可能是語音訊號,故設定VAD=0。
步驟418:由於兩連續聲音訊框的平均能量變化很大,因此判定目前聲音訊框是語音訊號,故設定VAD=1。
請注意,第4圖所示流程中檢查判斷條件(1)~(4)的順序僅作為
範例說明之用,並非本發明的限制條件,於其它設計變化中,亦可採用不同的順序來檢查判斷條件(1)~(4)。此外,並不一定要採用所有的判斷條件(1)~(4)來設計語音偵測結果VAD的判斷流程,換言之,只要採用了判斷條件(1)~(4)中的任一判斷條件,即落入本發明的範疇。
第5圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第二實施例的流程圖。若聲音能量過低,便設定VAD=0(步驟502、504),否則的話,便設定VAD=1(步驟502、506)。第6圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第三實施例的流程圖。若聲音能量過低,便設定VAD=0(步驟602、604);若聲音能量夠高,但平均能量的變動沒有很大,則設定VAD=0(步驟602、606、608);若聲音能量夠高,且平均能量的變動很大,則設定VAD=1(步驟602、606、610)。第7圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第四實施例的流程圖。若聲音能量過低,便設定VAD=0(步驟702、704);若聲音能量夠高,但兩連續聲音訊框的平均能量變化沒有很大,則設定VAD=0(步驟702、706、708);若聲音能量夠高,且兩連續聲音訊框的平均能量變化很大,則設定VAD=1(步驟702、706、710)。
由於熟習技藝者基於上述有關第4圖之流程的相關說明即可輕易地瞭解第5圖~第7中各個步驟的操作細節,故進一步的說明便在此省略以求簡潔。
以上所述僅為本發明之實施例,凡依本發明申請專利範圍所做之均等變化與修飾,皆應屬本發明之涵蓋範圍。
100‧‧‧訊號處理裝置
102‧‧‧訊號收集單元
104‧‧‧語音辨識系統
106‧‧‧語音偵測單元
202~218、302~312、402~418、502~506、602~610、702~710‧‧‧步驟
第1圖是本發明訊號處理裝置之一實施例的功能方塊示意圖。
第2圖是第1圖所示之訊號處理裝置於第一種應用(例如語音喚醒功能)中的範例操作的流程圖。
第3圖是第1圖所示之訊號處理裝置於第二種應用中的範例操作的流程圖。
第4圖為第1圖所示之語音偵測單元決定語音偵測結果之一第一實施例的流程圖。
第5圖為第1圖所示之語音偵測單元決定語音偵測結果之一第二實施例的流程圖。
第6圖為第1圖所示之語音偵測單元決定語音偵測結果之一第三實施例的流程圖。
第7圖為第1圖所示之語音偵測單元決定語音偵測結果之一第四實施例的流程圖。
100‧‧‧訊號處理裝置
102‧‧‧訊號收集單元
104‧‧‧語音辨識系統
106‧‧‧語音偵測單元
Claims (18)
- 一種訊號處理裝置,包含有:一語音辨識系統;以及一語音偵測單元,耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識;其中當該語音辨識系統由一正常模式進入一省電模式時,該語音偵測單元才會被致能。
- 如申請專利範圍第1項所述之訊號處理裝置,其中當該語音偵測單元偵測到該聲音訊號為該語音訊號時,該語音辨識系統會對該聲音訊號進行語音辨識,以及當該語音偵測單元偵測到該聲音訊號並非為該語音訊號時,該語音辨識系統不會對該聲音訊號進行語音辨識。
- 如申請專利範圍第1項所述之訊號處理裝置,其中當該語音偵測單元偵測到該聲音訊號為該語音訊號時,該語音辨識系統會離開該省電模式而進入該正常模式來對該聲音訊號進行語音辨識。
- 如申請專利範圍第3項所述之訊號處理裝置,其中該語音辨識系統會對該聲音訊號進行語音辨識來判斷該聲音訊號是否包含一預定指令資訊,以及當該語音辨識系統判斷該聲音訊號不包含該預定指令資訊時,該語音辨識系統會離開該正常模式並進入該省 電模式。
- 如申請專利範圍第4項所述之訊號處理裝置,其中該指令資訊係為一系統喚醒指令。
- 一種訊號處理裝置,包含有:一語音辨識系統;以及一語音偵測單元,耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有一目前聲音訊框,以及該語音偵測單元會比較該目前聲音訊框之平均能量與一臨界值。
- 一種訊號處理裝置,包含有:一語音辨識系統;以及一語音偵測單元,耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有至少一先前聲音訊框與一目前聲音訊框,以及該語音偵測單元會依據該至少一先前聲音訊框之平均能量來決定一訊號能量趨勢值,計算該目前聲音訊框之平均能量與該訊號能量趨勢值之一差值,並比較該差值與一臨界值。
- 一種訊號處理裝置,包含有:一語音辨識系統;以及一語音偵測單元,耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有複數個聲音訊框,以及該語音偵測單元會比較該複數個聲音訊框中被判斷為不包含該語音訊號之連續聲音訊框的個數與一臨界值。
- 一種訊號處理裝置,包含有:一語音辨識系統;以及一語音偵測單元,耦接於該語音辨識系統,用以偵測一聲音訊號是否為一語音訊號,並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有一先前聲音訊框與一目前聲音訊框,以及該語音偵測單元會計算該目前聲音訊框之平均能量與該先前聲音訊框之平均能量的一差值,並比較該差值與一臨界值。
- 一種訊號處理方法,包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以 及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識;其中偵測該聲音訊號是否為該語音訊號的步驟係於該語音辨識系統由一正常模式進入一省電模式時才會被執行。
- 如申請專利範圍第10項所述之訊號處理方法,其中依據該語音偵測結果來控制該語音辨識系統是否對該聲音訊號進行語音辨識的步驟包含:當偵測到該聲音訊號為該語音訊號時,使用該語音辨識系統來對該聲音訊號進行語音辨識;以及當偵測到該聲音訊號並非為該語音訊號時,不使用該語音辨識系統來對該聲音訊號進行語音辨識。
- 如申請專利範圍第10項所述之訊號處理方法,其中依據該語音偵測結果來控制該語音辨識系統是否對該聲音訊號進行語音辨識的步驟包含:當偵測到該聲音訊號為該語音訊號時,控制該語音辨識系統離開該省電模式而進入該正常模式來對該聲音訊號進行語音辨識。
- 如申請專利範圍第12項所述之訊號處理方法,其中該語音辨識系統會對該聲音訊號進行語音辨識來判斷該聲音訊號是否包含一預定指令資訊,以及該訊號處理方法另包含: 當該語音辨識系統判斷該聲音訊號不包含該預定指令資訊時,控制該語音辨識系統離開該正常模式並進入該省電模式。
- 如申請專利範圍第13項所述之訊號處理方法,其中該指令資訊係為一系統喚醒指令。
- 一種訊號處理方法,包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有一目前聲音訊框,以及偵測該聲音訊號是否為該語音訊號的步驟包含:比較該目前聲音訊框之平均能量與一臨界值。
- 一種訊號處理方法,包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有至少一先前聲音訊框與一目前聲音訊框,以及偵測該聲音訊號是否為該語音訊號的步驟包含:依據該至少一先前聲音訊框之平均能量來決定一訊號能量 趨勢值;計算該目前聲音訊框之平均能量與該訊號能量趨勢值之一差值;以及比較該差值與一臨界值。
- 一種訊號處理方法,包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有複數個聲音訊框,以及偵測該聲音訊號是否為該語音訊號的步驟包含:比較該複數個聲音訊框中被判斷為不包含該語音訊號之連續聲音訊框的個數與一臨界值。
- 一種訊號處理方法,包含有:偵測一聲音訊號是否為一語音訊號,並產生一語音偵測結果;以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識;其中該聲音訊號包含有一先前聲音訊框與一目前聲音訊框,以及偵測該聲音訊號是否為該語音訊號的步驟包含:計算該目前聲音訊框之平均能量與該先前聲音訊框之平均 能量的一差值;以及比較該差值與一臨界值。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101124391A TWI474317B (zh) | 2012-07-06 | 2012-07-06 | 訊號處理裝置以及訊號處理方法 |
US13/615,515 US8972252B2 (en) | 2012-07-06 | 2012-09-13 | Signal processing apparatus having voice activity detection unit and related signal processing methods |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101124391A TWI474317B (zh) | 2012-07-06 | 2012-07-06 | 訊號處理裝置以及訊號處理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201403590A TW201403590A (zh) | 2014-01-16 |
TWI474317B true TWI474317B (zh) | 2015-02-21 |
Family
ID=49879184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101124391A TWI474317B (zh) | 2012-07-06 | 2012-07-06 | 訊號處理裝置以及訊號處理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8972252B2 (zh) |
TW (1) | TWI474317B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11763929B2 (en) | 2018-08-22 | 2023-09-19 | Centre For Addiction And Mental Health & Memotext Corporation | Medical tool aiding diagnosed psychosis patients in detecting auditory psychosis symptoms associated with psychosis |
Families Citing this family (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
US8862476B2 (en) * | 2012-11-16 | 2014-10-14 | Zanavox | Voice-activated signal generator |
US9704486B2 (en) * | 2012-12-11 | 2017-07-11 | Amazon Technologies, Inc. | Speech recognition power management |
JP2014145838A (ja) * | 2013-01-28 | 2014-08-14 | Honda Motor Co Ltd | 音響処理装置及び音響処理方法 |
US9818407B1 (en) * | 2013-02-07 | 2017-11-14 | Amazon Technologies, Inc. | Distributed endpointing for speech recognition |
US9256269B2 (en) * | 2013-02-20 | 2016-02-09 | Sony Computer Entertainment Inc. | Speech recognition system for performing analysis to a non-tactile inputs and generating confidence scores and based on the confidence scores transitioning the system from a first power state to a second power state |
US9349386B2 (en) * | 2013-03-07 | 2016-05-24 | Analog Device Global | System and method for processor wake-up based on sensor data |
US9112984B2 (en) * | 2013-03-12 | 2015-08-18 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US11393461B2 (en) | 2013-03-12 | 2022-07-19 | Cerence Operating Company | Methods and apparatus for detecting a voice command |
US9361885B2 (en) | 2013-03-12 | 2016-06-07 | Nuance Communications, Inc. | Methods and apparatus for detecting a voice command |
US9367079B2 (en) * | 2013-03-15 | 2016-06-14 | West Virginia University | Compressed sampling and memory |
US9467785B2 (en) | 2013-03-28 | 2016-10-11 | Knowles Electronics, Llc | MEMS apparatus with increased back volume |
US9503814B2 (en) | 2013-04-10 | 2016-11-22 | Knowles Electronics, Llc | Differential outputs in multiple motor MEMS devices |
US9110889B2 (en) | 2013-04-23 | 2015-08-18 | Facebook, Inc. | Methods and systems for generation of flexible sentences in a social networking system |
US9606987B2 (en) | 2013-05-06 | 2017-03-28 | Facebook, Inc. | Methods and systems for generation of a translatable sentence syntax in a social networking system |
US9711166B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | Decimation synchronization in a microphone |
US9633655B1 (en) | 2013-05-23 | 2017-04-25 | Knowles Electronics, Llc | Voice sensing and keyword analysis |
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
US10020008B2 (en) | 2013-05-23 | 2018-07-10 | Knowles Electronics, Llc | Microphone and corresponding digital interface |
US9712923B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | VAD detection microphone and method of operating the same |
US10028054B2 (en) | 2013-10-21 | 2018-07-17 | Knowles Electronics, Llc | Apparatus and method for frequency detection |
US20140358552A1 (en) * | 2013-05-31 | 2014-12-04 | Cirrus Logic, Inc. | Low-power voice gate for device wake-up |
TWI502406B (zh) * | 2013-08-23 | 2015-10-01 | Acer Inc | 電子裝置以及操控方法 |
US9386370B2 (en) | 2013-09-04 | 2016-07-05 | Knowles Electronics, Llc | Slew rate control apparatus for digital microphones |
US9502028B2 (en) | 2013-10-18 | 2016-11-22 | Knowles Electronics, Llc | Acoustic activity detection apparatus and method |
US9147397B2 (en) | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
US8990079B1 (en) | 2013-12-15 | 2015-03-24 | Zanavox | Automatic calibration of command-detection thresholds |
US9774949B2 (en) * | 2014-02-28 | 2017-09-26 | Texas Instruments Incorporated | Power control for multichannel signal processing circuit |
JP6149775B2 (ja) * | 2014-03-28 | 2017-06-21 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US9607613B2 (en) * | 2014-04-23 | 2017-03-28 | Google Inc. | Speech endpointing based on word comparisons |
WO2016007528A1 (en) * | 2014-07-10 | 2016-01-14 | Analog Devices Global | Low-complexity voice activity detection |
US9257120B1 (en) | 2014-07-18 | 2016-02-09 | Google Inc. | Speaker verification using co-location information |
US9549273B2 (en) * | 2014-08-28 | 2017-01-17 | Qualcomm Incorporated | Selective enabling of a component by a microphone circuit |
US9831844B2 (en) | 2014-09-19 | 2017-11-28 | Knowles Electronics, Llc | Digital microphone with adjustable gain control |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
US9812128B2 (en) | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9712915B2 (en) | 2014-11-25 | 2017-07-18 | Knowles Electronics, Llc | Reference microphone for non-linear and time variant echo cancellation |
FR3030177B1 (fr) * | 2014-12-16 | 2016-12-30 | Stmicroelectronics Rousset | Dispositif electronique comprenant un module de reveil d'un appareil electronique distinct d'un coeur de traitement |
DE112016000287T5 (de) | 2015-01-07 | 2017-10-05 | Knowles Electronics, Llc | Verwendung von digitalen Mikrofonen zur Niedrigleistung-Schlüsselworterkennung und Rauschunterdrückung |
TW201640322A (zh) | 2015-01-21 | 2016-11-16 | 諾爾斯電子公司 | 用於聲音設備之低功率語音觸發及方法 |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
KR102346302B1 (ko) * | 2015-02-16 | 2022-01-03 | 삼성전자 주식회사 | 전자 장치 및 음성 인식 기능 운용 방법 |
US9866938B2 (en) | 2015-02-19 | 2018-01-09 | Knowles Electronics, Llc | Interface for microphone-to-microphone communications |
US10291973B2 (en) | 2015-05-14 | 2019-05-14 | Knowles Electronics, Llc | Sensor device with ingress protection |
CN107534818B (zh) | 2015-05-14 | 2020-06-23 | 美商楼氏电子有限公司 | 麦克风 |
US9478234B1 (en) | 2015-07-13 | 2016-10-25 | Knowles Electronics, Llc | Microphone apparatus and method with catch-up buffer |
US10045104B2 (en) | 2015-08-24 | 2018-08-07 | Knowles Electronics, Llc | Audio calibration using a microphone |
KR102446392B1 (ko) * | 2015-09-23 | 2022-09-23 | 삼성전자주식회사 | 음성 인식이 가능한 전자 장치 및 방법 |
US9894437B2 (en) | 2016-02-09 | 2018-02-13 | Knowles Electronics, Llc | Microphone assembly with pulse density modulated signal |
WO2017138934A1 (en) | 2016-02-10 | 2017-08-17 | Nuance Communications, Inc. | Techniques for spatially selective wake-up word recognition and related systems and methods |
US9779735B2 (en) | 2016-02-24 | 2017-10-03 | Google Inc. | Methods and systems for detecting and processing speech signals |
WO2017217978A1 (en) | 2016-06-15 | 2017-12-21 | Nuance Communications, Inc. | Techniques for wake-up word recognition and related systems and methods |
US10499150B2 (en) | 2016-07-05 | 2019-12-03 | Knowles Electronics, Llc | Microphone assembly with digital feedback loop |
US10115399B2 (en) * | 2016-07-20 | 2018-10-30 | Nxp B.V. | Audio classifier that includes analog signal voice activity detection and digital signal voice activity detection |
US10257616B2 (en) | 2016-07-22 | 2019-04-09 | Knowles Electronics, Llc | Digital microphone assembly with improved frequency response and noise characteristics |
US9972320B2 (en) | 2016-08-24 | 2018-05-15 | Google Llc | Hotword detection on multiple devices |
JP2018074366A (ja) * | 2016-10-28 | 2018-05-10 | 京セラ株式会社 | 電子機器、制御方法およびプログラム |
US10979824B2 (en) | 2016-10-28 | 2021-04-13 | Knowles Electronics, Llc | Transducer assemblies and methods |
EP3430617B1 (en) | 2016-11-07 | 2019-10-23 | Google LLC | Recorded media hotword trigger suppression |
CN111971742B (zh) | 2016-11-10 | 2024-08-20 | 赛轮思软件技术(北京)有限公司 | 与语言无关的唤醒词检测的技术 |
US20180174574A1 (en) * | 2016-12-19 | 2018-06-21 | Knowles Electronics, Llc | Methods and systems for reducing false alarms in keyword detection |
US10559309B2 (en) | 2016-12-22 | 2020-02-11 | Google Llc | Collaborative voice controlled devices |
DE112017006684T5 (de) | 2016-12-30 | 2019-10-17 | Knowles Electronics, Llc | Mikrofonanordnung mit authentifizierung |
CN106898352B (zh) * | 2017-02-27 | 2020-09-25 | 联想(北京)有限公司 | 语音控制方法及电子设备 |
KR102321396B1 (ko) | 2017-04-20 | 2021-11-03 | 구글 엘엘씨 | 장치에 대한 다중 사용자 인증 |
US10395650B2 (en) | 2017-06-05 | 2019-08-27 | Google Llc | Recorded media hotword trigger suppression |
US10929754B2 (en) | 2017-06-06 | 2021-02-23 | Google Llc | Unified endpointer using multitask and multidomain learning |
US10468020B2 (en) * | 2017-06-06 | 2019-11-05 | Cypress Semiconductor Corporation | Systems and methods for removing interference for audio pattern recognition |
WO2018226779A1 (en) | 2017-06-06 | 2018-12-13 | Google Llc | End of query detection |
US11025356B2 (en) | 2017-09-08 | 2021-06-01 | Knowles Electronics, Llc | Clock synchronization in a master-slave communication system |
US11061642B2 (en) | 2017-09-29 | 2021-07-13 | Knowles Electronics, Llc | Multi-core audio processor with flexible memory allocation |
US11087780B2 (en) * | 2017-12-21 | 2021-08-10 | Synaptics Incorporated | Analog voice activity detector systems and methods |
JP7065314B2 (ja) * | 2018-02-14 | 2022-05-12 | パナソニックIpマネジメント株式会社 | 制御システム、及び、制御方法 |
US10861462B2 (en) | 2018-03-12 | 2020-12-08 | Cypress Semiconductor Corporation | Dual pipeline architecture for wakeup phrase detection with speech onset detection |
US10692496B2 (en) | 2018-05-22 | 2020-06-23 | Google Llc | Hotword suppression |
US11438682B2 (en) | 2018-09-11 | 2022-09-06 | Knowles Electronics, Llc | Digital microphone with reduced processing noise |
US10908880B2 (en) | 2018-10-19 | 2021-02-02 | Knowles Electronics, Llc | Audio signal circuit with in-place bit-reversal |
US11277685B1 (en) * | 2018-11-05 | 2022-03-15 | Amazon Technologies, Inc. | Cascaded adaptive interference cancellation algorithms |
JP7407580B2 (ja) | 2018-12-06 | 2024-01-04 | シナプティクス インコーポレイテッド | システム、及び、方法 |
JP2022051970A (ja) * | 2019-02-01 | 2022-04-04 | ソニーグループ株式会社 | 情報処理装置、情報処理方法、およびプログラム |
KR20200126509A (ko) | 2019-04-30 | 2020-11-09 | 삼성전자주식회사 | 가전기기 및 이의 제어 방법 |
US11064294B1 (en) | 2020-01-10 | 2021-07-13 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
CN113571053B (zh) | 2020-04-28 | 2024-07-30 | 华为技术有限公司 | 语音唤醒方法和设备 |
US11462218B1 (en) * | 2020-04-29 | 2022-10-04 | Amazon Technologies, Inc. | Conserving battery while detecting for human voice |
CN113990311A (zh) * | 2021-10-15 | 2022-01-28 | 深圳市航顺芯片技术研发有限公司 | 语音采集装置、控制器、控制方法及语音采集控制系统 |
US12057138B2 (en) | 2022-01-10 | 2024-08-06 | Synaptics Incorporated | Cascade audio spotting system |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222258A1 (en) * | 2008-02-29 | 2009-09-03 | Takashi Fukuda | Voice activity detection system, method, and program product |
WO2010048635A1 (en) * | 2008-10-24 | 2010-04-29 | Aliphcom, Inc. | Acoustic voice activity detection (avad) for electronic systems |
GB2499781A (en) * | 2012-02-16 | 2013-09-04 | Ian Vince Mcloughlin | Acoustic information used to determine a user's mouth state which leads to operation of a voice activity detector |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2573352B2 (ja) * | 1989-04-10 | 1997-01-22 | 富士通株式会社 | 音声検出装置 |
US6070140A (en) * | 1995-06-05 | 2000-05-30 | Tran; Bao Q. | Speech recognizer |
JP3674990B2 (ja) * | 1995-08-21 | 2005-07-27 | セイコーエプソン株式会社 | 音声認識対話装置および音声認識対話処理方法 |
KR100429896B1 (ko) * | 2001-11-22 | 2004-05-03 | 한국전자통신연구원 | 잡음 환경에서의 음성신호 검출방법 및 그 장치 |
US20030171932A1 (en) * | 2002-03-07 | 2003-09-11 | Biing-Hwang Juang | Speech recognition |
US20070057798A1 (en) * | 2005-09-09 | 2007-03-15 | Li Joy Y | Vocalife line: a voice-operated device and system for saving lives in medical emergency |
JP5446874B2 (ja) * | 2007-11-27 | 2014-03-19 | 日本電気株式会社 | 音声検出システム、音声検出方法および音声検出プログラム |
EP2639793B1 (en) * | 2012-03-15 | 2016-04-20 | Samsung Electronics Co., Ltd | Electronic device and method for controlling power using voice recognition |
US9142215B2 (en) * | 2012-06-15 | 2015-09-22 | Cypress Semiconductor Corporation | Power-efficient voice activation |
-
2012
- 2012-07-06 TW TW101124391A patent/TWI474317B/zh active
- 2012-09-13 US US13/615,515 patent/US8972252B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090222258A1 (en) * | 2008-02-29 | 2009-09-03 | Takashi Fukuda | Voice activity detection system, method, and program product |
WO2010048635A1 (en) * | 2008-10-24 | 2010-04-29 | Aliphcom, Inc. | Acoustic voice activity detection (avad) for electronic systems |
GB2499781A (en) * | 2012-02-16 | 2013-09-04 | Ian Vince Mcloughlin | Acoustic information used to determine a user's mouth state which leads to operation of a voice activity detector |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11763929B2 (en) | 2018-08-22 | 2023-09-19 | Centre For Addiction And Mental Health & Memotext Corporation | Medical tool aiding diagnosed psychosis patients in detecting auditory psychosis symptoms associated with psychosis |
Also Published As
Publication number | Publication date |
---|---|
TW201403590A (zh) | 2014-01-16 |
US20140012573A1 (en) | 2014-01-09 |
US8972252B2 (en) | 2015-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI474317B (zh) | 訊號處理裝置以及訊號處理方法 | |
EP3522153B1 (en) | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor | |
US9779725B2 (en) | Voice wakeup detecting device and method | |
KR102488558B1 (ko) | 기계 학습 기능을 갖는 저전력 앰비언트 컴퓨팅 시스템 | |
US9406313B2 (en) | Adaptive microphone sampling rate techniques | |
CN108551686B (zh) | 音频特征数据的提取及分析 | |
US9959865B2 (en) | Information processing method with voice recognition | |
US9549273B2 (en) | Selective enabling of a component by a microphone circuit | |
US20150112690A1 (en) | Low power always-on voice trigger architecture | |
CN103543814A (zh) | 信号处理装置以及信号处理方法 | |
CN110223691A (zh) | 语音唤醒识别的切换控制方法和装置 | |
TW201743319A (zh) | 語音控制系統及其方法 | |
CN110265036A (zh) | 语音唤醒方法、系统、电子设备及计算机可读存储介质 | |
WO2017185702A1 (zh) | 基于压力传感器进行音量控制的方法及系统 | |
TW201843582A (zh) | 具有語音喚醒功能的電子裝置及其操作方法 | |
CN110473544A (zh) | 一种低功耗语音唤醒方法及装置 | |
CN106612367A (zh) | 一种基于麦克风的语音唤醒方法及移动终端 | |
CN111028831B (zh) | 一种语音唤醒方法及装置 | |
CN101446812A (zh) | 设备的状态控制方法、控制装置及设备 | |
CN103778950A (zh) | 录音电路关闭状态下的录音方法 | |
US20150356982A1 (en) | Speech detection circuit and method | |
CN103778925A (zh) | 录音电路关闭状态下控制录音的录音装置 | |
CN113096652A (zh) | 语音唤醒方法及芯片系统 | |
CN111179924B (zh) | 一种基于模式切换的唤醒性能优化的方法及系统 | |
TWI684912B (zh) | 語音喚醒裝置及方法 |