TWI474317B

TWI474317B - 訊號處理裝置以及訊號處理方法

Info

Publication number: TWI474317B
Application number: TW101124391A
Authority: TW
Inventors: Chia Yu Hung; Tsung Li Yeh; Yi Chang Tu
Original assignee: Realtek Semiconductor Corp
Priority date: 2012-07-06
Filing date: 2012-07-06
Publication date: 2015-02-21
Also published as: TW201403590A; US20140012573A1; US8972252B2

Description

訊號處理裝置以及訊號處理方法

本發明提供一種訊號處理裝置以及訊號處理方法，尤指一種透過一語音偵測單元來控制一語音辨識系統是否對一聲音訊號進行語音辨識的訊號處理裝置以及相關的訊號處理方法。

於語音指令功能中，核心工作是先將錄製之聲音訊號進行語音辨識，接著於辨識出指令之後，基於所辨識的指令來決定系統(例如電腦系統)應執行之相對應動作。例如，當系統透過語音辨識後獲得一開啟網頁瀏覽器之指令，則系統便開啟網頁瀏覽器。又例如系統處於省電模式(例如休眠狀態)下，透過語音辨識後獲得一喚醒系統之指令，則系統便脫離省電模式(休眠狀態)而回到正常模式(正常操作狀態)。

為了使進行系統語音辨識時沒有遺漏關鍵之語音訊號，系統可能以麥克風持續不斷地收音，並且將收錄並數位化之訊號持續進行語音辨識。然而，此收音過程往往使得錄製之待辨識之訊號包含過多非語音之期間。

此語音辨識的工作一般是以軟體程式執行，若持續將所有麥克風收音之訊號送與此語音辨識系統進行運算，但收音期間內之訊號中卻未曾出現過關鍵之語音訊號，將會造成無謂的電能耗費而無法順應節能/省電潮流，若語音辨識系統是設置於行動裝置中，則會降低行動裝置的電池續航能力。

傳統上為了避免持續進行語音辨識之額外功率消耗，或是節省語音辨識前所需的暫存空間，可能會要求使用者在使用語音辨識之前以手動方式(例如按壓按鍵)來發送/觸發一語音起始指令，使用者並在語音輸入完畢之後，以手動方式(例如按壓按鍵)來發送一語音結束指令。因此，語音辨識系統只需要針對語音起始指令和語音結束指令之期間進行聲音訊號之語音辨識即可。

然而，由於使用者需要手動地控制語音辨識的啟用與關閉，因此，必須在使用者本身得以觸及系統之按鍵的情形下才能順利控制語音辨識的啟用與關閉，所以，這樣的語音辨識控制機制對於使用者而言並非十分便利，再者，當上述之語音辨識控制機制應用於語音喚醒系統之功能時，則可能由於使用者無法直接觸及系統之按鍵，故無法以語音起始指令及語音結束指令來達成節電效果，因此只能以持續收音、錄製，並持續進行語音辨識之方式，才能提供語音喚醒功能。

本發明目的之一在於提供一種透過一語音偵測單元來控制一語音辨識系統是否對一聲音訊號進行語音辨識的訊號處理裝置以及相關的訊號處理方法，以解決上述問題。

依據本發明之實施例，其揭露一種訊號處理裝置。該訊號處理裝置包含有一語音辨識系統以及一語音偵測單元。該語音偵測單元耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識。

依據本發明之實施例，其另揭露一種訊號處理方法。該訊號處理方法包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識。

本發明是藉由運用語音偵測單元作為先期判斷，以篩選出不可能為語音訊號之部分，此部份已判定為非語音訊號之期間，故系統可以不進行語音辨識；而當語音偵測單元表示可能為語音訊號之期間，則需要進一步透過語音辨識系統來進行語音辨識，以決定系統的後續動作。因此，當本發明之語音辨識控制機制應用於語音喚醒系統之功能時，則可以於系統處於省電模式(休眠狀態)下致能語音偵測單元來偵測所收錄之聲音訊號是否為語音訊號，若語音偵測單元判斷所收錄之聲音訊號並非語音訊號，則系統會繼續處於省電模式(休眠狀態)下，另一方面，若語音偵測單元判斷所收錄之聲音訊號為語音訊號，則語音辨識系統會被致能來判斷所收錄之聲音訊號中是否存在一系統喚醒指令。因語音偵測單元可以簡單架構實現，即使全時開啟運作亦不影響全系統之節能效益，而因語音偵測單元可以篩選排除不可能為語音訊號之期間，故可避免語音辨識系統無謂之電能耗費，進而達成節能功效。此外，因為不需由使用者以手動方式來標示語音起始及語音結束之期間，故即使使用者無法直接觸及系統按鍵，亦可透過語音偵測單元的輔助而達成語音喚醒的目。

本發明的主要概念在於結合語音偵測(voice activity detection)與語音辨識(speech recognition)，因此，一語音偵測單元會依據收錄之聲音特性，經過連續之運算與判斷來推估該收錄之聲音訊號是否可能為語音訊號。另外，語音辨識系統會依據語音偵測單元之判斷結果，決定是否對收錄之聲音訊號進行語音辨識之工作，由於語音偵測可以篩選排除不可能為語音訊號之期間，故使得語音辨識系統無謂之電能耗費，進而達成節能功效。進一步的細節將於下詳述。

請參照第1圖，第1圖是本發明訊號處理裝置之一實施例的功能方塊示意圖。訊號處理裝置100包含一訊號收集(signal collection)單元102、一語音辨識系統104以及一語音偵測單元106，其中語音偵測單元106耦接於訊號收集單元102與語音辨識系統104，以及訊號收集單元102耦接於語音辨識系統104。於一實作方式中，訊號收集單元102、語音辨識系統104以及語音偵測單元106均是由硬體來加以實作，因此訊號收集單元102、語音辨識系統104以及語音偵測單元106可個別地控制操作狀態，故可達到較佳的節電功效，然而，此僅作為範例說明，而非本發明的限制條件，舉例來說，只要是採用本發明所揭示之透過語音偵測來輔助語音辨識的運作，均落入本發明的範疇。

於本發明的第一種應用(例如語音喚醒功能)中，只有當訊號收集單元102與語音辨識系統104均處於一省電模式(例如休眠狀態)時，語音偵測單元106才會被致能。假若訊號收集單元102與語音辨識系統104因為關機或休眠的指令而由一正常模式進入一省電模式，則語音偵測單元106此時會被致能來開始執行語音偵測的操作。一聲音訊號(audio signal)S_IN會輸入至語音偵測單元106，而語音偵測單元106便會即時地偵測聲音訊號S_IN是否為一語音訊號(voice signal)，並輸出一語音偵測結果VAD至語音辨識系統104。語音偵測結果VAD可作為語音辨識系統104之一致能訊號，舉例來說，當語音偵測單元106判斷聲音訊號S_IN並非為語音訊號時，VAD=0，因此語音辨識系統104仍持續處於省電模式，而當語音偵測單元106判斷聲音訊號S_IN為語音訊號時，則VAD=1，因此語音辨識系統104便會離開省電模式並回到正常模式。此外，訊號收集單元102亦可由語音偵測結果VAD來控制是否離開省電模式並回到正常模式。透過語音偵測結果VAD的輔助，只有在語音偵測單元106判斷聲音訊號S_IN為語音訊號時，語音辨識系統104才會對訊號收集單元102所收錄之聲音訊號S_IN進行語音辨識的處理，由於語音辨識系統104於省電模式中會關閉大部分的內部電路，因此可達到節電的目的。

另一方面，當語音辨識系統104對聲音訊號S_IN進行語音辨識的處理而判斷聲音訊號S_IN挾帶一預定指令資訊CMD(例如一系統喚醒指令)，則語音辨識系統104會輸出預定指令資訊CMD(例如系統喚醒指令)至後端的系統，舉例來說，訊號處理裝置100係為一應用裝置的一部份，則語音辨識系統104可輸出預定指令資訊CMD(例如系統喚醒指令)至該應用裝置之一控制器(例如處理器)，因此，該應用裝置之該控制器便會基於所接收到的預定指令資訊CMD(例如系統喚醒指令)來執行相對應的操作(例如讓該應用裝置開機或全速運行)。另一方面，若語音辨識系統104判斷聲音訊號S_IN並未挾帶任何預定指令資訊CMD(例如系統喚醒指令)，則表示目前的聲音訊號S_IN可能被語音偵測單元106誤判為語音訊號，或者目前的聲音訊號S_IN雖然是語音訊號，但是並非是跟系統喚醒有關的語音指令，故訊號收集單元102與語音辨識系統104會再次進入省電模式以有效地節電。

請一併參照第1圖與第2圖，第2圖是第1圖所示之訊號處理裝置100於第一種應用(例如語音喚醒功能)中的範例操作的流程圖。假若可以獲得大致上相同的結果，則步驟不一定要遵照第2圖所示之順序來執行。第1圖所示之訊號處理裝置100所採用之訊號處理方法可簡單歸納如下。

步驟202：使用訊號處理裝置100的應用裝置會全速運行。此時，訊號收集單元102與語音辨識系統104均處於正常模式，而語音偵測單元106此時並沒有被致能。

步驟204：訊號收集單元102與語音辨識系統104處於省電模式。

步驟206：語音偵測單元106會致能，並偵測聲音訊號S_IN是否為語音訊號來產生語音偵測結果VAD。

步驟208：語音偵測結果VAD是否指示聲音訊號S_IN為語音訊號(亦即VAD=1)？若是，則執行步驟210；否則，回到步驟204，故訊號收集單元102與語音辨識系統104仍繼續處於省電模式(步驟204)，且語音偵測單元106仍繼續偵測聲音訊號S_IN是否為語音訊號(步驟206)。

步驟210：語音偵測單元106無需致能而被關閉。

步驟212：訊號收集單元102與語音辨識系統104會被喚醒而由省電模式回到正常模式。

步驟214：訊號收集單元102開始將聲音訊號S_IN記錄至一儲存裝置(例如記憶體)，例如可透過直接記憶體存取(direct memory access,DMA)的技術來將所接收之聲音訊號S_IN寫入至儲存裝置，以及語音辨識系統104開始對訊號收集單元102所收錄的聲音訊號S_IN進行語音辨識，來判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如系統喚醒指令)。

步驟216：聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如系統喚醒指令)？若是，則執行步驟218；否則，回到步驟204，故訊號收集單元102與語音辨識系統104會再次進入省電模式(步驟204)，且語音偵測單元106會再次致能來偵測聲音訊號S_IN是否為語音訊號(步驟206)。

步驟218：該應用裝置基於預定指令資訊CMD(例如系統喚醒指令)而全速運行。

由於熟習技藝者基於上述的相關說明即可輕易地瞭解各個步驟的操作細節，故進一步的說明便在此省略以求簡潔。

於本發明的第二種應用中，當訊號收集單元102與語音辨識系統104均處於一正常模式(例如正常操作狀態)時，語音偵測單元106一併會被致能。聲音訊號S_IN會分別輸入至語音偵測單元106與訊號收集單元102，因此，訊號收集單元102會儲存聲音訊號S_IN以供語音辨識系統104進行語音辨識之用，同時，語音偵測單元106會一併偵測聲音訊號S_IN是否為語音訊號，並輸出語音偵測結果VAD至語音辨識系統104。語音偵測結果VAD可作為語音辨識系統104是否執行語音辨識操作的控制訊號，舉例來說，當語音偵測單元106判斷聲音訊號S_IN並非為語音訊號時，VAD=0，因此語音辨識系統104並不會對聲音訊號S_IN進行語音辨識的處理，雖然語音辨識系統104操作於正常模式而不會關閉內部電路，不過，由於語音辨識系統104沒有對聲音訊號S_IN進行語音辨識的處理，故語音辨識系統104此時僅會有最低功耗，故仍可達到節電的目的，另一方面，當語音偵測單元106判斷聲音訊號S_IN為語音訊號時，則VAD=1，因此語音辨識系統104便會對聲音訊號S_IN進行語音辨識的處理。簡而言之，透過語音偵測結果VAD的輔助，只有在語音偵測單元106判斷聲音訊號S_IN為語音訊號時，處於正常模式中的語音辨識系統104才會對訊號收集單元102所收錄之聲音訊號S_IN進行語音辨識的處理，並判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令)，因此亦可達到節電的目的。

請一併參照第1圖與第3圖，第3圖是第1圖所示之訊號處理裝置100於第二種應用中的範例操作的流程圖。假若可以獲得大致上相同的結果，則步驟不一定要遵照第3圖所示之順序來執行。第1圖所示之訊號處理裝置100所採用之訊號處理方法可簡單歸納如下。

步驟302：使用訊號處理裝置100的應用裝置會全速運行。此時，訊號收集單元102與語音辨識系統104均處於正常模式，且語音偵測單元106此時會被致能。

步驟304：訊號收集單元102將聲音訊號S_IN記錄至一儲存裝置(例如記憶體)，例如可透過直接記憶體存取的技術來將所接收之聲音訊號S_IN寫入至儲存裝置，以及語音偵測單元106偵測聲音訊號S_IN是否為語音訊號來產生語音偵測結果VAD。

步驟306：語音偵測結果VAD是否指示聲音訊號S_IN為語音訊號(亦即VAD=1)？若是，則執行步驟308；否則，回到步驟304。

步驟308：語音辨識系統104對訊號收集單元102所收錄的聲音訊號S_IN進行語音辨識，來判斷聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令)。

步驟310：聲音訊號S_IN中是否挾帶預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令)？若是，則執行步驟312；否則，回到步驟304。

步驟312：該應用裝置基於預定指令資訊CMD(例如開啟網頁瀏覽器指令或其它應用程式的控制指令)而執行相對應的操作。

如上所述，語音偵測單元106是用來偵測聲音訊號是否為語音訊號，而評估之聲音特性可能有單元訊框時間內之過零率、單元訊框時間內之平均能量、頻率範圍內之單元訊框時間內之峰值振幅，或是以線性預估(LP)分析頻譜取得之頻譜包絡線等等。於本實施例中，語音偵測單元106可利用一個或多個判斷條件來決定語音偵測結果VAD。舉例來說，語音偵測單元106可採用以下所述之複數種判斷條件的各種組合來決定語音偵測結果VAD為1或0：判斷條件(1)：聲音訊號S_IN包含有一目前聲音訊框，以及語音偵測單元106會比較該目前聲音訊框之平均能量EV_C與一臨界值TH1；判斷條件(2)：聲音訊號S_IN包含有至少一先前聲音訊框與一目前聲音訊框，以及語音偵測單元106會依據該至少一先前聲音訊框之平均能量來決定一訊號能量趨勢值EV_T，計算該目前聲音訊框之平均能量EV_C與訊號能量趨勢值EV_T之一差值D1(亦即D1=|EV_C-EV_T|)，並比較差值D1與一臨界值TH2；判斷條件(3)：聲音訊號S_IN包含有複數個聲音訊框，以及語音偵測單元106會比較該複數個聲音訊框中被判斷為不包含語音訊號之連續聲音訊框的個數N與一臨界值TH3；以及判斷條件(4)：聲音訊號S_IN包含有一先前聲音訊框與一目前聲音訊框，以及語音偵測單元106會計算該目前聲音訊框之平均能量EV_C與該先前聲音訊框之平均能量EV_P的一差值D2(亦即D2=|EV_C-EV_P|)，並比較差值D2與一臨界值TH4。

請參閱第4圖，第4圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第一實施例的流程圖。假若可以獲得大致上相同的結果，則步驟不一定要遵照第4圖所示之順序來執行。語音偵測單元106決定語音偵測結果VAD的操作可簡單歸納如下。

步驟402：檢查判斷條件(1)來判斷目前聲音訊框之平均能量EV_C是否小於臨界值TH1(亦即EV_C<TH1)以偵測聲音能量是否過低。若是，則執行步驟404；否則執行步驟406；步驟404：由於聲音能量過低，因此判定該目前聲音訊框不可能是語音訊號，故設定VAD=0。

步驟406：檢查判斷條件(2)來判斷差值D1是否小於臨界值TH2(亦即D1<TH2)以偵測平均能量相較於短時間的能量趨勢是否變動很大。若是，則執行步驟410；否則執行步驟408；步驟408：由於該目前聲音訊框之平均能量EV_C與短時間內之訊號能量趨勢無明顯差異，因此判定該目前聲音訊框不可能是語音訊號，故設定VAD=0。

步驟410：檢查判斷條件(3)來判斷個數N是否大於臨界值TH3(亦即N>TH3)以偵測先前是否已持續維持無聲達一段很長時間。若是，則執行步驟414；否則執行步驟412。

步驟412：由於先前尚未持續維持無聲達一段很長時間，因此判定目前聲音訊框是語音訊號，故設定VAD=1。

步驟414：檢查判斷條件(4)來判斷差值D2是否大於臨界值TH4(亦即D2>TH4)以偵測兩連續聲音訊框的平均能量變化是否很大。若是，則執行步驟418；否則執行步驟416。

步驟416：由於兩連續聲音訊框的平均能量變化並非很大，因此判定目前聲音訊框不可能是語音訊號，故設定VAD=0。

步驟418：由於兩連續聲音訊框的平均能量變化很大，因此判定目前聲音訊框是語音訊號，故設定VAD=1。

請注意，第4圖所示流程中檢查判斷條件(1)~(4)的順序僅作為範例說明之用，並非本發明的限制條件，於其它設計變化中，亦可採用不同的順序來檢查判斷條件(1)~(4)。此外，並不一定要採用所有的判斷條件(1)~(4)來設計語音偵測結果VAD的判斷流程，換言之，只要採用了判斷條件(1)~(4)中的任一判斷條件，即落入本發明的範疇。

第5圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第二實施例的流程圖。若聲音能量過低，便設定VAD=0(步驟502、504)，否則的話，便設定VAD=1(步驟502、506)。第6圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第三實施例的流程圖。若聲音能量過低，便設定VAD=0(步驟602、604)；若聲音能量夠高，但平均能量的變動沒有很大，則設定VAD=0(步驟602、606、608)；若聲音能量夠高，且平均能量的變動很大，則設定VAD=1(步驟602、606、610)。第7圖為第1圖所示之語音偵測單元106決定語音偵測結果VAD之一第四實施例的流程圖。若聲音能量過低，便設定VAD=0(步驟702、704)；若聲音能量夠高，但兩連續聲音訊框的平均能量變化沒有很大，則設定VAD=0(步驟702、706、708)；若聲音能量夠高，且兩連續聲音訊框的平均能量變化很大，則設定VAD=1(步驟702、706、710)。

由於熟習技藝者基於上述有關第4圖之流程的相關說明即可輕易地瞭解第5圖~第7中各個步驟的操作細節，故進一步的說明便在此省略以求簡潔。

以上所述僅為本發明之實施例，凡依本發明申請專利範圍所做之均等變化與修飾，皆應屬本發明之涵蓋範圍。

100‧‧‧訊號處理裝置

102‧‧‧訊號收集單元

104‧‧‧語音辨識系統

106‧‧‧語音偵測單元

202~218、302~312、402~418、502~506、602~610、702~710‧‧‧步驟

第1圖是本發明訊號處理裝置之一實施例的功能方塊示意圖。

第2圖是第1圖所示之訊號處理裝置於第一種應用(例如語音喚醒功能)中的範例操作的流程圖。

第3圖是第1圖所示之訊號處理裝置於第二種應用中的範例操作的流程圖。

第4圖為第1圖所示之語音偵測單元決定語音偵測結果之一第一實施例的流程圖。

第5圖為第1圖所示之語音偵測單元決定語音偵測結果之一第二實施例的流程圖。

第6圖為第1圖所示之語音偵測單元決定語音偵測結果之一第三實施例的流程圖。

第7圖為第1圖所示之語音偵測單元決定語音偵測結果之一第四實施例的流程圖。

100‧‧‧訊號處理裝置

102‧‧‧訊號收集單元

104‧‧‧語音辨識系統

106‧‧‧語音偵測單元

Claims

一種訊號處理裝置，包含有：一語音辨識系統；以及一語音偵測單元，耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識；其中當該語音辨識系統由一正常模式進入一省電模式時，該語音偵測單元才會被致能。
如申請專利範圍第1項所述之訊號處理裝置，其中當該語音偵測單元偵測到該聲音訊號為該語音訊號時，該語音辨識系統會對該聲音訊號進行語音辨識，以及當該語音偵測單元偵測到該聲音訊號並非為該語音訊號時，該語音辨識系統不會對該聲音訊號進行語音辨識。
如申請專利範圍第1項所述之訊號處理裝置，其中當該語音偵測單元偵測到該聲音訊號為該語音訊號時，該語音辨識系統會離開該省電模式而進入該正常模式來對該聲音訊號進行語音辨識。
如申請專利範圍第3項所述之訊號處理裝置，其中該語音辨識系統會對該聲音訊號進行語音辨識來判斷該聲音訊號是否包含一預定指令資訊，以及當該語音辨識系統判斷該聲音訊號不包含該預定指令資訊時，該語音辨識系統會離開該正常模式並進入該省電模式。
如申請專利範圍第4項所述之訊號處理裝置，其中該指令資訊係為一系統喚醒指令。
一種訊號處理裝置，包含有：一語音辨識系統；以及一語音偵測單元，耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有一目前聲音訊框，以及該語音偵測單元會比較該目前聲音訊框之平均能量與一臨界值。
一種訊號處理裝置，包含有：一語音辨識系統；以及一語音偵測單元，耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有至少一先前聲音訊框與一目前聲音訊框，以及該語音偵測單元會依據該至少一先前聲音訊框之平均能量來決定一訊號能量趨勢值，計算該目前聲音訊框之平均能量與該訊號能量趨勢值之一差值，並比較該差值與一臨界值。
一種訊號處理裝置，包含有：一語音辨識系統；以及一語音偵測單元，耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有複數個聲音訊框，以及該語音偵測單元會比較該複數個聲音訊框中被判斷為不包含該語音訊號之連續聲音訊框的個數與一臨界值。
一種訊號處理裝置，包含有：一語音辨識系統；以及一語音偵測單元，耦接於該語音辨識系統，用以偵測一聲音訊號是否為一語音訊號，並輸出一語音偵測結果至該語音辨識系統來控制該語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有一先前聲音訊框與一目前聲音訊框，以及該語音偵測單元會計算該目前聲音訊框之平均能量與該先前聲音訊框之平均能量的一差值，並比較該差值與一臨界值。
一種訊號處理方法，包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識；其中偵測該聲音訊號是否為該語音訊號的步驟係於該語音辨識系統由一正常模式進入一省電模式時才會被執行。
如申請專利範圍第10項所述之訊號處理方法，其中依據該語音偵測結果來控制該語音辨識系統是否對該聲音訊號進行語音辨識的步驟包含：當偵測到該聲音訊號為該語音訊號時，使用該語音辨識系統來對該聲音訊號進行語音辨識；以及當偵測到該聲音訊號並非為該語音訊號時，不使用該語音辨識系統來對該聲音訊號進行語音辨識。
如申請專利範圍第10項所述之訊號處理方法，其中依據該語音偵測結果來控制該語音辨識系統是否對該聲音訊號進行語音辨識的步驟包含：當偵測到該聲音訊號為該語音訊號時，控制該語音辨識系統離開該省電模式而進入該正常模式來對該聲音訊號進行語音辨識。
如申請專利範圍第12項所述之訊號處理方法，其中該語音辨識系統會對該聲音訊號進行語音辨識來判斷該聲音訊號是否包含一預定指令資訊，以及該訊號處理方法另包含：當該語音辨識系統判斷該聲音訊號不包含該預定指令資訊時，控制該語音辨識系統離開該正常模式並進入該省電模式。
如申請專利範圍第13項所述之訊號處理方法，其中該指令資訊係為一系統喚醒指令。
一種訊號處理方法，包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有一目前聲音訊框，以及偵測該聲音訊號是否為該語音訊號的步驟包含：比較該目前聲音訊框之平均能量與一臨界值。
一種訊號處理方法，包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有至少一先前聲音訊框與一目前聲音訊框，以及偵測該聲音訊號是否為該語音訊號的步驟包含：依據該至少一先前聲音訊框之平均能量來決定一訊號能量趨勢值；計算該目前聲音訊框之平均能量與該訊號能量趨勢值之一差值；以及比較該差值與一臨界值。
一種訊號處理方法，包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有複數個聲音訊框，以及偵測該聲音訊號是否為該語音訊號的步驟包含：比較該複數個聲音訊框中被判斷為不包含該語音訊號之連續聲音訊框的個數與一臨界值。
一種訊號處理方法，包含有：偵測一聲音訊號是否為一語音訊號，並產生一語音偵測結果；以及依據該語音偵測結果來控制一語音辨識系統是否對該聲音訊號進行語音辨識；其中該聲音訊號包含有一先前聲音訊框與一目前聲音訊框，以及偵測該聲音訊號是否為該語音訊號的步驟包含：計算該目前聲音訊框之平均能量與該先前聲音訊框之平均能量的一差值；以及比較該差值與一臨界值。