KR100954668B1

KR100954668B1 - 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법

Info

Publication number: KR100954668B1
Application number: KR1020030024438A
Authority: KR
Inventors: 한민수; 김재현; 김학균
Original assignee: 주식회사 케이티
Priority date: 2003-04-17
Filing date: 2003-04-17
Publication date: 2010-04-27
Also published as: KR20040090567A

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야

본 발명은 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 관한 것임.

2. 발명이 해결하려고 하는 기술적 과제

본 발명은, 비오아이피(VoIP : Voice over Internet Protocol)와 같은 방식을 이용하는 오디오 전송 시스템에서의 패킷손실을 손실 전/후의 피치정보와 스펙트럼 거리를 이용하여 양쪽의 음소를 비교하여 손실구간을 앞/뒤의 음소정보를 활용하여 보다 자연스러운 합성 음성신호를 제공하도록 하는 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법을 제공하고자 함.

3. 발명의 해결방법의 요지

본 발명은, 수신된 음성 패킷의 손실을 확인하고 상기 손실 전/후의 패킷을 비교하여 상기 손실 전/후의 패킷이 서로 상이한 음소인지를 판단하는 제 1 단계; 상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 동일한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보를 이용하여 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 2 단계; 및 상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 상이한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보 및 상기 손실 후 패킷의 음성정보를 이용하여 상기 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 3 단계를 포함함.

4. 발명의 중요한 용도

본 발명은 VoIP 방식의 오디오 전송 시스템 등에 이용됨.

음성, 패킷, 손실, 보상, 은닉, 피치, 스펙트럼 거리, 음소

Description

손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법{Method for concealing Packet Loss using Information of Packets before and after Packet Loss}

도 1 은 본 발명이 적용되는 오디오 전송 시스템의 구성예시도.

도 2 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 패킷손실구간 보상에 대한 일예시도.

도 3 은 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 불연속성을 줄이기 위한 OLA의 일예시도.

도 4 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 손실구간 합성음성의 크기조절에 대한 일예시도.

도 5 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 대한 일실시예 설명도.

도 6a 및 도 6b 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 따른 일실시예 흐름도.

*도면의 주요 부분에 대한 부호의 설명

110 : 인코더 115 : 손실 프레임 검출기

120 : 디코더 130 : 패킷손실 은닉 모듈

본 발명은 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 관한 것으로, 더욱 상세하게는 비오아이피(VoIP : Voice over Internet Protocol)와 같은 오디오 전송 시스템에서 패킷손실에 의한 음성품질 저하를 개선하기 위한 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 관한 것이다.

종래에 VoIP상에서 패킷손실을 보상하기 위해서 흔히 쓰이는 기술로 에프이씨(FEC : Forward Error Correction)와 패킷손실 은닉(PLC : Packet Loss Concealment)을 들 수 있다. FEC는 송신 측과 수신 측에서 소스에 대한 추가적인 처리가 요구되며, 그 효율성은 손실율과 손실분포에 따라 달라진다는 문제점이 있었다. 또한, FEC 방식은 넓은 대역폭과 부가적인 처리에 따른 지연을 필요로 한다는 문제점이 있었다.

반면, 패킷손실은닉 방식은 수신된 비트 스트림에 대해서 네트워크 상에서 사라진 데이터를 대신할 수 있는 합성음성신호를 만들어 내는 것이다. 음성신호는 대개 부분적으로 안정화 되어있기 때문에 이전의 음성신호로부터 손실된 패킷의 음 성신호를 추정하는 것이 가능하다. 이제까지 VoIP 코덱들에 주로 적용되는 패킷손실 은닉 방식들은 이전 패킷의 정보를 손실구간에 그대로 대체하거나 묵음으로 처리하고 있으며, 패턴매칭이나 음성정보 모델링에 기반한 다양한 알고리즘들이 연구되고 이에 대한 적용사례가 발표되고 있다.

그러나, 이제까지의 손실은닉 방식은 단일 프레임(4-40ms)의 낮은 패킷손실율(<15%)에 대해서 효과적으로 적용될 수 있으며, 연속적인 패킷손실에 의한 상대적으로 긴 구간에 대해서 패킷손실을 보상하기에는 무리가 있다는 문제점이 있었다.

종래기술의 문제점에 대해 다시 한 번 설명하면 다음과 같다.

실제 네트워크 상에서 패킷손실은 연이어서 발생하는 경우가 빈번하다. 따라서, 음성신호의 손실보상은 비교적 긴 구간의 패킷손실에 대해서도 좋은(robust) 결과를 제공해야 한다. 하지만, 음성 신호가 변하는 구간(transition)ㅣ나 한 음소정보 전부가 손실될 정도의 손실에 대해서는 앞 프레임 정보만을 이용한 손실보상은 한계가 있는 것이 사실이다.

예를 들어 설명하자면, 무리하게 피치정보를 반복함으로 해서 부자연스러운 인공결과물(artifact)이 발생하게 된다는 것이다. 이런 현상은 오디오 전송에 있어서 음성신호가 올바르게 손실이 보상되는 것이라 말할 수 없다. 물론, 'ITU-T' 권고안이나 종래 특허 출원된 "패킷 손실 또는 프레임 삭제 은폐를 실행하는 방법 및 장치(대한민국 출원번호 : 10-2000-7014272)"에도 이를 방지하기 위해 생성된 신호를 서서히 줄이는 방식을 제시하고 있다. 그러나, 이는 상기한 것처럼 비교적 긴구 간의 패킷손실을 보상하기에는 충분치 않다는 문제점이 있었다.

본 발명은, 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, VoIP와 같은 방식을 이용하는 오디오 전송 시스템에서의 패킷손실을 손실 전/후의 피치정보와 스펙트럼 거리를 이용하여 양쪽의 음소를 비교하여 손실구간을 앞/뒤의 음소정보를 활용하여 보다 자연스러운 합성 음성신호를 제공하도록 하는 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법을 제공하는데 그 목적이 있다.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법은, 오디오 전송 시스템에 적용되는 패킷손실 은닉 방법에 있어서, 수신된 음성 패킷의 손실을 확인하고 상기 손실 전/후의 패킷을 비교하여 상기 손실 전/후의 패킷이 서로 상이한 음소인지를 판단하는 제 1 단계; 상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 동일한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보를 이용하여 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 2 단계; 및 상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 상이한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보 및 상기 손실 후 패킷의 음성정보를 이용하여 상기 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 3 단계를 포함한다.

삭제

본 발명은, VoIP의 음성품질을 개선하기 위하여 음성패킷 손실 구간에 대해서 손실 전/후의 음소의 피치정보와 스펙트럼 거리를 비교하여 동일음소 여부를 확인하고 이에 따라서 패킷손실 전의 음소정보만을 이용하여 손실구간을 보상하거나 손실이후 음소정보를 추가로 이용하여 손실구간을 보상하게 되는 것이다. 여기서, 손실구간의 보상은 사라진 데이터를 대신할 수 있는 합성음성신호를 만들어 낸다는 것이다.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명한다.

도 1 은 본 발명이 적용되는 오디오 전송 시스템의 구성예시도이다.

본 발명이 적용되는 오디오 전송 시스템은 도면에 도시된 것처럼 인코더(110), 손실 프레임 검출기(115), 디코더(120) 및 패킷손실 은닉 모듈(130)을 포함한다.

도 1에서 인코더(110)는 입력 오디오 프레임을 전달받아 코드화된 비트-스트림(bit-stream)을 전송한다. 전송된 비트-스트림은 프레임이 손실되었나 여부를 결정하는 수신측의 손실 프레임 검출기(115)에 전달된다. 손실 프레임 검출기(115)에서 프레임이 손실된 것으로 결정되면 손실 프레임 검출기(115)는 손실 프레임을 재구성하기 위해 패킷손실 은닉 모듈(130)로 이를 통보한다.

패킷손실 은닉 모듈(130)에서는 손실 프레임에 대해 주어진 패킷손실 은닉 방식에 따라 보상하여 온전한 오디오 프레임이 디코더(120)를 통해 출력될 수 있도록 한다.

상기한 바와 같은 오디오 전송 시스템은 본 발명이 적용되는 시스템의 일예가 될 수 있다.

본 발명에 따른 패킷손실 은닉 방법은 손실이전 패킷과 손실이후 패킷에서 피치검출을 실시하고 피치가 검출되면 유성음, 그렇지 않으면 무성음으로 구분한다. 양쪽 다 무성음이나 유성음으로 같을 경우에는 두 패킷의 음성신호간의 스펙트럼 거리를 계산한다. 만일 스펙트럼 거리가 이웃한 스펙트럼 거리와 비교하여 상대적으로 차이가 많이 나면 서로 상이한 음소로 판단하고, 그렇지 않다면 동일한 음소라고 판단한다.

손실구간 양단의 음소가 동일하다면 앞의 패킷의 음소정보를 이용하여 손실구간 전부를 보상하고, 그렇지 않다면 손실구간의 2/3를 앞의 음소정보로 보상하고 나머지 1/3 부분을 뒤 패킷의 음소정보로 보상한다. 이때, 음소가 유성음인 경우에는 피치구간 음성정보를 반복해주고, 무성음인 경우에는 패킷의 음성정보를 전부 사용한다. 여기서, 유성음인 경우에 수행되는 피치구간 음성정보의 반복은 도 2를 통해 간략히 제시된다.

손실구간을 앞/뒤의 음성정보로 보상하게 되면 손실구간 끝 부분이나 중간에서 불연속적인 부분이 나타난다. 이 부분은 하기에 설명하는 도 3에 도시된 것처럼 중복구간 D(5msec) 만큼을 추가적으로 보상음성신호를 만들어 삼각 창을 이용한 오버랩 가산(OLA : Overlap Add)을 적용함으로써 불연속성을 줄일 수 있다.

손실구간이 길어짐에 따라 동일한 음성신호를 길게 반복하여 보상해 주면 재생되는 합성음이 부자연스러워지게 된다. 이때는 하기에 설명하는 도 4에서처럼 손실구간 2/3 구간의 음성신호 크기를 10 msec 당 20%씩 감소하도록 조절하고, 나머지 1/3 부분을 뒤프레임 음성신호의 크기와 맞도록 다시 서서히 증가시킨다. 만일 손실구간 앞뒤가 동일 음소인 경우에는 앞/뒤 음성정보의 피크점을 고려해 보상음성신호의 크기를 선형적으로 조정한다.

도 2 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 패킷손실구간 보상에 대한 일예시도이다.

도 2에서는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법이 가지는 특징을 도면을 통해 나타내고 있다. 즉, 패킷손실구간에 대해 손실구 간 전의 피치구간 음성정보와 손실구간 후의 피치구간 음성정보를 손실구간에 적용하고 있음을 도시하고 있다. 또한, 손실구간 전/후의 패킷이 만나는 불연속면에 대해 이를 줄이기 위해 OLA를 적용함을 나타내고 있다.

도 3 은 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 불연속성을 줄이기 위한 OLA의 일예시도이다.

본 발명에 따라 손실구간 합성음성을 보상하는데 있어서 손실전/후의 음성정보를 이용함으로 해서 발생하는 경계부분의 불연속성을 줄이기 위한 OLA를 나타내고 있다. 이때, 도 3에 도시된 것처럼 삼각창(triangular window) 형태로 OLA가 이루어진다.

도 4 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 있어서 손실구간 합성음성의 크기조절에 대한 일예시도이다.

도 4에서는 상기한 것처럼 손실구간이 긴 경우에는 부자연스러워질 수 있으므로 크기를 조절하게 된다. 도 4에서 보여지는 방식은 손실 전/후가 다른 음소일 경우이며, 동일 음소일 경우에는 상기한 것처럼 전/후 음성정보의 피크점을 고려해 보상음성신호의 크기를 선형적으로 조정하게 된다.

도 5 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 대한 일실시예 설명도이다.

검출된 음성 패킷과 음성 패킷 사이에 패킷손실구간이 발생하면 피치검출을 수행하고 고속푸리에변환(FFT : Fast Fourier Transform)을 통한 스펙트럼 거리 계산 결과를 기본적인 이웃한 패킷간의 스펙트럼거리와 비교하여 손실구간을 보상한 다. 또한, 손실구간의 길이에 맞게 음성파형의 크기를 조정한다.

도 6a 및 도 6b 는 본 발명에 따른 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법에 따른 일실시예 흐름도이다.

VoIP 전송 상에서 패킷 손실이 발생하였음을 수신측에서 확인한다(601).

패킷 손실을 은닉하기 위해서 수신측에서 우선 손실이전 패킷과 손실이후 패킷에서 피치검출을 실시한다(602). 피치검출 결과, 피치가 검출되면 유성음 그렇지 않으면 무성음으로 판별한다.

다음으로, 손실 전/후의 패킷이 모두 유성음이나 무성음으로 같은지를 확인한다(603). 확인 결과, 손실 전/후의 패킷이 모두 유성음 또는 무성음으로 같은 경우에는 두 패킷의 음성신호간의 스펙트럼 거리를 계산하여 파악한다(604). 그리고, 파악된 스펙트럼 거리가 이웃한 패킷간의 스펙트럼 거리와 비교하여 차이가 많이 나는지를 점검한다(605).

점검 결과, 차이가 많이 나지 않으면, 동일한 음소로 판단하고(606), 손실 전 패킷으로 패킷 손실구간 전부를 보상한다(607).

점검 결과, 상대적으로 차이가 많이 나면 손실 전/후 패킷이 서로 상이한 음소로 판단한다(608). 또한, 손실 전/후의 패킷이 모두 유성음이나 무성음으로 같은가를 확인한 결과, 하나는 유성음, 다른 하나는 무성음으로 다른 경우에도 서로 상이한 음소로 판단한다(608).

손실 전/후의 패킷이 서로 상이한 음소로 판단된 경우에는, 판단 후에 손실구간의 2/3를 손실 전 패킷의 음소로 하고 나머지 1/3을 손실 후 패킷의 음소로 하 여 보상을 한다(609).

손실구간의 패킷의 보상에 있어서 음소가 유성음인 경우에는 도 1처럼 피치구간 음성정보를 반복해주고 무성음인 경우에는 패킷의 음성정보를 전부 사용한다.

다음으로, 손실구간 보상에 따라 불연속적인 부분이 발생하였는지를 조사한다(610). 조사 결과, 불연속적인 면이 발생하였으면 해당하는 중복구간(도 3의 D)만큼을 추가적으로 보상음성신호를 만들어 삼각 창을 이용한 OLA를 적용하여 불연속성을 줄여준다(611). 즉, 손실구간 전/후가 서로 상이한 음소라 여겨지면 전/후의 음성정보로 보상한 중간부분에서 불연속면이 발생할 수 있으며, 손실구간 전/후가 동일하다고 여겨지는 경우에는 손실 전 패킷정보를 이용하여 손실구간을 보상함으로 손실구간 끝 부분에 불연속면이 발생할 수 있으며, 이렇게 불연속면이 발생할 때 OLA를 적용하게 된다.

손실구간 보상에 따른 불연속적인 면이 발생하지 않았거나 불연속적인 면이 발생한 부분에 대해 OLA를 적용한 후에, 손실구간이 기준값보다 긴가를 검사한다(612). 손실구간이 길어지면 질수록 동이한 음성신호를 길게 반복하게 되므로 재생되는 합성음이 부자연스러워지게 된다. 따라서, 손실구간이 주어진 기준값보다 긴지를 검사하여, 주어진 기준값보다 손실구간이 길면 보상되는 손실구간의 음성신호에 대해 크기를 선형적으로 조정한다(613). 즉, 손실구간 전/후가 서로 상이한 음소인 경우에는 손실구간 2/3 구간의 음성신호 크기를 10msec당 20% 씩 감소하도록 조절하고 나머지 1/3 부분을 뒤프레임 음성신호의 크기와 맞도록 다시 서서히 증가시키며, 서로 동일한 음소로 판단된 겨우에는 전/후 음성정보의 피크점을 고려해 보상음성신호의 크기를 선형적으로 조절한다.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

상기한 바와 같은 본 발명은, VoIP상에서의 패킷손실을 손실 전/후의 피치정보와 스펙트럼 거리를 이용하여 양쪽의 음소를 비교하여 손실구간을 앞/뒤의 음소정보로 보상하여 줌으로써 단일 패킷손실 뿐만 아니라 연속적인 패킷손실에 의한 상대적으로 긴 손실구간에 대해서 보다 자연스러운 합성 음성신호로 보상해 줄 수 있는 효과가 있다.

Claims

오디오 전송 시스템에 적용되는 패킷손실 은닉 방법에 있어서,

수신된 음성 패킷의 손실을 확인하고 상기 손실 전/후의 패킷을 비교하여 상기 손실 전/후의 패킷이 서로 상이한 음소인지를 판단하는 제 1 단계;

상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 동일한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보를 이용하여 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 2 단계; 및

상기 제 1 단계의 판단 결과, 상기 손실 전/후의 패킷이 서로 상이한 음소라고 판단되면, 상기 손실 전 패킷의 음성정보 및 상기 손실 후 패킷의 음성정보를 이용하여 상기 손실구간을 보상함으로써 수신된 상기 음성 패킷의 손실을 은닉하는 제 3 단계를 포함하는, 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법.
제 1 항에 있어서,

상기 손실구간의 보상으로 상기 손실구간에서 발생하는 불연속적인 부분에 대해 오버랩 가산(OLA: OverLap Add)을 적용하여 불연속성을 감소시키는 제 4 단계를 더 포함하는, 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법.
제 1 항에 있어서,

상기 제 1 단계는,

상기 오디오 전송 시스템이 수신된 상기 음성 패킷에 대해 패킷손실을 확인하는 제 5 단계;

상기 손실 전/후 패킷에 대해 피치 검출 여부를 통해 상기 손실 전/후의 패킷이 서로 상이한 음소인지를 판단하는 제 6 단계; 및

상기 피치 검출 여부의 결과가 동일한 경우에 대해 상기 손실 전/후 패킷의 음성신호간의 스펙트럼 거리를 구하여 이웃한 패킷간의 스펙트럼 거리와 차이가 있는지를 통해 상기 손실 전/후의 패킷이 서로 상이한 음소인지를 판단하는 제 7 단계를 포함하는, 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,

상기 손실구간이 기설정된 기준값보다 긴 경우, 보상된 상기 손실구간의 음성신호의 크기를 선형적으로 조정하는 제 8 단계를 더 포함하는, 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법.
제 4 항에 있어서,

상기 제 8 단계는,

상기 제2단계에서 상기 손실구간을 보상한 경우, 상기 손실 전/후 패킷의 음성정보의 피크점을 고려하여, 보상된 상기 손실구간의 음성신호의 크기를 선형적으로 조절하는 제 9 단계; 및

상기 제3단계에서 상기 손실구간을 보상한 경우, 상기 손실 전 패킷의 음성정보를 이용하여 보상된 구간의 음성신호의 크기는 선형적으로 감소하도록 조절하고, 상기 손실 후 패킷의 음성정보를 이용하여 보상된 구간의 음성신호의 크기는 상기 손실 후 패킷의 음성신호의 크기까지 선형적으로 증가하도록 조절하는 제 10 단계를 포함하는, 손실 전/후 패킷정보를 이용한 패킷손실 은닉 방법.
삭제
삭제
삭제