KR20050003457A - 신호 처리 방법 및 장치 - Google Patents
신호 처리 방법 및 장치 Download PDFInfo
- Publication number
- KR20050003457A KR20050003457A KR10-2004-7018395A KR20047018395A KR20050003457A KR 20050003457 A KR20050003457 A KR 20050003457A KR 20047018395 A KR20047018395 A KR 20047018395A KR 20050003457 A KR20050003457 A KR 20050003457A
- Authority
- KR
- South Korea
- Prior art keywords
- information signal
- fingerprint
- characteristic value
- processing
- signal
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/11—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Collating Specific Patterns (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Image Input (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Abstract
정보 신호를 처리하는 방법이 밝혀진다. 상기 방법은, 상기 정보 신호의 지문을 결정하는 단계(302)와, 상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 단계(308)로서, 상기 적어도 제 1 특성 값은 복수의 저장된 지문들 중 제 1 의 것에 관련하여 저장되고, 상기 제 1 특성 값은 상기 결정된 지문에 대응하는 상기 단계(308), 및 상기 얻어진 적어도 제 1 특성 값에 응답하는 상기 정보 신호의 처리를 적어도 부분적으로 제어하는 단계(313)로서, 상기 처리는 처리된 정보 신호로 끝나는 상기 단계(313)를 포함한다.
Description
정보 신호를 처리할 때, 처리 타입, 예를 들어 임의의 처리 파라미터들의 선택은 정보 신호의 내용에 따를 수 있다.
예를 들어, 비닐 레코드로부터 다른 기록가능 매체, 예를 들어 기록 가능 CD로 트랙들을 레코드할 때, 레코드상 여러 오디오 트랙들을 분리하는 것은 어렵다.
사용자는 레코딩 시간에서 트랙들을 수동으로 분리한다. 즉 사용자는 레코딩 동안 오디오 트랙들에 대해 청취하고 이에 따라 레코딩 장치를 동작시킴으로써 레코딩을 감독한다. 그러나, 이것은 상당한 사용자 상호작용을 요구하는 단점을 가진다.
또한 자동 침묵 검출에 의해 트랙들을 분리하는 방법이 공지된다. 예를 들어, 미리 결정된 시간 주기는 미리 선택될 수 있고, 만약 침묵 주기가 미리 선택된 주기 보다 긴 레코딩 동안 검출되면, 현재 트랙의 레코딩은 중단된다. 그러나, 이들 방법들은 예를 들어 만약 두개의 노래들 사이의 퍼즈(pause)가 미리 결정된 시간 주기보다 짧으면, 노래의 일시적 혼합이 유발되거나, 만약 노래내 또는 클랙식 음악의 일부내에서 상대적 침묵 기간이 짧으면 하나의 노래들의 우연한 분리가 유발되기 때문에 에러를 가지기 쉽다.
게다가, 트랙들의 전체 시퀀스는 단일 디지탈 레코딩, 예를 들어 단일 웨이브 파일로서 레코드될 수 있다. 추후에 오디오 트랙들은 오디오 처리 프로그램을 사용하여 컴퓨팅 플랫폼상에서 분리될 수 있다. 그러나, 이것은 부담스러운 방법이고, 다중 단계들 및 사용자 상호작용을 요구한다. 따라서, 상기 종래 기술 방법들의 어느 것도 최종 사용자에게 최적하게 근접하지 않다.
본 발명은 정보 신호 처리, 특히 오디오 트랙들의 분리에 관한 것이다.
도 1은 원격 지문 데이터베이스를 가진 본 발명의 실시예에 따른 오디오 트랙들을 레코드하기 위한 시스템을 개략적으로 도시한 도면.
도 2는 로컬 지문 데이터베이스를 가진 본 발명의 실시예에 따른 오디오 트랙들을 레코드하기 위한 시스템을 개략적으로 도시한 도면.
도 3은 본 발명에 따른 오디오 트랙들을 분리하기 위한 방법의 흐름도.
도 4는 보다 상세히 서버(109) 및 지문데이터베이스(110)를 개략적으로 도시한 도면.
도 5는 본 발명의 실시예에 따른 결정된 이퀄라이저 설정부에 지문 데이터를 사용하는 음악 플레이어를 개략적으로 도시한 도면.
도 6은 본 발명의 실시예에 따른 디스플레이 특성들을 설정하기 위하여 지문 데이터를 사용하는 텔레비젼 세트를 개략적으로 도시한 도면.
도 7은 본 발명의 실시예에 따른 인코딩 방법의 코딩 파라미터들을 결정하기 위하여 지문 데이터를 사용하는 비디오 레코더를 개략적으로 도시한 도면.
따라서, 본 발명의 일반적인 목적은 정보 신호의 효율적인 처리를 제공하는 것이다.
상기 및 다른 문제들은 정보 신호를 처리하는 방법에 의해 해결되고, 상기 방법은,
- 상기 정보 신호의 지문(fingerprint)을 결정하는 단계와,
- 상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 단계로서, 상기 적어도 제 1 특성 값은 복수의 저장된 지문들 중 제 1 의 것에 관련하여 저장되고, 상기 제 1 특성 값은 상기 결정된 지문에 대응하는 상기 단계, 및
- 상기 얻어진 적어도 제 1 특성 값에 응답하는 상기 정보 신호의 처리를 적어도 부분적으로 제어하는 단계로서, 상기 처리는 처리된 정보 신호로 끝나는 상기 단계를 포함한다.
결과적으로, 정보 신호의 처리는 정보 신호의 내용의 하나 이상의 특성들을 바탕으로 제어되고 여기서 대응 특성 값들은 정보 신호의 계산된 지문을 바탕으로 검색된다. 따라서, 효과적이고, 신뢰적이고 사용자 우호적인 정보 신호 처리 방법은 달성된다.
본 발명의 장점은 상기 처리가 정보 신호의 내용에 적응되어, 처리 성능 및/또는 처리 결과 품질을 개선시킨다는 것이다.
용어 정보 신호는 오디오 피쳐들 같은 지각적인 피쳐들 및/또는 사운드, 음악, 스피치, 이미지들, 영화, 애니메이션들 등 같은 가시적 피쳐들인 정보 내용을 나타내는 임의의 아날로그 또는 디지탈 신호를 포함한다. 상기 정보 신호들의 예들은 오디오 신호, 비디오 신호, 오디오 가시적 신호, 다중매체 신호, 다중매체 오브젝트 등을 포함한다.
정보 신호의 지문은 질문시 정보 신호의 표현이다. 바람직하게, 지문은 정보 신호보다 짧다. 게다가, 바람직하게 지문은 질문시 신호의 가장 관련있는 지각적 피쳐들을 나타낸다. 상기 지문들은 "(로버스트) 해시들"로서 공지된다. 용어 로버스트 해시들은 임의의 범위까지 압축/압축해제, 코딩, AD/DA 변환으로 인해 데이터 처리 및 신호 품질 저하와 관련하여 로버스트한 해시 함수를 일컫는다. 로버스트 해시들은 때때로 로버스트 요약, 로버스트 시그네이쳐, 또는 지각적 해시들이라 한다.
지문 기술을 사용하는 시스템에서, 다수의 정보 신호들과 함께 연관된 각각의 데이터의 지문들은 예를 들어 데이터베이스에 저장된다. 연관된 데이터는 메타데이터를 포함하고, 여기서 용어 "메타데이터"는 타이틀, 아티스트, 장르 등 같은 정보 신호의 내용에 관한 정보이다. 본 발명에 따라, 연관된 데이터는 정보 신호의 처리를 사용하기 위한 제 1 특성의 적어도 제 1 특성 값을 포함한다. 연관된 데이터는 정보 신호의 지문을 계산하고 룩업 키 또는 질문 파라미터 같은 계산된 지문을 사용하여 데이터베이스에서 룩업 또는 질문을 수행함으로써 검색된다. 그 다음 룩업은 지문과 연관된 데이터로 리턴한다.
정보 신호 또는 그 내용 자체 대신 데이터베이스에 정보 신호들에 대한 지문들을 저장하는데 몇 가지 단점들이 있다. 즉,
- 데이터베이스에 대한 메모리/저장 요구들은 감소된다.
- 지문들이 신호들보다 실질적으로 짧기 때문에 정보 신호들 자체의 비교보다 지문들의 비교가 보다 효과적이다.
- 보다 짧은 아이템들을 매칭하는 것을 포함하기 때문에, 매칭 지문에 대한 데이터베이스의 검색은 완전한 정보 신호에 대한 검색보다 효과적이다.
- 정보 신호에 대한 작은 변화들이(다른 포맷으로 인코딩 또는 비트 속도 변화 같은) 지문에 영향을 주지 않기 때문에, 매칭 지문에 대한 검색은 보다 성공적이다.
지문을 생성하는 방법의 예는 유럽특허출원번호 제 01200505.4 호(위임 도킷 PHNL010110)뿐만 아니라, 2001년 9월, 브레시아(Brescia)의, 내용-기반 멀티미디어색인에 관한 국제 워크숍(International Workshop on Content-Based Multimedia Indexing)에서, 자프 해이스마(Jaap Haitsma), 톤 칼커(Ton Kalker) 및 잡 오오스트빈(Job Oostveen)에 의한, 발명의 명칭이 "내용 식별을 위한 로버스트 오디오 해싱(Robust Audio Hashing For Content Identification)"라는 제목에 기술되어 있다.
적어도 하나의 제 1 특성은 시간, 연속적인 파라미터 세팅들 같은 연속적인 값 특성들, 또는 내용, 장르 등과 같은 카테고리 데이터인 정보 신호의 순차적 처리에 관련한 임의의 특성일 수 있다. 상기 특성들의 예는 정보 신호의 내용의 미리 결정된 일부 또는 내용 기간, 예를 들어 오디오 내용의 오디오 트랙들의 순서의 일부로서 레코드된 오디오 트랙의 길이, 음악 장르, 영화 내용의 영화 장르, 예를 들어 이퀄라이저 세팅들인 추후 처리를 위한 파라미터 값들, 인코딩 방법의 사용에 대한 파라미터들을 포함한다.
지문 데이터 및 연관된 특성 데이터는 처리 장치의 저장 매체, 상기 장치에 연결된 저장 매체, 대응 판독기에 삽입된 데이터 캐리어, CD 등상에서 신호의 처리를 수행하는 동일한 장치에 국부적으로 저장될 수 있다. 지문 데이터를 국부적으로 저장하고, 원격 데이터베이스에 접속이 필요하지 않다는 장점이 있다.
선택적으로 또는 부가적으로, 지문 데이터는 데이터 처리 시스템의 원격 지문 데이터베이스, 서버 컴퓨터인 원격 위치에서 저장될 수 있다. 예를 들어, 원격지문 데이터베이스는 인터넷, 케이블 텔레비젼 네트워크같은 통신 네트워크, 또는 유선 또는 무선 접속, 영구 접속 또는 다이얼 업 접속 등 같은 일시 접속 같은 임의의 적당한 데이터 접속을 통해 액세스할 수 있다. 원격 지문 데이터에서 특성 값들을 검색하는 장점이 있어서, 처리 장치는 수행 및 데이터베이스 질문, 지문 매칭 등을 수행할 필요가 없어서, 간단한 처리 장치를 유지하게 하는 장점이 있다. 게다가, 지문 데이터는 국부적으로 저장된 데이터 및 원격 데이터베이스의 결합으로서 저장될 수 있다. 예를 들어, 만약 지문이 로컬 데이터베이스에서 식별되지 않으면, 질문은 보다 큰 수의 지문들을 포함하는 원격 데이터베이스로 진행될 수 있다.
따라서, 본 발명의 바람직한 실시예에 따라, 적어도 하나의 제 1 특성 값을 얻는 단계는 저장된 지문들의 데이터베이스에 액세스를 가지며 저장된 지문들중 대응 하나와 연관된 적어도 하나의 제 1 특성 값을 검색하기 위하여 제공된 지문 서버에 결정된 지문을 전송하는 단계; 및 상기 지문 서버로부터 적어도 검색된 제 1 특성 값을 검색하는 단계를 포함한다.
정보 신호의 처리는 임의의 형태의 신호 처리, 예를 들어 아날로그 신호 또는 디지탈 신호의 처리를 포함할 수 있다. 상기 신호 처리의 예들은 정보 신호에서 하나 이상의 세그먼트들을 추출하는 단계, 정보 신호들을 합병하는 단계, 신호를 인코딩 및/또는 디코딩하는 단계, 신호를 예를 들어 플레이 장치, 데이터 처리 시스템, 텔레비젼등에 의해 재생하는 단계를 포함한다. 상기 처리는 식별된 특성 값을 바탕으로 전체적으로 또는 부분적으로 제어될 수 있다.
본 발명의 바람직한 실시예에서, 정보 신호는 적어도 제 1 오디오 트랙 다음 제 2 오디오 트랙을 나타내는 오디오 신호이고, 상기 제 1 오디오 트랙은 미리 결정된 길이를 가지며, 제 1 특성은 제 1 오디오 트랙의 길이이고, 정보 신호를 처리하는 것을 제어하는 단계는 제 2 오디오 트랙에서 제 1 오디오 트랙을 분리하는 단계를 포함한다.
결과적으로, 정확하고, 신뢰적이고, 사용자 친숙한 오디오 트랙들의 분리는 제공된다.
본 발명의 다른 바람직한 실시예에서, 상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 상기 단계는 상기 제 1 오디오 트랙내의 시간 위치를 나타내는 제 2 특성 값을 얻는 상기 단계를 더 포함하고, 상기 제 2 오디오 트랙으로부터 상기 제 1 오디오 트랙을 분리하는 상기 단계는 상기 제 1 오디오 트랙의 얻어진 길이 및 상기 제 1 오디오 트랙내의 얻어진 시간 위치로부터 상기 제 1 오디오 트랙의 남은 기간을 결정하는 상기 단계를 포함한다.
결과적으로, 오디오 트랙들의 정확한 분리에 사용된 정보는 예를 들어 라디오 스케이션에서 레코드할 때 와우(wow) 및 플러터(flutter), 시계 소리들, 속도 변화들 같은 품질 저하 조건들하에서도 신뢰적으로 검색된다. 시간 위치를 바탕으로, 즉 레코딩이 트랙에서 얼마나 진행되었는가, 및 트랙의 길이, 트랙 분리는 나머지 트랙 시간을 계산하거나, 본래 트랙인 기준 트랙에 레코드될 트랙들을 비교함으로써 정확하게 행해진다.
본 발명의 다른 바람직한 실시예에서, 상기 정보 신호는 미리 결정된 음악 장르의 음악을 나타내는 오디오 신호를 포함하고, 상기 적어도 제 1 특성 값은 상기 음악 장르를 나타내고, 상기 정보 신호를 처리하는 것을 제어하는 상기 단계는상기 정보 신호의 다른 주파수 대역들에 대한 이득 설정들을 조절하는 단계를 포함한다.
많은 음악 플레이어들, 예를 들어 홈 HiFi 장치들, 소프트웨어 플레이어들 등은 이퀄라이저가 장착되어, 다른 주파수 대역에 대하여 다른 이득을 설정하게 한다. 통상적으로 이퀄라이저 설정은 여러 음악 장르에 대해 다르다. 예를 들어, 팝 음악은 일반적으로 낮고 높은 주파수들로 플레이되는 반면, 클래식 음악은 보다 많은 레벨 설정을 가진다. 이들 형태의 이퀄라이저 설정들이 원격 핑거프린트 데이터베이스에 접속하거나, 국부적으로 저장된 핑거프린트 데이터베이스를 사용함으로써 자동적으로 결정될 수 있다.
본 발명의 다른 바람직한 실시예에서, 정보 신호는 미리 결정된 내용의 비디오 프로그램을 나타내는 오디오 가시적 신호를 포함하고, 적어도 제 1 특성 값은 상기 내용을 가리키고, 상기 정보 신호를 처리하는 것을 제어하는 단계는 비디오 프로그램을 디스플레이하기 위한 디스플레이 장치의 미리 결정된 디스플레이 특성들을 적용하는 단계를 포함한다.
현대 텔레비젼 세트들은 중앙 디스플레이 특성들을 설정하기 위한 옵션을 가진다. 예를 들어, 자연 영화들은 자연 색들의 우수한 재생을 허용하는 설정으로 보다 잘 보이고, 반면 카툰들은 개선된 선명도에서 보다 잘 보인다. 본 발명의 장점은 비디오 지문을 통한 비디오 식별이 시청되는 내용에 따라 이들 설정의 자동 적용을 허용하는 것이다.
본 발명의 다른 바람직한 실시예에서, 정보 신호는 비디오 신호를 포함하고,적어도 제 1 특성 값은 비디오 인코딩 방법의 코딩 파라미터들 세트를 가리키고, 정보 신호를 처리하는 것을 제어하는 단계는 얻어진 코딩 파라미터들을 사용하여 비디오 신호를 인코딩하는 단계를 포함한다. 결과적으로, 비디오 프로그램을 저장하기 전에 비디오 프로그램을 인코딩할 때, 예를 들어 장면 변화들, 이동 정보등의 관련 코딩 파라미터들은 검색되고 인코딩 처리의 제어에 사용되어, 코딩으로 인한 품질 손실을 줄이고 및/또는 보다 우수한 압축율을 달성함으로써 비디오 인코딩을 개선한다.
본 발명의 다른 바람직한 실시예에서, 정보 신호의 지문을 결정하는 단계는 정보 신호의 적어도 하나의 세그먼트의 지문을 결정하는 단계를 포함하고, 다수의 저장된 지문들은 미리 결정된 정보 신호들의 적어도 미리 결정된 세그먼트들의 지문을 포함한다. 결과적으로, 지문은 정보 신호중 하나 이상의 부분에 대해서만 결정되어, 지문을 계산하고 저장된 지문과 지문을 매칭하기 위하여 요구된 계산 리소스들을 감소시킨다.
예를 들어, 오디오 신호들의 경우, 지문은 몇분의 전체 오디오 트랙에 대해 계산될 필요가 없다. 몇몇 실시예들에서, 트랙의 처음, 중간 부근, 및 끝 부분에서 짧은 세그먼트인 오디오 트랙들의 짧은 세그먼트들의 지문들을 계산하기는 것은 충분할 수 있다.
바람직하게, 본 실시예에 따라, 정보 신호의 가장 특징적인 세그먼트들에 대한 지문 데이터는 데이터베이스 등에서 이용 가능하다. 예를 들어, 오디오 신호들의 경우, 짧은 세그먼트들 또는 클립(clip)들에 대한지문들은 저장되고 0.1초 이하의 시간 정확도로 식별될 수 있다.
본 발명은 상기되고 다음의 기술된 방법을 포함하는 여러 가지 방식들에서 실행될 수 있고, 장치, 및 추가 제품 수단은 제 1 방법과 관련하여 하나 이상의 기술된 장점 및 잇점들을 형성하고, 각각은 제 1 방법과 관련하여 기술되고 종속항에 개시된 바람직한 실시예에 대응하는 하나 이상의 바람직한 실시예들을 가진다.
상기 설명되고 다음에 기술된 방법의 특징들은 컴퓨터 실행 가능 명령들의 실행에 의해 발생된 데이터 처리 시스템 또는 다른 처리 수단에서 수행되고 소프트웨어에서 실행될 수 있다는 것이 주의된다. 명령들은 컴퓨터 네트워크를 통하여 RAM, 저장 매체 또는 다른 컴퓨터 같은 메모리에 로딩된 프로그램 코드 수단일 수 있다. 선택적으로, 기술된 특징들은 소프트웨어 대신 배선된 회로 또는 소프트웨어와 결합하여 실행될 수 있다.
본 발명은 정보 신호를 처리하기 위한 장치에 관한 것이고, 상기 장치는,
- 정보 신호의 지문을 결정하고, 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻기 위하여 제공된 처리 수단을 포함하는데, 상기 적어도 제 1 특성 값은 다수의 저장된 지문들중 대응하는 지문에 관련하여 저장되고; 및
- 얻어진 적어도 제 1 특성 값에 응답하는 정보 신호를 적어도 부분적으로 처리하는 것을 제어하기 위하여 제공된 제어 수단을 포함하고, 상기 처리는 처리된 정보 신호를 유발한다.
상기 장치는 예를 들어 Hifi 장치, 비디오 레코더들인 오디오 신호들, 비디오 신호들 등의 레코딩을 위한 레코딩 장치들을 포함하는 임의의 전자 장치의 일부일 수 있다. 다른 실시예들은 비디오 레코더들, 오디오 플레이어들, 텔레비젼 세트들 등 같은 정보 내용을 재생하기 위한 장치, 및 고정 및 휴대용 PC들, 정지 및 휴대용 라디오 통신 장치 및 다른 포켓용 또는 이동 전화들, 페이저들, 오디오 플레이어들, 다중매체 플레이어들, 통신기들, 즉 전자 오거나이저들, 스마트 폰들, 퍼스널 디지탈 어시스탄트들(PDA), 포켓용 컴퓨터들 같은 휴대용 장치들 같은 정보 신호들을 처리하기 위한 장치를 포함한다.
용어 처리 수단은 범용 또는 특수용 프로그램 가능 마이크로프로세서들, 디지탈 신호 처리기들(DSP), 애플리케이션 특정 집적 회로들(ASIC), 프로그램 가능 논리 어레이들(PLA), 필드 프로그램가능 게이트 어레이들(FPGA), 특수용 전자 회로들 등, 또는 그것의 결합을 포함한다. 용어 제어 수단은 정보 신호의 처리를 제어하기 위하여 제공된 회로를 포함한다. 예를 들어, 제어 수단은 상기된 처리 수단을 포함할 수 있다.
상기 장치는 다수의 지문들을 저장하기 위한 저장 수단을 더 포함할 수 있다. 여기서, 용어 저장 수단은 자기 테이프, 광학 디스크, 디지탈 비디오 디스크(DVD), 컴팩트 디스크(CD 또는 CD-ROM), 미니 디스크, 하드 디스크, 플로피 디스크, 강자기 메모리, 전기적 소거가능 프로그램 가능 판독 전용 메모리(EEPROM), 플래시 메모리, EPROM, 판독 전용 메모리(ROM), 스태틱 램덤 액세스 메모리(SRAM), 다이나믹 랜덤 액세스 메모리(DRAM), 싱크로노스 다이나믹 랜덤 액세스 메모리(SDRAM), 강자기 메모리, 광학 저장기, 전하 결합 장치들, 스마트 카드들, PCMCIA 카드 등을 포함한다. 용어 저장 수단은 컴퓨터 판독 가능 매체를 판독하기 위한입력 장치들을 더 포함한다. 상기 수신 수단의 예는 플로피 디스크 드라이브, CD-Rom 드라이브, DVD 드라이브, 또는 다른 적당한 디스크 드라이브, 메모리 카드 어댑터, 스마트 카드 어댑터 등을 포함한다.
본 발명은 다수의 대응하는 정보 신호들의 다수의 지문들을 저장하기 위하여 제공된 데이터 구조에 관한 것이고, 데이터 구조는 처리된 정보 신호에서 발생하는 정보 신호를 적어도 부분적으로 처리하는 것을 제어하기 위하여 대응 정보 신호의 미리 결정된 제 1 특성의 적어도 하나의 대응하는 제 1 특성 값에 관련하여 각각의 다수의 지문들을 저장하기 위하여 제공된다. 데이터 구조는 예를 들어 관련 데이터베이스에서 하나 이상의 테이블들로서 공지된 데이터베이스 구조로 구현될 수 있다.
본 발명은 다수의 대응하는 정보 신호들의 다수의 저장된 지문들을 포함하는 컴퓨터 판독 가능 매체에 관한 것이고, 각각의 다수의 저장된 지문들은 처리된 정보 신호를 발생시키는 정보 신호를 적어도 부분적으로 처리하는 것을 제어하기 위한 대응 정보 신호의 미리 결정된 제 1 특성의 적어도 대응하는 제 1 특성 값에 관련하여 저장된다.
용어 컴퓨터 판독가능 매체는 테이프, 광학 디스크, 디지탈 비디오 디스크(DVD), 컴팩트 디스크(CD 또는 CD-ROM), 미니 디스크, 하드 디스크, 플로피 디스크, 강전기 메모리, 전기 소거가능 프로그램 가능 판독 전용 메모리(EEPROM), 플래시 메모리, EPROM, 판독 전용 메모리(ROM), 스태틱 랜덤 액세스 메모리(SRAM), 다이나믹 랜덤 액세스 메모리(DRAM), 싱크로노스 다이나믹 랜덤 액세스 메모리(SDRAM), 강자기 메모리, 광학 저장기, 전하 결합 장치들, 스마트 카드들, PCMCIA 카드 등을 포함한다.
본 발명은 상기되고 다음에 기술되는 소스 정보 신호의 처리 방법에 의해 발생되는 정보 신호에 관한 것이다.
본 발명은 상기된 다음에 기술되는 방법을 처리기가 실행하도록 하기 위해 배열된 컴퓨터 프로그램 제품에 관한 것이다.
컴퓨터 프포그램 제품은 컴퓨터 판독가능 매체로 실현될 수 있다. 용어 컴퓨터 판독가능 매체는 자기 테이프, 광학 디스크, 디지탈 비디오 디스크(DVD), 컴팩트 디스크(CD 또는 CD-ROM), 미니 디스크, 하드 디스크, 플로피 디스크, 강전기 메모리, 전기 소거가능 프로그램 가능 판독 전용 메모리(EEPROM), 플래시 메모리, EPROM, 판독 전용 메모리(ROM), 스태틱 랜덤 액세스 메모리(SRAM), 다이나믹 랜덤 액세스 메모리(DRAM), 싱크로노스 다이나믹 랜덤 액세스 메모리(SDRAM), 강자기 메모리, 광학 저장기, 전하 결합 장치들, 스마트 카드들, PCMCIA 카드 등을 포함한다.
본 발명의 이들 및 다른 측면들은 도면 및 실시예들을 참조하여 명백하고 설명될 것이다.
도 1은 원격 지문 데이터베이스를 가진 본 발명의 실시예에 따른 오디오 트랙들을 레코딩하기 위한 시스템을 개략적으로 도시한다. 시스템은 오디오 소스(101), 레코더(103) 및 지문 데이터베이스(110)에 액세스를 가지는 지문 서버(109)를 포함한다.
도 1의 실시예에서, 오디오 소스는 음악, 스피치 등 같은 오디오 트랙들을 포함하는 비닐 레코드(102)를 플레이하기 위한 레코드 플레이어이다. 레코드 플레이어(101)는 다른 캐리어상에 오디오 프로그램을 레코딩하기 위한 증폭기 또는 레코더(103)에 공급될 수 있는 아날로그 오디오 신호를 출력한다. 선택적으로, 다른 오디오 소스들은 공기 또는 케이블 네트워크, 테이프 레코더들 등을 통해 라디오 프로그램들을 수신하기 위한 라디오에 사용될 수 있다.
통상적인 비닐 레코드에서, 다수의 오디오 트랙들은 상대적 침묵 간격에 의해 분리되어 레코드될 수 있다. 그러나, 관련 침묵 기간으로 인해, 비닐 레코드 또는 플레이어의 결함, 스크래치들, 먼지 등 같은 손상으로 인한 가청 노이즈의 임의의 레벨이 있을 수 있다. 도 1의 실시예에서, 비닐 레코드(102)는 간격들(102d-e) 만큼 이격된 트랙들(102a-c)이 도시된다. 오디오 소스(101)로부터 생성된 오디오 신호는 종래 라인 입력 잭을 통해 레코더(103)에 공급된다.
레코더(103)는 인입 오디오 신호의 기록을 제어하기 위한 대응 회로(104) 및 CD상 오디오 트랙들을 기록하기 위한 CD 드라이브(106)를 포함한다. 회로(104)는 AD 전환, 필터링, 압축(예를 들어, MP3) 등 같은 종래 신호 처리를 추가로 수행할 수 있다.
본 발명에 따라, 레코더(103)는 트랙 분리를 위한 회로(105)를 더 포함한다. 회로(105)는 회로(104)로부터 오디오 신호를 수신하고 오디오 신호로부터 지문을 계산하기 위한 회로를 포함한다. 회로(105)는 입력 모듈(105a), 지문 모듈(105b), 및 트랙 분리 제어 모듈(105c)을 포함한다. 입력 모듈(105a)은 회로(104)로부터의 오디오 클립을 수신하고 지문 모듈(105b)에 오디오 클립을 공급한다. 지문 모듈(105b)은 수신된 오디오 클립으로부터 지문을 계산한다. 로버스트 지문을 계산하는 하나의 방법은 비록 로버스트 지문을 계산하기 위한 임의의 방법이 사용될 수있지만, 유럽특허출원 제 01200505.4 호(위임 도킷 PHNL010110)에 기술된다.
유럽특허출원 제 01200505.4 호(위임 도킷 PHNL010110)은 예를 들어 오디오 클립들 같은 다중매체 오브젝트들에 대한 로버스트 지문들을 생성하는 방법을 기술한다. 오디오 클립은 연속적인(바람직하게 오버래핑) 시간 간격들에서 분할된다. 각각의 시간 간격 동안, 주파수 스펙트럼은 대역들에서 분할된다. 로버스트 특성의 각각의 대역(예를 들어, 에너지)는 각각의 지문 비트에 의해 계산되고 표현된다.
다중 매체 오브젝트는 각각의 시간 간격 동안 하나인 이진 값들의 연결을 포함하는 지문에 의해 표현된다. 지문은 전체 다중매체 오브젝트상에서 계산될 필요가 없고, 통상적으로 3초의 길이 부분이 수신될때 계산될 수 있다. 따라서 상기 부분이 지문을 계산하기 위하여 사용되는 것에 따라, 하나의 다중매체 오브젝트에 대한 다수의 지문들이 있을 수 있다. 간략화를 위하여, 용어 "지문"은 하나의 다중매체 오브젝트에 대한 다중 지문들이 존재할 수 있을때 조차 사용될 것이다.
레코더(103)는 회로(105)로부터 계산된 지문을 수신하고 계산된 지문을 통신 링크(107)를 통하여 지문 서버(109)에 전송하는 통신 회로(108)를 더 포함한다. 통신 회로(108)는 현재 오디오 트랙의 길이 및 계산된 지문에 대응하는 현재 오디오 트랙내의 현재 위치에 관한 정보를 가리키는 지문 서버로부터 응답을 수신하기 위한 회로를 더 포함한다. 수신된 데이터는 다시 회로(105)의 트랙 분리 제어 모듈(105c)에 공급된다. 트랙 분리 제어 모듈(105c)은 수신된 정보를 기초로 남은 노래 시간을 계산하고 회로(104)에 공급되는 남은 노래 시간을 가리키는 제어 신호를 생성하기 위하여 제공된다. 그 다음 회로(104)는 현재 트랙의 끝을 식별하기 위한 이런 정보를 사용한다.
지문 서버(109)는 데이터베이스(110)를 가진 적당히 프로그램 서버 컴퓨터일 수 있다. 지문 서버(109)는 계산된 지문을 포함하는 레코더(103)로부터의 요구를 수신한다. 이런 요구에 응답하여, 지문 서버는 데이터베이스(110)의 지문을 식별하고 도 3-4와 관련하여 기술된 저장된 지문과 연관된 요구 데이터를 리턴한다.
통신 링크(107)는 임의의 적당한 유선 또는 무선 데이터 링크, 인터넷 또는 다른 TCP/IP 네트워크 같은 패킷 바탕 통신 네트워크, 라디오 바탕 링크 등 같은 짧은 범위 통신 링크일 수 있다. 게다가, 통신 채널의 실시예들은 셀방식 디지탈 패킷 데이터(CDPD) 네트워크 같은 컴퓨터 네트워크들 및 무선 원격통신 네트워크들, 이동(GSM) 네트워크에 대한 글로벌 시스템, 코드 분할 다중 액세스(CDMA) 네트워크, 시분할 다중 액세스 네트워크(TDMA), 일반적인 패킷 라디오 서비스(GPRS) 네트워크, UMTS 네트워크 같은 제 3 세대 네트워크를 포함한다.
따라서, 통신 회로(108)는 통신 네트워크(107)를 통하여 데이터의 통신을 인에이블링하기에 적당한 회로 및/또는 장치들을 포함한다. 상기 회로으 실시예들은 네트워크 인터페이스, 네트워크 카드, 라디오 수신기, 적당한 전자기 신호들에 대한 수신기 등을 포함한다. 게다가, 상기 회로들의 예들은 케이블 모뎀, 전화 모뎀, 집적된 서비스들 디지탈 네트워크(ISDN) 어댑터, 디지탈 가입자 라인(DSL) 어댑터, 위성 송수신기, 이더넷 어댑터등을 포함한다.
선택적으로 레코더의 지문을 계산하기 위하여, 짧은 오디오 클립들은 서버(109)에 전송될 수 있다는 것이 주의된다. 다른 실시예에서 서버(109)는 수신된 오디오 클립의 지문을 계산하기 위한 회로를 포함하여, 증가된 대역폭 요구의 비용에서 레코더의 요구된 계산 리소스들을 감소시킨다.
도 2는 로컬 지문 데이터베이스를 가진 본 발명의 실시예에 따른 오디오 트랙들을 레코딩하기 위한 시스템을 개략적으로 도시한다. 시스템은 오디오 소스(101) 및 레코더(203), 예를 들어 다중 디스크 레코더를 포함한다. 이 실시예에 따라 지문 데이터는 레코더(203)에 국부적으로 저장된다. 도 2의 실시예에서 레코더(203)는 제 2 CD 드라이브(210)를 포함하고, 여기에서 지문 데이터베이스가 저장된 CD는 제거 가능하게 삽입될 수 있다. 레코더는 CD상에 저장된 데이터에 대한 액세스를 제어하고 지문 매칭을 수행하기 위한 회로(209)를 더 포함한다. 즉 상기 회로(209)는 도 3-4와 관련하여 기술된 도 1의 실시예에서 지문 서버(109)에 대응하는 기능을 수행한다. 따라서, 이 실시예에 따라, 레코더는 원격 데이터베이스와 통신하기 위한 회로를 포함할 필요가 없어서, 트랙 분리를 포함하는 자체 포함 레코딩 시스템을 제공한다.
선택적으로 CD상 지문 데이터를 저장하기 위해, 다른 저장 매체, DVD, 하드 디스크 드라이브, 메모리 카드들, EPROM, EEPROM 등이 사용될 수 있다는 것이 이해된다.
도 1 또는 2에 따른 트랙 분리가 오디오 소스(101)로부터 입력을 수신하고 레코더에 공급될 수 있는 단일 오디오 트랙에 대응하는 출력을 생성하는 분리된 장치에서 수행되는 것이 이해된다. 이것은 종래 레코더, 필립스에 의해 제조된 CD레코더(CDR-800)는 사용될 수 있는 장점을 가진다. 예를 들어, 트랙들을 분리하기 위한 장치는 인터넷 등을 통해 CD 등에서 지문 데이터베이스에 대한 액세스를 가진 프로그램된 컴퓨터일 수 있다.
도 1 또는 2의 레코더들이 DVD상에서 CD와 다른 레코더 가능 매체상 분리된 오디오 트랙들, 또는 하드 디스크, 디스켓, 또는 임의의 다른 컴퓨터 판독가능 매체 같은 데이터 저장 매체상 파일들을 레코드하는 것이 추가로 이해된다.
도 3은 본 발명의 실시예에 따른 오디오 트랙들을 분리하는 방법의 흐름도를 도시한다.
처음 단계에서 레코딩 장치(103)는 아날로그 입력 신호를 수신한다. 예를 들어, 입력 신호는 도 1과관련하여 기술된 바와같이 비닐 레코드를 플레이하는 레코드 플레이어 또는 다른 오디오 소스로부터 수신될 수 있다.
단계(302)에서, 지문(H)은 수신된 오디오 신호의 세그먼트에 대해 계산된다.
단계(303)에서, 계산된 지문은 지문(H)을 식별하는 식별기(nH)와 함께 지문 서버(109)로 전송된다.
지문 서버(109)는 단계(304)에서 계산된 지문(H) 및 식별기(nH)를 수신한다.
단계(305)에서, 수신기는 키로서 지문(H)을 사용하여 데이터베이스(110)로부터 노래 ID를 검색한다. 만약 매칭되는 노래 ID가 발견되지 않으면, 서버는 새로운 요구를 기다리는 단계(304)로 리턴할 수 있다.
선택적으로, 단계(307)에서, 서버는 노래 ID를 식별하는 결함을 나타내는 메시지를 리턴할 수 있다. 단계(314)에서 이런 메시지의 수신후, 레코더는 단계(302)로 리턴하여, 입력 오디오 신호의 다른 세그먼트에 대한 새로운 지문을 계산한다.
단계(308)에서, 만약 유효 노래 ID가 단계(305)의 데이터베이스에서 검색되면, 식별된 노래의 시작에서 지문(H)의 대응하는 시간 위치(T)는 식별된 노래의 총 길이뿐 아니라 데이터베이스(110)로부터 검색된다.
단계(309)에서, 수신된 노래 위치(T) 및 총 길이(L)는 지문 식별기(nH)와 함게 레코더(103)로 리턴된다.
단계(310)에서, 레코더가 리턴된 데이터를 수신하고 단계(311)에서, 레코더는 남은 노래 시간 TR= L-T-Trep를 계산하고, 여기서 Trep는 남은 시간의 계산때까지 지문 계산으로부터 유도된 지연이다. 예를 들어, 이런 지연은 상기 단계(302) 동안 타이머를 시작함으로서 레코더에 의해 측정될 수 있다. 따라서, 경과된 시간은 단계(311)에서 결정될 수 있고 TR의 계산에 사용된다.
남은 노래 시간(TR)을 바탕으로, 현재 트랙의 끝은 단계(312)에서 결정된다. 만약 트랙의 끝에 도달되면, 현재 트랙의 레코딩은 단계(313)에서 종료된다. 그렇지 않으면, 레코더는 단계(302)로 리턴하고 다른 섹션에 대한 새로운 지문을 계산한다. 선택적으로 도는 부가적으로, 타이머는 시작되어, 레코더는 시간 TR이 경과될때를 결정하도록 하고 레코더는 추가 지문들을 계산하지 않고 현재 트랙의 끝을 측정할 수 있게 한다.
도 4는 보다 상세히 서버(109) 및 지문 데이터베이스(110)를 개략적으로 도시한다. 서버(109)는 입력 모듈(401), 데이터베이스 관리 시스템(DBMS) 백엔드 모듈(403), 및 응답 모듈(404)을 포함한다.
입력 모듈(401)은 클라이언트 장치로부터 지문을 수신하고 상기 지문을 DBMS 백엔드 모듈(403)로 공급한다. DBMS 백엔드 모듈(303)은 데이터베이스(110)에서 질문을 수행하여 데이터베이스(110)로부터 계산된 지문과 관련된 메타데이터 세트를 검색한다. 도 4에 도시된 바와같이, 데이터베이스(110)는 지문들(FP1, FP2, FP3, FP4 및 FP5) 및 메타데이터(MDS1, MDS2, MDS3, MDS4 및 MDS5)의 각각 연관된 세트를 포함한다. 상기된 유럽특허출원 제 01200505.4 호(위임 도킷 PHNL010110)은 데이터베이스에 저장된 지문들과 오디오 클립에 대해 계산된 지문들을 매칭하기 위하여 다양한 매칭 방법들을 기술한다.
유럽특허출원 제 01202720.7 호(위임 도킷 PHNL010510)은 미지의 신호를 식별하기 위하여 데이터베이스에 저장된 식별된 정보 신호들의 다수의 지문들과 미지의 정보 신호를 나타내는 지문을 매칭하는 효율적인 방법을 기술한다. 이 방법은 추출된 지문 비트들의 신뢰성 정보를 사용한다. 지문 비트들은 지문 비트들을 얻기 위하여 정보 신호의 피쳐들을 계산하고 상기 피쳐들을 임계화함으로써 결정된다. 만약 피쳐가 임계치에 매우 근접한 값을 가지면, 신호의 작은 변화는 반대 값을 가진 지문 비트에 유도될 수 있다. 피쳐 값 및 임계치 사이의 절대값 차는 신뢰적이거나 신뢰적이지 않은 각각의 지문 비트를 마크하기 위하여 사용된다. 신뢰성은 실제 매칭 과정을 개선하기 위하여 순차적으로 사용된다.
데이터베이스(110)는 질문 시간 및/또는 데이터 구성을 최적화하기 위하여 다양한 방식들로 구성될 수 있다. 입력 모듈(401)로부터의 출력은 데이터베이스(110)에서 테이블들을 설계할 때 고려되어야 한다. 도 4에 도시된 실시예에서, 데이터베이스(110)는 각각의 지문들 및 메타데이터 세트들을 포함하는 엔트리들(레코드들)을 가진 단일 테이블을 포함한다. DBMS 백엔드 모듈(403)은 클라이언트 장치에 결과들을 전송하는 응답 모듈(404)에 질문의 결과들을 공급한다.
도 5는 본 발명의 실시예에 다른 이퀄라이저 세팅을 결정하기 위하여 지문 데이터를 사용하는 음악 플레이어를 개략적으로 도시한다. 많은 음악 플레이어들에는 이퀄라이저 세팅들이 장착되어, 다른 주파수 대역들에 대해 다른 이득들이 설정되게 한다. 통상적으로 이퀄라이저 세팅들은 다른 뮤지컬 장르와 다르다. 예를 들어, 팝 음악은 낮고 높은 주파수들이 부스트되게 플레이되는 반면, 클랙식 음악은 보다 많은 레벨 세팅이 바람직하다. 지문을 통한 음악 식별을 사용하여, 이들 형태의 이퀄라이저 세팅들은 원격 지문 데이터베이스(접속된 플레이어들에 대하여)과 접속을 통해, 또는 국부적으로 저장된 지문 데이터베이스를 사용하여 자동으로 결정될 수 있다.
도 5의 실시예에서, 음악 플레이어(503), 예를 들어 홈 HiFi 장치, 소프트웨어 플레이어 등은 입력으로서 오디오 신호, 예를 들어 외부 신호를 다른 오디오 소스, 즉 레코드 플레이어, 테이프, 레코드 등으로부터 수신하거나, CD 플레이어, 라디오 동조기, 테이프 레코더, 레코드 플레이어 등인 음악 플레이어에 포함된 사운드 소스(501)로부터 신호를 수신하는 이퀄라이저(508)를 포함한다. 이퀄라이저(508)는 스피커(509), 다른 증폭기(도시되지 않음) 등에 공급될 수 있는 출력 신호의 이득을 제어한다. 입력 오디오 신호는 도 1과 관련하여 기술된 바와같은 수신된 오디오 클립들의 지문들을 계산하는 지문 모듈(505)에 추가로 공급된다. 지문 모듈은 데이터베이스(110)에게 질문하고 지문 모듈에게 장르 정보, 예를 들어 다수의 장르중 하나를 식별하는 식별기 코드를 리턴하는 데이터베이스 서버(109)에 계산된 지문을 전송한다. 지문 모듈은 장르 정보를 사용하여 이퀄라이저(508)의 이퀄라이저 세팅들을 제어한다.
도 6은 본 발명의 실시예에 따른 디스플레이 특징들을 설정하기 위하여 지문 데이터를 사용하는 텔레비젼 세트(603)를 개략적으로 도시한다.
현대의 텔레비젼 세트들은 임의의 디스플레이 특징들을 설정하기 위하 옵션을 가진다. 예를 들어, 자연 영화들은 자연 칼라들의 보다 우수한 재생을 허용하는 세팅으로 보다 잘 보이고, 카툰들은 개선된 선명도로 보다 잘 보인다. 다시, 비디오 지문을 통한 비디오 식별은 시청되는 내용에 따라 이들 세팅들의 자동 적응을 허용한다.
텔레비젼 세트(603)는 공기(608)를 통해 텔레비젼 신호를 수신한다. 선택적으로 또는 부가적으로, 텔레비젼 세트(603)는 케이블 네트워크, 위성 등인 다른 채널들을 통해 텔레비젼 신호를 수신할 수 있다. 텔레비젼 세트는 디스플레이 특성들을 제어하는 것을 포함하는 텔레비젼 세트의 디스플레이(606)를 제어하기 위한 제어 회로(604)를 포함한다. 본 발명에 따라, 텔레비젼 세트(603)는 제어 회로(604)로부터 비디오 신호를 수신하고 대응하는 지문을 게산하는 지문 모듈(605)을더 포함한다. 지문 모듈(605)은 상기된 바와같이, 계산된 지문에 연관된 메타데이터를 리턴하는 지문 서버(109)에 계산된 지문을 전송한다. 리턴된 메타데이터는 제어 회로(604)가 적당한 디스플레이 세팅을 설정하도록 하는 지문 모듈(605)에 다시 공급된다.
도 7은 본 발명의 실시예에 따른 인코딩 방법의 코딩 파라미터들을 결정하기 위하여 지문 데이터를 사용하는 비디오 레코더(703)를 개략적으로 도시한다.
현대 비디오 레코더들, 예를 들어 디지탈 셋톱 박스들 또는 퍼스널 텔레비젼 레코더들 또는 서버들은 사용자가 텔레비젼 프로그램을 하드 디스크에 직접적으로 기록하게 한다. 상기 퍼스널 비디오 레코더들의 예들은 필립스에 의해 제조된 Tivo 레코더 및 릴레이 레코더를 포함한다. 상기 레코더들은 레코드된 비디오 프로그램들을 저장하기 위하여 MPEG-2 등과 같은 현대 비디오 압축 표준들을 이용한다.
도 7의 실시예에서, 비디오 레코더(703)는 비디오 신호를 인코딩하기 위한 인코딩 모듈(704)을 포함한다. 비디오 인코딩은 비디오 디코딩 보다 일반적으로 복잡하고: 비디오 인코딩은 속도(사용될 바이트들의 수) 및 비디오 품질 사이의 가장 우수한 트레이드 오프 를 얻기 위하여 큰 공간의 자유 파라미터들상에서 검색을 수반한다. 비디오 디코딩 엔진은 유일한 태스크가 선택된 파라미터들을 해석할 때 이런 복잡성으로 인해 고통을 받지 않는다. 일반적으로 높은 품질의 비디오 인코딩은 비교적 덜 비싼 소비자 장치내에서 이용할 수 있는 보다 많은 계산 리소드들을 요구한다.
이 실시예에 따라, 비디오 레코더는 자유 파라미터들의 선택시 비디오 인코딩 모듈(704)을 돕는 지문 모듈(705)을 더 포함하여, 전체 디코딩 품질을 개선시킨다. 이들 파라미터들은 주어진 영화 또는 비디오 프로그램에 대해 사전에 계산될 수 있고, 데이터베이스(110)상 계산된 비디오 지문 데이터를 가진 메타 데이터로서 저장된다. 인코더(704)에 의해 인코드될 주어진 비디오 신호에 대하여, 비디오 신호는 비디오 신호의 지문 또는 비디오 신호의 일부를 계산하는 지문 모듈(705)에 공급된다.
지문 모듈은 개선된 비디오 인코딩을 위하여 장면 변화들, 이동 정보 등 같은 관련된 코딩 파라미터들을 검색하는 지문 서버에 게산된 지문을 전송한다. 예를 들어 비디오 레코더는 인터넷, 케이블 텔레비젼 네트워크 등을 통해 지문 서버에 접속할 수 있다. 수신된 코딩 파라미터들은 이에 따라 비디오 인코딩을 수행하는 인코딩 모듈(704)에 다시 공급된다.
당업자가 상기 실시예들의 피쳐를 부가 또는 제거하거나, 결합함으로서 상기 실시예들을 적용할 수 있다는 것이 이해된다. 예를 들어, 상기 모든 실시예들에서, 지문 데이터베이스는 로컬 또는 원격 데이터베이스이거나, 그것의 결합일 수 있다는 것이 이해된다. 게다가, 계산된 지문을 바탕으로 신호 처리를 제어하기 위한 특성 값들의 검색은 예를 들어 사용자에게 제공될 메타데이터의 검색인 다른 목적을 위해 다른 데이터의 검색과 결합될 수 있다.
상기 장치들이 범용 또는 특수용 프로그램 가능 마이크로프로세서들, 디지탈 신호 처리기들(DSP), 애플리케이션 특정 집적 회로들(ASIC), 프로그램 가능 논리어레이들(PLA), 필드 프로그램 가능 게이트 어레이들(FPGA), 특수용 전자 회로들 등, 또는 그것의 결합으로서 실행될 수 있다는 것이 이해된다.
본 발명이 다수의 실시예들과 관련하여 기술되었다는 것이 추가로 주의된다. 그러나, 당업자가 단일 처리의 다른 형태로 본 발명에 적용될 수 있어서, 연관된 신호 처리를 개선하기 위하여 특정 오디오 가시적 아이템 또는 다른 정보 아이템의 정보의 지식을 사용하는 것이 이해된다.
상기된 실시예들은 본 발명을 제한하기 보다 오히려 도시하고, 당업자가 첨부된 청구항들의 범위에서 벗어나지 않고 많은 다른 실시예들을 설계할 수 있다는 것이 주의되어야 한다.
청구항들에서, 괄호 사이에 배치된 임의의 참조 부호들은 청구항을 제한하는 것으로 구성되지 않는다. 워드 "컴프라이징"은 청구항에 리스트된 것과 다른 엘리먼트들 또는 단계들의 존재를 배제하지 않는다. 엘리먼트 앞의 워드 "어" 또는 "언"은 다수의 상기 엘리먼트들의 존재를 배제하지 않는다.
본 발명은 몇몇 구별된 엘리먼트들을 포함하는 하드웨어, 및 적당히 프로그램된 컴퓨터에 의해 실행될 수 있다. 상기 장치에서 청구항은 몇몇 수단을 열거하였고, 이들 수단의 몇몇은 하드웨어중 하나 및 동일한 아이템에 의해 실현될 수 있다. 임의의 방법들은 상호 다른 종속항들에서 제한되는 단순한 사실은 이들 방법들의 결합이 장점으로 사용되지 않을 수 있다는 것을 가리키지 않는다.
Claims (15)
- 정보 신호를 처리하는 방법에 있어서,- 상기 정보 신호의 지문(fingerprint)을 결정하는 단계와,- 상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 단계로서, 상기 적어도 제 1 특성 값은 복수의 저장된 지문들 중 제 1 의 것에 관련하여 저장되고, 상기 제 1 특성 값은 상기 결정된 지문에 대응하는 상기 단계, 및- 상기 얻어진 적어도 제 1 특성 값에 응답하는 상기 정보 신호의 처리를 적어도 부분적으로 제어하는 단계로서, 상기 처리는 처리된 정보 신호로 끝나는 상기 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호는 적어도 제 1 오디오 트랙 다음의 제 2 오디오 트랙을 나타내는 오디오 신호이고, 상기 제 1 오디오 트랙은 미리 결정된 길이를 가지며, 상기 제 1 특성은 상기 제 1 오디오 트랙의 길이이고, 상기 정보 신호를 처리하는 것을 제어하는 상기 단계는 상기 제 2 오디오 트랙으로부터 상기 제 1 오디오 트랙을 분리하는 단계를 포함하는, 정보 신호 처리 방법.
- 제 2 항에 있어서,상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 상기 단계는 상기 제 1 오디오 트랙내의 시간 위치를 나타내는 제 2 특성 값을 얻는 상기 단계를 더 포함하고, 상기 제 2 오디오 트랙으로부터 상기 제 1 오디오 트랙을 분리하는 상기 단계는 상기 제 1 오디오 트랙의 얻어진 길이 및 상기 제 1 오디오 트랙내의 얻어진 시간 위치로부터 상기 제 1 오디오 트랙의 남은 기간을 결정하는 상기 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호는 미리 결정된 음악 장르의 음악을 나타내는 오디오 신호를 포함하고, 상기 적어도 제 1 특성 값은 상기 음악 장르를 나타내고, 상기 정보 신호를 처리하는 것을 제어하는 상기 단계는 상기 정보 신호의 다른 주파수 대역들에 대한 이득 설정들을 조절하는 상기 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호는 미리 결정된 내용의 비디오 프로그램을 나타내는 오디오 가시적 신호를 포함하고, 상기 적어도 제 1 특성 값은 상기 내용을 가리키며, 상기 정보 신호를 처리하는 것을 제어하는 상기 단계는 상기 비디오 프로그램을 디스플레이하는 디스플레이 장치의 미리 결정된 디스플레이 특징들을 적응시키는 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호는 비디오 신호를 포함하고, 상기 적어도 제 1 특성 값은 비디오 인코딩 방법의 코딩 파라미터들의 세트를 가리키며, 상기 정보 신호를 처리하는 것을 제어하는 상기 단계는 상기 얻어진 코딩 파라미터들을 사용하여 상기 비디오 신호를 인코딩하는 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호는 오디오 신호, 비디오 신호, 다중매체 신호 및 오디오 가시적 신호로 구성되는 정보 신호들의 그룹으로부터 선택되는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 적어도 제 1 특성 값을 얻는 단계는 저장된 지문들의 데이터베이스에 액세스할 수 있고 상기 저장된 지문들 중 대응하는 하나와 연관된 상기 적어도 제 1 특성 값을 검색하도록 적응되는 지문 서버에 상기 미리 결정된 지문을 전송하는 단계, 및 상기 지문 서버로부터 상기 검색된 적어도 제 1 특성 값을 수신하는 단계를 포함하는, 정보 신호 처리 방법.
- 제 1 항에 있어서,상기 정보 신호의 지문을 결정하는 상기 단계는 상기 정보 신호의 적어도 하나의 세그먼트의 지문을 결정하는 단계를 포함하고, 상기 복수의 저장된 지문들은미리 결정된 정보 신호들의 적어도 미리 결정된 세그먼트들의 지문들을 포함하는, 정보 신호 처리 방법.
- 정보 신호를 처리하는 장치에 있어서,상기 정보 신호의 지문을 결정하고, 상기 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻도록 제공되는 처리 수단으로서, 상기 적어도 제 1 특성 값은 복수의 저장된 지문들 중 대응하는 하나와 관련하여 저장되는, 상기 처리 수단, 및상기 얻어진 적어도 제 1 특성 값에 응답하여 상기 정보 신호 처리를 적어도 부분적으로 제어하도록 적응되는 제어 수단으로서, 상기 처리는 처리된 정보 신호로 끝나는, 상기 제어 수단을 포함하는, 정보 신호 처리 장치.
- 제 10 항에 있어서,상기 복수의 저장된 지문들을 저장하는 저장 수단을 더 포함하는, 정보 신호 처리 장치.
- 복수의 대응하는 정보 신호들의 복수의 지문들을 저장하도록 적응되는 데이터 구조에 있어서,처리된 정보 신호로 끝나는 상기 정보 신호를 처리하는 것을 적어도 부분적으로 제어하는 상기 대응하는 정보 신호의 미리 결정된 제 1 특성의 적어도 대응하는 제 1 특성 값에 관련하여 상기 복수의 지문들 각각을 저장하도록 적응되는, 데이터 구조.
- 복수의 대응하는 정보 신호들의 복수의 저장된 지문들을 포함하는 컴퓨터 판독가능 매체에 있어서,상기 복수의 저장된 지문들 각각은 처리된 정보 신호로 끝나는 상기 정보 신호를 처리하는 것을 적어도 부분적으로 제어하는 상기 대응하는 정보 신호의 미리 결정된 제 1 특성의 적어도 대응하는 제 1 특성 값에 관련하여 저장되는, 컴퓨터 판독가능 매체.
- 소스 정보 신호를 처리하는 방법에 의해 생성된 정보 신호에 있어서,상기 방법은,- 상기 소스 정보 신호의 지문을 결정하는 단계와,- 상기 소스 정보 신호의 미리 결정된 제 1 특성의 적어도 제 1 특성 값을 얻는 단계로서, 상기 적어도 제 1 특성 값은 복수의 저장된 지문들 중 제 1 하나에 관련하여 저장되고, 상기 제 1 특성 값은 상기 미리 결정된 지문에 대응하는, 상기 단계, 및- 상기 얻어진 적어도 제 1 특성 값에 응답하는 상기 소스 정보 신호를 처리하는 것을 적어도 부분적으로 제어하는 단계로서, 상기 처리는 상기 정보 신호로 끝나는, 상기 단계를 포함하는, 정보 신호.
- 처리기가 제 1 항의 방법을 실행하도록 배열되는, 컴퓨터 프로그램 제품.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02076909.7 | 2002-05-16 | ||
EP02076909 | 2002-05-16 | ||
PCT/IB2003/001679 WO2003098627A2 (en) | 2002-05-16 | 2003-04-22 | Signal processing method and arrangement |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050003457A true KR20050003457A (ko) | 2005-01-10 |
Family
ID=29433144
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2004-7018395A KR20050003457A (ko) | 2002-05-16 | 2003-04-22 | 신호 처리 방법 및 장치 |
Country Status (7)
Country | Link |
---|---|
US (1) | US20050229204A1 (ko) |
EP (1) | EP1506550A2 (ko) |
JP (1) | JP2005526349A (ko) |
KR (1) | KR20050003457A (ko) |
CN (1) | CN1672211A (ko) |
AU (1) | AU2003219438A1 (ko) |
WO (1) | WO2003098627A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190141790A (ko) * | 2014-12-19 | 2019-12-24 | 스냅 인코포레이티드 | 공유된 관심사를 갖는 메시지들의 갤러리 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102005014477A1 (de) * | 2005-03-30 | 2006-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung |
EP2033443A2 (en) * | 2006-06-13 | 2009-03-11 | Koninklijke Philips Electronics N.V. | Fingerprint, apparatus, method for identifying and synchronizing video |
WO2009036435A1 (en) * | 2007-09-14 | 2009-03-19 | Auditude.Com, Inc. | Restoring program information for clips of broadcast programs shared online |
JP2012019381A (ja) * | 2010-07-08 | 2012-01-26 | Sony Corp | 画像処理装置及び画像処理方法 |
US20120294459A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function |
US20120294457A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function |
WO2012163013A1 (zh) * | 2011-10-19 | 2012-12-06 | 华为技术有限公司 | 音乐查询方法和装置 |
US9460204B2 (en) * | 2012-10-19 | 2016-10-04 | Sony Corporation | Apparatus and method for scene change detection-based trigger for audio fingerprinting analysis |
US20140373036A1 (en) * | 2013-06-14 | 2014-12-18 | Telefonaktiebolaget L M Ericsson (Publ) | Hybrid video recognition system based on audio and subtitle data |
JP7210127B2 (ja) * | 2013-07-17 | 2023-01-23 | ヴィジブル ワールド リミテッド ライアビリティ カンパニー | コンテンツ提示管理のためのシステム及び方法 |
US9380383B2 (en) | 2013-09-06 | 2016-06-28 | Gracenote, Inc. | Modifying playback of content using pre-processed profile information |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5745583A (en) * | 1994-04-04 | 1998-04-28 | Honda Giken Kogyo Kabushiki Kaisha | Audio playback system |
US5751672A (en) * | 1995-07-26 | 1998-05-12 | Sony Corporation | Compact disc changer utilizing disc database |
US20020120925A1 (en) * | 2000-03-28 | 2002-08-29 | Logan James D. | Audio and video program recording, editing and playback systems using metadata |
US6031795A (en) * | 1996-12-02 | 2000-02-29 | Thomson Consumer Electronics, Inc. | Method and apparatus for programming a jukebox with information related to content on media contained therein |
US5987525A (en) * | 1997-04-15 | 1999-11-16 | Cddb, Inc. | Network delivery of interactive entertainment synchronized to playback of audio recordings |
US7047305B1 (en) * | 1999-12-09 | 2006-05-16 | Vidiator Enterprises Inc. | Personal broadcasting system for audio and video data using a wide area network |
US6539395B1 (en) * | 2000-03-22 | 2003-03-25 | Mood Logic, Inc. | Method for creating a database for comparing music |
JP3825615B2 (ja) * | 2000-08-11 | 2006-09-27 | 株式会社東芝 | 動画像符号化装置および動画像符号化方法およびプログラムを記録した媒体 |
ATE405101T1 (de) * | 2001-02-12 | 2008-08-15 | Gracenote Inc | Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei |
US20020133499A1 (en) * | 2001-03-13 | 2002-09-19 | Sean Ward | System and method for acoustic fingerprinting |
US6993532B1 (en) * | 2001-05-30 | 2006-01-31 | Microsoft Corporation | Auto playlist generator |
US7328153B2 (en) * | 2001-07-20 | 2008-02-05 | Gracenote, Inc. | Automatic identification of sound recordings |
WO2003012695A2 (en) * | 2001-07-31 | 2003-02-13 | Gracenote, Inc. | Multiple step identification of recordings |
US20030135513A1 (en) * | 2001-08-27 | 2003-07-17 | Gracenote, Inc. | Playlist generation, delivery and navigation |
US7161887B2 (en) * | 2001-11-13 | 2007-01-09 | Digeo, Inc. | Method and apparatus for extracting digital data from a medium |
US6995309B2 (en) * | 2001-12-06 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | System and method for music identification |
-
2003
- 2003-04-22 EP EP03715250A patent/EP1506550A2/en not_active Ceased
- 2003-04-22 JP JP2004506031A patent/JP2005526349A/ja active Pending
- 2003-04-22 KR KR10-2004-7018395A patent/KR20050003457A/ko not_active Application Discontinuation
- 2003-04-22 WO PCT/IB2003/001679 patent/WO2003098627A2/en active Application Filing
- 2003-04-22 CN CNA038109085A patent/CN1672211A/zh active Pending
- 2003-04-22 AU AU2003219438A patent/AU2003219438A1/en not_active Abandoned
- 2003-04-22 US US10/514,285 patent/US20050229204A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190141790A (ko) * | 2014-12-19 | 2019-12-24 | 스냅 인코포레이티드 | 공유된 관심사를 갖는 메시지들의 갤러리 |
KR20200125761A (ko) * | 2014-12-19 | 2020-11-04 | 스냅 인코포레이티드 | 메시지 파라미터에 의한 메시지들의 라우팅 |
KR20210024233A (ko) * | 2014-12-19 | 2021-03-04 | 스냅 인코포레이티드 | 메시지 파라미터에 의한 메시지들의 라우팅 |
KR20210072136A (ko) * | 2014-12-19 | 2021-06-16 | 스냅 인코포레이티드 | 메시지 파라미터에 의한 메시지들의 라우팅 |
Also Published As
Publication number | Publication date |
---|---|
CN1672211A (zh) | 2005-09-21 |
EP1506550A2 (en) | 2005-02-16 |
AU2003219438A1 (en) | 2003-12-02 |
JP2005526349A (ja) | 2005-09-02 |
US20050229204A1 (en) | 2005-10-13 |
WO2003098627A3 (en) | 2004-03-04 |
AU2003219438A8 (en) | 2003-12-02 |
WO2003098627A2 (en) | 2003-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4658598B2 (ja) | ストリームに埋め込まれた反復オブジェクトに対するユーザ制御を提供するシステムおよび方法 | |
US6748360B2 (en) | System for selling a product utilizing audio content identification | |
US7062442B2 (en) | Method and arrangement for search and recording of media signals | |
US7451078B2 (en) | Methods and apparatus for identifying media objects | |
US7531735B2 (en) | Musical piece extraction program, apparatus, and method | |
KR101001178B1 (ko) | 비디오 재생 디바이스, 이 비디오 재생 디바이스에 있는 장치, 뮤직 비디오 인덱싱 방법 및 컴퓨터-실행가능 명령을 저장한 컴퓨터-판독가능 저장 매체 | |
US7567899B2 (en) | Methods and apparatus for audio recognition | |
US8688248B2 (en) | Method and system for content sampling and identification | |
US20140214190A1 (en) | Method and System for Content Sampling and Identification | |
US20050044561A1 (en) | Methods and apparatus for identifying program segments by detecting duplicate signal patterns | |
US7665035B2 (en) | Content selection apparatus, system, and method | |
US20040059570A1 (en) | Feature quantity extracting apparatus | |
KR20050003457A (ko) | 신호 처리 방법 및 장치 | |
JP2002245066A (ja) | 情報検索装置及び方法、並びに記憶媒体 | |
US7985915B2 (en) | Musical piece matching judging device, musical piece recording device, musical piece matching judging method, musical piece recording method, musical piece matching judging program, and musical piece recording program | |
JP2004334160A (ja) | 特徴量抽出装置 | |
EP2026482A1 (en) | Method for controlling the playback of a radio program | |
JP2009147775A (ja) | 番組再生方法、装置、プログラム及び媒体 | |
EP1417583B1 (en) | Method for receiving a media signal | |
JP2005148775A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム | |
JP2006270233A (ja) | 信号処理方法及び信号記録再生装置 | |
KR100798524B1 (ko) | 매체 신호 검색 및 레코딩 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |