KR20060027351A - Raising detectability of additional data in a media signal having few frequency components - Google Patents
Raising detectability of additional data in a media signal having few frequency components Download PDFInfo
- Publication number
- KR20060027351A KR20060027351A KR1020057024342A KR20057024342A KR20060027351A KR 20060027351 A KR20060027351 A KR 20060027351A KR 1020057024342 A KR1020057024342 A KR 1020057024342A KR 20057024342 A KR20057024342 A KR 20057024342A KR 20060027351 A KR20060027351 A KR 20060027351A
- Authority
- KR
- South Korea
- Prior art keywords
- media signal
- signal
- additional data
- modified
- media
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000008859 change Effects 0.000 claims description 24
- 238000007493 shaping process Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 17
- 230000008447 perception Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 8
- 238000001514 detection method Methods 0.000 description 7
- 230000005236 sound signal Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
- G06T1/0021—Image watermarking
- G06T1/005—Robust watermarking, e.g. average attack or collusion attack resistant
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32154—Transform domain methods
- H04N1/3216—Transform domain methods using Fourier transforms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32149—Methods relating to embedding, encoding, decoding, detection or retrieval operations
- H04N1/32203—Spatial or amplitude domain methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32144—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
- H04N1/32352—Controlling detectability or arrangements to facilitate detection or retrieval of the embedded information, e.g. using markers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8358—Generation of protective data, e.g. certificates involving watermark
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0052—Embedding of the watermark in the frequency domain
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2201/00—General purpose image data processing
- G06T2201/005—Image watermarking
- G06T2201/0065—Extraction of an embedded watermark; Reliable detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3269—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
- H04N2201/327—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/08—Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Physics (AREA)
- Computer Security & Cryptography (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
Abstract
Description
본 발명은 일반적으로 부가적 데이터를 미디어 신호 내에 제공하는 분야에 관한 것이며, 보다 상세하게는, 부가적 데이터의 미디어 신호 내 매입에 관련된 방법들, 디바이스들, 신호 및 정보 저장 매체에 관한 것이다. The present invention generally relates to the field of providing additional data in a media signal, and more particularly to methods, devices, signals and information storage media related to embedding of additional data in a media signal.
인터넷의 전개로, 가상적으로 무제한적인 양의 정보 콘텐트를 액세스 또는 검색할 수 있다. 이때, 콘텐트는 상이한 콘텐트 제공자들에 의해 모양들 및 형태를 변경하는 미디어 신호들의 형태로 제공될 수 있다. 미디어 신호들은, 예를 들면, 압축되거나 압축 해제된 형태의 오디오 신호들, 압축되거나 압축 해제된 형태의 이미지 신호들 및 압축되거나 압축 해제된 형태의 비디오 신호들로서 제공될 수 있다. 상기 미디어 콘텐트에 대한 자격이 없는 사람들에게 의해 상기 미디어 콘텐트가 불법적으로 획득되거나, 콘텐트의 불법 복제가 이루어지는 것을 금지하기 위해, 콘텐트 소유자들은 그들의 콘텐트를 보호할 필요가 있다. 콘텐트를 보호하기 위해, 그들은 종종 부가적 정보를 미디어 신호들 내에 제공할 필요가 있다. 부가적 정보는 또한, 예를 들면, 오디오(예를 들면, 서정시)에 관하여 텍스트를 제공하는 것과 같이 다른 이유들로 제공될 수 있다. With the development of the Internet, virtually unlimited amounts of information content can be accessed or retrieved. In this case, the content may be provided in the form of media signals changing shapes and shapes by different content providers. The media signals may be provided, for example, as audio signals in a compressed or decompressed form, image signals in a compressed or decompressed form, and video signals in a compressed or decompressed form. In order to prevent the media content from being illegally obtained or illegal copying of content by people who are not entitled to the media content, content owners need to protect their content. To protect the content, they often need to provide additional information in the media signals. Additional information may also be provided for other reasons, such as providing text with respect to audio (eg, lyric).
부가적 데이터가 미디어 신호 내에 제공되는 하나의 사용 분야는 디지털 권리 관리(Digital Rights Management; DRM) 분야이며, 여기서 워터마크들 형태의 부가적 데이터는, 미디어 콘텐트의 불법적 변경을 금지하기 위해 미디어 콘텐트 및 가능한 사용자의 출처를 나타내는데 사용된다.One field of use in which additional data is provided within a media signal is the field of Digital Rights Management (DRM), where additional data in the form of watermarks may be used to prevent media content from being tampered with. Used to indicate possible sources of users.
정확하고 효과적인 워터마크 검출의 가능성은, 호스트 신호로의 데이터 매입 방법 및 호스트 신호의 특성들에 매우 의존한다. 워터마크 매입에 자주 사용되는 한 형태는 소위 승산 워터마킹(multiplicative watermarking)이라 불리며, 여기서 워터마킹될 미디어 신호는 해당 워터마크와 승산된다. 한편, 일반적으로 미디어 신호는 다수의 상이한 주파수 성분들을 가지며, 때때로 적은 주파수 성분들을 가질 수 있다. 주파수 성분들이 적은 경우에, 승산 워터마킹을 사용하여 매입된 워터마크를 검출하는 것은 어려울 수 있다. The possibility of accurate and effective watermark detection is highly dependent on the data embedding method into the host signal and the characteristics of the host signal. One form often used for embedding watermarks is called multiplicative watermarking, where the media signal to be watermarked is multiplied with the corresponding watermark. On the other hand, in general, a media signal has many different frequency components, and may sometimes have fewer frequency components. In the case of low frequency components, it may be difficult to detect embedded watermarks using multiplication watermarking.
국제 특허 출원 번호 제 WO-A-02/15587 호는, 워터마크와 같은 부가적 데이터가 미디어 신호에 부가되는 방법을 설명한다. 여기서 신호는 사인파에 관하여 설명된다. 이진 코드는, 고주파수 대역에 잡음을 가산하지 않거나 가산하여 고주파수 대역의 신호에 가산된다. 검출 시에, 획득된 디지트들의 시퀀스(즉, 0들 및 1들)는 워터마크 정보(의 코딩된 버전)를 나타낸다. 따라서, 상기 문헌은 덧셈 워터마킹(additive watermarking)에 대한 기술을 설명하며, 이것은 승산 워터마킹 환경에 적용 가능하지 않다. 또한, 부가적 정보가 고주파수 대역(간단한 저대역 필터를 사용하여 쉽게 필터링될 수 있음) 내에만 제공되기 때문에, 강인함이 중요한 조건일 경우, 덧셈 워터마킹은 부서지기 쉽고 따라서 적합하지 않다.International Patent Application No. WO-A-02 / 15587 describes a method in which additional data, such as a watermark, is added to a media signal. Here the signal is described with respect to a sine wave. The binary code is added to the signal of the high frequency band by adding or not adding noise to the high frequency band. Upon detection, the sequence of acquired digits (ie, 0s and 1s) represents watermark information (coded version of). Thus, the document describes a technique for additive watermarking, which is not applicable to multiplicative watermarking environments. In addition, since additional information is provided only within the high frequency band (which can be easily filtered using a simple low band filter), when robustness is an important condition, addition watermarking is brittle and therefore unsuitable.
보다 강인한, 승산 워터마킹 방법에서, 복수의 실수들의 원형 시프트된 칩 시퀀스들은 미디어 신호의 적절히 스케일링된 버전과 승산되고, 다시 원 미디어 신호에 가산된다. 검출 시에, 다양한 상관 피크들 간의 거리들은 워터마크 정보(의 코딩된 버전)를 반송한다. 호스트 신호가 적은 주파수 성분들을 포함하는 경우에, 상관은 약할 것이다. 따라서, 적은 주파수 성분들을 갖는 미디어 신호에 승산 매입 기술을 사용하여 매입되는 부가적 데이터에 대한 검출 가능성을 더 높일 필요가 있다. In a more robust multiplication watermarking method, circularly shifted chip sequences of a plurality of real numbers are multiplied with an appropriately scaled version of the media signal and added back to the original media signal. Upon detection, the distances between the various correlation peaks carry watermark information (coded version of). If the host signal contains less frequency components, the correlation will be weak. Thus, there is a need to further increase the detectability for additional data that is embedded using a multiplication embedding technique for media signals having fewer frequency components.
따라서 본 발명의 목적은, 미디어 신호, 특히, 적은 주파수 성분들을 갖는 미디어 신호의 섹션들에 부가적 데이터를 매입하는 강인한 승산 매입 방법을 제공하는 것이다. It is therefore an object of the present invention to provide a robust multiply embedding method of embedding additional data in a section of a media signal, in particular a section of a media signal with less frequency components.
본 발명의 제 1 특징에 따라, 부가적 데이터를 미디어 신호 내에 매입하는 방법으로서:According to a first aspect of the invention, there is provided a method for embedding additional data in a media signal:
미디어 신호를 획득하는 단계;Obtaining a media signal;
변경된 미디어 신호를 제공하기 위해, 상기 미디어 신호 중 적어도 하나의 섹션을 잡음 신호와 혼합하는 단계; 및Mixing at least one section of the media signal with a noise signal to provide a modified media signal; And
제 1 호스트 변경 미디어 신호를 제공하기 위해, 상기 부가적 데이터를 상기 변경된 미디어 신호와 조합하는 단계를 포함하는, 매입 방법에 의해 본 발명의 목적이 성취된다.The object of the invention is achieved by an embedding method comprising combining said additional data with said modified media signal to provide a first host altered media signal.
본 발명의 제 2 특징에 따라, 부가적 데이터를 미디어 신호 내에 매입하는 디바이스로서:According to a second aspect of the invention, there is provided a device for embedding additional data in a media signal:
변경된 미디어 신호를 제공하기 위해, 상기 미디어 신호 중 적어도 하나의 섹션을 잡음 신호와 혼합하는 제 1 가산 유닛; 및A first adding unit for mixing at least one section of the media signal with a noise signal to provide a modified media signal; And
제 1 호스트 변경 미디어 신호를 제공하기 위해, 상기 부가적 데이터를 상기 변경된 미디어 신호와 조합하는 조합기 유닛을 포함하는, 매입 디바이스에 의해 본 발명의 목적이 또한 성취된다.The object of the invention is also achieved by an embedding device comprising a combiner unit for combining the additional data with the modified media signal to provide a first host altered media signal.
본 발명의 제 3 특징에 따라, 미디어 신호로서: According to a third aspect of the invention, as a media signal:
잡음 신호와 혼합된 미디어 신호를 포함하는 변경된 미디어 신호 중 적어도 하나의 섹션을 포함하고, 부가적 데이터는 변경된 미디어 신호와 조합되는, 미디어 신호에 의해 본 발명의 목적이 또한 성취된다.The object of the present invention is also achieved by a media signal comprising at least one section of an altered media signal comprising a media signal mixed with a noise signal, wherein additional data is combined with the altered media signal.
본 발명의 제 4 특징에 따라, 정보 저장 매체로서:According to a fourth aspect of the invention, as an information storage medium:
잡음 신호와 혼합된 미디어 신호를 포함하는 변경된 미디어 신호 중 적어도 하나의 섹션을 포함하는 미디어 신호를 포함하고, 부가적 데이터는 상기 변경된 미디어와 조합되는, 정보 저장 매체에 의해 본 발명의 목적이 또한 성취된다.An object of the present invention is also achieved by an information storage medium comprising a media signal comprising at least one section of an altered media signal comprising a media signal mixed with a noise signal, wherein additional data is combined with the altered media. do.
본 발명은 또한, 이러한 새로운 호스트 신호에 대한 승산으로 매입된 정보의 검출 가능성을 선택적으로 개선하기 위해 미디어 신호와 미디어 신호의 변경된 버전 간에 (자동적으로) 스위칭하기 위한 기술을 제공하는 것에 관한 것이다.The present invention also relates to providing a technique for (automatically) switching between a media signal and a modified version of the media signal to selectively improve the detectability of embedded information in multiplication with this new host signal.
본 발명의 제 5 특징에 따라, 부가적 데이터를 미디어 신호 내에 매입하는 방법으로서: According to a fifth aspect of the invention, there is provided a method for embedding additional data in a media signal:
미디어 신호를 획득하는 단계;Obtaining a media signal;
상기 미디어 신호를 분석하는 단계;Analyzing the media signal;
변경된 미디어 신호를 제공하기 위해, 상기 미디어 신호 중 적어도 하나의 섹션을 잡음 신호와 혼합하는 단계; 및Mixing at least one section of the media signal with a noise signal to provide a modified media signal; And
상기 미디어 신호의 상이한 섹션들에 대해, 상기 분석에 의존하여, 상기 부가적 데이터를 상기 변경된 미디어 신호 또는 상기 원 미디어 신호와 조합하는 단계를 포함하는, 매입 방법에 의해 본 발명의 목적이 또한 성취된다.For different sections of the media signal, the object of the invention is also achieved by an embedding method, comprising combining the additional data with the modified media signal or the original media signal, depending on the analysis. .
본 발명의 제 6 특징에 따라, 부가적 데이터를 미디어 신호 내에 매입하는 디바이스로서:According to a sixth aspect of the invention, there is provided a device for embedding additional data in a media signal:
변경된 미디어 신호를 제공하기 위해, 상기 미디어 신호 중 적어도 하나의 섹션을 잡음 신호와 혼합하는 제 1 가산 유닛; A first adding unit for mixing at least one section of the media signal with a noise signal to provide a modified media signal;
제 1 호스트 변경 미디어 신호를 제공하기 위해, 상기 부가적 데이터를 상기 변경된 미디어 신호 또는 상기 미디어 신호와 조합하는 조합기 유닛; 및A combiner unit for combining the additional data with the modified media signal or the media signal to provide a first host altered media signal; And
상기 미디어 신호를 분석하고, 상기 미디어 신호의 상이한 섹션들에 대해서, 상기 분석에 의존하여 상기 변경된 미디어 신호 또는 상기 미디어 신호를 상기 조합기 유닛에 제공하는 것을 제어하도록 배열된 분석 유닛을 포함하는, 매입 디바이스에 의해 본 발명의 목적이 또한 성취된다. An analysis unit arranged to analyze the media signal and to control, for different sections of the media signal, providing the modified media signal or the media signal to the combiner unit depending on the analysis. The object of the present invention is also achieved by.
청구항 2 및 16 항은 승산을 사용하여 조합을 수행하는 것에 관한 것이다.
청구항 5 및 17 항은 인간의 지각 모델에 기초하여 잡음 신호를 정형하는 것에 관한 것이다.Claims 5 and 17 relate to shaping a noise signal based on a human perceptual model.
청구항 6 및 18 항은 인간의 지각 모델에 기초한 신호 정형 함수로 상기 부가적 데이터와 조합된 변경된 미디어 신호를 정형하는 것에 관한 것이다.
청구항 8, 9, 10, 20, 21 및 22 항은 부가된 잡음을 스케일링하고, 상기 부가된 데이터와 조합된 변경된 미디어 신호에 미디어 신호를 부가하고, 상기 부가적 데이터와 조합된 미디어 신호에 스케일링되지 않은 잡음 신호를 부가하는 것에 관한 것이다. 이것은, 부가적 데이터의 매입을 위해 보다 예측 가능한 제어 메카니즘을 제공하는 이점이 있다.
청구항 12 및 23 항은 미디어 신호를 분석하고, 미디어 신호 또는 상기 분석에 의존하여 잡음과 혼합된 미디어 신호의 섹션들을 부가적 데이터와 조합하는 것에 관한 것이다.
본 발명은, 적은 주파수 성분들을 갖는 미디어 신호, 예를 들면, 피치-파이프 또는 하프시코드의 발췌들과 같은 높은 음색 신호들 내에 부가적 데이터를 매입할 때, 부가적 데이터의 보다 좋은 검출 가능성을 제공하는 이점이 있다. 본 발명으로, 이러한 특성들을 갖는 일반 미디어 신호와 비교하여, 예를 들면, 보다 쉽게 검출 가능한 워터마크를 변경된 미디어 신호 내에 매입하는 것이 가능하다. 이러한 보다 높은 레벨의 검출 가능성으로 인해, 미디어 신호의 품질이 저하될지라도, 부가적 데이터는 여전히 검출가능하며, 즉, 정확한 검출의 확률이 증가된다. 이때, 예를 들면, 프로세싱된 미디어 신호의 수사적 트래킹이 쉬어진다.The present invention provides better detection possibilities of additional data when embedding additional data in media signals having less frequency components, for example, high tone signals such as pitch-pipe or harpsichord excerpts. This has the advantage. With the present invention, it is possible to embed a more easily detectable watermark in a modified media signal, for example, compared to a general media signal having these characteristics. Due to this higher level of detectability, even if the quality of the media signal is degraded, the additional data is still detectable, i.e. the probability of accurate detection is increased. At this point, for example, rhetorical tracking of the processed media signal is facilitated.
따라서, 본 발명의 일반적인 사상은, 미디어 신호를 잡음 신호와 혼합하고 부가적 데이터를 미디어 신호와 조합하는 것이며, 미디어 신호는 이러한 방법으로 변경된다.Thus, the general idea of the present invention is to mix the media signal with the noise signal and to combine additional data with the media signal, which is changed in this way.
본 발명의 이들 및 다른 특징들은 이후에 설명되는 실시예들로부터 명백해질 것이며, 상기 실시예들을 참조하여 설명될 것이다. These and other features of the present invention will be apparent from the embodiments described hereinafter, and will be described with reference to the embodiments.
도 1은 본 발명의 제 1 실시예에 따라 워터마크를 변경된 미디어 신호 내에 매입하는 디바이스의 개략도.1 is a schematic diagram of a device for embedding a watermark into a modified media signal according to a first embodiment of the present invention;
도 2는 도 1의 디바이스에서 사용될 수 있는 조합기 유닛의 제 1 변동의 개략도.2 is a schematic representation of a first variation of a combiner unit that may be used in the device of FIG. 1.
도 3은 도 1의 디바이스에서 사용될 수 있는 조합기 유닛의 제 2 변동의 개략도.3 is a schematic representation of a second variation of a combiner unit that may be used in the device of FIG. 1.
도 4는 본 발명의 제 2 실시예에 따라 워터마크를 변경된 미디어 신호 내에 매입하는 디바이스의 개략도.4 is a schematic diagram of a device for embedding a watermark into a modified media signal in accordance with a second embodiment of the present invention;
도 5는 본 발명의 제 3 실시예에 따라 워터마크를 변경된 미디어 신호 내에 매입하는 디바이스의 개략도.5 is a schematic diagram of a device for embedding a watermark into a modified media signal according to a third embodiment of the present invention.
도 6은 본 발명의 제 3 실시예에 따라 워터마크를 변경된 미디어 신호 내에 매입하는 방법의 흐름도.6 is a flowchart of a method for embedding a watermark into a modified media signal according to a third embodiment of the present invention.
도 7은 본 발명의 제 4 실시예에 따라 워터마크를 변경된 미디어 신호 내에 매입하는 디바이스의 개략도.7 is a schematic diagram of a device for embedding a watermark into a modified media signal according to a fourth embodiment of the present invention.
도 8은 본 발명에 따라 원 미디어 신호 또는 변경된 미디어 신호 내 워터마크의 매입 간에 스위칭하는 디바이스의 개략도.8 is a schematic diagram of a device for switching between embedding of a watermark in an original media signal or a modified media signal in accordance with the present invention;
도 9는 본 발명에 따라 정보 저장 매체 상에 저장된 미디어 신호를 갖는 CD 디스크의 형태의 정보 저장 매체. 9 is an information storage medium in the form of a CD disk having a media signal stored on the information storage medium according to the present invention.
본 발명은 첨부한 도면들에 관련하여 보다 상세하게 설명될 것이다. The invention will be explained in more detail with reference to the accompanying drawings.
본 발명은, 미디어 신호 중 적어도 일부 내에 희소(sparse) 주파수 콘텐트를 갖는 미디어 신호들 내에 부가적 데이터를 제공하는 분야에 관한 것이다. 오디오 분야에서, 그러한 신호들은 하프시코드 및 피치 파이프와 같은 악기들로부터의 사운드를 포함할 수 있다. 그러나 본 발명은 오디오로 제한되지 않으며, 예를 들면, 비디오 또는 디지털 이미지들과 같은 다른 미디어 신호들에 적용될 수 있다. 부가적 데이터는 워터마크 형태로 제공되는 것이 바람직하다. 그러나, 본 발명은 워터마크들로 제한되지 않으며, 부가적 데이터는, 예를 들면, 노래에 관련된 부가적 텍스트와 같이, 미디어 신호 내에서 검출될 필요가 있는 임의의 부가적 데이터일 수 있다는 것은 주의되어야 한다. The present invention relates to the field of providing additional data in media signals having sparse frequency content in at least some of the media signal. In the audio field, such signals may include sound from instruments such as harpsichord and pitch pipe. However, the present invention is not limited to audio and can be applied to other media signals such as, for example, video or digital images. The additional data is preferably provided in the form of a watermark. However, it is noted that the present invention is not limited to watermarks, and that the additional data may be any additional data that needs to be detected within the media signal, such as additional text associated with the song. Should be.
도 1은 본 발명의 제 1 실시예에 따라 희소 주파수 콘텐트를 갖는 미디어 신호 내에 부가적 데이터를 매입하는 디바이스(10)의 개략도를 도시한다. 이러한 이유로, 디바이스(10)는 제 1 가산 유닛(12)을 포함하며, 먼저 제 1 가산 유닛(12)은 미디어 신호(x)를 수신하고, 변경된 미디어 신호(x+n)를 제공하기 위해 잡음 신호(n)를 가산한다. 미디어 신호(x)는 이러한 상황들에서 종종 호스트 신호라 지칭된다. 이때 변경된 호스트 신호(x+n)는 워터마크 조합기 유닛(14)에 제공되고, 조합 기 유닛은 그의 출력에서 제 1 호스트 변경 신호(mw)를 제공하기 위해 워터마크(w) 형태의 부가적 데이터를 조합한다. 마지막으로, 제 2 가산 유닛(36)에서, 제 1 호스트 변경 신호(mw)는 출력 미디어 신호(y)에 상기 부가적 신호를 제공하기 위해 변경된 호스트 신호(x+n)(또는 호스트 신호(x))에 다시 가산된다. 여기에 도시된 조합기 유닛(14)은, 적절히 선택된 필터 계수들 형태의 워터마크를 적용하는 필터이다. 따라서, 조합기 유닛(14)은, 호스트 신호와 워터마크의 승산을 통해 변경된 호스트 신호(x+n)를 변경하는 승산 유닛이다. 변경된 신호가 원래 신호보다 보다 많은 주파수 성분들을 포함하기 때문에, 워터마크는 더 쉽게 검출된다. 여기서 잡음 신호(n)는 부가적 워터마크 캐리어이며, 잡음 신호 및 호스트 신호 모두가 워터마크를 반송한다. 1 shows a schematic diagram of a
그러나, 또한 많은 상이한 주파수 성분들을 갖는 신호들은, 특히 더 높은 주파수 영역에서 정형한 잡음의 삽입에 의해 이러한 형태의 매입에서 이로울 수 있다. 이것은 워터마크의 강인함을 상당히 개선하지는 않을 것이지만, 프로세싱되지 않고 워터마킹되지 않은 오디오에서, 이는 상당히 더 좋은 검출 신뢰성을 산출할 수 있다.However, signals with many different frequency components can also benefit from this type of embedding, especially by the insertion of shaped noise in the higher frequency region. This will not significantly improve the robustness of the watermark, but for unprocessed and unwatermarked audio, this can yield significantly better detection reliability.
도 2는 본 발명에 따른 조합기 유닛(14)의 제 1 변동을 도시하며, 조합기 유닛은 주파수 영역에서 동작한다. 따라서, 조합기 유닛은, 변경된 호스트 신호(x)를 수신하고 이를 주파수 영역으로 변환하는 이산 푸리에 변환 유닛(16)을 포함한다. 그후, 변환되고 변경된 호스트 신호는 승산 유닛(18)에 제공되고, 승산 유닛은 변 환되고 변경된 호스트 신호와 워터마크(w)를 승산한다. 여기서 워터마크(w)는 주파수 영역 워터마크이다. 그후, 워터마킹되고 변환되고 변경된 호스트 신호는 푸리에 역변환 유닛(20)에 제공되고, 푸리에 역변환 유닛은 워터마킹되고 변환되고 변경된 호스트 신호를 시간 영역으로 다시 변환하고, 이를 승산 유닛(22)에 제공한다. 승산 유닛(22)은 또한 증가/감소 온/오프 스위칭 함수로부터 결과들을 수신한다. 따라서, 이러한 스위칭을 제공하기 위해, 변경된 호스트 신호(x+n)는 유닛(24)에 제공되고, 상기 유닛은 시간적 게인 함수(G)를 사용한다. 그후, 승산 유닛(22)의 출력은 스케일링 유닛(26)에 제공되고, 스케일링 유닛은 승산된 신호를 스케일링 파라미터(α)로 스케일링한다. 그후, 이러한 승산되고 스케일링된 신호는 제 2 가산 유닛(36)에 제공되고, 가산 유닛은 변경된 호스트 신호를 수신하고, 출력 신호(y)를 형성하기 위해 이들 신호들을 함께 가산하고, 상기 출력 신호는 워터마킹된 호스트 신호이다. 이러한 원리에 따른 워터마크들의 매입은 2001년 5월, 네덜란드, 암스테르담, 110번째 AES Convention의 Proceeding에서 Michiel van der Veen, Fons Breukers, Jaap Haitsma, Ton Kalker, Aweke Negash Lemma 및 Werner Oomen에 의한 "Robust, multi-functional and high-quality audio watermarking technology"에 설명되어 있다. 2 shows a first variation of
상술된 주파수 영역 조합기 유닛은 많은 방법들로 변경될 수 있다. 예를 들면, 증폭 유닛을 포함하는 브랜치를 제거할 수 있으며, 또한 스케일링 유닛을 제거할 수 있지만, 이는 신호 품질을 저하할 것이다.The frequency domain combiner unit described above can be modified in many ways. For example, it is possible to remove the branch containing the amplification unit and also to remove the scaling unit, but this will degrade the signal quality.
도 3은 시간 영역에서 동작하는 조합기 유닛의 다른 변동을 도시한다. 조합 기 유닛(14)은 대역 통과 필터(30)를 포함하고, 대역 통과 필터는 변경된 호스트 신호(x+n)를 필터링하고, 필터링된 신호를 승산 유닛(32)에 제공하며, 승산 유닛은 또한 워터마크를 수신하고, 워터마크와 필터링된 변경된 호스트 신호(x+n)를 승산한다. 승산 유닛(32)의 출력은 스케일링 유닛(34)에 접속되고, 스케일링 유닛은 워터마킹된 신호를 스케일링 파라미터(α)로 스케일링하고, 이를 제 2 가산 유닛(36)에 제공하며, 가산 유닛은 또한 변경된 호스트 신호(x+n)를 수신한다. 이때, 제 2 가산 유닛(36)의 출력은 워터마킹된 호스트 신호(y)이다. 여기서 스케일링 유닛(34)은, 워터마킹된 신호를 제공하는데 반드시 필요한 것은 아니다. 여기서 워터마크(w)는 시간 영역 워터마크이다. 이러한 워터마킹 기술은, 여기에 참조로서 통합된, IEEE Transaction on Signal Processing, 2003년 4월, Vol 51, 1088-1097쪽, Aweke Negash Lemma, Javier Aprea, Werner Oomen 및 Leon van de Kerkhof에 의한 "A temporal domain audio watermarking technique"에서 찾을 수 있다. 3 shows another variation of the combiner unit operating in the time domain. The
상술된 조합기 유닛들은 본 발명에서 사용되기 보다는 단지 승산 조합기 유닛들의 예이다. 많은 다른 형태의 승산 조합기 유닛들이 대신에 사용될 수 있다.The combiner units described above are merely examples of multiplier combiner units rather than used in the present invention. Many other types of multiplication combiner units may be used instead.
인간 지각 모델이 지각 가능한 왜곡을 감소시키기 위해 잡음 신호를 정형하는데 사용될 수 있는, 도 1에 도시되고 상술된 워터마킹 기술이 개선될 수 있다. 사용된 모델은 신호의 형태에 의존한다. 미디어 신호가 오디오 신호인 경우에, 상기 모델은 인간 청취 시스템의 정신 음향 모델(psychoacoustic model)이며, 순수 이미지가 사용되는 경우에, 인간 시각 시스템의 정신-시각 모델(psych-visual model)이 사용된다.The watermarking technique shown and described in FIG. 1 can be improved, in which a human perceptual model can be used to shape a noisy signal to reduce perceptible distortion. The model used depends on the type of signal. In the case where the media signal is an audio signal, the model is a psychoacoustic model of the human listening system, and when pure images are used, the psych-visual model of the human visual system is used. .
본 발명의 제 2 실시예에 따라 워터마크를 미디어 신호에 매입하는 디바이스의 개략도가 도 4에 도시된다. 도 4의 디바이스는 기본적으로 도 1의 디바이스와 동일한 구성요소들을 포함한다. 디바이스(10)가 마스킹 필터 형태의 제 1 신호 정형 유닛(40) 및 필터 제어 유닛(38)을 더 포함하는 점에서 차이가 있다. 필터 제어 유닛(38)은 호스트 신호(x)를 수신하고, 인간 청각 시스템(P)의 정신-음향 모델을 사용하여 이러한 신호를 분석한다. 상기 유닛(38)은 필터(40)의 필터 계수들을 선택하기 위해 분석으로부터의 결과들을 사용한다. 잡음 신호(n)를 수신하는 필터(40)는, 정형된 잡음 신호(ns)가 획득되도록 제 1 신호 정형 함수(M1)를 사용하여 잡음을 정형한다. 그후, 이러한 정형된 잡음 신호(ns)는 호스트 신호(x)와 혼합하기 위해 제 1 가산 유닛(12)에 제공된다. 그후, 상술된 방법으로 워터마크 조합기 유닛(14)에서 워터마크 매입이 수행된다. 필터(40)는, 잡음 신호가 호스트 신호(x)에 의해 지각 가능하게 마스킹되도록 잡음 신호를 정형한다. 미디어 신호가 이미지신호이며, 상기 모델은 대신에 인간 시각 시스템의 정신-시각 모델일 것이다.A schematic diagram of a device for embedding a watermark in a media signal according to the second embodiment of the present invention is shown in FIG. The device of FIG. 4 basically comprises the same components as the device of FIG. 1. The difference is that the
신호 정형 함수(M2)를 사용하는 제 2 신호 정형 유닛을 포함함으로써, 본 발명에 따른 디바이스를 또한 변경할 수 있으며, 신호 정형 함수(M2)는 필터 제어 유닛(38)으로부터의 정보에 기초한다. 이러한 제 3 실시예에 따른 디바이스가 도 5에 개략적으로 도시된다. 도 5의 디바이스의 기능은 도 6에 관련하여 설명될 것이며, 도 6은 이러한 제 3 실시예에 따른 방법의 흐름도이다. 이러한 실시예에서, 잡음 가산은 도 4의 잡음 가산과 동일하다. 디바이스(10)가 제 2 잡음 정형 유닛(44)을 포함하는 것만이 차이점이다. 예를 들면, 호스트 신호가 저장된 메모리로부터 상기 신호를 불러옴으로써 먼저 호스트 신호(x)가 획득되고(단계 48), 예를 들면, 잡음 생성 유닛으로부터 잡음 신호(n)가 제공되고(단계 50), 그후 잡음 신호(n)는, 정형된 잡음 신호(ns)를 획득하기 위해 필터(40)에서 제 1 잡음 정형 함수(M1)를 사용하여 정형된다(단계 52). 그후, 정형된 잡음 신호(ns)는, 변경된 호스트 신호(x+ns)를 제공하기 위해 제 1 가산 유닛(12)에 의해 호스트 신호(x)에 가산되거나 호스트 신호와 혼합된다(단계 54). 도 2 또는 도 3에 도시된 유닛들 중 하나이거나, 예를 들면, 단지 필터일 수 있는 조합기 유닛(14)은 변경된 호스트 신호(x+ns)를 수신하고, 워터마킹된 호스트 변경 신호(mw)를 제공하기 위해 워터마크를 이러한 신호와 조합하고(단계 56), 워터마킹된 호스트 변경 신호는 제 1 호스트 변경 신호로서 지칭된다. 그후, 제 1 호스트 변경 신호(mw)는 제 2 신호 정형 유닛(44)에 제공되고, 제 2 신호 정형 유닛은, 정형된 호스트 변경 신호(mws) 또는 제 2 호스트 변경 신호를 제공하기 위해 필터 제어 유닛(38)에 의해 결정된 제 2 신호 정형 함수(M2)를 사용한다(단계 58). 또한 제 2 신호 정형 유닛(44)은 필터의 형태로 제공되고, 필터의 계수들은 상술된 모델(P)에 따른 세트이다. 함수(M2)는, 워터마킹된 신호 내에 여분의 지각 가능한 아티팩트들이 존재하지 않다는 것을 보장한다. 그후, 제 2 호스트 변경 신호(mws)는 제 2 가산 유닛(36)에 제공되고, 제 2 가산 유닛은 변경된 호스트 신호(x+ns)를 수신하고, 워터마킹된 호스트 신호 또는 워터마킹된 출력 미디어 신호 (y)를 제공하기 위해 이들 두 신호를 함께 가산한다(단계 60). 이러한 방법에서, 워터마크는 미디어 신호(x)에 의해 지각 가능하게 마스킹된다. 잡음 신호(ns)는 지각 가능하지 않게 미디어 신호에 가산되기 때문에 이는 지각 가능하지 않은 워터마크 채널을 제공한다는 것을 유의해야 된다.By including a second signal shaping unit using the signal shaping function M2, the device according to the invention can also be modified, the signal shaping function M2 being based on the information from the
사용된 함수를 변경할 수 있다. 대안으로서, 미디어 신호가 오디오 신호일 때, 상기 함수들(M1 및/또는 M2) 대신에 소위 TQ(Threshold-in-Quit) 함수가 사용될 수 있다. 이러한 경우에, 잡음은, 잡음이 청취 임계값으로 떨어지도록 미리 필터링된다. 유사한 함수들은 이미지 신호들 및/또는 비디오에서 사용될 수 있다.You can change the function used. Alternatively, when the media signal is an audio signal, a so-called threshold-in-quit (TQ) function may be used instead of the functions M1 and / or M2. In this case, the noise is prefiltered so that the noise falls to the listening threshold. Similar functions may be used in image signals and / or video.
도 5 및 도 6에 도시된 본 발명의 제 3 실시예에 따른 디바이스 및 방법은 약간의 단점이 있는데, 이는, 잡음 신호가 호스트 신호에 두 번 가산된다는 것이다. 이것은 워터마킹 프로세싱의 제어를 약간 예측 가능하지 않게 만든다. 이러한 문제점의 해결하는 디바이스는 본 발명의 제 4 실시예인 도 7의 개략도로 도시된다. 이러한 디바이스에는 어떠한 제 1 신호 정형 유닛도 존재하지 않는다. 여기서, 잡음 신호(n)는 먼저 스케일링 유닛(62)에 제공되고, 스케일링 유닛은 스케일링 함수(δ)로 잡음 신호를 스케일링한다. 함수(δ)는 1 보다 작거나 0.1 및 0.2 사이가 바람직하다. 그후, 다운스케일링된 잡음 신호(δn)는 제 1 가산 유닛(12)에 제공되고, 변경된 호스트 신호를 제공하기 위해 호스트 신호(x)에 가산되며, 변경된 호스트 신호는 (x+δn)으로 표기되는데, 잡음 신호는 다운스케일링되기 때문이다. 그후, 변경된 호스트 신호는 조합기 유닛(14)에 전달되고, 조합기 유닛은 워터마크 (w)를 이전 설명된 방식으로 매입한다. 조합기 유닛(14)의 출력은 제 3 가산 유닛(64)에 접속되고, 제 3 가산 유닛은 또한, 제 1 호스트 변경 신호(mw)를 제공하기 위해, 워터마킹된 변경된 호스트 신호에 가산하는 스케일링되지 않은 잡음 신호(n)를 수신한다. 상기 신호(mw)는 제 2 신호 정형 유닛(44)에 제공되고, 제 2 신호 정형 유닛은 이전 설명된 함수(M2)에 따라 제 1 호스트 변경 신호(mw)를 필터링하고, 상기 함수(M2)는 필터 제어 유닛(38)에서 이루어진 인간 청취 시스템 분석의 함수(P)에 기초한다. 필터(44)로부터의 정형된 신호(mws) 또는 제 2 호스트 변경 신호는, 원래 호스트 신호(x)에 가산하기 위해 제 2 가산 유닛(36)에 제공된다. 따라서, 필터(44)는, 호스트 변경 신호(mw)가 호스트 신호(x)에 의해 지각 가능하게 마스킹되는 것을 보장한다. 이러한 방법에서, 모든 부가적 신호 성분들은 하나의 지점에서 호스트 신호(x)에만 삽입되며, 이는 제어 메카니즘을 보다 예측 가능하게 한다. The device and method according to the third embodiment of the invention shown in FIGS. 5 and 6 have some disadvantages, in that the noise signal is added twice to the host signal. This makes the control of watermarking processing slightly unpredictable. The device for solving this problem is shown in the schematic diagram of Fig. 7, which is a fourth embodiment of the present invention. There is no first signal shaping unit in such a device. Here, the noise signal n is first provided to the
상술된 바와 같이, 호스트 또는 미디어 신호가 적은 주파수 성분들을 가질 때, 워터마크의 보다 안전한 검출을 가능하게 하기 위해 잡음 신호가 가산되며, 상기 주파수 성분들은, 신호가 오디오 신호 또는 공간 주파수일 경우에 사운드 주파수 성분들일 수 있다. 그러나, 오디오 신호는 스펙트럼적인 희소 사운드들만으로 구성되지 않지만, 종종 음악의 일부 구절 또는 섹션들에서만 적은 주파수 성분들을 가질 수 있다. 따라서, 전체 미디어 신호 및 음악의 일부 구절 또는 섹션들에서 본 발명의 상술된 실시예들을 사용할 필요가 없다. 따라서, 본 발명의 상술된 실시예들에 따라 워터마크를 매입하고 미디어 신호의 특성들에 의존하여 공지된 원리들에 따라 워터마크를 매입할 필요가 있다. As described above, when the host or media signal has fewer frequency components, a noise signal is added to enable more secure detection of the watermark, and the frequency components are sound when the signal is an audio signal or a spatial frequency. Frequency components. However, an audio signal is not composed of only spectral sparse sounds, but can often have fewer frequency components only in some passages or sections of music. Thus, there is no need to use the above-described embodiments of the invention in some passages or sections of the entire media signal and music. Therefore, there is a need to embed a watermark in accordance with the above-described embodiments of the present invention and to embed a watermark according to known principles depending on the characteristics of the media signal.
도 8은 이러한 기능을 제공하는 디바이스를 도시한다. 상기 디바이스는 제 1 실시예에 따라 제 1 가산 유닛(12), 워터마크 조합기 유닛(14) 및 제 2 가산 유닛(36)을 포함한다. 제 2, 3 및 4 실시예들에 따른 디바이스들은 약간의 쉬운 변경들로 도 8의 디바이스에서 사용되도록 쉽게 적응될 수 있다. 도 8에서, 제 1 가산 유닛(12)은 잡음 신호(n) 및 호스트 신호(x)를 수신하고, 상술된 원리들에 따라 변경된 호스트 신호(x+n)를 정형하기 위해 이들 서로를 가산한다. 제 1 가산 유닛(12)의 출력은 제 1 스위치(68)를 통해 워터마크 조합기 유닛(14)에 접속된다. 호스트 신호는 또한 제 2 스위치(70)를 통해 워터마크 조합기 유닛(14)에 직접 접속된다. 분석 유닛(66)은 호스트 신호의 주파수 콘텐트를 분석하기 위해 분석 함수(A)를 사용하고, 상기 분석에 의존하여 제 1 및 2 스위치를 제어하여, 호스트 신호(x)의 주파수 성분들의 수가 희소한 경우, 제 1 스위치(68)는 제 1 가산 유닛(12)을 워터마크 조합기 유닛(14)에 접속시키고, 그렇지 않다면 제 2 스위치(70)는 변경되지 않은 호스트 신호(x)를 워터마크 조합기 유닛(14)에 접속시킨다. 그후 워터마크 조합기 유닛(14)은 상술된 방법으로 수신된 신호 내에 워터마크를 매입하고, 제 2 가산 유닛(36)은, 출력 신호(y)를 제공하기 위해 제 1 호스트 변경 신호(mw)를 변경되지 않은 호스트 신호(x) 또는 변경된 호스트 신호(x+n)에 가산한다. 여기서 스위칭 은, 워터마크 조합기 유닛(14)으로의 하나의 신호 입력으로부터 다른 것으로의 전환이 점진적으로 이루어지도록 소프트 스위치 기능이 바람직하다. 이것은, 스위치가 한 상태에서 다른 상태로 수행될 때, 풀 신호가 스위치를 통과할 때까지, 먼저 신호가 매우 작거나 감쇄되거나 점차적으로 증가하도록 스위칭 온(on)된 스위치는 신호의 통과가 점차적으로 이루어지도록 한다. 스위칭 오프(off)된 스위치는, 스위치가 완전히 오프될 때까지 신호를 동일한 방법으로 신호를 점차적으로 감쇄시킨다. 워터마크 조합기 유닛으로 통과된 총 에너지는 스위칭 동안, 전후에서 실질적으로 일정하다.8 shows a device providing such functionality. The device comprises a first adding
스위칭이 소프트하거나 점진적으로 되지는 않지만, 소프트하거나 점진적으로 이루어지는 것이 바람직하다는 것을 유의해야 한다. 소프트 스위칭이 수행되지 않는 경우에, 변경된 호스트 신호 또는 변경되지 않은 호스트 신호 중 하나를 워터마크 조합기 유닛(14)에 접속시키는 하나의 스위치만을 제공하는 것도 충분할 수 있다. 단일 스위치가 사용될 때, 예를 들면, 제 1 가산 유닛(12) 전에 적절한 신호들의 스위칭을 성취하기 위해 스위치를 임의의 위치에 제공하는 것은 가능하다. It should be noted that switching is not soft or gradual, but is preferred to be soft or gradual. In the case where soft switching is not performed, it may be sufficient to provide only one switch connecting one of the modified host signal or the unchanged host signal to the
출력 신호(y)는 도 9 에 도시된 CD 디스크의 한 형태(72)의 저장 매체에 제공될 수 있다. 출력 신호(y)는 또한 컴퓨터 내의 메모리와 같은 다른 형태의 저장 매체 상에 제공될 수 있다. The output signal y may be provided to a storage medium of one
미디어 신호가 적은 주파수 성분들을 가질 때, 부가적 데이터를 미디어 신호 내에 승산적으로 매입하는 디바이스 및 방법이 설명되었다. 본 발명으로, 이들 특성들을 갖는 일반 미디어 신호보다 검출하기 쉬운 미디어 신호 내에 워터마크를 매 입하는 것이 가능하다. 제 2 실시예는, 가산된 잡음이 지각 가능하지 않다는 것을 보장하고, 제 3 실시예는 가산된 잡음 및 매입된 워터마크 모두가 지각 가능하지 않다는 것을 보장한다. 제 4 실시예는 워터마크의 매입을 위한 보다 예측 가능한 제어 메카니즘을 제공하는 이점이 있다. 부가적 데이터는, 미디어 신호의 품질이 저하될지라도 여전히 검출 가능하다. 예를 들면, 프로세싱된 미디어 신호의 복제 제어 또는 수사적 트래킹이 쉽게 수행된다. A device and method for multiply embedding additional data in a media signal when the media signal has fewer frequency components has been described. With the present invention, it is possible to embed a watermark in a media signal that is easier to detect than a general media signal having these characteristics. The second embodiment ensures that the added noise is not perceptible, and the third embodiment ensures that both the added noise and the embedded watermark are not perceptible. The fourth embodiment has the advantage of providing a more predictable control mechanism for embedding a watermark. The additional data is still detectable even if the quality of the media signal is degraded. For example, copy control or rhetorical tracking of the processed media signal is easily performed.
본 발명은 많은 방법들로 변경될 수 있다. 예를 들면, 잡음 신호가 데이터를 포함하도록 이루어질 수 있다. 하나의 임의의 시퀀스는 "0"을 표시하도록 이루어질 수 있고, 다른 것은 "1"을 나타내도록 이루어질 수 있는 방법으로 이것이 이루어질 수 있다. 이러한 방법에서, 가산 및 승산 워터마크들은 단일 시스템으로 통합될 수 있다. 상술된 바와 같이, 워터마크는 시간 및 주파수 영역 모두에 매입될 수 있으며, 미디어 신호는 임의 형태의 미디어 신호일 수 있다. 미디어 신호는 또한 오디오, 비디오 또는 이미지 신호일 수 있다. 오디오인 경우에, 미디어 신호는 PCM과 같은 압축되지 않은 오디오일 수 있다. 그러나, 본 발명은 압축된 미디어 신호에 적용할 수 있으며, 오디인 경우에 압축되지 않은 미디어 신호는 MP3 비트스트림일 수 있다. 그러나, 이때 잡음은 비트스트림으로 적절히 변환되어야 한다. 따라서, 본 발명은 청구 범위에 의해서만 제한된다. The invention can be modified in many ways. For example, the noise signal may be made to contain data. This can be done in a way that one arbitrary sequence can be made to indicate "0" and the other can be made to indicate "1". In this way, addition and multiplication watermarks can be integrated into a single system. As mentioned above, the watermark may be embedded in both time and frequency domains, and the media signal may be any type of media signal. The media signal may also be an audio, video or image signal. In the case of audio, the media signal may be uncompressed audio such as PCM. However, the present invention can be applied to a compressed media signal, and in the case of audio, the uncompressed media signal may be an MP3 bitstream. However, the noise must be properly converted to the bitstream at this time. Accordingly, the invention is limited only by the claims.
Claims (28)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03101792.4 | 2003-06-19 | ||
EP03101792 | 2003-06-19 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20060027351A true KR20060027351A (en) | 2006-03-27 |
Family
ID=33547741
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020057024342A KR20060027351A (en) | 2003-06-19 | 2004-06-15 | Raising detectability of additional data in a media signal having few frequency components |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060168448A1 (en) |
EP (1) | EP1639826B1 (en) |
JP (1) | JP2006527958A (en) |
KR (1) | KR20060027351A (en) |
CN (1) | CN1810034A (en) |
AT (1) | ATE415784T1 (en) |
DE (1) | DE602004017993D1 (en) |
WO (1) | WO2004112399A1 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7082413B2 (en) * | 1999-11-24 | 2006-07-25 | International Business Machines Corporation | System and method for authorized compression of digitized music |
EP2362385A1 (en) * | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Watermark signal provision and watermark embedding |
US10210545B2 (en) * | 2015-12-30 | 2019-02-19 | TCL Research America Inc. | Method and system for grouping devices in a same space for cross-device marketing |
US11095927B2 (en) * | 2019-02-22 | 2021-08-17 | The Nielsen Company (Us), Llc | Dynamic watermarking of media based on transport-stream metadata, to facilitate action by downstream entity |
US11632598B2 (en) | 2019-05-10 | 2023-04-18 | Roku, Inc. | Content-modification system with responsive transmission of reference fingerprint data feature |
WO2020231813A1 (en) * | 2019-05-10 | 2020-11-19 | The Nielsen Company (Us), Llc | Content-modification system with responsive transmission of reference fingerprint data feature |
TWI802797B (en) | 2019-05-10 | 2023-05-21 | 美商六科股份有限公司 | Method for detecting and responding to a fingerprint mismatch detected after a previously detected fingerprint match, non-transitory computer-readable storage medium, and computing system |
US11234050B2 (en) | 2019-06-18 | 2022-01-25 | Roku, Inc. | Use of steganographically-encoded data as basis to control dynamic content modification as to at least one modifiable-content segment identified based on fingerprint analysis |
US11012757B1 (en) * | 2020-03-03 | 2021-05-18 | The Nielsen Company (Us), Llc | Timely addition of human-perceptible audio to mask an audio watermark |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6104863A (en) * | 1990-08-17 | 2000-08-15 | Samsung Electronics Co., Ltd. | Video signal encoded with additional detail information |
US5613004A (en) * | 1995-06-07 | 1997-03-18 | The Dice Company | Steganographic method and device |
US6611599B2 (en) * | 1997-09-29 | 2003-08-26 | Hewlett-Packard Development Company, L.P. | Watermarking of digital object |
CA2418722C (en) * | 2000-08-16 | 2012-02-07 | Dolby Laboratories Licensing Corporation | Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information |
-
2004
- 2004-06-15 DE DE602004017993T patent/DE602004017993D1/en not_active Expired - Fee Related
- 2004-06-15 CN CNA2004800171461A patent/CN1810034A/en active Pending
- 2004-06-15 EP EP04736871A patent/EP1639826B1/en not_active Expired - Lifetime
- 2004-06-15 AT AT04736871T patent/ATE415784T1/en not_active IP Right Cessation
- 2004-06-15 US US10/560,679 patent/US20060168448A1/en not_active Abandoned
- 2004-06-15 KR KR1020057024342A patent/KR20060027351A/en not_active Application Discontinuation
- 2004-06-15 JP JP2006516691A patent/JP2006527958A/en active Pending
- 2004-06-15 WO PCT/IB2004/050906 patent/WO2004112399A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP1639826B1 (en) | 2008-11-26 |
EP1639826A1 (en) | 2006-03-29 |
ATE415784T1 (en) | 2008-12-15 |
US20060168448A1 (en) | 2006-07-27 |
DE602004017993D1 (en) | 2009-01-08 |
WO2004112399A1 (en) | 2004-12-23 |
CN1810034A (en) | 2006-07-26 |
JP2006527958A (en) | 2006-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lin et al. | Audio watermarking techniques | |
Swanson et al. | Robust audio watermarking using perceptual masking | |
Kirovski et al. | Blind pattern matching attack on watermarking systems | |
US7676336B2 (en) | Watermark embedding | |
Wu et al. | Robust and efficient digital audio watermarking using audio content analysis | |
Dutta et al. | Data hiding in audio signal: A review | |
Dhar et al. | Digital watermarking scheme based on fast Fourier transformation for audio copyright protection | |
US20070052560A1 (en) | Bit-stream watermarking | |
Bibhu et al. | Secret key watermarking in WAV audio file in perceptual domain | |
KR20060027351A (en) | Raising detectability of additional data in a media signal having few frequency components | |
Petrovic | Audio signal watermarking based on replica modulation | |
Yamamoto et al. | Real-Time Audio Watermarking Based on Characteristics of PCM in Digital Instrument. | |
He | Watermarking in audio: key techniques and technologies | |
JP2005528652A (en) | Independent channel watermark encoding and decoding | |
US20150221317A1 (en) | Method and apparatus for watermarking successive sections of an audio signal | |
EP1695337A1 (en) | Method and apparatus for detecting a watermark in a signal | |
Kirbiz et al. | Decode-time forensic watermarking of AAC bitstreams | |
Cvejic et al. | Audio watermarking: Requirements, algorithms, and benchmarking | |
Nishimura et al. | Advanced audio watermarking based on echo hiding: Time-spread echo hiding | |
Xu et al. | Digital Audio Watermarking | |
Wang et al. | A robust watermarking system based on the properties of low frequency in perceptual audio coding | |
Xu et al. | Audio watermarking | |
Choi et al. | An efficient audio watermarking by using spectrum warping | |
Lien et al. | Two channel digital watermarking for music based on exponential time-spread echo kernel | |
Yadav et al. | Audio watermarking based on PCM technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |