WO2022038929A1 - 情報処理方法、プログラム、及び、音響再生装置 - Google Patents
情報処理方法、プログラム、及び、音響再生装置 Download PDFInfo
- Publication number
- WO2022038929A1 WO2022038929A1 PCT/JP2021/026585 JP2021026585W WO2022038929A1 WO 2022038929 A1 WO2022038929 A1 WO 2022038929A1 JP 2021026585 W JP2021026585 W JP 2021026585W WO 2022038929 A1 WO2022038929 A1 WO 2022038929A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sound
- predetermined
- filter
- predetermined direction
- fluctuation
- Prior art date
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 30
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 230000005236 sound signal Effects 0.000 claims description 55
- 230000008859 change Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 description 46
- 230000033001 locomotion Effects 0.000 description 34
- 210000003128 head Anatomy 0.000 description 29
- 238000000034 method Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000006073 displacement reaction Methods 0.000 description 4
- 210000005069 ears Anatomy 0.000 description 4
- 230000004807 localization Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000000613 ear canal Anatomy 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/302—Electronic adaptation of stereophonic sound system to listener position or orientation
- H04S7/303—Tracking of listener position or orientation
- H04S7/304—For headphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
Definitions
- This disclosure relates to an audio reproduction device and an information processing method and program related to the sound reproduction device.
- the information processing method is an arrival direction on a three-dimensional sound field corresponding to the predetermined direction from sound information including information on a predetermined sound and information on a predetermined direction at each time point on the time axis. It is an information processing method for generating an output sound signal for the user to perceive the predetermined sound as a sound coming from the user in time series, and calculates the amount of angle of fluctuation in the predetermined direction on the time axis.
- a selection is made from among the three-dimensional acoustic filters, information about the predetermined sound is input to the selected three-dimensional acoustic filter to generate the output signal, and in the selection of the three-dimensional acoustic filter, the calculated variation in the predetermined direction is performed.
- the amount of angle of the predetermined sound is smaller than the threshold value
- the stereoscopic acoustic filter is selected so that the predetermined sound is emphasized and perceived by the user as compared with the case where the amount of fluctuation in the predetermined direction is equal to or larger than the threshold value. do.
- the sound reproduction device is on a three-dimensional sound field corresponding to the predetermined direction from sound information including information on a predetermined sound and information on a predetermined direction at each time point on the time axis.
- An acoustic reproduction device that generates and reproduces an output sound signal for allowing the user to perceive the predetermined sound as a sound arriving from the arrival direction, the acquisition unit for acquiring the sound information, and the predetermined sound on the time axis.
- a plurality of candidate three-dimensional acoustic filters that calculate the amount of angle of variation in the direction and perceive the input input sound as the sound from the arrival direction based on the information regarding the predetermined direction.
- a filter selection unit that selects from a plurality of three-dimensional acoustic filters prepared for each arrival direction, and information about the predetermined sound is input to the selected three-dimensional acoustic filter as the input sound, and the output sound signal.
- the filter selection unit includes an output sound generation unit that generates a sound, and an output unit that outputs a sound based on the generated output sound signal.
- the stereoscopic sound filter is selected so that the predetermined sound is emphasized and perceived by the user as compared with the case where the angle amount of the fluctuation in the predetermined direction is equal to or larger than the threshold value.
- one aspect of the present disclosure can also be realized as a program for causing a computer to execute the sound reproduction method described above.
- FIG. 1 is a schematic diagram showing a use case of the sound reproduction device according to the embodiment.
- FIG. 2 is a block diagram showing a functional configuration of the sound reproduction device according to the embodiment.
- FIG. 3 is a block diagram showing a functional configuration of the acquisition unit according to the embodiment.
- FIG. 4 is a block diagram showing a functional configuration of the filter selection unit according to the embodiment.
- FIG. 5 is a block diagram showing a functional configuration of the output sound generation unit according to the embodiment.
- FIG. 6 is a flowchart showing the operation of the sound reproduction device according to the embodiment.
- FIG. 7 is a diagram illustrating the arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- FIG. 8 is a second diagram illustrating an arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- FIG. 9 is a third diagram illustrating an arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- a process of convolving a head-related transfer function for perceiving it as a sound arriving from a predetermined direction with a signal of a target sound is known.
- the realistic sensation experienced by the user is improved.
- it is known that in the convolution of the head-related transfer function it is difficult to perceive fluctuations in the time domain in the direction of arrival of sound. For this reason, the user may mistakenly perceive that the sound does not change even if the sound has a slight change in the time domain.
- the present disclosure in view of the above, while utilizing a stereophonic filter for allowing the user to perceive the sound as a sound from a predetermined direction in the three-dimensional sound field, the easiness of perceiving a sound with a slight fluctuation in the time domain is improved. Rather, carry out appropriate calculation processing. It is an object of the present disclosure to provide an information processing method or the like that allows a user to perceive a three-dimensional sound by this appropriate calculation process.
- the information processing method is a three-dimensional sound corresponding to a predetermined direction from sound information including information on a predetermined sound and information on a predetermined direction at each time point on the time axis. It is an information processing method that generates an output sound signal for the user to perceive a predetermined sound as a sound arriving from the arrival direction on the field in chronological order.
- the calculated angle amount of fluctuation in the predetermined direction is calculated.
- the stereoscopic sound filter is selected so that the predetermined sound is emphasized and perceived by the user as compared with the case where the angle amount of fluctuation in the predetermined direction is equal to or larger than the threshold value.
- the predetermined sound when the calculated angle amount of fluctuation in a predetermined direction is smaller than the threshold value, that is, the fluctuation is minute so that it is difficult for the user to perceive the fluctuation in the arrival direction.
- the predetermined sound can be emphasized and perceived by the user. Since the user's attention is directed to the predetermined sound, it is possible to make the user more appropriately perceive a minute change in the arrival direction of the predetermined sound.
- the stereophonic filter when the calculated angle amount of fluctuation in a predetermined direction is smaller than the threshold value, the direction of arrival perceived by the output sound signal when the selected stereophonic filter is used.
- the amount of variation angle is greater than the amount of variation perceived by the output sound signal when using the stereophonic filter selected when the calculated amount of variation in the predetermined direction is greater than or equal to the threshold.
- the stereophonic filter may be selected so as to be large.
- the stereophonic filter selected when the fluctuation angle amount is equal to or larger than the threshold value with respect to the predetermined sound that is, the output sound so as to be the fluctuation angle amount preset in the content.
- the stereophonic filter can be selected so that the amount of fluctuation is large.
- the output sound signal emphasizes and perceives the predetermined sound by expanding the amount of fluctuation angle.
- the stereophonic filter in the selection of a stereophonic filter, the smaller the calculated angle amount of fluctuation in a predetermined direction, the greater the angle amount of variation in the arrival direction perceived by the output sound signal when the selected stereophonic filter is used.
- the stereophonic filter may be selected so that
- the stereophonic filter selected when the fluctuation angle amount is equal to or larger than the threshold value with respect to the predetermined sound that is, the output sound so as to be the fluctuation angle amount preset in the content.
- the stereophonic filter can be selected so that the amount of fluctuation is large.
- the output sound signal emphasizes and perceives the predetermined sound by expanding the amount of fluctuation angle.
- the smaller the amount of fluctuation in the sound information the larger the amount of fluctuation in the sound in the output sound signal. It is emphasized and presented to the user to make it more perceptible.
- the smaller the angle amount of fluctuation in the predetermined direction on the sound information the more the numerical value.
- the expansion coefficient ⁇ ( ⁇ > 1), the amount of variation in the arrival direction on the time axis of the output sound signal is expanded, and the relationship between the amount of variation in the predetermined direction and the expansion coefficient ⁇ . May be non-linear.
- the expansion coefficient ⁇ By multiplying by the expansion coefficient ⁇ , the relationship between the amount of fluctuation in the predetermined direction and the arrival direction of the predetermined sound in the output sound information becomes non-linear, and it is possible to emphasize the emphasis effect as the fluctuation is smaller. It becomes.
- a predetermined direction is on the front side of the boundary surface with respect to a virtual boundary surface that divides the user's head into front and back, and the calculated angle of fluctuation in the predetermined direction is obtained.
- the predetermined direction is on the rear surface side of the boundary surface and is calculated from the angle amount of the fluctuation of the arrival direction on the time axis when the selected stereophonic filter is used.
- the stereophonic filter is selected so that the angle amount of fluctuation in the arrival direction on the time axis when the selected stereophonic filter is used is larger. May be good.
- the emphasis effect can be made larger on the rear surface side of the boundary surface where it is difficult to detect the fluctuation in the arrival direction than on the front surface side of the boundary surface.
- the arrival direction perceived by the output sound signal when the selected stereophonic filter is used vibrates on the time axis as compared with the predetermined direction on the sound information.
- a stereophonic filter may be selected.
- a predetermined sound whose arrival direction vibrates can be presented to the user. Since the arrival direction vibrates on the time axis, the user can more easily perceive the predetermined sound as compared with other sounds, so that there is an effect that the fluctuation of the predetermined sound is more easily perceived.
- the arrival direction at the time point of the Nth (N is an integer of 2 or more) on the time axis of the output sound signal is the third on the time axis of the output sound signal.
- N-1 Vibration in which the numerical value vibrates on the time axis with respect to the difference value between the predetermined direction on the sound information corresponding to the Nth time point and the predetermined direction on the sound information corresponding to the Nth time point. It may be calculated by multiplying the numerical value of the corresponding time point in the function and adding the difference value after the multiplication in the predetermined direction on the sound information corresponding to the (N-1) th time point.
- a predetermined sound whose arrival direction vibrates can be presented to the user. Since the arrival direction vibrates on the time axis, the user can more easily perceive the predetermined sound as compared with other sounds, so that there is an effect that the fluctuation of the predetermined sound is more easily perceived.
- a stereophonic filter when the calculated angle amount of fluctuation in a predetermined direction is smaller than the threshold value, it is on the time axis perceived by the output sound signal when the selected stereophonic filter is used.
- the amount of change in the sound pressure of the predetermined sound is the predetermined sound perceived by the output sound signal when the stereophonic filter selected when the calculated angle amount of fluctuation in the predetermined direction is equal to or greater than the threshold value.
- the stereophonic filter may be selected so as to be larger than the amount of change in sound pressure.
- the stereophonic filter selected when the fluctuation angle amount is equal to or larger than the threshold value with respect to the predetermined sound that is, the output sound so as to be the fluctuation angle amount preset in the content.
- the stereophonic filter can be selected so that the amount of change in sound pressure is large.
- the output sound signal enhances and perceives the predetermined sound by expanding the amount of change in sound pressure.
- the predetermined sound is timed as the sound arriving from the arrival direction on the three-dimensional sound field corresponding to the predetermined direction. It is an information processing method that generates an output sound signal to be perceived by the user along the sequence.
- the amount of fluctuation in a predetermined direction on the time axis is calculated, and the calculated amount of fluctuation in the predetermined direction is calculated.
- the information about the predetermined sound is corrected so that the user perceives the predetermined sound by emphasizing the predetermined sound more than when the angle amount of the fluctuation in the predetermined direction is equal to or larger than the threshold value.
- a plurality of candidate stereophonic filters which are input to the stereophonic filter selected based on the information regarding the corrected predetermined direction from among the plurality of stereophonic filters prepared for each arrival direction, and the output signal. May be generated.
- the predetermined sound when the calculated angle amount of the fluctuation in the predetermined direction is smaller than the threshold value, that is, the predetermined sound having a minute fluctuation that makes it difficult for the user to perceive the fluctuation in the arrival direction is included. If this is the case, the predetermined sound can be emphasized and perceived by the user.
- the stereophonic filter selected thereafter by correcting the information regarding the predetermined direction included in the sound information, the stereophonic filter selected thereafter can be made to be a stereophonic filter for emphasizing the predetermined sound and making the user perceive it. ..
- the user's attention is directed to the predetermined sound, it is possible to make the user more appropriately perceive a minute change in the arrival direction of the predetermined sound.
- program according to one aspect of the present disclosure is a program for causing a computer to execute the information processing method described above.
- the sound reproduction device arrives on a three-dimensional sound field corresponding to a predetermined direction from sound information including information on a predetermined sound and information on a predetermined direction at each time point on the time axis. It is an acoustic reproduction device that generates and reproduces an output sound signal for allowing the user to perceive a predetermined sound as a sound coming from a direction.
- a plurality of candidate three-dimensional acoustic filters that calculate the amount of angle and perceive the input sound as sound from the arrival direction based on the information about the predetermined direction are prepared for each arrival direction.
- a filter selection unit that selects from a plurality of three-dimensional acoustic filters that have been created, and an output sound generation unit that generates an output sound signal by inputting information about a predetermined sound into the selected three-dimensional acoustic filter as an input sound.
- the filter selection unit includes an output unit that outputs a sound based on the output sound signal, and the filter selection unit has a fluctuation angle amount in the predetermined direction equal to or larger than the threshold value when the calculated fluctuation angle amount in the predetermined direction is smaller than the threshold value.
- the stereophonic filter is selected so that the user perceives the predetermined sound with more emphasis than in the case of.
- ordinal numbers such as 1, 2, and 3 may be attached to the elements. These ordsinal numbers are attached to the elements to identify them and do not necessarily correspond to a meaningful order. These ordinals may be replaced, newly added, or removed as appropriate.
- FIG. 1 is a schematic diagram showing a use case of the sound reproduction device according to the embodiment.
- FIG. 1 shows a user 99 who uses the sound reproduction device 100.
- the sound reproduction device 100 shown in FIG. 1 is used at the same time as the stereoscopic image reproduction device 200.
- the image enhances the auditory sense of presence and the sound enhances the visual sense of presence, as if you were in the scene where the image and sound were taken. You can experience it.
- the user 99 is emitted from the person's mouth even when the localization of the sound image of the conversation sound is deviated from the person's mouth. It is known to be perceived as a conversational sound.
- the visual information corrects the position of the sound image, and the image and the sound may be combined to enhance the sense of presence.
- the stereoscopic image reproduction device 200 is an image display device mounted on the head of the user 99. Therefore, the stereoscopic image reproduction device 200 moves integrally with the head of the user 99.
- the stereoscopic image reproduction device 200 is a glasses-type device supported by the user 99's ears and nose, as shown in the figure.
- the stereoscopic image reproduction device 200 changes the image to be displayed according to the movement of the head of the user 99, so that the user 99 is perceived as moving the head in the three-dimensional image space. That is, when an object in the three-dimensional image space is located in front of the user 99, when the user 99 turns to the right, the object moves to the left of the user 99, and when the user 99 turns to the left, the object moves to the left. Moves to the right of the user. In this way, the stereoscopic image reproduction device 200 moves the three-dimensional image space in the direction opposite to the movement of the user 99 with respect to the movement of the user 99.
- the stereoscopic image reproduction device 200 displays two images in which a difference in visual difference occurs in each of the left and right eyes of the user 99.
- the user 99 can perceive the three-dimensional position of the object on the image based on the deviation of the visual difference of the displayed image.
- the stereoscopic image reproduction device 200 is not an essential component of the present disclosure.
- the sound reproduction device 100 is a sound presentation device mounted on the head of the user 99. Therefore, the sound reproduction device 100 moves integrally with the head of the user 99.
- the sound reproduction device 100 in the present embodiment is a so-called over-ear headphone type device.
- the form of the sound reproduction device 100 is not particularly limited, and may be, for example, two earplug-type devices that are independently attached to the left and right ears of the user 99. By communicating with each other, these two devices simultaneously present the sound for the right ear and the sound for the left ear.
- the sound reproduction device 100 changes the sound presented according to the movement of the head of the user 99, so that the user 99 perceives that the user 99 is moving the head in the three-dimensional sound field. Therefore, as described above, the sound reproduction device 100 moves the three-dimensional sound field in the direction opposite to the movement of the user with respect to the movement of the user 99.
- the sound reproduction device 100 can make the user 99 perceive that the sound image has movement by correcting the sound presented by information processing so as to complement this phenomenon. That is, the sound reproduction device 100 acquires the amount of movement of the sound image, and when the amount of the acquired movement is smaller than the threshold value, the user 99 further emphasizes the predetermined sound on the three-dimensional sound field and causes the user 99 to perceive it.
- this threshold value is a numerical value related to the amount of movement that makes it impossible for the user 99 to grasp the amount of movement, the threshold value is unique to the user 99. Therefore, this threshold value may be set to a value obtained experimentally or empirically. Further, a generalized threshold value based on the statistics of a plurality of users 99 may be applied.
- the amount of movement here is the amount of change in the arrival direction of the predetermined sound in a minute time, and is the amount of the change angle per minute time in the predetermined direction as seen from the user 99. That is, the amount of movement is expressed by the maximum value of the angle formed by the arrival directions of the two predetermined sounds corresponding to each of the two time points between the first time point and the second time point.
- FIG. 2 is a block diagram showing a functional configuration of the sound reproduction device according to the embodiment.
- the sound reproduction device 100 includes a processing module 101, a communication module 102, a detector 103, and a driver 104.
- the processing module 101 is an arithmetic unit for performing various signal processing in the sound reproduction device 100.
- the processing module 101 includes, for example, a processor and a memory, and a program stored in the memory is executed by the processor. So, it exerts various functions.
- the processing module 101 has an acquisition unit 111, a filter selection unit 121, an output sound generation unit 131, and a signal output unit 141. The details of each functional unit of the processing module 101 will be described below together with the details of the configurations other than the processing module 101.
- the communication module 102 is an interface device for receiving input of sound information to the sound reproduction device 100.
- the communication module 102 includes, for example, an antenna and a signal converter, and receives sound information from an external device by wireless communication. More specifically, the communication module 102 receives a radio signal indicating sound information converted into a format for wireless communication by using an antenna, and reconverts the wireless signal into sound information by a signal converter. ..
- the sound reproduction device 100 acquires sound information from an external device by wireless communication.
- the sound information acquired by the communication module 102 is acquired by the acquisition unit 111. In this way, the sound information is input to the processing module 101.
- the communication between the sound reproduction device 100 and the external device may be performed by wire communication.
- the sound information acquired by the sound reproduction device 100 is encoded in a predetermined format such as MPEG-H 3D Audio (ISO / IEC 23008-3).
- a predetermined format such as MPEG-H 3D Audio (ISO / IEC 23008-3).
- information about a predetermined sound reproduced by the sound reproduction device 100 and a sound image of the sound are localized at a predetermined position in a three-dimensional sound field (that is, a sound arriving from a predetermined direction).
- Information on the localization position at the time of (perceived as), that is, information on a predetermined direction is included.
- the sound information includes information on a plurality of sounds including the first predetermined sound and the second predetermined sound, and the sound image when each sound is reproduced is a sound arriving from different directions in the three-dimensional sound field. The sound image is localized so that it is perceived as.
- the sound information may include only information about a predetermined sound. In this case, information regarding a predetermined direction may be acquired separately. Further, as described above, the sound information includes the first sound information regarding the first predetermined sound and the second sound information regarding the second predetermined sound, but a plurality of sound information including these separately is acquired. However, the sound image may be localized at different positions in the three-dimensional sound field by simultaneously reproducing the sound. As described above, the form of the input sound information is not particularly limited, and the sound reproduction device 100 may be provided with the acquisition unit 111 corresponding to various forms of sound information.
- FIG. 3 is a block diagram showing a functional configuration of the acquisition unit according to the embodiment.
- the acquisition unit 111 in the present embodiment includes, for example, an encoded sound information input unit 112, a decoding processing unit 113, and a sensing information input unit 114.
- the encoded sound information input unit 112 is a processing unit for inputting encoded (in other words, encoded) sound information acquired by the acquisition unit 111.
- the encoded sound information input unit 112 outputs the input sound information to the decoding processing unit 113.
- the decoding processing unit 113 decodes (in other words, decodes) the sound information output from the encoded sound information input unit 112, thereby processing the information regarding the predetermined sound included in the sound information and the information regarding the predetermined direction in the subsequent processing. It is a processing unit generated in the format used for.
- the sensing information input unit 114 will be described below together with the functions of the detector 103.
- the detector 103 is a device for detecting the movement speed of the head of the user 99.
- the detector 103 is configured by combining various sensors used for motion detection such as a gyro sensor and an acceleration sensor.
- the detector 103 is built in the sound reproduction device 100, and for example, a stereoscopic image reproduction device 200 or the like that operates according to the movement of the head of the user 99 like the sound reproduction device 100. It may be built in an external device. In this case, the detector 103 does not have to be included in the sound reproduction device 100.
- the movement of the head of the user 99 may be captured by using an external image pickup device or the like, and the movement of the user 99 may be detected by processing the captured image.
- the detector 103 is integrally fixed to the housing of the sound reproduction device 100, for example, and detects the speed of movement of the housing. Since the sound reproduction device 100 including the above housing moves integrally with the head of the user 99 after being worn by the user 99, the detector 103 detects the speed of movement of the head of the user 99 as a result. can do.
- the detector 103 may detect, for example, as the amount of movement of the head of the user 99, the amount of rotation having at least one of the three axes orthogonal to each other in the three-dimensional space as the rotation axis, or the above three axes.
- the amount of displacement may be detected with at least one of the above as the displacement direction. Further, the detector 103 may detect both the rotation amount and the displacement amount as the amount of movement of the head of the user 99.
- the sensing information input unit 114 acquires the movement speed of the head of the user 99 from the detector 103. More specifically, the sensing information input unit 114 acquires the amount of movement of the head of the user 99 detected by the detector 103 per unit time as the speed of movement. In this way, the sensing information input unit 114 acquires at least one of the rotation speed and the displacement speed from the detector 103.
- the amount of movement of the user 99's head acquired here is used to determine the coordinates and orientation of the user 99 in the three-dimensional sound field.
- the relative position of the sound image is determined based on the determined coordinates and orientation of the user 99, and the sound is reproduced. Specifically, the above function is realized by the filter selection unit 121 and the output sound generation unit 131.
- the filter selection unit 121 determines from which direction in the three-dimensional sound field the user 99 perceives the predetermined sound as the sound arriving from the predetermined sound, and determines with respect to the predetermined sound. It is a processing unit that selects the stereophonic filter to be applied.
- the stereophonic filter is a function that causes the user 99 to perceive the above-mentioned predetermined sound as a sound arriving from a predetermined direction based on the specific head-related transfer function by convolving a specific head-related transfer function into the input predetermined sound. It is a filter.
- a sound pressure difference, a time difference, a phase difference, etc. are generated in the left and right sound signals of the predetermined sound, and the arrival direction is controlled. It is possible to output a sound signal capable of reproducing the predetermined sound.
- a plurality of stereophonic filters that are candidates for selection are, for example, adjusted and prepared in advance for each user 99.
- FIG. 4 is a block diagram showing a functional configuration of the filter selection unit according to the embodiment.
- the filter selection unit 121 in the present embodiment includes, for example, a filter storage unit 122, a fluctuation angle calculation unit 123, and a filter determination unit 124.
- the filter storage unit 122 is a storage device for storing a plurality of stereophonic filters generated by calculating in advance for each direction of arrival of sound.
- the fluctuation angle calculation unit 123 is a processing unit that calculates the amount of fluctuation (angle amount) in a predetermined direction in a minute time based on the sound information. For example, the fluctuation angle calculation unit 123 calculates the amount of fluctuation in the predetermined direction within a fixed period within a range of several milliseconds to several seconds from the information regarding the predetermined direction. Here, the fluctuation angle calculation unit 123 calculates the angle difference when the angle difference in the predetermined direction becomes maximum within the above period as the above angle amount. The fluctuation angle calculation unit 123 compares the calculated angle amount with the threshold value. The comparison result such that the calculated angle amount is smaller than the threshold value is used for the determination of the stereophonic filter to be selected by the filter determination unit 124.
- the filter determination unit 124 emphasizes the predetermined sound more and causes the user 99 to perceive the stereophonic filter selected. It is a processing unit that determines.
- the stereophonic filter determined by the filter determination unit 124 is output by being read from the filter storage unit 122, that is, is output as a stereophonic filter selected by the filter selection unit 121.
- the details of the determination of the stereophonic filter by the filter determination unit 124 (that is, the selection of the stereophonic filter by the filter selection unit 121) will be described later.
- the output sound generation unit 131 generates an output sound signal by inputting information about a predetermined sound included in the sound information to the selected stereophonic filter by using the stereophonic filter selected by the filter selection unit 121. It is a processing unit.
- FIG. 5 is a block diagram showing a functional configuration of the output sound generation unit according to the embodiment.
- the output sound generation unit 131 in the present embodiment includes, for example, a filter processing unit 132.
- the filter processing unit 132 sequentially reads the filters continuously selected by the filter selection unit 121, and inputs information about the corresponding predetermined sound on the time axis, so that the predetermined sound arrives on the three-dimensional sound field. Continuously outputs the controlled sound signal.
- the sound information divided for each time of the processing unit on the time axis is output as a continuous sound signal (output sound signal) on the time axis.
- the signal output unit 141 is a functional unit that outputs the generated output sound signal to the driver 104.
- the signal output unit 141 generates a waveform signal by performing signal conversion from a digital signal to an analog signal based on the output sound signal, generates a sound wave in the driver 104 based on the waveform signal, and makes a sound to the user 99.
- the driver 104 has, for example, a diaphragm and a drive mechanism such as a magnet and a voice coil.
- the driver 104 operates the drive mechanism in response to the waveform signal, and the drive mechanism vibrates the diaphragm. In this way, the driver 104 generates a sound wave by the vibration of the diaphragm in response to the output sound signal, the sound wave propagates through the air and is transmitted to the user 99's ear, and the user 99 perceives the sound.
- FIG. 6 is a flowchart showing the operation of the sound reproduction device according to the embodiment.
- the acquisition unit 111 acquires sound information via the communication module 102.
- the sound information is decoded into information about a predetermined sound and information about a predetermined direction by the decoding processing unit 113, and filter selection is started.
- the filter selection unit 121 As an initial value, a stereophonic filter that reproduces a predetermined sound so as to be in the arrival direction (the arrival direction that matches the predetermined direction) preset in the content is read from the filter storage unit 122.
- the fluctuation angle calculation unit 123 calculates the amount of fluctuation in the predetermined direction (S101). After that, the fluctuation angle calculation unit 123 determines whether or not the fluctuation angle amount is smaller than the threshold value (S102). When the amount of fluctuation angle is equal to or greater than the threshold value (No in S102), the filter selection unit 121 ends the process and outputs a stereophonic filter whose predetermined direction and arrival direction match to the output sound generation unit 131.
- the filter determination unit 124 determines the stereophonic filter (S103).
- the determination of the stereophonic filter can also be read as making a selection for changing the stereophonic filter selected as the initial value.
- the direction of arrival of the sound in the output sound signal at this time is a direction different from the predetermined direction on the sound information.
- the stereophonic filter determined directly by the filter determination unit 124 may be read out from the filter storage unit 122 without setting the initial value of the stereophonic filter as described above. That is, the modification of the stereophonic filter is an expression used for convenience for explanation, and the present disclosure also includes directly selecting and outputting the stereophonic filter without using the initial value.
- FIG. 7 is a diagram illustrating the arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- FIG. 8 is a second diagram illustrating an arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- FIG. 9 is a third diagram illustrating an arrival direction of a predetermined sound by the selected stereophonic filter according to the embodiment.
- the arrival direction of the predetermined sound when the stereophonic filter is not changed is shown on the left side of the white arrow pointing to the right, and the arrival direction of the predetermined sound at the first time point is shown by a solid line.
- the arrival direction of the predetermined sound at the second time point following is indicated by a broken line.
- the arrival direction of the predetermined sound when the stereophonic filter is changed is shown on the right side of the white arrow pointing to the right, and the arrival direction of the predetermined sound at the first time point is shown by a solid line.
- the arrival direction of the predetermined sound at the second time point following the first time point is shown by a broken line.
- a user 99 in a posture with the paper surface facing forward is schematically shown in a circle with a “U”, and the user 99 is in an upright posture in a direction perpendicular to the paper surface. ..
- FIG. 7 the position where the predetermined sound is localized is shown as a black circle, and a virtual speaker is also shown.
- the localized position of the first predetermined sound at the first time point is the first position S1.
- This first predetermined sound moves to the second position S1a at the second time point when the stereophonic filter is not changed.
- the predetermined direction rotates from the first direction connecting the first position S1 and the user 99 to the second direction connecting the second position S1a and the user 99. It is assumed that the first predetermined sound moves linearly both temporally and spatially between the first time point and the second time point.
- the amount of rotation from the first direction to the second direction is smaller than the threshold value, it is difficult for the user 99 to recognize that the first predetermined sound has moved. be.
- the predetermined sound is moved to the third position S1b at the second time point.
- the predetermined direction rotates from the first direction connecting the first position S1 and the user 99 to the third direction connecting the third position S1b and the user 99.
- the angle difference between the second direction and the third direction may be a fixed angle such as 5 degrees, 10 degrees, 15 degrees, 20 degrees, or the first direction. Based on the angle difference between the first direction and the second direction, the angle difference between the first direction and the third direction may be an angle sufficiently exceeding the minimum human discrimination angle (about 10 degrees).
- the smaller the angle difference between the first direction and the second direction that is, the amount of the angle of fluctuation in the predetermined direction on the original sound information
- the filter determination unit 124 the smaller the amount of fluctuation in the predetermined direction on the original sound information, the more the angle of fluctuation in the arrival direction of the output sound signal when the changed stereophonic filter is used.
- the stereophonic filter may be determined so that the amount is large. For example, as shown in FIG. 8, the expansion coefficient ⁇ ( ⁇ > 1), and the numerical value becomes larger as the angle amount of fluctuation in the predetermined direction on the sound information is smaller, is the first direction.
- the third direction is determined by multiplying the angle difference from the second direction, and the stereophonic filter may be changed so that a predetermined sound at the second time point arrives from this third direction.
- the expansion coefficient ⁇ may have a non-linear relationship because the smaller the amount of fluctuation angle, the larger the amount of fluctuation due to the change.
- the alternate long and short dash line extending to the left and right of the user 99 indicates a virtual boundary surface that divides the head of the user 99 into front and back.
- This boundary surface may be a surface along the ear canal of the user 99, a surface passing through the last point of the auricle of the user 99, or simply a surface passing through the center of gravity of the head of the user 99. May be. It is known that there is a difference in the audibility of sound before and after such a boundary surface, that is, before and after the user 99. Therefore, it is effective to make the changing characteristics of the stereophonic filter different between the front surface side and the rear surface side with the boundary surface as a boundary.
- the localized position of the second predetermined sound at the first time point is the fourth position S2.
- This second predetermined sound moves to the fifth position S2a at the second time point when the stereophonic filter is not changed.
- the predetermined direction rotates from the fourth direction connecting the fourth position S2 and the user 99 to the fifth direction connecting the fifth position S2a and the user 99.
- the first direction and the fourth direction are parallel, and the second direction and the fifth direction are parallel. Therefore, in the period from the first time point to the second time point, the angle amount of the fluctuation of the second predetermined sound is equivalent to the angle amount of the fluctuation of the first predetermined sound.
- the second predetermined sound is on the rear side (behind the user 99) of the boundary surface, it can be said that the fluctuation is less likely to be recognized by the user 99 as compared with the front side.
- the filter determination unit 124 has a boundary in the predetermined direction rather than an angle amount of variation in the arrival direction on the time axis when the changed stereophonic filter is used when the predetermined direction is on the front side of the boundary surface.
- the stereophonic filter is determined so that the angle amount of the variation in the arrival direction on the time axis becomes larger when the modified stereophonic filter is used when it is on the rear surface side of the surface.
- the localization position of the predetermined sound is set from the fourth position S2 in the fourth direction to the sixth position S2b so that the fluctuation angle is larger than the angle formed by the first direction and the third direction. It's changing.
- the angle difference between the 5th direction and the 6th direction may be a fixed angle such as 10 degrees, 15 degrees, 20 degrees, 25 degrees, or twice the angle difference on the front side, 3 It may be set so that the angle difference is a coefficient multiple such as fold, quadruple, or quintuple.
- FIG. 9 shows another example of the determination of the stereophonic filter by the filter determination unit 124.
- FIG. 9 shows a diagram having the same configuration as that of FIG. 7, and the configuration after the modification of the stereophonic filter (the right side of the white arrow pointing to the right) is different. Note that FIG. 9 shows only the sound image on the front side of the boundary surface, and on the right side of the white arrow pointing to the right, the first predetermined sound at the first time point is localized for readability. The illustration regarding the position S1 is omitted.
- the first predetermined sound at the second time point is localized at the seventh position S1c and the stereophonic filter is selected so as to vibrate separately from the fluctuation in the predetermined direction on the sound information. good.
- the first predetermined sound vibrates in the angle region sandwiched between the two alternate long and short dash lines around the seventh position S1c.
- the first predetermined sound may be emphasized by a method in which the magnitude of the variation in the arrival direction is not expanded.
- the first predetermined sound is made to change periodically and regularly so that the user 99 is directed to the consciousness, and even if the change is a little small, the user 99 recognizes it. Can be made easier.
- a vibration function whose numerical value vibrates on the time axis, such as a sine function or a cosine function, is multiplied or added to the angle amount of fluctuation in the arrival direction of a predetermined sound.
- the arrival direction (corresponding to the changed angle amount) at the time of the Nth (N is an integer of 2 or more) on the time axis of the output sound signal is output.
- Difference value original angle
- Difference value original angle
- the stereophonic filter may be changed so that the amount of change in the sound pressure of a predetermined sound on the time axis is larger.
- these examples of modification of the stereophonic filter do not contradict each other, and may be used as any combination.
- the phenomenon that the fluctuation is difficult to be recognized by the user 99 is emphasized by changing the stereophonic filter.
- the output sound signal can be generated in this way. Therefore, small fluctuations in the arrival direction of the predetermined sound, which are difficult for the user 99 to recognize, become clearer, and the user 99 can more appropriately perceive a three-dimensional sound.
- the content of the present disclosure is also effective when the sound follows the movement of the user's head. That is, in the operation of causing the user to perceive a predetermined sound as a sound arriving from the first position that moves relatively with the movement of the user's head, when the amount of fluctuation in the arrival direction of the predetermined sound is smaller than the threshold value, the stereophonic sound is formed.
- Acoustic filters may be selected to emphasize variability.
- the sound reproduction device described in the above embodiment may be realized as one device including all the components, or each function is assigned to a plurality of devices, and the plurality of devices cooperate with each other. It may be realized by.
- an information processing device such as a smartphone, a tablet terminal, or a PC may be used as the device corresponding to the processing module.
- the modified stereophonic filter can be selected by correcting the original sound information by the decoding processing unit.
- the decoding processing unit in this example is a processing unit that generates information about a predetermined direction included in the sound information and corrects the original sound information.
- the decoding processing unit calculates the amount of fluctuation in the predetermined direction on the time axis, and when the calculated amount of fluctuation in the predetermined direction is smaller than the threshold value, the amount of fluctuation in the predetermined direction is equal to or greater than the threshold value.
- the information about the predetermined direction is corrected so that the user perceives the predetermined sound with more emphasis than in a certain case.
- the stereophonic filter that defines the arrival direction in which the predetermined sound arrives is selected based on the corrected predetermined direction information output from the decoding processing unit, and the modified stereophonic filter in the above embodiment is selected.
- a stereophonic filter will be applied.
- the information processing method and the like disclosed in the present application may be realized by correcting the information regarding the predetermined direction in the original sound information.
- the decoding processing unit as described above can be inserted in place of the processing unit that performs the decoding processing of the conventional stereophonic sound reproduction device, thereby realizing an sound reproduction device capable of achieving the same effect as that disclosed in the present application. Can be done.
- the sound reproduction device of the present disclosure is connected to a reproduction device provided with only a driver, and outputs an output sound signal to the reproduction device using a stereophonic filter selected based on the acquired sound information. It can also be realized as an acoustic processing device that only does.
- the sound processing device may be realized as hardware provided with a dedicated circuit, or may be realized as software for causing a general-purpose processor to execute a specific process.
- another processing unit may execute the processing executed by the specific processing unit. Further, the order of the plurality of processes may be changed, or the plurality of processes may be executed in parallel.
- each component may be realized by executing a software program suitable for each component.
- Each component may be realized by a program execution unit such as a CPU or a processor reading and executing a software program recorded on a recording medium such as a hard disk or a semiconductor memory.
- each component may be realized by hardware.
- each component may be a circuit (or an integrated circuit). These circuits may form one circuit as a whole, or may be separate circuits from each other. Further, each of these circuits may be a general-purpose circuit or a dedicated circuit.
- the general or specific aspects of the present disclosure may be realized by a recording medium such as an apparatus, an apparatus, a method, an integrated circuit, a computer program, or a computer-readable CD-ROM.
- the general or specific aspects of the present disclosure may be realized by any combination of devices, devices, methods, integrated circuits, computer programs and recording media.
- the present disclosure may be realized as an audio signal reproduction method executed by a computer, or may be realized as a program for causing an audio signal reproduction method computer to execute.
- the present disclosure may be realized as a computer-readable non-temporary recording medium in which such a program is recorded.
- This disclosure is useful for acoustic reproduction such as making a user perceive a three-dimensional sound.
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
情報処理方法は、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、時間軸上での所定方向の変動の角度量を算出し、所定方向に関する情報に基づいて、入力される入力音を到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択し、所定音に関する情報を、選択された立体音響フィルタに入力して出力信号を生成し、立体音響フィルタの選択では、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、立体音響フィルタを選択する。
Description
本開示は、音響再生装置、ならびに、当該音響再生装置に係る情報処理方法及びプログラムに関する。
従来、仮想的な三次元空間内で、感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている(例えば、特許文献1参照)。
一方で、音を三次元音場内の立体的な音としてユーザに知覚させる際に、ユーザによって知覚されにくい音が発生する場合がある。従来の音響再生装置などにおける情報処理方法では、このような知覚されにくい音に対して、適切な処理がなされていない場合があった。
上記に鑑みて、本開示は、より適切に立体的な音をユーザに知覚させる情報処理方法等を提供することを目的とする。
本開示の一態様に係る情報処理方法は、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、前記所定方向に対応する三次元音場上の到来方向から到来する音として前記所定音を時系列に沿ってユーザに知覚させるための出力音信号を生成する情報処理方法であって、時間軸上での前記所定方向の変動の角度量を算出し、前記所定方向に関する情報に基づいて、入力される入力音を前記到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択し、前記所定音に関する情報を、前記選択された立体音響フィルタに入力して前記出力信号を生成し、前記立体音響フィルタの選択では、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記所定方向の変動の角度量が閾値以上である場合に比べて前記所定音をより強調して前記ユーザに知覚させるように、前記立体音響フィルタを選択する。
また、本開示の一態様に係る音響再生装置は、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、前記所定方向に対応する三次元音場上の到来方向から到来する音として前記所定音をユーザに知覚させるための出力音信号を生成して再生する音響再生装置であって、前記音情報を取得する取得部と、時間軸上での前記所定方向の変動の角度量を算出し、前記所定方向に関する情報に基づいて、入力される入力音を前記到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択するフィルタ選択部と、前記所定音に関する情報を、前記入力音として、前記選択された立体音響フィルタに入力して前記出力音信号を生成する出力音生成部と、生成された前記出力音信号により音を出力する出力部と、を備え、前記フィルタ選択部は、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記所定方向の変動の角度量が閾値以上である場合に比べて前記所定音をより強調して前記ユーザに知覚させるように、前記立体音響フィルタを選択する。
また、本開示の一態様は、上記に記載の音響再生方法をコンピュータに実行させるためのプログラムとして実現することもできる。
なお、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なCD-ROMなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。
本開示によれば、より適切に立体的な音をユーザに知覚させることが可能となる。
(開示の基礎となった知見)
従来、仮想的な三次元空間内(以下、三次元音場という場合がある)で、ユーザの感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている(例えば、特許文献1参照)。仮想的な三次元空間内における所定位置に音像を定位させることで、ユーザは、当該所定位置とユーザとを結ぶ直線に平行な方向(すなわち所定方向)から到来する音であるかのごとく、この音を知覚することができる。このように仮想的な三次元空間内の所定位置に音像を定位させるには、例えば、収音された音に対して、立体的な音として知覚されるような両耳間での音の到来時間差、及び、両耳間での音のレベル差(又は音圧差)などを生じさせる計算処理が必要となる。
従来、仮想的な三次元空間内(以下、三次元音場という場合がある)で、ユーザの感覚上の音源オブジェクトである音像の位置を制御することにより、立体的な音をユーザに知覚させるための音響再生に関する技術が知られている(例えば、特許文献1参照)。仮想的な三次元空間内における所定位置に音像を定位させることで、ユーザは、当該所定位置とユーザとを結ぶ直線に平行な方向(すなわち所定方向)から到来する音であるかのごとく、この音を知覚することができる。このように仮想的な三次元空間内の所定位置に音像を定位させるには、例えば、収音された音に対して、立体的な音として知覚されるような両耳間での音の到来時間差、及び、両耳間での音のレベル差(又は音圧差)などを生じさせる計算処理が必要となる。
このような計算処理の一例として、所定方向から到来する音として知覚させるための頭部伝達関数を目的の音の信号に対して畳み込む処理が知られている。この頭部伝達関数の畳み込みの処理を、より高解像度に実施することで、ユーザが体感する臨場感が向上される。一方で、頭部伝達関数の畳み込みにおいて、音の到来方向の時間領域における変動が知覚されにくいということが知られている。このため、時間領域における変動がわずかな音に対して、ユーザはこの音が変動しないものと誤って知覚してしまう場合がある。
また、近年、仮想現実(VR:Virtual Reality)に関する技術の開発が盛んに行われている。仮想現実では、ユーザの動きに対して仮想的な三次元空間の位置が追従せず、あたかもユーザが仮想空間内を移動しているように体感できることが主眼に置かれている。特に、この仮想現実の技術において視覚的な要素に聴覚的な要素を取り入れることで、より臨場感を高めるといった試みが行われている。例えば、ユーザの正面に音像が定位しているときに、ユーザが右を向くと当該音像がユーザの左方向に移動し、ユーザが左を向くと当該音像がユーザの右方向に移動する。このように、ユーザの動きに対して、仮想空間内の音像の定位位置をユーザの動きとは逆方向に移動させる必要が生じる。このような処理は、元の音情報に対して立体音響フィルタを適用することで行われる。
本開示では、上記に鑑みて、三次元音場内の所定方向からの音としてユーザに知覚させるための立体音響フィルタを利用しながら、時間領域における変動がわずかな音の知覚されやすさを改善するというより適切な計算処理を実施する。本開示では、この適切な計算処理により立体的な音をユーザに知覚させる情報処理方法等を提供することを目的とする。
より具体的には、本開示の一態様に係る情報処理方法は、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、所定方向に対応する三次元音場上の到来方向から到来する音として所定音を時系列に沿ってユーザに知覚させるための出力音信号を生成する情報処理方法であって、時間軸上での所定方向の変動の角度量を算出し、所定方向に関する情報に基づいて、入力される入力音を到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択し、所定音に関する情報を、選択された立体音響フィルタに入力して出力信号を生成し、立体音響フィルタの選択では、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、立体音響フィルタを選択する。
このような情報処理方法によれば、算出された所定方向の変動の角度量が閾値よりも小さい場合、すなわち、ユーザにとって、その到来方向の変動を感知しにくいような微小な変動をしている所定音が含まれている場合に、この所定音をより強調してユーザに知覚させることができる。ユーザの注意が当該所定音に向かうため、所定音の到来方向の微小な変動をより適切にユーザに知覚させることができる。
また、例えば、立体音響フィルタの選択では、算出された所定方向の変動の角度量が閾値よりも小さい場合において、選択された立体音響フィルタを用いたときの出力音信号によって知覚される到来方向の変動の角度量の方が、算出された所定方向の変動の角度量が閾値以上の場合に選択される立体音響フィルタを用いるときの出力音信号によって知覚される到来方向の変動の角度量よりも大きくなるように、立体音響フィルタを選択してもよい。
これによれば、所定音に対して閾値以上の変動の角度量を有している場合に選択される立体音響フィルタ、すなわち、コンテンツにあらかじめ設定されている変動の角度量となるように出力音信号を生成させる立体音響フィルタを適用する場合に比べて、所定音をより強調するために、変動の角度量が大きくなるように立体音響フィルタの選択を行うことができる。この結果、出力音信号によって、変動の角度量が拡大されることで所定音が強調されて知覚される。
また、例えば、立体音響フィルタの選択では、算出された所定方向の変動の角度量が小さいほど、選択された立体音響フィルタを用いた場合の出力音信号によって知覚される到来方向の変動の角度量が大きくなるように、立体音響フィルタを選択してもよい。
これによれば、所定音に対して閾値以上の変動の角度量を有している場合に選択される立体音響フィルタ、すなわち、コンテンツにあらかじめ設定されている変動の角度量となるように出力音信号を生成させる立体音響フィルタを適用する場合に比べて、所定音をより強調するために、変動の角度量が大きくなるように立体音響フィルタの選択を行うことができる。この結果、出力音信号によって、変動の角度量が拡大されることで所定音が強調されて知覚される。このとき、音情報上で変動の角度量がより小さいほど出力音信号における音の変動の角度量が大きくなるので、元のコンテンツ上では変動が小さいためにその変動が知覚されにくい所定音ほど、より知覚されやすくなるように強調されてユーザに提示される。
また、例えば、算出された所定方向の変動の角度量が閾値よりも小さい場合において、選択された立体音響フィルタを用いたとき、音情報上の所定方向の変動の角度量が小さいほど、その数値が大きくなる拡張係数α(α>1)が乗算されることで出力音信号の時間軸上の到来方向の変動の角度量が拡張され、所定方向の変動の角度量と拡張係数αとの関係は非線形であってもよい。
これによれば、音情報上で変動の角度量がより小さいほど出力音信号における音の変動の角度量が大きくなるので、元のコンテンツ上では変動が小さいためにその変動が知覚されにくい所定音ほど、より知覚されやすくなるように強調されてユーザに提示される。拡張係数αが乗じられることより、所定方向の変動の角度量と出力音情報における所定音の到来方向との関係が非線形となって、変動が小さい所定音ほどその強調効果を際立たせることが可能となる。
また、例えば、立体音響フィルタの選択では、ユーザの頭部を前後に分ける仮想的な境界面に対して、所定方向が境界面の前面側にあり、かつ、算出された所定方向の変動の角度量が閾値よりも小さい場合において、選択された立体音響フィルタを用いたときの時間軸上の到来方向の変動の角度量よりも、所定方向が境界面の後面側にあり、かつ、算出された所定方向の変動の角度量が閾値よりも小さい場合において、選択された立体音響フィルタを用いたときの時間軸上の到来方向の変動の角度量のほうが大きくなるように立体音響フィルタを選択してもよい。
これによれば、到来方向の変動を感知しにくい境界面の後面側において、境界面の前面側よりも強調効果をより大きくすることができる。
また、例えば、立体音響フィルタの選択では、音情報上の所定方向に比べて、選択された立体音響フィルタを用いた場合の出力音信号によって知覚される到来方向が時間軸上で振動するように、立体音響フィルタを選択してもよい。
これによれば、出力音情報において、到来方向が振動する所定音をユーザに提示できる。到来方向が時間軸上で振動しているために他の音に比べて所定音をユーザがより知覚しやすくなっているので、この所定音の変動をより知覚させやすいという効果がある。
また、例えば、選択された立体音響フィルタを用いた場合、出力音信号の時間軸上の第N番目(Nは2以上の整数)の時点の到来方向は、出力音信号の時間軸上の第(N-1)番目の時点に対応する音情報上の所定方向と、第N番目の時点に対応する音情報上の所定方向との差分値に対して、時間軸上で数値が振動する振動関数における対応する時点の数値を乗算し、乗算後の差分値を第(N-1)番目の時点に対応する音情報上の所定方向に加算することで算出されてもよい。
これによれば、出力音情報において、到来方向が振動する所定音をユーザに提示できる。到来方向が時間軸上で振動しているために他の音に比べて所定音をユーザがより知覚しやすくなっているので、この所定音の変動をより知覚させやすいという効果がある。
また、例えば、立体音響フィルタの選択では、算出された所定方向の変動の角度量が閾値よりも小さい場合において、選択された立体音響フィルタを用いたときの出力音信号によって知覚される時間軸上の所定音の音圧の変化の量の方が、算出された所定方向の変動の角度量が閾値以上の場合に選択される立体音響フィルタを用いるときの出力音信号によって知覚される所定音の音圧の変化の量よりも大きくなるように、立体音響フィルタを選択してもよい。
これによれば、所定音に対して閾値以上の変動の角度量を有している場合に選択される立体音響フィルタ、すなわち、コンテンツにあらかじめ設定されている変動の角度量となるように出力音信号を生成させる立体音響フィルタを適用する場合に比べて、所定音をより強調するために、音圧の変化の量が大きくなるように立体音響フィルタの選択を行うことができる。この結果、出力音信号によって、音圧の変化の量が拡大されることで所定音が強調されて知覚される。
また、例えば、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、所定方向に対応する三次元音場上の到来方向から到来する音として所定音を時系列に沿ってユーザに知覚させるための出力音信号を生成する情報処理方法であって、時間軸上での所定方向の変動の角度量を算出し、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、所定方向に関する情報を補正し、所定音に関する情報を、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から補正後の所定方向に関する情報に基づいて選択された立体音響フィルタに入力して出力信号を生成してもよい。
これによれば、算出された所定方向の変動の角度量が閾値よりも小さい場合、すなわち、ユーザにとって、その到来方向の変動を感知しにくいような微小な変動をしている所定音が含まれている場合に、この所定音をより強調してユーザに知覚させることができる。このために、音情報に含まれる所定方向に関する情報を補正することで、その後に選択される立体音響フィルタを、所定音をより強調してユーザに知覚させるための立体音響フィルタにさせることができる。この結果、ユーザの注意が当該所定音に向かうため、所定音の到来方向の微小な変動をより適切にユーザに知覚させることができる。
また、本開示の一態様に係るプログラムは、上記に記載の情報処理方法をコンピュータに実行させるためのプログラムである。
これによれば、コンピュータを用いて上記に記載の情報処理方法と同様の効果を奏することができる。
また、本開示の一態様に係る音響再生装置は、時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、所定方向に対応する三次元音場上の到来方向から到来する音として所定音をユーザに知覚させるための出力音信号を生成して再生する音響再生装置であって、音情報を取得する取得部と、時間軸上での所定方向の変動の角度量を算出し、所定方向に関する情報に基づいて、入力される入力音を到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択するフィルタ選択部と、所定音に関する情報を、入力音として、選択された立体音響フィルタに入力して出力音信号を生成する出力音生成部と、生成された出力音信号により音を出力する出力部と、を備え、フィルタ選択部は、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、立体音響フィルタを選択する。
これによれば、上記に記載の情報処理方法と同様の効果を奏することができる。
さらに、これらの包括的又は具体的な態様は、システム、装置、方法、集積回路、コンピュータプログラム、又は、コンピュータ読み取り可能なCD-ROMなどの非一時的な記録媒体で実現されてもよく、システム、装置、方法、集積回路、コンピュータプログラム、及び、記録媒体の任意な組み合わせで実現されてもよい。
以下、実施の形態について、図面を参照しながら具体的に説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付し、重複する説明は省略又は簡略化される場合がある。
また、以下の説明において、第1、第2及び第3等の序数が要素に付けられている場合がある。これらの序数は、要素を識別するため、要素に付けられており、意味のある順序に必ずしも対応しない。これらの序数は、適宜、入れ替えられてもよいし、新たに付与されてもよいし、取り除かれてもよい。
(実施の形態)
[概要]
はじめに、実施の形態に係る音響再生装置の概要について説明する。図1は、実施の形態に係る音響再生装置の使用事例を示す概略図である。図1では、音響再生装置100を使用するユーザ99が示されている。
[概要]
はじめに、実施の形態に係る音響再生装置の概要について説明する。図1は、実施の形態に係る音響再生装置の使用事例を示す概略図である。図1では、音響再生装置100を使用するユーザ99が示されている。
図1に示す音響再生装置100は、立体映像再生装置200と同時に使用されている。立体的な画像及び立体的な音を同時に視聴することで、画像が聴覚的な臨場感を、音が視覚的な臨場感をそれぞれ高め合い、画像及び音が撮られた現場に居るかのように体感することができる。例えば、人が会話をする画像(動画像)が表示されている場合に、会話音の音像の定位が当該人の口元とずれている場合にも、ユーザ99が、当該人の口から発せられた会話音として知覚することが知られている。このように視覚情報によって、音像の位置が補正されるなど、画像と音とが併せられることで臨場感が高められることがある。
立体映像再生装置200は、ユーザ99の頭部に装着される画像表示デバイスである。したがって、立体映像再生装置200は、ユーザ99の頭部と一体的に移動する。例えば、立体映像再生装置200は、図示するように、ユーザ99の耳と鼻とで支持するメガネ型のデバイスである。
立体映像再生装置200は、ユーザ99の頭部の動きに応じて表示する画像を変化させることで、ユーザ99が三次元画像空間内で頭部を動かしているように知覚させる。つまり、ユーザ99の正面に三次元画像空間内の物体が位置しているときに、ユーザ99が右を向くと当該物体がユーザ99の左方向に移動し、ユーザ99が左を向くと当該物体がユーザの右方向に移動する。このように、立体映像再生装置200は、ユーザ99の動きに対して、三次元画像空間をユーザ99の動きとは逆方向に移動させる。
立体映像再生装置200は、ユーザ99の左右の目それぞれに視差分のずれが生じた2つの画像を表示する。ユーザ99は、表示される画像の視差分のずれに基づき、画像上の物体の三次元的な位置を知覚することができる。なお、音響再生装置100を睡眠誘導用のヒーリング音の再生に使用する等、ユーザ99が目を閉じて使用する場合等には、立体映像再生装置200が同時に使用される必要はない。つまり、立体映像再生装置200は、本開示の必須の構成要素ではない。
音響再生装置100は、ユーザ99の頭部に装着される音提示デバイスである。したがって、音響再生装置100は、ユーザ99の頭部と一体的に移動する。例えば、本実施の形態における音響再生装置100は、いわゆるオーバーイヤーヘッドホン型のデバイスである。なお、音響再生装置100の形態に特に限定はなく、例えば、ユーザ99の左右の耳にそれぞれ独立して装着される2つの耳栓型のデバイスであってもよい。この2つのデバイスは、互いに通信することで、右耳用の音と左耳用の音とを同期して提示する。
音響再生装置100は、ユーザ99の頭部の動きに応じて提示する音を変化させることで、ユーザ99が三次元音場内で頭部を動かしているようにユーザ99に知覚させる。このため、上記したように、音響再生装置100は、ユーザ99の動きに対して三次元音場をユーザの動きとは逆方向に移動させる。
ここで、ユーザに提示される音像の時間領域における変化(時間軸上の変動ともいう)が小さくなると、ユーザ99は、三次元音場内における音像の動きの識別が曖昧になることが知られている。本実施の形態に係る音響再生装置100は、この現象を補完するように情報処理によって提示される音を補正することで音像に動きがあることをユーザ99に知覚させることができる。すなわち、音響再生装置100は、音像の動きの量を取得し、取得した動きの量が閾値より小さい場合に、三次元音場上の所定音をより強調してユーザ99に知覚させる。
この閾値は、ユーザ99が動きの量をとらえきれなくなるような動きの量に関する数値であるので、ユーザ99によって固有の閾値となる。したがって、この閾値は、実験又は経験的に得られる値が設定されるとよい。また、複数のユーザ99の統計による、一般化された閾値が適用されるとしてもよい。なお、ここでの動きの量とは、微小時間における所定音の到来方向の変動の量であり、ユーザ99からみた所定方向の微小時間当たりの変化角の量である。すなわち、動きの量とは、第1時点から第2時点までの間の2つの時点のそれぞれに対応する2つの所定音の到来方向同士がなす角度の最大値によって表現される。
[構成]
次に、図2を参照して、本実施の形態に係る音響再生装置100の構成について説明する。図2は、実施の形態に係る音響再生装置の機能構成を示すブロック図である。
次に、図2を参照して、本実施の形態に係る音響再生装置100の構成について説明する。図2は、実施の形態に係る音響再生装置の機能構成を示すブロック図である。
図2に示すように、本実施の形態に係る音響再生装置100は、処理モジュール101と、通信モジュール102と、検知器103と、ドライバ104と、を備える。
処理モジュール101は、音響再生装置100における各種の信号処理を行うための演算装置である、処理モジュール101は、例えば、プロセッサとメモリとを備え、メモリに記憶されたプログラムがプロセッサによって実行されることで、各種の機能を発揮する。 処理モジュール101は、取得部111、フィルタ選択部121、出力音生成部131、及び、信号出力部141を有する。処理モジュール101が有する各機能部の詳細は、処理モジュール101以外の構成の詳細と併せて以下に説明する。
通信モジュール102は、音響再生装置100への音情報の入力を受け付けるためのインタフェース装置である。通信モジュール102は、例えば、アンテナと信号変換器とを備え、無線通信により外部の装置から音情報を受信する。より詳しくは、通信モジュール102は、無線通信のための形式に変換された音情報を示す無線信号を、アンテナを用いて受波し、信号変換器により無線信号から音情報への再変換を行う。これにより、音響再生装置100は、外部の装置から無線通信により音情報を取得する。通信モジュール102によって取得された音情報は、取得部111によって取得される。このようにして音情報は、処理モジュール101に入力される。なお、音響再生装置100と外部の装置との通信は、有線通信によって行われてもよい。
音響再生装置100が取得する音情報は、例えば、MPEG-H 3D Audio(ISO/IEC 23008-3)等の所定の形式で符号化されている。一例として、符号化された音情報には、音響再生装置100によって再生される所定音についての情報と、当該音の音像を三次元音場内において所定位置に定位させる(つまり所定方向から到来する音として知覚させる)際の定位位置に関する情報、すなわち所定方向に関する情報とが含まれる。例えば、音情報には第1の所定音及び第2の所定音を含む複数の音に関する情報が含まれ、それぞれの音が再生された際の音像を三次元音場内における異なる方向から到来する音として知覚させるように音像を定位させる。
この立体的な音によって、例えば、立体映像再生装置200を用いて視認される画像と併せて、視聴されるコンテンツなどの臨場感を向上することができる。なお、音情報には、所定音についての情報のみが含まれていてもよい。この場合、所定方向に関する情報を別途取得してもよい。また、上記したように、音情報は、第1の所定音に関する第1音情報、及び、第2の所定音に関する第2音情報を含むが、これらを別個に含む複数の音情報をそれぞれ取得し、同時に再生することで三次元音場内における異なる位置に音像を定位させてもよい。このように、入力される音情報の形態に特に限定はなく、音響再生装置100に各種の形態の音情報に応じた取得部111が備えられればよい。
ここで、取得部111の一例を、図3を用いて説明する。図3は、実施の形態に係る取得部の機能構成を示すブロック図である。図3に示すように、本実施の形態における取得部111は、例えば、エンコード音情報入力部112、デコード処理部113、及び、センシング情報入力部114を備える。
エンコード音情報入力部112は、取得部111が取得した、符号化された(言い換えるとエンコードされている)音情報が入力される処理部である。エンコード音情報入力部112は、入力された音情報をデコード処理部113へと出力する。デコード処理部113は、エンコード音情報入力部112から出力された音情報を復号する(言い換えるとデコードする)ことにより音情報に含まれる所定音に関する情報と、所定方向に関する情報とを、以降の処理に用いられる形式で生成する処理部である。センシング情報入力部114については、検知器103の機能とともに、以下に説明する。
検知器103は、ユーザ99の頭部の動き速度を検知するための装置である。検知器103は、ジャイロセンサ、加速度センサなど動きの検知に使用される各種のセンサを組み合わせて構成される。本実施の形態では、検知器103は、音響再生装置100に内蔵されているが、例えば、音響再生装置100と同様にユーザ99の頭部の動きに応じて動作する立体映像再生装置200等、外部の装置に内蔵されていてもよい。この場合、検知器103は、音響再生装置100に含まれなくてもよい。また、検知器103として、外部の撮像装置などを用いて、ユーザ99の頭部の動きを撮像し、撮像された画像を処理することでユーザ99の動きを検知してもよい。
検知器103は、例えば、音響再生装置100の筐体に一体的に固定され、筐体の動きの速度を検知する。上記の筐体を含む音響再生装置100は、ユーザ99が装着した後、ユーザ99の頭部と一体的に移動するため、検知器103は、結果としてユーザ99の頭部の動きの速度を検知することができる。
検知器103は、例えば、ユーザ99の頭部の動きの量として、三次元空間内で互いに直交する3軸の少なくとも一つを回転軸とする回転量を検知してもよいし、上記3軸の少なくとも一つを変位方向とする変位量を検知してもよい。また、検知器103は、ユーザ99の頭部の動きの量として、回転量及び変位量の両方を検知してもよい。
センシング情報入力部114は、検知器103からユーザ99の頭部の動き速度を取得する。より具体的には、センシング情報入力部114は、単位時間あたりに検知器103が検知したユーザ99の頭部の動きの量を動きの速度として取得する。このようにしてセンシング情報入力部114は、検知器103から回転速度及び変位速度の少なくとも一方を取得する。ここで取得されるユーザ99の頭部の動きの量は、三次元音場内のユーザ99の座標及び向きを決定するために用いられる。音響再生装置100では、決定されたユーザ99の座標及び向きに基づいて、音像の相対的な位置を決定して音が再生される。具体的には、フィルタ選択部121、及び、出力音生成部131によって、上記の機能が実現されている。
フィルタ選択部121は、決定されたユーザ99の座標及び向きに基づいて、所定音について、三次元音場内のいずれの方向から到来する音としてユーザ99に知覚させるかを決定し、所定音に対して適用される立体音響フィルタを選択する処理部である。立体音響フィルタは、入力された所定音に特定の頭部伝達関数を畳み込むことにより、当該特定の頭部伝達関数に基づく所定方向から到来する音として、上記の所定音をユーザ99に知覚させる関数フィルタである。言い換えると、立体音響フィルタに所定音(又は、所定音に関する情報)が入力されることにより、所定音の左右の音信号に音圧差、時間差、及び、位相差などを発生させ、到来方向が制御された所定音を再生できる音信号を出力することができる。
選択の候補となる複数の立体音響フィルタは、例えば、ユーザ99ごとに調整されてあらかじめ準備されている。
ここで、フィルタ選択部121の一例を、図4を用いて説明する。図4は、実施の形態に係るフィルタ選択部の機能構成を示すブロック図である。図4に示すように、本実施の形態におけるフィルタ選択部121は、例えば、フィルタ記憶部122、変動角算出部123、及び、フィルタ決定部124を備える。
フィルタ記憶部122は、上記のように、あらかじめ音の到来方向ごとに計算して生成された複数の立体音響フィルタを記憶するための記憶装置である。変動角算出部123は、音情報に基づいて、微小時間における所定方向の変動の量(角度量)を算出する処理部である。例えば、変動角算出部123は、所定方向に関する情報から、数ミリ秒~数秒の範囲内で固定された期間内における、所定方向の変動の量を算出する。ここでは、変動角算出部123は、上記期間内において、所定方向の角度差が最大となった際の角度差を上記の角度量として算出する。変動角算出部123は、算出した角度量と閾値との比較を行う。算出した角度量が閾値よりも小さい等の比較結果は、フィルタ決定部124による、選択される立体音響フィルタの決定のために用いられる。
フィルタ決定部124は、上記の変動角算出部123によって算出された角度量が閾値よりも小さい場合に、所定音をより強調してユーザ99に知覚させるようにして、選択される立体音響フィルタを決定する処理部である。フィルタ決定部124によって決定された立体音響フィルタは、フィルタ記憶部122から読み出されることで出力される、すなわち、フィルタ選択部121によって選択された立体音響フィルタとして出力される。フィルタ決定部124による立体音響フィルタの決定(つまり、フィルタ選択部121による立体音響フィルタの選択)の詳細は、後述する。
出力音生成部131は、フィルタ選択部121において選択された立体音響フィルタを用いて、音情報に含まれる所定音に関する情報を選択された立体音響フィルタに入力することで、出力音信号を生成する処理部である。
ここで、出力音生成部131の一例を、図5を用いて説明する。図5は、実施の形態に係る出力音生成部の機能構成を示すブロック図である。図5に示すように、本実施の形態における出力音生成部131は、例えば、フィルタ処理部132を備える。フィルタ処理部132は、フィルタ選択部121が連続的に選択するフィルタを逐次読み込み、時間軸上の対応する所定音に関する情報を入力することで、三次元音場上で所定音が到来する到来方向が制御された音信号を連続的に出力する。このようにして、時間軸上で処理単位の時間ごとに区切られた音情報が、時間軸上で連続的な音信号(出力音信号)として出力される。
信号出力部141は、生成された出力音信号をドライバ104へと出力する機能部である。信号出力部141は、出力音信号に基づいてデジタル信号からアナログ信号への信号変換などを行うことで、波形信号を生成し、波形信号に基づいてドライバ104に音波を発生させ、ユーザ99に音を提示する。ドライバ104は、例えば、振動板とマグネット及びボイスコイルなどの駆動機構とを有する。ドライバ104は、波形信号に応じて駆動機構を動作させ、駆動機構によって振動板を振動させる。このようにして、ドライバ104は、出力音信号に応じた振動板の振動により、音波を発生させ、音波が空気を伝播してユーザ99の耳に伝達し、ユーザ99が音を知覚する。
[動作]
次に、図6を参照して、上記に説明した音響再生装置100の動作について説明する。図6は、実施の形態に係る音響再生装置の動作を示すフローチャートである。まず、音響再生装置100の動作が開始されると、取得部111が通信モジュール102を介して音情報を取得する。音情報は、デコード処理部113によって所定音に関する情報と、所定方向に関する情報とにデコードされ、フィルタ選択が開始される。
次に、図6を参照して、上記に説明した音響再生装置100の動作について説明する。図6は、実施の形態に係る音響再生装置の動作を示すフローチャートである。まず、音響再生装置100の動作が開始されると、取得部111が通信モジュール102を介して音情報を取得する。音情報は、デコード処理部113によって所定音に関する情報と、所定方向に関する情報とにデコードされ、フィルタ選択が開始される。
フィルタ選択部121では、初期値として、コンテンツにあらかじめ設定された到来方向(所定方向と一致する到来方向)となるように所定音を再生させる立体音響フィルタが、フィルタ記憶部122から読み出される。一方で、変動角算出部123では、所定方向の変動の角度量を算出する(S101)。その後、変動角算出部123は、変動の角度量が閾値よりも小さいか否かを判定する(S102)。変動の角度量が閾値以上の場合(S102でNo)、フィルタ選択部121は処理を終了して、所定方向と到来方向とが一致する立体音響フィルタを、出力音生成部131へと出力する。
一方で、変動の角度量が閾値より小さい場合(S102でYes)、フィルタ決定部124による立体音響フィルタの決定(S103)が行われる。立体音響フィルタの決定は、すなわち、初期値として選択されている立体音響フィルタを変更するための選択を行うことと読み替えることもできる。このときの出力音信号における音の到来方向は、音情報上の所定方向と異なる方向である。
なお、上記のような立体音響フィルタの初期値を設定することなく、直接的にフィルタ決定部124が決定した立体音響フィルタをフィルタ記憶部122から読み出してもよい。つまり、立体音響フィルタの変更とは、説明のために便宜的に用いられる表現であり、初期値を用いることなく直接的に立体音響フィルタを選択して出力することも本開示に含まれる。
以下、立体音響フィルタの決定について、図7~図9を参照して説明する。図7は、実施の形態に係る、選択された立体音響フィルタによる所定音の到来方向を説明する第1図である。また、図8は、実施の形態に係る、選択された立体音響フィルタによる所定音の到来方向を説明する第2図である。また、図9は、実施の形態に係る、選択された立体音響フィルタによる所定音の到来方向を説明する第3図である。
図7では、白抜き右向き矢印の左側に立体音響フィルタの変更が行われない場合における所定音の到来方向が示されており、第1時点の所定音の到来方向を実線で示し、第1時点に続く第2時点の所定音の到来方向を破線で示している。また、図7では、白抜き右向き矢印の右側に立体音響フィルタの変更が行われた場合における所定音の到来方向が示されており、第1時点の所定音の到来方向を実線で示し、第1時点に続く第2時点の所定音の到来方向を破線で示している。また、図7では、紙面上方向を正面とした姿勢のユーザ99を「U」が付された円形で模式的に示しており、このユーザ99は、紙面に垂直な方向に直立の姿勢でいる。
さらに、図7では、所定音が定位されている位置を、黒丸印として示しており、仮想的なスピーカが併せて示されている。
図7に示すように、第1時点の第1の所定音の定位されている位置は、第1位置S1である。この第1の所定音は、立体音響フィルタの変更がない場合、第2時点で第2位置S1aへと移動している。所定方向は、第1位置S1とユーザ99とを結ぶ第1方向から、第2位置S1aとユーザ99とを結ぶ第2方向へと回転している。なお、第1時点と第2時点との間で、第1の所定音は時間的にも空間的にも直線的に移動したものとする。この第1方向から第2方向への回転の量(所定音の到来方向の変動量)が閾値よりも小さい場合、ユーザ99は、第1の所定音が移動したことを認識することが困難である。
一方で、立体音響フィルタの変更をすることによって、所定音は、第2時点での第3位置S1bへと移動している。所定方向は、第1位置S1とユーザ99とを結ぶ第1方向から、第3位置S1bとユーザ99とを結ぶ第3方向へと回転している。第2方向と第3方向との角度差(変更によって拡大される角度)は、例えば、5度、10度、15度、20度などの固定的な角度であってもよいし、第1方向と第2方向との角度差に基づいて、第1方向と第3方向との角度差がヒトの最小弁別角度(約10度)を十分に超える角度であってもよい。
また、第1方向と第2方向との角度差(つまり、もとの音情報上の所定方向の変動の角度量)が小さいほど、第2方向と第3方向との角度差が大きくなるようにしてもよい。具体的には、フィルタ決定部124は、もとの音情報上の所定方向の変動の角度量が小さいほど、変更後の立体音響フィルタを用いた場合の出力音信号の到来方向の変動の角度量が大きくなるように、立体音響フィルタを決定してもよい。例えば、図8に示すように、拡張係数α(α>1)であって、音情報上の所定方向の変動の角度量が小さいほど、その数値が大きくなる拡張係数αが、第1方向と第2方向との角度差に乗算されることで、第3方向が決定され、この第3方向から、第2時点での所定音が到来するような立体音響フィルタの変更がされればよい。また、この拡張係数αは、変動の角度量が小さいほど変更によって変動する角度量を拡大するために、非線形の関係であってもよい。
また、図7において、ユーザ99の左右に延びる1点鎖線は、ユーザ99の頭部を前後に分ける仮想的な境界面を示している。この境界面は、ユーザ99の外耳道に沿う面であってもよいし、ユーザ99の耳殻の最後端の点を通る面であってもよいし、単にユーザ99の頭部の重心を通る面であってもよい。このような境界面の前後において、つまり、ユーザ99の前後で音の聞き取りやすさに差があることが知られている。したがって、境界面を境に、前面側と後面側とで、立体音響フィルタの変更の特性を異ならせることが有効である。
図7では、第1時点の第2の所定音の定位されている位置は、第4位置S2である。この第2の所定音は、立体音響フィルタの変更がない場合、第2時点で第5位置S2aへと移動している。所定方向は、第4位置S2とユーザ99とを結ぶ第4方向から、第5位置S2aとユーザ99とを結ぶ第5方向へと回転している。第1方向と第4方向とは平行であり、第2方向と第5方向とは平行である。したがって、第1時点から第2時点までの期間で、第2の所定音の変動の角度量は第1の所定音の変動の角度量と同等である。しかしながら、第2の所定音は、境界面よりも後面側(ユーザ99の背後側)であるため、前面側に比べて、ユーザ99によって変動がより認識されにくいといえる。
このため、フィルタ決定部124は、所定方向が境界面の前面側にあるときに変更後の立体音響フィルタを用いた場合の時間軸上の到来方向の変動の角度量よりも、所定方向が境界面の後面側にあるときに変更後の立体音響フィルタを用いた場合の時間軸上の到来方向の変動の角度量のほうが大きくなるように立体音響フィルタを決定する。例えば、図7では、第1方向と第3方向とがなす角度よりも大きい変動角となるように、第4方向の第4位置S2から、第6位置S2bへと、所定音の定位位置が変化している。第5方向と第6方向との角度差は、例えば、10度、15度、20度、25度などの固定的な角度であってもよいし、前面側での角度差に対する2倍、3倍、4倍、5倍などの係数倍の角度差となるように設定されてもよい。
また、フィルタ決定部124による立体音響フィルタの決定の別例を図9に示す。図9では、図7と同様の構成の図が示されており、立体音響フィルタの変更後の構成(白抜き右向き矢印の右側)が異なっている。なお、図9では、境界面の前面側の音像のみを示しており、また、白抜き右向き矢印の右側では、判読性のため、第1時点の第1の所定音が定位している第1位置S1に関する図示を省略している。
図9に示すように、第2時点での第1の所定音は、第7位置S1cに定位され、音情報上の所定方向の変動とは別に振動するように立体音響フィルタが選択されてもよい。ここでは、第7位置S1cを中心に、2つの1点鎖線に挟まれた角度領域内で、第1の所定音が振動している様子が示されている。このように、第1の所定音は、到来方向の変動の大きさが拡大されるのではない方法によって強調されてもよい。図9の例では、第1の所定音に周期的及び規則的な変動をさせることで、ユーザ99によって意識が向けられるようにさせ、その変化が多少小さくてもユーザ99が注意することで認識されやすくすることができる。
なお、このような周期的及び規則的な変動は、正弦関数又は余弦関数等の時間軸上で数値が振動する振動関数を、所定音の到来方向の変動の角度量に対して、乗算又は加算することによって生じさせることができる。例えば、変更後の立体音響フィルタを用いた場合の、出力音信号の時間軸上の第N番目(Nは2以上の整数)の時点の到来方向(変更後の角度量に対応)を、出力音信号の時間軸上の第(N-1)番目の時点に対応する音情報上の所定方向と、第N番目の時点に対応する音情報上の所定方向との差分値(もとの角度量)に対して、振動関数における対応する時点の数値を乗算し、乗算後の差分値を第(N-1)番目の時点に対応する音情報上の所定方向に加算することで算出してもよい。
このほか、第2時点での所定音の到来方向を強調させるために、変更前の立体音響フィルタを用いる場合に比べて、変更後の立体音響フィルタを用いた場合の出力音信号によって知覚される時間軸上の所定音の音圧の変化の量の方が大きくなるように、立体音響フィルタを変更してもよい。また、これらの立体音響フィルタの変更の例は、互いに相反するものではなく、任意の組み合わせとして用いられてもよい。
このようにして、本実施の形態では、所定音の到来方向の変動が閾値よりも小さい場合に、この変動がユーザ99によって認識されにくいといった現象を、立体音響フィルタの変更によって、変動を強調するようにして出力音信号を生成することができる。よって、ユーザ99において認識されにくい所定音の到来方向の小さな変動がより明瞭なものとなるので、より適切に立体的な音をユーザ99に知覚させることが可能となる。
(その他の実施の形態)
以上、実施の形態について説明したが、本開示は、上記の実施の形態に限定されるものではない。
以上、実施の形態について説明したが、本開示は、上記の実施の形態に限定されるものではない。
例えば、上記の実施の形態では、ユーザの頭部の動きに音が追従しない例を説明したが、本開示の内容は、ユーザの頭部の動きに音が追従する場合においても有効である。つまり、ユーザの頭部の動きとともに相対的に移動する第1位置から到達する音として所定音をユーザに知覚させる動作の中で、所定音の到来方向の変動量が閾値より小さい場合に、立体音響フィルタを選択して、変動が強調されるようにしてもよい。
また、例えば、上記の実施の形態に説明した音響再生装置は、構成要素をすべて備える一つの装置として実現されてもよいし、複数の装置に各機能が割り振られ、この複数の装置が連携することで実現されてもよい。後者の場合には、処理モジュールに該当する装置として、スマートフォン、タブレット端末、又は、PCなどの情報処理装置が用いられてもよい。
上記実施の形態の説明と異なる構成として例えば、デコード処理部によって、元の音情報を補正することにより、変更された立体音響フィルタを選択させることもできる。具体的には、本例におけるデコード処理部は、音情報に含まれる所定方向に関する情報を生成するとともに、元の音情報の補正を行う処理部である。デコード処理部は、時間軸上での所定方向の変動の角度量を算出し、算出された所定方向の変動の角度量が閾値よりも小さい場合において、所定方向の変動の角度量が閾値以上である場合に比べて所定音をより強調してユーザに知覚させるように、所定方向に関する情報を補正する。これにより、デコード処理部から出力された補正後の所定方向に関する情報に基づいて、所定音が到来する到来方向を規定する立体音響フィルタが選択されるだけで、上記の実施の形態における変更後の立体音響フィルタが適用されることとなる。
このように、本願開示の情報処理方法等を、元の音情報における所定方向に関する情報を補正することによって実現してもよい。上記のようなデコード処理部は、例えば、従来の立体音響再生装置のデコード処理を行う処理部と入れ替えて挿入するだけで、本願開示と同様の効果を奏することができる音響再生装置を実現することができる。
また、本開示の音響再生装置は、ドライバのみを備える再生装置に接続され、当該再生装置に対して、取得した音情報に基づいて選択が行われた立体音響フィルタを用いて出力音信号を出力するのみの音響処理装置として実現することもできる。この場合、音響処理装置は、専用の回路を備えるハードウェアとして実現してもよいし、汎用のプロセッサに特定の処理を実行させるためのソフトウェアとして実現してもよい。
また、上記の実施の形態において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
また、上記の実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPU又はプロセッサなどのプログラム実行部が、ハードディスク又は半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
また、各構成要素は、ハードウェアによって実現されてもよい。例えば、各構成要素は、回路(又は集積回路)でもよい。これらの回路は、全体として1つの回路を構成してもよいし、それぞれ別々の回路でもよい。また、これらの回路は、それぞれ、汎用的な回路でもよいし、専用の回路でもよい。
また、本開示の全般的又は具体的な態様は、装置、装置、方法、集積回路、コンピュータプログラム又はコンピュータ読み取り可能なCD-ROMなどの記録媒体で実現されてもよい。また、本開示の全般的又は具体的な態様は、装置、装置、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。
例えば、本開示は、コンピュータによって実行される音声信号再生方法として実現されてもよいし、音声信号再生方法コンピュータに実行させるためのプログラムとして実現されてもよい。本開示は、このようなプログラムが記録されたコンピュータ読み取り可能な非一時的な記録媒体として実現されてもよい。
その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本開示の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本開示に含まれる。
本開示は、立体的な音をユーザに知覚させる等の音響再生の際に有用である。
99 ユーザ
100 音響再生装置
101 処理モジュール
102 通信モジュール
103 検知器
104 ドライバ
111 取得部
112 エンコード音情報入力部
113 デコード処理部
114 センシング情報入力部
121 フィルタ選択部
122 フィルタ記憶部
123 変動角算出部
124 フィルタ決定部
131 出力音生成部
132 フィルタ処理部
141 信号出力部
200 立体映像再生装置
S1 第1位置
S1a 第2位置
S1b 第3位置
S1c 第7位置
S2 第4位置
S2a 第5位置
S2b 第6位置
100 音響再生装置
101 処理モジュール
102 通信モジュール
103 検知器
104 ドライバ
111 取得部
112 エンコード音情報入力部
113 デコード処理部
114 センシング情報入力部
121 フィルタ選択部
122 フィルタ記憶部
123 変動角算出部
124 フィルタ決定部
131 出力音生成部
132 フィルタ処理部
141 信号出力部
200 立体映像再生装置
S1 第1位置
S1a 第2位置
S1b 第3位置
S1c 第7位置
S2 第4位置
S2a 第5位置
S2b 第6位置
Claims (11)
- 時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、前記所定方向に対応する三次元音場上の到来方向から到来する音として前記所定音を時系列に沿ってユーザに知覚させるための出力音信号を生成する情報処理方法であって、
時間軸上での前記所定方向の変動の角度量を算出し、
前記所定方向に関する情報に基づいて、入力される入力音を前記到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択し、
前記所定音に関する情報を、前記選択された立体音響フィルタに入力して前記出力信号を生成し、
前記立体音響フィルタの選択では、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記所定方向の変動の角度量が閾値以上である場合に比べて前記所定音をより強調して前記ユーザに知覚させるように、前記立体音響フィルタを選択する
情報処理方法。 - 前記立体音響フィルタの選択では、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記選択された立体音響フィルタを用いたときの前記出力音信号によって知覚される前記到来方向の変動の角度量の方が、算出された前記所定方向の変動の角度量が閾値以上の場合に選択される立体音響フィルタを用いるときの前記出力音信号によって知覚される前記到来方向の変動の角度量よりも大きくなるように、前記立体音響フィルタを選択する
請求項1に記載の情報処理方法。 - 前記立体音響フィルタの選択では、算出された前記所定方向の変動の角度量が小さいほど、前記選択された立体音響フィルタを用いた場合の前記出力音信号によって知覚される前記到来方向の変動の角度量が大きくなるように、前記立体音響フィルタを選択する
請求項2に記載の情報処理方法。 - 算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記選択された立体音響フィルタを用いたとき、前記音情報上の前記所定方向の変動の角度量が小さいほど、その数値が大きくなる拡張係数α(α>1)が乗算されることで前記出力音信号の時間軸上の前記到来方向の変動の角度量が拡張され、
前記所定方向の変動の角度量と前記拡張係数αとの関係は非線形である
請求項3に記載の情報処理方法。 - 前記立体音響フィルタの選択では、前記ユーザの頭部を前後に分ける仮想的な境界面に対して、前記所定方向が前記境界面の前面側にあり、かつ、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記選択された立体音響フィルタを用いたときの時間軸上の前記到来方向の変動の角度量よりも、前記所定方向が前記境界面の後面側にあり、かつ、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記選択された立体音響フィルタを用いたときの時間軸上の前記到来方向の変動の角度量のほうが大きくなるように前記立体音響フィルタを選択する
請求項2~4のいずれか1項に記載の情報処理方法。 - 前記立体音響フィルタの選択では、前記音情報上の前記所定方向に比べて、前記選択された立体音響フィルタを用いた場合の前記出力音信号によって知覚される前記到来方向が時間軸上で振動するように、前記立体音響フィルタを選択する
請求項1~5のいずれか1項に記載の情報処理方法。 - 前記選択された立体音響フィルタを用いた場合、前記出力音信号の時間軸上の第N番目(Nは2以上の整数)の時点の前記到来方向は、
前記出力音信号の時間軸上の第(N-1)番目の時点に対応する前記音情報上の前記所定方向と、前記第N番目の時点に対応する前記音情報上の前記所定方向との差分値に対して、時間軸上で数値が振動する振動関数における対応する時点の数値を乗算し、
乗算後の前記差分値を前記第(N-1)番目の時点に対応する前記音情報上の前記所定方向に加算することで算出される
請求項6に記載の情報処理方法。 - 前記立体音響フィルタの選択では、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記選択された立体音響フィルタを用いたときの前記出力音信号によって知覚される時間軸上の前記所定音の音圧の変化の量の方が、算出された前記所定方向の変動の角度量が閾値以上の場合に選択される立体音響フィルタを用いるときの前記出力音信号によって知覚される前記所定音の音圧の変化の量よりも大きくなるように、前記立体音響フィルタを選択する
請求項1に記載の情報処理方法。 - 時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、前記所定方向に対応する三次元音場上の到来方向から到来する音として前記所定音を時系列に沿ってユーザに知覚させるための出力音信号を生成する情報処理方法であって、
時間軸上での前記所定方向の変動の角度量を算出し、
算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記所定方向の変動の角度量が閾値以上である場合に比べて前記所定音をより強調して前記ユーザに知覚させるように、前記所定方向に関する情報を補正し、
前記所定音に関する情報を、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から補正後の前記所定方向に関する情報に基づいて選択された立体音響フィルタに入力して前記出力信号を生成する
情報処理方法。 - 請求項1~9のいずれか1項に記載の情報処理方法をコンピュータに実行させるための
プログラム。 - 時間軸上の各時点での、所定音に関する情報及び所定方向に関する情報を含む音情報から、前記所定方向に対応する三次元音場上の到来方向から到来する音として前記所定音をユーザに知覚させるための出力音信号を生成して再生する音響再生装置であって、
前記音情報を取得する取得部と、
時間軸上での前記所定方向の変動の角度量を算出し、前記所定方向に関する情報に基づいて、入力される入力音を前記到来方向からの音として知覚させる立体音響フィルタを、候補となる複数の立体音響フィルタであって、到来方向ごとに準備された複数の立体音響フィルタの中から選択するフィルタ選択部と、
前記所定音に関する情報を、前記入力音として、前記選択された立体音響フィルタに入力して前記出力音信号を生成する出力音生成部と、
生成された前記出力音信号により音を出力する出力部と、を備え、
前記フィルタ選択部は、算出された前記所定方向の変動の角度量が閾値よりも小さい場合において、前記所定方向の変動の角度量が閾値以上である場合に比べて前記所定音をより強調して前記ユーザに知覚させるように、前記立体音響フィルタを選択する
音響再生装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022543320A JPWO2022038929A1 (ja) | 2020-08-20 | 2021-07-15 | |
CN202180056561.1A CN116018824A (zh) | 2020-08-20 | 2021-07-15 | 信息处理方法、程序和音响再现装置 |
EP21858078.5A EP4203520A4 (en) | 2020-08-20 | 2021-07-15 | INFORMATION PROCESSING METHOD, PROGRAM AND ACOUSTIC PLAYBACK DEVICE |
US18/104,908 US20230179938A1 (en) | 2020-08-20 | 2023-02-02 | Information processing method, recording medium, and sound reproduction device |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063068003P | 2020-08-20 | 2020-08-20 | |
US63/068,003 | 2020-08-20 | ||
JP2021-091020 | 2021-05-31 | ||
JP2021091020 | 2021-05-31 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US18/104,908 Continuation US20230179938A1 (en) | 2020-08-20 | 2023-02-02 | Information processing method, recording medium, and sound reproduction device |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022038929A1 true WO2022038929A1 (ja) | 2022-02-24 |
Family
ID=80323565
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2021/026585 WO2022038929A1 (ja) | 2020-08-20 | 2021-07-15 | 情報処理方法、プログラム、及び、音響再生装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230179938A1 (ja) |
EP (1) | EP4203520A4 (ja) |
JP (1) | JPWO2022038929A1 (ja) |
CN (1) | CN116018824A (ja) |
WO (1) | WO2022038929A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023199815A1 (ja) * | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響処理方法、プログラム、及び音響処理システム |
WO2024214799A1 (ja) * | 2023-04-14 | 2024-10-17 | パナソニックホールディングス株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0946797A (ja) * | 1995-07-28 | 1997-02-14 | Sanyo Electric Co Ltd | 音響信号再生装置 |
JP2009159073A (ja) * | 2007-12-25 | 2009-07-16 | Panasonic Corp | 音響再生装置および音響再生方法 |
JP2020018620A (ja) | 2018-08-01 | 2020-02-06 | 株式会社カプコン | 仮想空間における音声生成プログラム、四分木の生成方法、および音声生成装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1227392A2 (en) * | 2001-01-29 | 2002-07-31 | Hewlett-Packard Company | Audio user interface |
WO2010048157A1 (en) * | 2008-10-20 | 2010-04-29 | Genaudio, Inc. | Audio spatialization and environment simulation |
KR102319880B1 (ko) * | 2016-04-12 | 2021-11-02 | 코닌클리케 필립스 엔.브이. | 포커스 거리에 가까운 사운드 소스들을 강조하는 공간 오디오 처리 |
EP3264802A1 (en) * | 2016-06-30 | 2018-01-03 | Nokia Technologies Oy | Spatial audio processing for moving sound sources |
CN113993061A (zh) * | 2018-04-09 | 2022-01-28 | 杜比国际公司 | 用于mpeg-h 3d音频的三自由度(3dof+)扩展的方法、设备和系统 |
-
2021
- 2021-07-15 JP JP2022543320A patent/JPWO2022038929A1/ja active Pending
- 2021-07-15 CN CN202180056561.1A patent/CN116018824A/zh active Pending
- 2021-07-15 WO PCT/JP2021/026585 patent/WO2022038929A1/ja unknown
- 2021-07-15 EP EP21858078.5A patent/EP4203520A4/en active Pending
-
2023
- 2023-02-02 US US18/104,908 patent/US20230179938A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0946797A (ja) * | 1995-07-28 | 1997-02-14 | Sanyo Electric Co Ltd | 音響信号再生装置 |
JP2009159073A (ja) * | 2007-12-25 | 2009-07-16 | Panasonic Corp | 音響再生装置および音響再生方法 |
JP2020018620A (ja) | 2018-08-01 | 2020-02-06 | 株式会社カプコン | 仮想空間における音声生成プログラム、四分木の生成方法、および音声生成装置 |
Non-Patent Citations (1)
Title |
---|
See also references of EP4203520A4 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023199815A1 (ja) * | 2022-04-14 | 2023-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 音響処理方法、プログラム、及び音響処理システム |
WO2024214799A1 (ja) * | 2023-04-14 | 2024-10-17 | パナソニックホールディングス株式会社 | 情報処理装置、情報処理方法、及び、プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN116018824A (zh) | 2023-04-25 |
JPWO2022038929A1 (ja) | 2022-02-24 |
US20230179938A1 (en) | 2023-06-08 |
EP4203520A1 (en) | 2023-06-28 |
EP4203520A4 (en) | 2024-01-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7165215B2 (ja) | 空間化オーディオを用いた仮想現実、拡張現実、および複合現実システム | |
CN111615834B (zh) | 用于虚拟化的音频的甜蜜点适配的方法、系统和装置 | |
CN102318374B (zh) | 头部跟踪方法和系统、以及音频再现系统 | |
US20120207308A1 (en) | Interactive sound playback device | |
WO2012028906A1 (en) | Determining individualized head-related transfer functions | |
WO2022038929A1 (ja) | 情報処理方法、プログラム、及び、音響再生装置 | |
JP2018126185A (ja) | 装置、音データの生成方法、及びプログラム | |
US12075232B2 (en) | Acoustic reproduction method, recording medium, and acoustic reproduction system | |
KR102656969B1 (ko) | 불일치 오디오 비주얼 캡쳐 시스템 | |
WO2022038931A1 (ja) | 情報処理方法、プログラム、及び、音響再生装置 | |
JP3573797B2 (ja) | ステレオ音声再生装置 | |
US20240381051A1 (en) | Acoustic reproduction method, recording medium, and acoustic reproduction system | |
WO2023106070A1 (ja) | 音響処理装置、音響処理方法、及び、プログラム | |
WO2022220182A1 (ja) | 情報処理方法、プログラム、及び情報処理システム | |
WO2023166721A1 (ja) | 情報処理装置、情報処理システムおよび情報処理方法 | |
WO2024176791A1 (ja) | 情報処理方法、情報処理装置、音響再生システム、及び、プログラム | |
WO2023199815A1 (ja) | 音響処理方法、プログラム、及び音響処理システム | |
JP2024056580A (ja) | 情報処理装置及びその制御方法及びプログラム | |
JP2007318188A (ja) | 音像提示方法および音像提示装置 | |
JP2024159912A (ja) | 音響処理方法、音響処理装置、及び音響処理プログラム | |
JP2024152931A (ja) | 音響処理装置、音響処理方法、及び音響処理プログラム | |
JP2023049852A (ja) | 音声出力装置、制御システムおよびキャリブレーション方法 | |
CN117063489A (zh) | 信息处理方法、程序和信息处理系统 | |
JP2007166126A (ja) | 音像提示方法および音像提示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21858078 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2022543320 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
ENP | Entry into the national phase |
Ref document number: 2021858078 Country of ref document: EP Effective date: 20230320 |