CN104883503A - 基于语音的个性化拍照技术 - Google Patents
基于语音的个性化拍照技术 Download PDFInfo
- Publication number
- CN104883503A CN104883503A CN201510282187.3A CN201510282187A CN104883503A CN 104883503 A CN104883503 A CN 104883503A CN 201510282187 A CN201510282187 A CN 201510282187A CN 104883503 A CN104883503 A CN 104883503A
- Authority
- CN
- China
- Prior art keywords
- voice
- shooting
- contrast
- shooting technology
- typing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Studio Devices (AREA)
Abstract
本发明涉及智能照相领域,是一种基于语音的个性化拍照技术,包括以下步骤:(1)通过语音录入拍照指令,并将拍照指令存储于存储器;(2)开启语音录入功能,进行实时语音录入,关闭语音录入功能;(3)通过信息处理系统对实时录入的语音与拍照指令进行对比;(4)通过步骤(3)的对比结果判断是否进行拍照。本发明公开的一种基于语音的个性化拍照技术,通过即时输入语音信息控制照片的拍摄,使拍照设备或具有拍照功能的智能系统能进行更便捷、时尚地拍照;通过设置可判断音调、音高和音长的拍照,使拍照设备或具有拍照功能的智能系统具有更高的个人化识别,实现个性化拍照。
Description
技术领域
本发明涉及智能照相领域,特别的是一种基于语音的个性化拍照技术。
背景技术
近年来,随着拍照设备和具有拍照功能的智能系统不断普及,如手机、专业拍照及摄影设备等,随时随地的拍照取景已经成为人们生活中常见的、必不可少的一部分。现有的拍照设备或具有拍照功能的智能设备是通过操作快门按钮或者操作触控屏中的虚拟快门来进行拍照的。然而,在某些特定场合下,如自拍、远距离拍照等,用户无法腾出手来操作快门按钮,使得拍照极为不便。
随着拍照系统的需要越来越精细化、人性化和个性化,现有技术的拍照系统并不能满足用户个性化的需要。因此,如何进行便捷、个性化地拍照成为了拍照系统或设备中一项亟待解决的问题。
发明内容
本发明提供的一种基于语音的个性化拍照技术,旨在解决现有拍照设备或具有拍照功能的智能系统中拍照方式不够便捷、个性化的问题。
本发明是一种基于语音的个性化拍照技术,基于语音的个性化拍照技术,包括以下步骤:(1)通过语音录入拍照指令,并将拍照指令存储于存储器;(2)开启语音录入功能,进行实时语音录入,关闭语音录入功能;(3)通过信息处理系统对实时录入的语音与拍照指令进行对比;(4)通过步骤(3)的对比结果判断是否进行拍照。
进一步地,所述步骤(3)的对比具体的是:对实时录入的语音进行语音的文本信息智能提取,与拍照指令的文本信息进行比较。
进一步地,所述步骤(3)的对比具体的是:对实时录入的语音与拍照指令进行相似度比较。
进一步地,所述相似度比较包括音调对比、音高对比和音长对比,所述音调对比、音高对比和音长对比均超过预先所设置阈值自动拍照。
进一步地,所述步骤(1)中开启语音录入功能的操作方式包括:(a)手动模式:通过手动操作拍照设备或拍照系统中的按钮来开启语音录入功能;(b)自动模式:当镜头出现场景画面后,即打开拍照设备或拍照系统开关时自动开启语音录入功能。
具体地,所述步骤(3)中语音的文本信息智能提取具体的为:利用语音识别技术提取出语音中的全部或部分文本信息。
本发明公开的一种基于语音的个性化拍照技术,通过即时输入语音信息控制照片的拍摄,使拍照设备或具有拍照功能的智能系统能进行更便捷、时尚地拍照;通过设置可判断音调、音高和音长的拍照,使拍照设备或具有拍照功能的智能系统具有更高的个人化识别,实现个性化拍照。
具体实施方式
下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所公开的一种基于语音的个性化拍照技术,基于语音的个性化拍照技术,包括以下步骤:(1)通过语音录入拍照指令,并将拍照指令存储于存储器;(2)开启语音录入功能,进行实时语音录入,关闭语音录入功能;(3)通过信息处理系统对实时录入的语音与拍照指令进行对比;(4)通过步骤(3)的对比结果判断是否进行拍照。
进一步地,所述步骤(3)的对比具体的是:对实时录入的语音进行语音的文本信息智能提取,与拍照指令的文本信息进行比较。
进一步地,所述步骤(3)的对比具体的是:对实时录入的语音与拍照指令进行相似度比较。进一步地,所述相似度比较包括音调对比、音高对比和音长对比,所述音调对比、音高对比和音长对比均超过预先所设置阈值自动拍照。
进一步地,所述步骤(1)中开启语音录入功能的操作方式包括:(a)手动模式:通过手动操作拍照设备或拍照系统中的按钮来开启语音录入功能;(b)自动模式:当镜头出现场景画面后,即打开拍照设备或拍照系统开关时自动开启语音录入功能。
具体地,所述步骤(3)中语音的文本信息智能提取具体的为:利用语音识别技术提取出语音中的全部或部分文本信息。
本发明所使用的语音的文本信息智能提取具体的是,通过在音频播放过程中采集、滤出并还原音频制作时隐藏在音频信息中的标识信息,从而实现音频的即时识别;亦可通过设置音频识别系统,具体地包括一音频接收元件、一音频转换元件、一控制芯片、一存储器、一音频识别元件、一音频数据库,音频转换元件用于将音频信号转换为音频接收数据并存储音频接收数据于存储器中;音频识别元件用于在音频数据库中寻找对应的文字接收数据、回应的第一音频输出数据及对应第一音频输出数据的第一文字输出数据,并将文字接收数据及第一文字输出数据传送给控制芯片。
在本发明所公开的提供的基于语音的个性化拍照技术中,可以应用于软件和硬件中。
具体实施例一——软件对语义的对比:
本发明通过手机APP应用程序,通过利用手机具有的拍照功能,结合APP软件操作界面和操作系统部分功能,具体地是:通过实时录入语音拍照指令并存储于存储器中,通过APP软件操作界面控制开启语音录入功能,进行实时语音录入控制APP操作系统控制快门按钮进行拍照、关闭语音录入功能;APP操作系统对实时录入的语音进行语音的文本信息智能提取,对比拍照指令所提取的文本信息,若一致进行自动拍照,若不一致则不拍照。从而完成手机基于语音的个性化拍照,操作方便快捷。
具体实施例二——软件对语音的对比:
本发明通过手机APP应用程序,通过利用手机具有的拍照功能,结合APP软件操作界面和操作系统部分功能,具体地是:通过实时录入语音拍照指令并存储于存储器中,通过APP软件操作界面控制开启语音录入功能,进行实时语音录入控制APP操作系统控制快门按钮进行拍照、关闭语音录入功能;APP操作系统对实时录入的语音进行相似度对比,即音调对比、音高对比和音长对比,所述音调对比、音高对比和音长对比均超过预先所设置的阈值自动拍照,反之不拍照。从而完成手机基于语音的个性化拍照,尤其体现用户自己的个性化,满足用户对拍照设备或具有拍照功能的智能系统个性化的要求,且操作简单、使用方便。
具体实施例三——硬件:
本发明通过在专业拍照和摄影设备中添加语音录入、语音解析硬件设备,具体的是一音频接收元件、一音频转换元件、一控制芯片、一音频识别元件、一音频数据库、一显示器及一音频播放元件;具体地音频接收元件可以为麦克风,控制芯片可以为单片机;音频转换元件用于将音频信号转换为音频接收数据并存储音频接收数据于存储器中;音频识别元件用于在音频数据库中寻找对应的文字接收数据、回应的第一音频输出数据及对应第一音频输出数据的第一文字输出数据,并将文字接收数据及第一文字输出数据传送给控制芯片。
所述音频识别方法包括如下步骤:音频接收元件用于接收音频信号;音频转换元件将所述音频信号转换为音频接收数据并存储所述音频接收数据于存储器中;音频识别元件在一音频数据库中寻找对应所述音频接收数据的文字接收数据、回应;所述音频接收数据的第一音频输出数据及对应所述第一音频输出数据的第一文字输出数据,并将所述文字接收数据及所述第一文字输出数据传送给一控制芯片。所述音频识别元件在所述音频数据库中寻找时还寻找回应所述音频接收数据的第二音频输出数据及对应所述第二音频;输出数据的第二文字输出数据;一输入元件接收用户选择所述第一文字输出数据或所述第二文字输出数据的指令;所述控制芯片将所述第一文字输出数据显示于所述显示器时将所述第二文字输出数据显示于所述显示器,并根据所述指令播放所述第一音频输出数据或所述第二音频输出数据。
本发明所公开的基于语音的个性化拍照技术通过麦克风采集即时语音数据,单片机控制即时语音信息与拍照指令进行对比,具体的是单片机通过音频转换元件和音频识别元件对音频信号进行文本信息智能化提取,对即时录入的语音信息包含的文本信息进行转换,即对即时语音信息的文本信息与拍照指令的文本信息进行比较,当一致时进行自动拍照,完成拍照功能,使用方便。
本发明所公开的基于语音的个性化拍照技术还可通过单片机控制即时语音信息与拍照指令进行对比,具体的是单片机通过音调识别元件、音高识别元件和音长识别元件对音频信号与拍照指令的音调、音高和音长进行对比,即对实时录入的音频信号的音调、音高和音长与拍照指令的音频信号的音调阀值、音高阀值和音长阀值进行对比,当超过阀值时进行自动拍照,完成拍照功能,使用方便,更能体现用户的个性化,避免其他用户的干扰,使用方便、操作简单。
本发明公开的一种基于语音的个性化拍照技术,通过即时输入语音信息控制照片的拍摄,使拍照设备或具有拍照功能的智能系统能进行更便捷、时尚地拍照;通过设置可判断音调、音高和音长的拍照,使拍照设备或具有拍照功能的智能系统具有更高的个人化识别,实现个性化拍照。
当然,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员应该可以根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (6)
1.基于语音的个性化拍照技术,其特征在于,包括以下步骤:
(1)通过语音录入拍照指令,并将拍照指令存储于存储器;
(2)开启语音录入功能,进行实时语音录入,关闭语音录入功能;
(3)通过信息处理系统对实时录入的语音与拍照指令进行对比;
(4)通过步骤(3)的对比结果判断是否进行拍照。
2.如权利要求1所述的基于语音的个性化拍照技术,其特征在于,所述步骤(3)的对比具体的是:对实时录入的语音进行语音的文本信息智能提取,与拍照指令的文本信息进行比较。
3.如权利要求1所述的基于语音的个性化拍照技术,其特征在于,所述步骤(3)的对比具体的是:对实时录入的语音与拍照指令进行相似度比较。
4.如权利要求3所述的基于语音的个性化拍照技术,其特征在于,所述相似度比较包括音调对比、音高对比和音长对比,所述音调对比、音高对比和音长对比均超过预先所设置阈值自动拍照。
5.权利要求1—4中任意一项所述的基于语音的个性化拍照技术,其特征在于,所述步骤(1)中开启语音录入功能的操作方式包括:
(a)手动模式:通过手动操作拍照设备或拍照系统中的按钮来开启语音录入功能;
(b)自动模式:当镜头出现场景画面后,即打开拍照设备或拍照系统开关时自动开启语音录入功能。
6.如权利要求2所述的基于语音的个性化拍照技术,其特征在于,所述步骤(3)中语音的文本信息智能提取具体的为:利用语音识别技术提取出语音中的全部或部分文本信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510282187.3A CN104883503A (zh) | 2015-05-28 | 2015-05-28 | 基于语音的个性化拍照技术 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510282187.3A CN104883503A (zh) | 2015-05-28 | 2015-05-28 | 基于语音的个性化拍照技术 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104883503A true CN104883503A (zh) | 2015-09-02 |
Family
ID=53950827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510282187.3A Pending CN104883503A (zh) | 2015-05-28 | 2015-05-28 | 基于语音的个性化拍照技术 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104883503A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105472166A (zh) * | 2016-01-04 | 2016-04-06 | 广东欧珀移动通信有限公司 | 照片拍摄方法及装置 |
CN105592264A (zh) * | 2015-12-17 | 2016-05-18 | 北京大学深圳研究生院 | 一种语音控制拍照软件 |
CN105931637A (zh) * | 2016-04-01 | 2016-09-07 | 金陵科技学院 | 一种可自定义指令识别的语音拍照系统 |
CN106375681A (zh) * | 2016-09-29 | 2017-02-01 | 维沃移动通信有限公司 | 一种动静结合影像的生成方法和移动终端 |
CN106603865A (zh) * | 2016-12-31 | 2017-04-26 | 深圳天珑无线科技有限公司 | 手机自拍控制的方法及其系统 |
CN107734149A (zh) * | 2017-09-25 | 2018-02-23 | 努比亚技术有限公司 | 一种拍摄方法、终端及计算机可读存储介质 |
CN108932942A (zh) * | 2018-06-26 | 2018-12-04 | 四川斐讯信息技术有限公司 | 一种实现智能音箱人机对话的系统及其方法 |
CN109587391A (zh) * | 2017-09-29 | 2019-04-05 | 多玩国株式会社 | 服务器装置、发布系统、发布方法及程序 |
-
2015
- 2015-05-28 CN CN201510282187.3A patent/CN104883503A/zh active Pending
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105592264A (zh) * | 2015-12-17 | 2016-05-18 | 北京大学深圳研究生院 | 一种语音控制拍照软件 |
CN105472166A (zh) * | 2016-01-04 | 2016-04-06 | 广东欧珀移动通信有限公司 | 照片拍摄方法及装置 |
CN105931637A (zh) * | 2016-04-01 | 2016-09-07 | 金陵科技学院 | 一种可自定义指令识别的语音拍照系统 |
CN106375681A (zh) * | 2016-09-29 | 2017-02-01 | 维沃移动通信有限公司 | 一种动静结合影像的生成方法和移动终端 |
CN106603865A (zh) * | 2016-12-31 | 2017-04-26 | 深圳天珑无线科技有限公司 | 手机自拍控制的方法及其系统 |
CN107734149A (zh) * | 2017-09-25 | 2018-02-23 | 努比亚技术有限公司 | 一种拍摄方法、终端及计算机可读存储介质 |
CN109587391A (zh) * | 2017-09-29 | 2019-04-05 | 多玩国株式会社 | 服务器装置、发布系统、发布方法及程序 |
US10645274B2 (en) | 2017-09-29 | 2020-05-05 | Dwango Co., Ltd. | Server apparatus, distribution system, distribution method, and program with a distributor of live content and a viewer terminal for the live content including a photographed image of a viewer taking a designated body pose |
CN108932942A (zh) * | 2018-06-26 | 2018-12-04 | 四川斐讯信息技术有限公司 | 一种实现智能音箱人机对话的系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104883503A (zh) | 基于语音的个性化拍照技术 | |
CN105204357B (zh) | 智能家居设备的情景模式调整方法及装置 | |
CN105204742B (zh) | 电子设备的控制方法、装置及终端 | |
CN106024009B (zh) | 音频处理方法及装置 | |
CN105657537B (zh) | 视频剪辑方法及装置 | |
WO2017059815A1 (zh) | 一种快速识别方法及家庭智能机器人 | |
CN108289169A (zh) | 拍摄方法、装置、电子设备及存储介质 | |
CN104580886B (zh) | 拍摄控制方法及装置 | |
CN107396177A (zh) | 视频播放方法、装置及存储介质 | |
CN105592264A (zh) | 一种语音控制拍照软件 | |
CN107708007A (zh) | 一种无线耳机控制方法、装置和无线耳机 | |
TW201807565A (zh) | 基於語音分享資訊的方法、裝置與移動終端 | |
CN106791921A (zh) | 视频直播的处理方法及装置 | |
CN107871494B (zh) | 一种语音合成的方法、装置及电子设备 | |
CN109151642B (zh) | 一种智能耳机、智能耳机处理方法、电子设备及存储介质 | |
CN108985176A (zh) | 图像生成方法及装置 | |
CN105447150A (zh) | 基于面孔相册的音乐播放方法、装置和终端设备 | |
CN107945806B (zh) | 基于声音特征的用户识别方法及装置 | |
WO2016183961A1 (zh) | 智能设备的界面切换方法、系统、设备及非易失性计算机存储介质 | |
CN108806714A (zh) | 调节音量的方法和装置 | |
CN106791394A (zh) | 图像处理方法及装置 | |
CN108986803A (zh) | 场景控制方法及装置、电子设备、可读存储介质 | |
CN109992754A (zh) | 文档处理方法及装置 | |
CN109961793A (zh) | 处理语音信息的方法及装置 | |
CN106303253A (zh) | 一种语音控制拍照的拍照方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150902 |