CN106802885A - 一种会议纪要自动记录方法、装置和电子设备 - Google Patents
一种会议纪要自动记录方法、装置和电子设备 Download PDFInfo
- Publication number
- CN106802885A CN106802885A CN201611107537.3A CN201611107537A CN106802885A CN 106802885 A CN106802885 A CN 106802885A CN 201611107537 A CN201611107537 A CN 201611107537A CN 106802885 A CN106802885 A CN 106802885A
- Authority
- CN
- China
- Prior art keywords
- recording
- text character
- keyword
- character string
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000015654 memory Effects 0.000 claims description 16
- 230000011218 segmentation Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例公开了一种会议纪要自动记录方法、装置和电子设备,所述方法包括:获取语音信号;将所述语音信号分段;将各个语音段转换成对应的本文字符串;逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。本发明实施例使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
Description
技术领域
本发明实施例涉及通信技术领域,特别是涉及一种会议纪要自动记录方法、装置和电子设备。
背景技术
对于一些比较重要的会议,需要对关键内容进行记录,采用人工记录的方式耗费人力,目前已有自动对会议内容进行记录的技术,通常是将与会者发出的语音信号直接转换成文本字符予以保存。
实现本发明过程中,发明人发现相关技术中至少存在如下问题:将与会者的语音信号直接转换成文本字符进行保存而形成的会议记录比较冗长,观看会议记录的人需要通篇浏览才能提炼出想了解的关键内容,效率较差。
发明内容
本发明实施例主要解决的技术问题是提供一种会议纪要自动记录方法、装置和电子设备,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
为解决上述技术问题,第一方面,本发明实施例提供了一种会议纪要自动记录方法,包括:
获取语音信号;
将所述语音信号转换成对应的文本字符;
确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
可选的,所述方法在从首次出现关键词的位置开始记录所述文本字符的内容之后还包括:
确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
为解决上述技术问题,第二方面,本发明实施例提供了一种会议纪要自动记录方法,所述方法包括:
获取语音信号;
将所述语音信号分段;
将各个语音段转换成对应的本文字符串;
逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
可选的,所述基于所述文本字符串进行记录,包括:
记录所述文本字符串的内容。
可选的,所述将所述语音信号分段,包括:
将所述语音信号按预设时间段进行分段;
所述基于所述文本字符串进行记录,包括:
确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
可选的,所述方法还包括:将记录的内容根据预设的关键词集合中的关键词进行分类。
可选的,所述方法还包括:
接收关键词设置指令,根据关键词设置指令建立关键词集合。
为解决上述技术问题,第三方面,本发明实施例提供了一种会议纪要自动记录装置,包括:
第一语音信号获取模块,用于获取语音信号;
第一转换模块,用于将所述语音信号转换成对应的文本字符;
第一记录模块,用于确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
可选的,所述装置还包括:
结束记录模块,用于确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
为解决上述技术问题,第四方面,本发明实施例提供了一种会议纪要自动记录装置,包括:
第二语音信号获取模块,用于获取语音信号;
语音信号分段模块,用于将所述语音信号分段;
第二转换模块,用于将各个语音段转换成对应的本文字符串;
第二记录模块,用于逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
可选的,所述第二记录模块,包括:
第一记录子模块,用于记录所述文本字符串的内容。
可选的,所述语音信号分段模块,包括:
语音信号分段子模块,用于将所述语音信号按预设时间段进行分段;
所述第二记录模块包括:
第二记录子模块,用于确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
可选的,所述装置还包括:
分类模块,用于将记录的内容根据预设的关键词集合中的关键词进行分类。
可选的,所述装置还包括:
关键词集合建立模块,用于接收关键词设置指令,根据关键词设置指令建立关键词集合。
第五方面,本申请实施例还提供了一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
第六方面,本申请实施例还提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,当所述计算机可执行指令被电子设备执行时,使所述电子设备执行如上所述的方法。
第七方面,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被电子设备执行时,使所述电子设备执行如上所述的方法。
本发明实施例的有益效果是:本发明实施例通过将会议发言者的语音信号转化成对应的文本字符,然后判断所述文本字符是否含有预设的关键词,对于部分不含有预设关键词的文本字符串不予记录。这样就能排除掉一些与会议主题不太相关的内容,避免会议记录冗长,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
附图说明
图1是本发明会议纪要自动记录方法的一个实施例的流程图;
图2是本发明会议纪要自动记录方法的一个实施例的流程图;
图3是本发明会议纪要自动记录方法的一个实施例的流程图;
图4是本发明会议纪要自动记录方法的一个实施例的流程图;
图5是本发明会议纪要自动记录装置的一个实施例的结构示意图;
图6是本发明会议纪要自动记录装置的一个实施例的结构示意图;
图7是本发明会议纪要自动记录装置的一个实施例的结构示意图;
图8是本发明会议纪要自动记录方法的一个实施例的流程图;
图9是本发明会议纪要自动记录方法的一个实施例的流程图;
图10是本发明会议纪要自动记录装置的一个实施例的结构示意图;
图11是本发明会议纪要自动记录装置的一个实施例的结构示意图;
图12是本发明实施例提供的会议纪要自动记录方法的电子设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种会议纪要自动记录方法,所述方法包括:
步骤101:获取语音信号;
其中,所述语音信号可以是会议录音的语音信号,也可以是实时获取的语音信号。
步骤102:将所述语音信号分段;
即将所述语音信号切割成更小的单位以便进行处理。
步骤103:将各个语音段转换成对应的本文字符串;
即将步骤102中分割的各个语音段转换成对应的文本字符串,具体应用中,可以采用语音识别技术对语音进行转换。
步骤104:逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
对步骤103中获得的各个文本字符串,逐一确定每个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是,则针对该文本字符串予以记录,否则不予记录。每个文本字符串有可能包含一个关键词也有可能包含多个关键词,对于包含一个或多个预设关键词的文本字符串都予以记录,对于不包含任何预设关键词的文本字符串,不予记录。其中所述关键词集合预先设置,为数个关键词的集合。所述关键词可以为任何词,例如计划、目标、第一季度,2016年等。
本发明实施例通过对会议发言者的语音信号进行分段,然后逐段判断每段语音信号对应的文本字符串是否含有预设的关键词,如果含有预设的关键词则予以记录,否则不予记录。这样就能排除掉一些与会议主题不太相关的内容,避免会议记录冗长,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
可选的,在所述方法的其他实施例中,所述将所述语音信号分段,包括:
将所述语音信号按预设时间段进行分段。
所述预设时间预先设置,例如可以是1分钟或者30秒。以1分钟的场合来说明,假设语音信号时长10分30秒,则可以将该语音信号分成10段长1分钟的语音段和1段长30秒的语音段。
可选的,在所述方法的某些实施例中,所述基于所述文本字符串进行记录,包括:
记录所述文本字符串的内容。
如图2所示,为所述方法的一个实施例的流程图,在该实施例中,所述方法包括:
步骤201:获取语音信号;
步骤202:将所述语音信号分段;
步骤203:将各个语音段转换成对应的本文字符串;
步骤204:逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则记录所述文本字符串的内容,否则,不予记录。
在该实施例中,对每个语音段对应的文本字符串进行确定该文本字符串中是否包含预设的关键词集合中的任一关键词,如果包含预设关键词则记录该文本字符串的内容。这种记录方式可以保证全面记录,避免遗漏内容。
可选的,在所述方法的另一实施例中,只记录文本字符串的部分内容,进一步简化会议记录,即所述基于所述文本字符串进行记录,包括:
确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
需要说明的是,当当前文本字符串对应的语音段为首个时间段的语音段时,即当前文本字符串对应的语音段的相邻前一预设时间段的语音段不存在时,属于当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串为空的情形,则当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串与当前文本字符串不含有相同得关键词,记录当前文本字符串从关键词开始到结尾的部分。
如图3所示,为所述方法的一个实施例的流程图,在该实施例中,所述方法包括:
步骤301:获取语音信号;
步骤302:将所述语音信号按预设时间段进行分段;
步骤303:将各个语音段转换成对应的本文字符串;
步骤304:逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则进一步确定该文本字符串即当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。如果文本字符串不包含预设的关键词集合中的任一关键词,则不予记录。
即针对包含预设的关键词集合中的任一关键词的文本字符串进一步判断,将该文本字符串作为当前字符串,判断当前字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果含有相同的关键词,则记录该文本字符串的全部内容,如果不含有相同的关键词,则只记录该文本字符串的部分内容,记录从该关键词开始到该文本字符串的结尾部分。这种记录方式可以进一步简化会议记录。如果文本字符串包含多个关键词的场合,从第一个关键词开始记录。
可选的,在所述方法的其他实施例中,所述方法还包括:将记录的内容根据预设的关键词集合中的关键词进行分类。
假设关键词集合含有五个关键词,那么含有第一个关键词的集合分为一类,含有第二个关键词的集合分为一类,以此类推共分五类,在实际应用中,如果记录方式采用在文本文件中保存的方式,可以将同一类文本字符串集中到一起,这样更方便会议记录的观看者迅速抓到自己感兴趣的内容。在一个文本字符串含有多个预设关键词的场合,例如同时含有第一预设关键词和第二预设关键词,则可以只把该文本字符串归入第一预设关键词,也可以即把该文本字符串归入第一预设关键词又同时归入第二预设关键词。
可选的,在所述方法的其他实施例中,所述方法还包括:接收关键词设置指令,根据关键词设置指令建立关键词集合。
在实际应用中,还可以设置一用户界面,用于接收用户的关键词设置指令,用户可以根据自己感兴趣的话题设置若干个关键词,因为每次会议的内容不尽相同,可以根据本次会议的主题设置关键词。
如图4所示,为所述方法的一个实施例的流程图,在该实施例中,所述方法包括:
步骤401:接收关键词设置指令,根据关键词设置指令建立关键词集合。
步骤402:获取语音信号;
步骤403:将所述语音信号分段;
步骤404:将各个语音段转换成对应的本文字符串;
步骤405:逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则记录所述文本字符串的内容,否则,不予记录;
步骤406:将记录的内容根据预设的关键词集合中的关键词进行分类。
根据预设关键词对记录内容进行分类,可以将同一类文本字符串集中到一起,这样更方便会议记录的观看者迅速抓到自己感兴趣的内容。
相应的,如图5所示,本发明实施例还提供了一种会议纪要自动记录装置,所述装置包括:
第二语音信号获取模块501,用于获取语音信号;
语音信号分段模块502,用于将所述语音信号分段;
第二转换模块503,用于将各个语音段转换成对应的本文字符串;
第二记录模块504,用于逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
本发明实施例通过对会议发言者的语音信号进行分段,然后逐段判断每段语音信号对应的文本字符串是否含有预设的关键词,如果含有预设的关键词则予以记录,否则不予记录。这样就能排除掉一些与会议主题不太相关的内容,避免会议记录冗长,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
可选的,在所述装置的其他实施例中,所述语音信号分段模块,包括:
语音信号分段子模块,用于将所述语音信号按预设时间段进行分段。
可选的,在所述装置的其他实施例中,所述第二记录模块,包括:
第一记录子模块,用于记录所述文本字符串的内容。
可选的,在所述装置的其他实施例中,所述第二记录模块包括:
第二记录子模块,用于确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
如图6所示,为所述装置的一个实施例的结构示意图,在该实施例中,所述装置包括:
第二语音信号获取模块601,用于获取语音信号;
语音信号分段模块602包括语音信号分段子模块6021,所述语音信号分段子模块用于将所述语音信号按预设时间段进行分段;
第二转换模块603,用于将各个语音段转换成对应的本文字符串;
第二记录模块604,用于逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录;
第二记录模块604还包括第二记录子模块,用于对包含预设的关键词集合中的任一关键词的文本字符串,进一步确定该文本字符串即当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
这种记录方式可以进一步简化会议记录。
可选的,在所述装置的其他实施例中,所述装置还包括:
分类模块,用于将记录的内容根据预设的关键词集合中的关键词进行分类。
可选的,在所述装置的其他实施例中,所述装置还包括:
关键词集合建立模块,用于接收关键词设置指令,根据关键词设置指令建立关键词集合。
如图7所示,为所述装置的一个实施例的结构示意图,在该实施例中,所述装置包括:
关键词集合建立模块701,用于接收关键词设置指令,根据关键词设置指令建立关键词集合;
第二语音信号获取模块702,用于获取语音信号;
语音信号分段模块703,用于将所述语音信号分段;
第二转换模块704,用于将各个语音段转换成对应的本文字符串;
第二记录模块705,用于逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
分类模块706,用于将记录的内容根据预设的关键词集合中的关键词进行分类。
根据预设关键词对记录内容进行分类,可以将同一类文本字符串集中到一起,这样更方便会议记录的观看者迅速抓到自己感兴趣的内容。
需要说明的是,由于本发明实施例的装置实施例与方法实施例基于相同的发明构思,方法实施例中的技术内容同样适用于装置实施例,因此,装置实施例中与方法实施例相同的技术内容在此不再赘述。
相应的,如图8所述,本发明实施例还提供了一种会议纪要自动记录方法,所述方法包括:
步骤801:获取语音信号;
其中,所述语音信号可以是会议录音的语音信号,也可以是实时获取的语音信号。
步骤802:将所述语音信号转换成对应的文本字符;
即将步骤801中获得的语音信号转换成对应的文本字符,具体应用中,可以采用语音识别技术对语音信号进行转换。
步骤803:确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
例如预设的关键词集合包括第一关键词、第二关键词和第三关键词,则只要所述文本字符包含上述任一关键词,则进行记录。记录的位置从所述文本字符中首次出现关键词的位置开始记录。其中所述关键词集合预先设置,为数个关键词的集合。所述关键词可以为任何词,例如计划、目标、第一季度,2016年等。
本发明实施例通过将会议发言者的语音信号转化成对应的文本字符,然后判断所述文本字符是否含有预设的关键词,如果包含预设的关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,而对于首次出现关键词的位置之前的部分不予记录。这样就能排除掉一些与会议主题不太相关的内容,避免会议记录冗长,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
可选的,在所述方法的其他实施例中,所述方法在从首次出现关键词的位置开始记录所述文本字符的内容之后还包括:
确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
即确认所述文本字符首次出现关键词的位置之后的部分是否包含预设长度的不包含任何预设关键词的文本字符串,如果出现这样的字符串,说明该段内容与关键词涉及的内容无关,即关键词已经开始变化了,可以停止记录。假设预设长度为100,那么如果所述文本字符首次出现关键词的位置之后的部分包含长度为100的不包含任何关键词的文本字符串,则在所述文本字符串的第一个字符的位置停止记录,即记录到所述文本字符串的前一个字符为止。
如图9所示,为所述方法的一个实施例的流程图,所述方法包括:
步骤901:获取语音信号;
步骤902:将所述语音信号转换成对应的文本字符;
步骤903:确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录;
步骤904:确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
本发明实施例通过将会议发言者的语音信号转化成对应的文本字符,然后判断所述文本字符是否含有预设的关键词,如果包含预设的关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,而对于首次出现关键词的位置之前的部分不予记录。如果首次出现关键词的位置之后的部分存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,则停止记录。这样能进一步排除掉与会议主题不太相关的内容,避免会议记录冗长。
相应的,如图10所示,本发明实施例还提供了一种会议纪要自动记录装置,所述装置包括:第一语音信号获取模块1001,用于获取语音信号;
第一转换模块1002,用于将所述语音信号转换成对应的文本字符;
第一记录模块1003,用于确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
本发明实施例通过将会议发言者的语音信号转化成对应的文本字符,然后判断所述文本字符是否含有预设的关键词,如果包含预设的关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,而对于首次出现关键词的位置之前的部分不予记录。这样就能排除掉一些与会议主题不太相关的内容,避免会议记录冗长,使观看会议记录的人能高效的通过会议记录提炼出想了解的关键内容。
如图11所示,为所述装置的一个实施例的结构示意图,在该实施例中,所述装置包括:
第一语音信号获取模块1101,用于获取语音信号;
第一转换模块1102,用于将所述语音信号转换成对应的文本字符;
第一记录模块1103,用于确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录;
结束记录模块1104,用于确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
本发明实施例通过将会议发言者的语音信号转化成对应的文本字符,然后判断所述文本字符是否含有预设的关键词,如果包含预设的关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,而对于首次出现关键词的位置之前的部分不予记录。如果首次出现关键词的位置之后的部分存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,则停止记录。这样能进一步排除掉与会议主题不太相关的内容,避免会议记录冗长。
需要说明的是,由于本发明实施例的装置实施例与方法实施例基于相同的发明构思,方法实施例中的技术内容同样适用于装置实施例,因此,装置实施例中与方法实施例相同的技术内容在此不再赘述。
图12是本申请实施例提供的会议纪要自动记录方法的电子设备10的硬件结构示意图,如图12所示,该电子设备10包括:
一个或多个处理器11以及存储器12,图12中以一个处理器11为例。
处理器11和存储器12可以通过总线或者其他方式连接,图12中以通过总线连接为例。
存储器12作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的会议纪要自动记录方法对应的程序指令/模块(例如,附图5所示的第二语音信号获取模块501、语音信号分段模块502、第二转换模块503和第二记录模块504)。处理器11通过运行存储在存储器12中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例会议纪要自动记录方法。
存储器12可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据会议纪要自动记录装置的使用所创建的数据等。此外,存储器12可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器12可选包括相对于处理器11远程设置的存储器,这些远程存储器可以通过网络连接至会议纪要自动记录装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器12中,当被所述一个或者多个处理器11执行时,执行上述任意方法实施例中的会议纪要自动记录方法,例如,执行以上描述的图1中的方法步骤101至步骤104,图2中的方法步骤201至步骤204,图3中的方法步骤301至步骤304,图4中的方法步骤401至步骤406,图8中的方法步骤801至步骤803,图9中的方法步骤901至步骤904,实现图5中的模块501-504、图6中的模块601-604、子模块6021和6041,和实现图7中的模块701-706、图10中的模块1001-1004、图11中的模块1101-1104的功能。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
本申请实施例提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图12中的一个处理器11,可使得上述一个或多个处理器可执行上述任意方法实施例中的会议纪要自动记录方法,例如,执行以上描述的图1中的方法步骤101至步骤104,图2中的方法步骤201至步骤204,图3中的方法步骤301至步骤304,图4中的方法步骤401至步骤406,图8中的方法步骤801至步骤803,图9中的方法步骤901至步骤904,实现图5中的模块501-504、图6中的模块601-604、子模块6021和6041,和实现图7中的模块701-706、图10中的模块1001-1004、图11中的模块1101-1104的功能。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
通过以上的实施例的描述,本领域普通技术人员可以清楚地了解到各实施例可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (15)
1.一种会议纪要自动记录方法,其特征在于,包括:
获取语音信号;
将所述语音信号转换成对应的文本字符;
确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
2.根据权利要求1所述的方法,其特征在于,所述方法在从首次出现关键词的位置开始记录所述文本字符的内容之后还包括:
确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
3.一种会议纪要自动记录方法,其特征在于,包括:
获取语音信号;
将所述语音信号分段;
将各个语音段转换成对应的本文字符串;
逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
4.根据权利要求3所述的方法,其特征在于,所述基于所述文本字符串进行记录,包括:
记录所述文本字符串的内容。
5.根据权利要求3所述的方法,其特征在于,所述将所述语音信号分段,包括:
将所述语音信号按预设时间段进行分段;
所述基于所述文本字符串进行记录,包括:
确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
6.根据权利要求3-5的任一项所述的方法,其特征在于,所述方法还包括:将记录的内容根据预设的关键词集合中的关键词进行分类。
7.根据权利要求3所述的方法,其特征在于,所述方法还包括:
接收关键词设置指令,根据关键词设置指令建立关键词集合。
8.一种会议纪要自动记录装置,其特征在于,包括:
第一语音信号获取模块,用于获取语音信号;
第一转换模块,用于将所述语音信号转换成对应的文本字符;
第一记录模块,用于确定所述文本字符中是否包含预设的关键词集合中的任一关键词,如果包含预设的关键词集合中的任一关键词,则从首次出现关键词的位置开始记录所述文本字符的内容,否则,不予记录。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
结束记录模块,用于确定所述文本字符在首次出现关键词的位置之后的部分是否存在预设长度的不包含预设的关键词集合中的任一关键词的文本字符串,如果存在,则在所述文本字符串的起始位置停止对所述文本字符的记录。
10.一种会议纪要自动记录装置,其特征在于,包括:
第二语音信号获取模块,用于获取语音信号;
语音信号分段模块,用于将所述语音信号分段;
第二转换模块,用于将各个语音段转换成对应的本文字符串;
第二记录模块,用于逐一确定各个文本字符串中是否包含预设的关键词集合中的任一关键词,如果是包含预设的关键词集合中的任一关键词的文本字符串,则基于所述文本字符串进行记录,否则,不予记录。
11.根据权利要求10所述的装置,其特征在于,所述第二记录模块包括:
第一记录子模块,用于记录所述文本字符串的内容。
12.根据权利要求10所述的装置,其特征在于,所述语音信号分段模块,包括:
语音信号分段子模块,用于将所述语音信号按预设时间段进行分段;
所述第二记录模块包括:
第二记录子模块,用于确定当前文本字符串对应的语音段的相邻前一预设时间段的语音段对应的文本字符串是否与当前文本字符串含有相同关键词,如果是,则记录当前文本字符串的内容,如果否,则记录当前文本字符串从关键词开始到结尾的部分。
13.根据权利要求10-12的任一项所述的装置,其特征在于,所述装置还包括:
分类模块,用于将记录的内容根据预设的关键词集合中的关键词进行分类。
14.根据权利要求10所述的装置,其特征在于,所述装置还包括:
关键词集合建立模块,用于接收关键词设置指令,根据关键词设置指令建立关键词集合。
15.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7的任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611107537.3A CN106802885A (zh) | 2016-12-06 | 2016-12-06 | 一种会议纪要自动记录方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611107537.3A CN106802885A (zh) | 2016-12-06 | 2016-12-06 | 一种会议纪要自动记录方法、装置和电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106802885A true CN106802885A (zh) | 2017-06-06 |
Family
ID=58984028
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611107537.3A Pending CN106802885A (zh) | 2016-12-06 | 2016-12-06 | 一种会议纪要自动记录方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106802885A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316516A (zh) * | 2017-07-12 | 2017-11-03 | 马永怡 | 一种电子学习课程递送平台 |
CN108052578A (zh) * | 2017-12-08 | 2018-05-18 | 上海星佑网络科技有限公司 | 用于信息处理的方法和装置 |
CN108231064A (zh) * | 2018-01-02 | 2018-06-29 | 联想(北京)有限公司 | 一种数据处理方法及系统 |
CN108363765A (zh) * | 2018-02-06 | 2018-08-03 | 深圳市鹰硕技术有限公司 | 音频段落识别方法以及装置 |
CN108733649A (zh) * | 2018-04-25 | 2018-11-02 | 北京华夏电通科技有限公司 | 一种语音识别文本插入笔录文档的方法、装置及系统 |
WO2019095586A1 (zh) * | 2017-11-17 | 2019-05-23 | 平安科技(深圳)有限公司 | 会议纪要生成方法、应用服务器及计算机可读存储介质 |
CN110019744A (zh) * | 2018-08-17 | 2019-07-16 | 深圳壹账通智能科技有限公司 | 辅助生成会议纪要的方法、装置、设备及计算机存储介质 |
CN110099332A (zh) * | 2019-05-21 | 2019-08-06 | 科大讯飞股份有限公司 | 一种音频环境展示方法及装置 |
CN110263313A (zh) * | 2019-06-19 | 2019-09-20 | 安徽声讯信息技术有限公司 | 一种用于会议速记的人机协同编辑方法 |
WO2020073633A1 (zh) * | 2018-10-12 | 2020-04-16 | 深圳海翼智新科技有限公司 | 会议音箱及会议记录方法、设备、系统和计算机存储介质 |
CN111564157A (zh) * | 2020-03-18 | 2020-08-21 | 浙江省北大信息技术高等研究院 | 会议记录优化方法、装置、设备及存储介质 |
CN112687272A (zh) * | 2020-12-18 | 2021-04-20 | 北京金山云网络技术有限公司 | 一种会议纪要的记录方法、装置及电子设备 |
CN112802480A (zh) * | 2021-04-15 | 2021-05-14 | 广东际洲科技股份有限公司 | 基于多方交流的语音数据文字转化方法 |
CN113409777A (zh) * | 2020-03-16 | 2021-09-17 | 上海博泰悦臻网络技术服务有限公司 | 一种记录用户关注点的方法、车载主机及车辆 |
TWI761841B (zh) * | 2020-05-22 | 2022-04-21 | 緯創資通股份有限公司 | 基於語音對講功能的任務管理方法、系統與移動裝置 |
-
2016
- 2016-12-06 CN CN201611107537.3A patent/CN106802885A/zh active Pending
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107316516A (zh) * | 2017-07-12 | 2017-11-03 | 马永怡 | 一种电子学习课程递送平台 |
WO2019095586A1 (zh) * | 2017-11-17 | 2019-05-23 | 平安科技(深圳)有限公司 | 会议纪要生成方法、应用服务器及计算机可读存储介质 |
CN108052578A (zh) * | 2017-12-08 | 2018-05-18 | 上海星佑网络科技有限公司 | 用于信息处理的方法和装置 |
CN108052578B (zh) * | 2017-12-08 | 2020-07-28 | 上海星佑网络科技有限公司 | 用于信息处理的方法和装置 |
CN108231064A (zh) * | 2018-01-02 | 2018-06-29 | 联想(北京)有限公司 | 一种数据处理方法及系统 |
WO2019153406A1 (zh) * | 2018-02-06 | 2019-08-15 | 深圳市鹰硕技术有限公司 | 音频段落识别方法以及装置 |
CN108363765A (zh) * | 2018-02-06 | 2018-08-03 | 深圳市鹰硕技术有限公司 | 音频段落识别方法以及装置 |
CN108733649A (zh) * | 2018-04-25 | 2018-11-02 | 北京华夏电通科技有限公司 | 一种语音识别文本插入笔录文档的方法、装置及系统 |
CN110019744A (zh) * | 2018-08-17 | 2019-07-16 | 深圳壹账通智能科技有限公司 | 辅助生成会议纪要的方法、装置、设备及计算机存储介质 |
WO2020073633A1 (zh) * | 2018-10-12 | 2020-04-16 | 深圳海翼智新科技有限公司 | 会议音箱及会议记录方法、设备、系统和计算机存储介质 |
CN110099332A (zh) * | 2019-05-21 | 2019-08-06 | 科大讯飞股份有限公司 | 一种音频环境展示方法及装置 |
CN110263313A (zh) * | 2019-06-19 | 2019-09-20 | 安徽声讯信息技术有限公司 | 一种用于会议速记的人机协同编辑方法 |
CN110263313B (zh) * | 2019-06-19 | 2021-08-24 | 安徽声讯信息技术有限公司 | 一种用于会议速记的人机协同编辑方法 |
CN113409777A (zh) * | 2020-03-16 | 2021-09-17 | 上海博泰悦臻网络技术服务有限公司 | 一种记录用户关注点的方法、车载主机及车辆 |
CN111564157A (zh) * | 2020-03-18 | 2020-08-21 | 浙江省北大信息技术高等研究院 | 会议记录优化方法、装置、设备及存储介质 |
TWI761841B (zh) * | 2020-05-22 | 2022-04-21 | 緯創資通股份有限公司 | 基於語音對講功能的任務管理方法、系統與移動裝置 |
US11315574B2 (en) | 2020-05-22 | 2022-04-26 | Wistron Corporation | Mobile device, system and method for task management based on voice intercom function |
CN112687272A (zh) * | 2020-12-18 | 2021-04-20 | 北京金山云网络技术有限公司 | 一种会议纪要的记录方法、装置及电子设备 |
CN112802480A (zh) * | 2021-04-15 | 2021-05-14 | 广东际洲科技股份有限公司 | 基于多方交流的语音数据文字转化方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106802885A (zh) | 一种会议纪要自动记录方法、装置和电子设备 | |
US11176938B2 (en) | Method, device and storage medium for controlling game execution using voice intelligent interactive system | |
CN104869467B (zh) | 媒体播放中的信息输出方法、装置和系统 | |
CN109473104B (zh) | 语音识别网络延时优化方法及装置 | |
CN110390927B (zh) | 音频处理方法、装置、电子设备及计算机可读存储介质 | |
US20170154450A1 (en) | Multimedia Picture Generating Method, Device and Electronic Device | |
CN106658200A (zh) | 直播视频分享和获取的方法、装置及其终端设备 | |
CN109947984A (zh) | 一种针对儿童的内容推送方法及推送装置 | |
CN106454497A (zh) | 一种投屏播放视频的方法及装置 | |
CN107733666A (zh) | 一种会议实现方法、装置及电子设备 | |
EP3203749A1 (en) | Method for switching video playing terminal, and terminal device | |
CN108304368B (zh) | 文本信息的类型识别方法和装置及存储介质和处理器 | |
CN106384591A (zh) | 一种与语音助手应用交互的方法和装置 | |
CN110246501B (zh) | 用于会议记录的语音识别方法及系统 | |
CN111798279A (zh) | 基于对话的用户画像生成方法和装置 | |
US20170171621A1 (en) | Method and Electronic Device for Information Processing | |
CN106782604A (zh) | 语音消息的处理方法、装置及其电子设备 | |
CN110267113A (zh) | 视频文件加工方法、系统、介质和电子设备 | |
US20150156236A1 (en) | Synchronize Tape Delay and Social Networking Experience | |
US20170180445A1 (en) | Advertisement data acquisition method and electronic equipment | |
US20170168660A1 (en) | Voice bullet screen generation method and electronic device | |
CN110910874A (zh) | 一种互动课堂语音控制方法、终端设备、服务器和系统 | |
US20170171339A1 (en) | Advertisement data transmission method, electrnoic device and system | |
CN106815042A (zh) | 刷新页面的动态加载方法、装置及电子设备 | |
CN113284500B (zh) | 音频处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170606 |