CN109726764A - 一种模型选择方法、装置、设备和介质 - Google Patents
一种模型选择方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN109726764A CN109726764A CN201811643389.6A CN201811643389A CN109726764A CN 109726764 A CN109726764 A CN 109726764A CN 201811643389 A CN201811643389 A CN 201811643389A CN 109726764 A CN109726764 A CN 109726764A
- Authority
- CN
- China
- Prior art keywords
- model
- preset model
- preset
- training
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010187 selection method Methods 0.000 title abstract description 14
- 238000012549 training Methods 0.000 claims abstract description 117
- 238000012360 testing method Methods 0.000 claims description 58
- 238000004364 calculation method Methods 0.000 claims description 43
- 238000005259 measurement Methods 0.000 claims description 26
- 238000000034 method Methods 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 10
- 238000012821 model calculation Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012857 repacking Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种模型选择方法、装置、设备和介质,所述模型选择方法,包括:获取属于同一预设模型分类的至少一个预设模型对应的训练数据;针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;根据各所述所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。通过本申请实施例可以在对多个预设模型进行训练的同时,还可以计算出每个预设模型的模型度量参数,提高了用户的体验效果。
Description
技术领域
本申请涉及数据处理领域,尤其涉及一种模型选择方法、装置、设备和介质。
背景技术
随着工业的飞速发展,工业领域中各类生产制造、工艺流程、经营理念、管理经验等各种无形的数字资产越来越多,为了便于对这些数字资产的管理,将这些数字资产转变成工业算法模型,因此,工业算法模型的数量也越来越多。
现有技术中,用户在应用工业算法模型时,需要在数量庞大的工业算法模型中选出满足用户需求工业算法模型,最终选择出的满足用户需求的工业算法模型可能有多个,用户获取的各个工业算法模型都基本符合用户的需求。
发明内容
有鉴于此,本申请的目的在于提供了一种模型选择方法、装置、设备和介质,解决了现有技术中在多个模型中选出目标模型的效率低的问题。
第一方面,本申请实施例提供了一种模型选择方法,包括:
获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
可选的,所述获取属于同一预设模型分类的至少一个预设模型对应的训练数据,包括:
获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
可选的,所述确定该预设模型对应的模型度量参数,包括:
获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型,确定该完成训练的预设模型的测试结果;
基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
可选的,所述根据各所述所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型,包括:
将表征最大值的模型准确率对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型;或者,
将表征最小值的模型训练时间对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型。
可选的,所述获取属于同一预设模型分类的至少一个预设模型对应的训练数据,包括:
若确定所述训练数据的数据量大于设定数据量阈值,则按照设定数据获取方式获取所述训练数据。
第二方面,本申请实施例提供了一种模型选择装置,包括:
获取数据模块,用于获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
计算模块,用于针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
确定模块,用于根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
可选的,所述获取模块具体用于:
获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
可选的,所述计算模块具体用于:
获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型确定该完成训练的预设模型的测试结果;
基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述的方法的步骤。
本发明实施例提供的模型选择方法,通过训练数据对属于同一预设模型分类的至少一个预设模型进行训练,并确定每个预设模型的模型度量参数,根据模型度量参数从属于同一预设模型分类的至少一个预设模型中选出最优模型,最优模型就是用户需要的目标模型,通过本申请实施例可以在对多个预设模型进行训练的同时,还可以计算出每个预设模型的模型度量参数,可以根据各模型度量参数选出满足用户需求的最优模型,使得用户得到的数量较少的目标模型,与现有技术相比可以让用户的选择更具有针对性,可以在同类型的多个预设模型中选出最符合用户要求的预设模型,也提高了用户的体验效果。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种模型选择方法的流程示意图;
图2为本申请实施例提供的一种计算模型度量参数方法的流程示意图;
图3为本申请实施例提供的一种模型选择装置的结构示意图;
图4为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到现有技术中部队模拟训练系统是通过嵌入式方式将单片机设置在作战设备中,进而采集作战设备的操作数据,通过嵌入式方式设置单片机需要对作战设备进行改装,改装后的作战设备在实战中应用时,会对实战结果造成不利影响。基于此,本发明实施例提供了一种固定结构、传感器和模拟系统,下面通过实施例进行描述。
用户如图1所示,本申请实施例提供了一种模型选择方法,包括:
101,获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
这里,预设模型是预先设置好的模型,例如,预先设置好的模型可以为卷积神经网络模型、贝叶斯算法模型、正则化算法模型等,预设模型分类一般是基于预设模型的应用场景确定,例如,刀具寿命预测、设备污染超标分析等,训练数据是用来训练预设模型的数据。
例如,预设分类是刀具寿命预测,通过刀具寿命预测获取对应的刀具寿命预测训练数据;预设分类是设备污染超标分析,通过设备污染超标分析获取对应的设备污染超标分析训练数据。
具体的,根据用户需求在所有的预设模型中选出同一预设模型分类的所有预设模型,针对选择的每个预设模型关联同一训练数据。
例如,用户的需求是预测模型,属于预测类别的预测模型有3个,包括预测模型A、预测模型B、预测模型C,根据预测类别获取训练数据,将该训练数据分别与预测模型A、预测模型B、预测模型C关联。
在步骤101中,获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
这里,元数据是用来描述数据属性的信息,包括但不限于数据的存储地址、数据库的用户账号、用户密码等,数据库中存储有训练数据、测试数据等,测试数据是用来检测预设模型是否准确的数据,测试数据包括未标注测试数据和标注测试数据。
在获取到与各预设模型属于同一预设模型分类的元数据后,将元数据与各预设模型进行关联,根据元数据中的数据库地址找到对应的数据库,利用元数据中的用户账号和用户密码从数据库中获取用户所需数据,用户所需数据包括训练数据。
102,针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
这里,模型度量参数是用来度量完成训练的预设模型的数据,模型度量参数包括准确率和计算时间,准确率是将测试数据中的所有未标注测试数据输入到完成训练的预设模型中计算得到的正确结果数量与所有结果数量的百分比,计算时间是将测试数据中的未标注测试数据输入到完成训练的预设模型中计算完成后所需的时间。
如图2所示,本申请实施例提供了一种计算模型度量参数方法,在步骤102中,所述确定该预设模型对应的模型度量参数,包括:
201,获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
202,针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型,确定该完成训练的预设模型的测试结果;
203,基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
具体的,将获取的训练数据输入到对同一预设模型分类的每一个预设模型中,对输入训练数据的预设模型进行训练,在训练完成后,获取测试数据,将未标注测试数据输入到完成训练的预设模型中,通过预设模型对未标注测试数据进行计算,得到计算结果,将得到的计算结果与标注测试数据进行比对,计算结果与标注测试数据大于设定阈值时,标记该预设模型的计算结果为正确,计算结果与标注测试数据小于设定阈值时,标记该预设模型的计算结果为错误,计算正确的计算结果数量与所有计算结果数量的百分比,该百分比为该预设模型的准确率,在计算输入了未标注测试数据的预设模型时,还可以记录完成计算所用的计算时间,其中,设定阈值可以是计算结果与标注测试数据的相似度,比如,90%。
延续上述步骤101中获取训练数据的示例,将获取的训练数据分别对预测模型A、预测模型B、预测模型C进行训练,得到完成训练的预测模型A1、预测模型B1、预测模型C1,获取了100组标注测试数据和未标注测试数据,将这100组数据中的未标注测试数据分别输入到预测模型A1、预测模型B1、预测模型C1中,针对预测模型A1,通过预测模型A1对未标注测试数据进行计算,得到100组计算结果,将这100组计算结果与100组的标注数据进行比对,得到80组计算结果是正确的,则预测模型A1的准确率为80%,同理,通过与计算预测模型A1准确率的示例相同的方法计算预测模型B1、预测模型C1的准确率,预测模型B1的准确率为70%,预测模型C1的准确率为85%。
103,根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
这里,目标模型是满足用户需求的模型。
在步骤103中,将表征最大值的模型准确率对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型;或者,
将表征最小值的模型训练时间对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型。
当用户所需的模型是准确率较高的目标模型时,根据计算得到的各准确率,在属于同一预设模型分类的所有预设模型中选择出与最大准确率对应的预设模型,则该预设模型就是用户所需的目标模型。
延续步骤102中的计算预设模型准确率的示例,根据预测模型A1的准确率为80%、预测模型B1的准确率为70%、预测模型C1的准确率为85%,在三个预设模型中的准确率最大的是预测模型C1,则预测模型C1是用户所需的目标模型。
当用户所需的模型是计算时间短的目标模型时,根据输入了未标注测试数据的预设模型的计算时间,在属于同一预设模型分类的所有预设模型中选择出与最短计算时间对应的预设模型,则该预设模型就是用户所需的目标模型。
延续步骤102中的计算预设模型准确率的示例,在计算预测模型A1、预测模型B1、预测模型C1准确率的同时,记录预测模型A1、预测模型B1、预测模型C1的计算时间,预测模型A1的计算时间为10s,预测模型B1的计算时间为15s,预测模型C1的计算时间为20s,在三个预测模型中计算时间最短的是预测模型A1,则预测模型A1是用户所需的目标模型。
当属于同一预设模型分类的所有预设模型中有至少两个预设模型的准确率相同时,根据至少两个预设模型的计算时间,在至少两个预设模型中选择出与最短计算时间对应的预设模型,则该预设模型就是用户所需的目标模型。
例如,三个完成训练的预测模型包括预测模型A2、预测模型B2、预测模型C2,预测模型A2的准确率为85%、预测模型B2的准确率为70%、预测模型C2的准确率为85%,预测模型A2的计算时间为10s、预测模型B2的计算时间为15s、预测模型C2的计算时间为20s,在三个预测模型中准确率最大的预测模型为预测模型A2和预测模型C2,根据预测模型A2的计算时间和预测模型C2的计算时间,在两个预测模型中计算时间最短的是预测模型A2,则预测模型A2用户的目标模型。
当属于同一预设模型分类的所有预设模型中有至少两个预设模型的计算时间相同时,根据至少两个预设模型的准确率,在至少两个预设模型中选择出与最大准确率对应的预设模型,则该预设模型就是用户所需的目标模型。
例如,三个完成训练的预测模型包括预测模型A3、预测模型B3、预测模型C3,预测模型A3的准确率为75%、预测模型B3的准确率为70%、预测模型C3的准确率为85%,预测模型A3的计算时间为10s、预测模型B3的计算时间为15s、预测模型C3的计算时间为10s,在三个预测模型中计算时间最短的预测模型为预测模型A3和预测模型C3,根据预测模型A3的准确率和预测模型C3的准确率,在两个预测模型中准确率最大的是预测模型C3,则预测模型C3用户的目标模型。
在步骤101中,所述获取属于同一预设模型分类的至少一个预设模型对应的训练数据,包括:
若确定所述训练数据的数据量大于设定数据量阈值,则按照设定数据获取方式获取所述训练数据。
这里,设定数据量阈值是用来标记数据量的值,例如,1TB、1GB等,设定数据获取方式是根据设置好的规则获取数据的方式,例如,消息队列等,本申请对此不予限制。
当通过元数据中的数据库地址获取到的训练数据的数据量太大时,服务器不能支持该训练数据的传输,使得预设模型不能正常的进行训练,为了能够让训练数据可以及时传输,以及预设模型可以根据该训练数据进行训练,需要将该训练数据按照一定的规则进行传输,使得预设模型可以及时的根据传输的训练数据进行训练,进而提高预设模型的训练效率。
例如,通过元数据中的数据库地址获取到训练数据,如果检测到训练数据的数据量大于1TB,则训练数据的数据量过大,以服务器的数据传输能力不能支持大于1TB数据量的数据传输,导致预设模型不能根据该训练数据进行训练,需要将该训练数据按照消息队列的方式进行传输,例如,将训练数据按照64M的数据量进行分割,训练数据的数据量可能不是64M的整数倍,则训练数据分割后,包含有不满于64M的数据量,以大于或者小于64M的数据量进行数据传输。
在通过元数据中的数据库地址获取到的训练数据与预设模型中的参数格式不同时,还需要将获取的训练数据的格式转换成预设模型中参数的格式,例如,获取的训练数据是文档格式,通过各式转换,将该训练数据转换成字符串格式。
本申请实施例提供的算法执行方法,通过训练数据对属于同一预设模型分类的至少一个预设模型进行训练,并确定每个预设模型的模型度量参数,根据模型度量参数从属于同一预设模型分类的至少一个预设模型中选出最优模型,最优模型就是用户需要的目标模型,通过本申请实施例可以在对多个预设模型进行训练的同时,还可以计算出每个预设模型的模型度量参数,可以根据各模型度量参数选出满足用户需求的最优模型,也提高了用户的体验效果。
本申请还提供了一种具体的算法执行方法使用场景,根据用户需求可知,用户需要两种目标模型,包括:分类模型和预测模型,其中,用户获取到5个分类模型和8个预测模型,在5个分类模型中,通过上述算法执行方法得到的最符合用户需求的目标模型的过程,需要较长的计算时间,为了节省用户的时间,可以通过开启多线程实现在计算并得到分类模型中的目标模型时,同时计算并得到预测模型的目标模型,计算并得到分类模型的目标模型的任务和计算并得到预测模型的目标模型的任务可以同时进行,节约了用户的时间,提高了用户得到目标模型的效率,从而提高了用户的体验效果。
针对每个预设模型对训练数据进行计算的过程中,如果训练数据的数据量较大时,可以通过分布式系统实现预设模型的训练,例如,预测模型D需要训练的训练数据的数据量较大,在计算机S中将预测模型D的训练任务发布至多个计算机(如,3个)中,首先,将预测模型D分布在3个计算机中,分别有计算机S1、计算机S2、计算机S3,然后,将训练数据分割成三分数据,分别用数据J1、数据J2、数据J3表征,将数据J1表征的训练数据分配给计算机S1,通过预测模型D对数据J1表征的训练数据进行训练,将数据J2表征的训练数据分配给计算机S2,通过预测模型D对数据J2表征的训练数据进行训练,将数据J3表征的训练数据分配给计算机S3,通过预测模型D对数据J3表征的训练数据进行训练,计算机S1、计算机S2、计算机S3将训练结果传输至计算机S,计算机S根据计算机S1、计算机S2、计算机S3的训练结果计算得到用户所需的预测模型。通过分布式系统对数据量较大的训练数据进行训练,不需要用户一直用同一个预测模型对所有训练数据进行训练,将训练数据分割成多份,针对每一份的训练数据都用同一个预测模型进行训练,缩短了预测模型对训练数据的训练时间,提高了用户得到目标模型的效率,进而提高了用户的体验效果。
如图3所示,本申请实施例提供了一种模型选择装置,包括:
获取数据模块301,用于获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
计算模块302,用于针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
确定模块303,用于根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
可选的,所述获取模块301具体用于:
获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
可选的,所述计算模块302具体用于:
获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型,确定该完成训练的预设模型的测试结果;
基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
可选的,所述确定模块303具体用于:
将表征最大值的模型准确率对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型;或者,
将表征最小值的模型计算时间对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型。
可选的,所述模型选择装置还包括:传输模块304,所述传输模块304具体用于:
若确定所述训练数据的数据量大于设定数据量阈值,则按照设定数据获取方式获取所述训练数据。
对应于图1中的模型选择方法,本申请实施例还提供了一种计算机设备400,如图4所示,该设备包括存储器401、处理器402及存储在该存储器401上并可在该处理器402上运行的计算机程序,其中,上述处理器402执行上述计算机程序时实现上述模型选择方法的步骤。
具体地,上述存储器401和处理器402能够为通用的存储器和处理器,这里不做具体限定,当处理器402运行存储器401存储的计算机程序时,能够执行上述模型选择方法,用于解决现有技术中在多个模型中选出目标模型的效率低的问题,通过本申请实施例可以在对多个预设模型进行训练的同时,还可以计算出每个预设模型的模型度量参数,可以根据各模型度量参数选出满足用户需求的最优模型,使得用户得到的数量较少的目标模型,与现有技术相比可以让用户的选择更具有针对性,可以在同类型的多个预设模型中选出最符合用户要求的预设模型,提高了用户的体验效果。
对应于图1中的模型选择方法,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述模型选择方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述模型选择方法,用于解决现有技术中在多个模型中选出目标模型的效率低的问题,通过本申请实施例可以在对多个预设模型进行训练的同时,还可以计算出每个预设模型的模型度量参数,可以根据各模型度量参数选出满足用户需求的最优模型,使得用户得到的数量较少的目标模型,与现有技术相比可以让用户的选择更具有针对性,可以在同类型的多个预设模型中选出最符合用户要求的预设模型,提高了用户的体验效果。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种模型选择方法,其特征在于,包括:
获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
2.如权利要求1所述的方法,其特征在于,所述获取属于同一预设模型分类的至少一个预设模型对应的训练数据,包括:
获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
3.根据权利要求1所述的方法,其特征在于,所述确定该预设模型对应的模型度量参数,包括:
获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型,确定该完成训练的预设模型的测试结果;
基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
4.根据权利要求1或3所述的方法,其特征在于,所述根据各所述所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型,包括:
将表征最大值的模型准确率对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型;或者,
将表征最小值的模型计算时间对应的完成训练的预设模型确定为所述同一预设模型分类对应的目标模型。
5.根据权利要求1所述的方法,其特征在于,所述获取属于同一预设模型分类的至少一个预设模型对应的训练数据,包括:
若确定所述训练数据的数据量大于设定数据量阈值,则按照设定数据获取方式获取所述训练数据。
6.一种模型选择装置,其特征在于,包括:
获取数据模块,用于获取属于同一预设模型分类的至少一个预设模型对应的训练数据;
计算模块,用于针对所述至少一个预设模型中的每个预设模型,根据所述训练数据对该预设模型进行训练,确定完成训练的预设模型和该预设模型对应的模型度量参数;
确定模块,用于根据各所述预设模型对应的模型度量参数,从所述完成训练的预设模型中,确定所述同一预设模型分类对应的目标模型。
7.如权利要求6所述的装置,其特征在于,所述获取模块具体用于:
获取属于同一预设模型分类的至少一个预设模型的元数据;
基于所述元数据,获取所述同一预设模型分类的至少一个预设模型的训练数据。
8.根据权利要求6所述的装置,其特征在于,所述计算模块具体用于:
获取属于同一预设模型分类的至少一个预设模型对应的标注测试数据和未标注测试数据;
针对每个完成训练的预设模型,将所述未标注测试数据输入到该完成训练的预设模型,确定该完成训练的预设模型的测试结果;
基于各完成训练的预设模型的测试结果和标注测试数据确定各完成训练预设模型的模型准确率,将该模型准确率作为所述模型度量参数。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-5中任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-5中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811643389.6A CN109726764A (zh) | 2018-12-29 | 2018-12-29 | 一种模型选择方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811643389.6A CN109726764A (zh) | 2018-12-29 | 2018-12-29 | 一种模型选择方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109726764A true CN109726764A (zh) | 2019-05-07 |
Family
ID=66299442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811643389.6A Pending CN109726764A (zh) | 2018-12-29 | 2018-12-29 | 一种模型选择方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109726764A (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110333994A (zh) * | 2019-07-08 | 2019-10-15 | 深圳乐信软件技术有限公司 | 一种数据集匹配的模型确定方法、装置、设备及存储介质 |
CN110443310A (zh) * | 2019-08-07 | 2019-11-12 | 浙江大华技术股份有限公司 | 比对分析系统的更新方法、服务器及计算机存储介质 |
CN110457369A (zh) * | 2019-08-07 | 2019-11-15 | 北京嘉和海森健康科技有限公司 | 一种模型的训练方法及相关设备 |
CN112149708A (zh) * | 2019-06-28 | 2020-12-29 | 富泰华工业(深圳)有限公司 | 数据模型选择优化方法、装置、计算机装置及存储介质 |
CN113284141A (zh) * | 2021-07-09 | 2021-08-20 | 武汉精创电子技术有限公司 | 用于缺陷检测的模型确定方法、装置和设备 |
CN113723467A (zh) * | 2021-08-05 | 2021-11-30 | 武汉精创电子技术有限公司 | 用于缺陷检测的样本收集方法、装置和设备 |
CN114831378A (zh) * | 2022-05-17 | 2022-08-02 | 杭州品茗安控信息技术股份有限公司 | 一种下颚带佩戴状态监控方法、装置、设备及存储介质 |
CN115689626A (zh) * | 2022-10-31 | 2023-02-03 | 荣耀终端有限公司 | 一种终端设备的用户属性确定方法及电子设备 |
CN112149708B (zh) * | 2019-06-28 | 2024-11-15 | 富泰华工业(深圳)有限公司 | 数据模型选择优化方法、装置、计算机装置及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268517A (zh) * | 2013-04-23 | 2013-08-28 | 重庆科技学院 | 基于支持向量机和遗传优化的多元质量过程失控信号诊断方法 |
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN107563999A (zh) * | 2017-09-05 | 2018-01-09 | 华中科技大学 | 一种基于卷积神经网络的芯片缺陷识别方法 |
CN107566907A (zh) * | 2017-09-20 | 2018-01-09 | 广东欧珀移动通信有限公司 | 视频剪辑方法、装置、存储介质及终端 |
CN108446388A (zh) * | 2018-03-22 | 2018-08-24 | 平安科技(深圳)有限公司 | 文本数据质检方法、装置、设备及计算机可读存储介质 |
CN109033921A (zh) * | 2017-06-08 | 2018-12-18 | 北京君正集成电路股份有限公司 | 一种识别模型的训练方法和装置 |
CN109086825A (zh) * | 2018-08-03 | 2018-12-25 | 北京邮电大学 | 一种基于模型自适应选择的多分类模型融合方法 |
-
2018
- 2018-12-29 CN CN201811643389.6A patent/CN109726764A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103268517A (zh) * | 2013-04-23 | 2013-08-28 | 重庆科技学院 | 基于支持向量机和遗传优化的多元质量过程失控信号诊断方法 |
CN103412882A (zh) * | 2013-07-18 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 一种识别消费意图的方法及装置 |
CN109033921A (zh) * | 2017-06-08 | 2018-12-18 | 北京君正集成电路股份有限公司 | 一种识别模型的训练方法和装置 |
CN107563999A (zh) * | 2017-09-05 | 2018-01-09 | 华中科技大学 | 一种基于卷积神经网络的芯片缺陷识别方法 |
CN107566907A (zh) * | 2017-09-20 | 2018-01-09 | 广东欧珀移动通信有限公司 | 视频剪辑方法、装置、存储介质及终端 |
CN108446388A (zh) * | 2018-03-22 | 2018-08-24 | 平安科技(深圳)有限公司 | 文本数据质检方法、装置、设备及计算机可读存储介质 |
CN109086825A (zh) * | 2018-08-03 | 2018-12-25 | 北京邮电大学 | 一种基于模型自适应选择的多分类模型融合方法 |
Non-Patent Citations (1)
Title |
---|
王喜宾 等: "《基于优化支持向量机的个性化推荐研究》", 30 June 2017, 重庆大学出版社 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112149708A (zh) * | 2019-06-28 | 2020-12-29 | 富泰华工业(深圳)有限公司 | 数据模型选择优化方法、装置、计算机装置及存储介质 |
CN112149708B (zh) * | 2019-06-28 | 2024-11-15 | 富泰华工业(深圳)有限公司 | 数据模型选择优化方法、装置、计算机装置及存储介质 |
CN110333994A (zh) * | 2019-07-08 | 2019-10-15 | 深圳乐信软件技术有限公司 | 一种数据集匹配的模型确定方法、装置、设备及存储介质 |
CN110333994B (zh) * | 2019-07-08 | 2023-06-06 | 深圳乐信软件技术有限公司 | 一种数据集匹配的模型确定方法、装置、设备及存储介质 |
CN110443310A (zh) * | 2019-08-07 | 2019-11-12 | 浙江大华技术股份有限公司 | 比对分析系统的更新方法、服务器及计算机存储介质 |
CN110457369A (zh) * | 2019-08-07 | 2019-11-15 | 北京嘉和海森健康科技有限公司 | 一种模型的训练方法及相关设备 |
CN110443310B (zh) * | 2019-08-07 | 2022-08-09 | 浙江大华技术股份有限公司 | 比对分析系统的更新方法、服务器及计算机存储介质 |
CN113284141A (zh) * | 2021-07-09 | 2021-08-20 | 武汉精创电子技术有限公司 | 用于缺陷检测的模型确定方法、装置和设备 |
CN113723467A (zh) * | 2021-08-05 | 2021-11-30 | 武汉精创电子技术有限公司 | 用于缺陷检测的样本收集方法、装置和设备 |
CN114831378A (zh) * | 2022-05-17 | 2022-08-02 | 杭州品茗安控信息技术股份有限公司 | 一种下颚带佩戴状态监控方法、装置、设备及存储介质 |
CN115689626A (zh) * | 2022-10-31 | 2023-02-03 | 荣耀终端有限公司 | 一种终端设备的用户属性确定方法及电子设备 |
CN115689626B (zh) * | 2022-10-31 | 2024-03-01 | 荣耀终端有限公司 | 一种终端设备的用户属性确定方法及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109726764A (zh) | 一种模型选择方法、装置、设备和介质 | |
CN106951925B (zh) | 数据处理方法、装置、服务器及系统 | |
CN105678587B (zh) | 一种推荐特征确定方法、信息推荐方法及装置 | |
CN105893406A (zh) | 群体用户画像方法及系统 | |
US20190266619A1 (en) | Behavior pattern search system and behavior pattern search method | |
JP5282857B1 (ja) | 情報拡散規模予測装置、情報拡散規模予測方法、および情報拡散規模予測プログラム | |
US20130231975A1 (en) | Product cycle analysis using social media data | |
CN111160783B (zh) | 数字资产价值的评价方法、系统及电子设备 | |
CN105580043A (zh) | 用于推荐系统的基于强度的建模 | |
US20230045330A1 (en) | Multi-term query subsumption for document classification | |
CN112613938A (zh) | 模型训练方法、装置及计算机设备 | |
JP7559762B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
Chen et al. | Kickpredict: Predicting kickstarter success | |
CN113886697A (zh) | 基于聚类算法的活动推荐方法、装置、设备及存储介质 | |
CN110520702A (zh) | 监视电子设备的热健康 | |
CN112070559A (zh) | 状态获取方法和装置、电子设备和存储介质 | |
CN109711849B (zh) | 以太坊地址画像生成方法、装置、电子设备及存储介质 | |
US20180211195A1 (en) | Method of predicting project outcomes | |
CN113935788B (zh) | 模型评估方法、装置、设备及计算机可读存储介质 | |
CN117634506B (zh) | 一种目标语言模型的训练方法、装置和电子设备 | |
CN110858343A (zh) | 一种数据资产价值评估系统以及方法 | |
CN113742069A (zh) | 基于人工智能的容量预测方法、装置及存储介质 | |
CN108073464A (zh) | 一种基于速度和加速度的时序数据异常点检测方法及装置 | |
CN113822693A (zh) | 用户购买力评价值的生成方法、装置、设备及存储介质 | |
CN109600627B (zh) | 一种视频识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190507 |
|
RJ01 | Rejection of invention patent application after publication |