CN112596919A - 模型调用方法、装置、设备及存储介质 - Google Patents
模型调用方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112596919A CN112596919A CN202011478851.9A CN202011478851A CN112596919A CN 112596919 A CN112596919 A CN 112596919A CN 202011478851 A CN202011478851 A CN 202011478851A CN 112596919 A CN112596919 A CN 112596919A
- Authority
- CN
- China
- Prior art keywords
- model
- request
- server
- preset
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 230000015654 memory Effects 0.000 claims description 36
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000000977 initiatory effect Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 abstract description 7
- 238000010586 diagram Methods 0.000 description 7
- 241000282326 Felis catus Species 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/547—Remote procedure calls [RPC]; Web services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9566—URL specific, e.g. using aliases, detecting broken or misspelled links
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及数据处理领域,提供了一种模型调用方法、装置、设备及存储介质。通过接收客户端发出的模型调用的请求,根据请求携带的标识从预设数据库获取待调用模型的配置信息,基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将待调用模型的配置信息发送至目标服务器,目标服务器基于配置信息生成请求对应的URL地址,基于URL地址向目标服务器调用所述请求对应的模型,当判断调用到请求对应的模型时,将该模型反馈至客户端,本发明可以在调用模型时实现负载均衡,且模型对外提供服务的URL地址动态化和规范化。本发明还涉及区块链技术领域,上述配置信息及待调用的模型还可以存储于一区块链的节点中。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种模型调用方法、装置、设备及存储介质。
背景技术
模型是采用预设的机器学习算法对预设样本进行训练得到的模型,模型的文件通常被应用程序调用。
目前,一般将待上线的模型文件部署在服务器中,在服务器集群中,可以通过集群中的任意一台服务器调用模型,但调用模型时可能出现负载不均衡的情况(例如,调用模型的服务器负载过高),且存在调用模型的URL地址不规范的问题。
发明内容
鉴于以上内容,本发明提供一种模型调用方法、装置、设备及存储介质,其目的在于解决现有技术中调用模型时可能出现负载不均衡的技术问题。
为实现上述目的,本发明提供一种模型调用方法,该方法包括:
接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
优选的,所述基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,包括:
获取服务器IP地址集合中各个服务器的预设指标的指标值,基于各所述预设指标的指标值及预设计算规则,计算得到各个服务器的资源使用率,将所述资源使用率最低的服务器作为所述目标服务器。
优选的,所述预设计算规则包括:
Li=1-(1-W1×Xi1)×(1-W2×Xi2)×(1-W3×Xi3)
其中,Li表示第i个服务器的资源使用率,Xi1表示第i个服务器的CPU的使用率,Xi2表示第i个服务器内存的使用率,Xi3表示第i服务器的网络使用率,W1表示第i服务器的CPU的预设权重,W2表示第i服务器内存的预设权重,W3表示第i服务器的网络的预设权重。
优选的,所述配置信息包括:模型所在的服务器信息、模型服务端口信息、模型名称信息及模型的版本信息,所述目标服务器基于所述配置信息生成所述请求对应的URL地址,包括:
将所述配置信息的模型所在的服务器信息、模型服务端口信息、模型名称信息、模型的版本信息依次填充至预设URL模板中得到所述请求对应的URL地址。
优选的,所述判断是否调用到所述请求对应的模型,包括:
当判断未调用到所述请求对应的模型时,从所述服务器IP地址集合中随机选取一个IP地址对应的服务器,基于所述URL地址向该服务器调用所述请求对应的模型。
优选的,所述判断是否调用到所述请求对应的模型,包括:
当判断连续预设次数未调用到所述请求对应的模型时,生成第一预设提示信息并发送至预设终端。
优选的,在所述接收客户端发出的模型调用的请求之前,所述方法还包括:
获取所述客户端对应用户的身份信息,将所述身份信息与具备发起调用请求权限的白名单进行匹配,当匹配成功时,执行后续步骤,当匹配失败时,拒绝所述请求并反馈第二预设提示信息。
为实现上述目的,本发明还提供一种模型调用装置,该模型调用装置包括:
接收模块:用于接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
生成模块:用于基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
调用模块:用于基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
为实现上述目的,本发明还提供一种电子设备,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的模型调用方法的任意步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有模型调用程序,所述模型调用程序被处理器执行时,实现如上所述模型调用方法的任意步骤。
本发明提出的模型调用方法、装置、设备及存储介质,通过结合服务器的资源使用率来调用模型,可以在调用模型时实现负载均衡,且模型对外提供服务的URL地址动态化和规范化。
附图说明
图1为本发明模型调用方法较佳实施例的流程图示意图;
图2为本发明模型调用装置较佳实施例的模块示意图;
图3为本发明电子设备较佳实施例的示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供一种模型调用方法。参照图1所示,为本发明模型调用方法的实施例的方法流程示意图。该方法可以由一个电子设备执行,该电子设备可以由软件和/或硬件实现。模型调用方法包括:
步骤S10:接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息。
在本实施例中,当用户需要调用已上线的模型时,用户可以开启终端上用于调用已上线模型的应用程序,通过该应用程序输入需要调用的模型的相关信息(例如,模型的标识或名称),用户输入需要调用的模型的相关信息后,可以将模型的相关信息提交并发出模型服务调用的请求,服务器接收到用户发出的调用模型服务的请求后,解析请求获取请求中携带的待调用模型的相关信息,其中,请求中可以包括待调用模型的相关信息,也可以包括待调用模型的相关信息的存储路径。也就是说,相关信息可以是用户在提交调用模型请求时一并录入,也可以是用户提交调用模型请求之后应用程序从请求指定的地址中获取的。之后,根据请求中携带的标识信息从预设数据库获取待调用模型的各项配置信息,其中,预设数据库可以是本地数据库,还可以是第三方数据库,模型配置信息包括:模型所在的服务器IP、模型服务端口、模型名称、模型的版本、模型参数等。
在一个实施例中,在所述接收客户端发出的模型调用的请求之前,所述方法还包括:
获取所述客户端对应用户的身份信息,将所述身份信息与具备发起调用请求权限的白名单进行匹配,当匹配成功时,执行后续步骤,当匹配失败时,拒绝所述请求并反馈第二预设提示信息。
将用户的身份信息与预设数据库中的具备请求权限的白名单进行匹配,白名单可以是指具有调用模型权限的用户名单,当白名单中存在与用户身份信息匹配的数据时,认为用户具备发起模型调用请求的权限,允许该用户发起调用请求,当白名单中不存在与用户身份信息匹配的数据时,认为用户不具备权限,拒绝该用户的调用请求并发送第一预设提示信息,并发送预设的提示信息,提示信息可以是“无调用权限”等。
步骤S20:基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址。
在本实施例中,从预设数据库获取待调用模型的配置信息之后,可以根据预设的选取规则从预先配置的多个模型转发服务器中选取出目标服务器,将待调用模型的配置信息发送至目标服务器,由于各个模型转发服务器的负载可能出现不均衡的情况,为了避免某个模型转发服务器出现负载过低或者过高的情况,可以利用负载均衡器选择出资源使用率较低的模型转发服务器,并将待调用模型的配置信息发送至该目标服务器。模型转发服务器是指可以调用模型的服务器。
负载平衡也称负载共享,是指对系统中的负载情况进行动态调整,以尽量消除或减少系统中各节点负载不均衡的现象。具体实现方法是将过载节点上的任务转移到其他轻载节点上,尽可能实现系统各节点的负载平衡,从而提高系统的吞吐量,负载均衡有利于统筹管理分布式系统中的各种资源,便于利用共享信息及其服务机制扩大系统的处理能力。
在一个实施例中,所述基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,包括:
获取服务器IP地址集合中各个服务器的预设指标的指标值,基于各所述预设指标的指标值及预设计算规则,计算得到各个服务器的资源使用率,将所述资源使用率最低的服务器作为所述目标服务器。
模型转发服务器的预设指标可以包括服务器的CPU占用率、内存占用率、网络占用率等,获取服务器的各预设指标可以根据Linux内核中的文件查看服务器的性能以及消耗,该方法可以准确的获取服务器性能,且比其他获取方案更加精确,通过“cat/proc/stat”命令可以获取节点所有的CPU总体信息,以及CPU当前的使用情况,通过“cat/proc/meminfo”命令可以获取节点内存信息以及当前使用情况,通过“cat/proc/net/dev”命令可以获取相关的网络信息。预设计算规则可以是计算得到各个模型转发服务器的预设指标的均值作为该模型转发服务器的资源使用率,例如,A服务器的CPU占用率为30%,内存占用率为40%、网络占用率为50%,则A服务器的资源使用率为40%。
进一步地,所述预设计算规则还可以包括:
Li=1-(1-W1×Xi1)×(1-W2×Xi2)×(1-W3×Xi3)
其中,Li表示第i个服务器的资源使用率,Xi1表示第i个服务器的CPU的使用率,Xi2表示第i个服务器内存的使用率,Xi3表示第i服务器的网络使用率,W1表示第i服务器的CPU的预设权重,W2表示第i服务器内存的预设权重,W3表示第i服务器的网络的预设权重。
目标服务器接收到待调用模型的配置信息的配置信息之后,将待调用模型的配置信息拼接成调用请求的URL地址,该URL地址用于发起模型调用请求。
在一个实施例中,所述配置信息包括:模型所在的服务器信息、模型服务端口信息、模型名称信息及模型的版本信息,所述目标服务器基于所述配置信息生成所述请求对应的URL地址,包括:
将所述配置信息的模型所在的服务器信息、模型服务端口信息、模型名称信息、模型的版本信息依次填充至预设URL模板中得到所述请求对应的URL地址。
将所述配置信息的模型所在的服务器ip、模型服务端口port、模型名称modelName、模型的版本version依次填充至预设URL模板中得到所述请求对应的URL地址。
例如,目标URL地址为“http://ip:port/modelName/version”。使得模型对外提供服务的URL动态化和规范化,减少了维护成本及知道模型对外提供服务信息。
步骤S30:基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
在本实施例中,目标服务器拼接成所述请求对应的URL地址后,根据该URL地址向目标服务器发起调用请求,该调用请求为post请求,当调用到所述请求对应的模型时,将该模型反馈至客户端。
在一个实施例中,所述判断是否调用到所述请求对应的模型,包括:
当判断未调用到所述请求对应的模型时,从所述服务器IP地址集合中随机选取一个IP地址对应的服务器,基于所述URL地址向该服务器调用所述请求对应的模型。
当未从目标服务器调用到请求对应的模型时,即向目标服务器调用失败时,则调用IP地址集合中随机一个IP地址对应的服务器。
在一个实施例中,所述判断是否调用到所述请求对应的模型,包括:
当判断连续预设次数未调用到所述请求对应的模型时,生成第一预设提示信息并发送至预设终端。
调用次数配置默认为三次,如果连续三次都失败就记录日志,并生成第一提示信息(例如,调用失败)并发邮件通知相关业务方,供相关业务方查看是否模型服务性能存在问题。
参照图2所示,为本发明模型调用装置100的功能模块示意图。
本发明所述模型调用装置100可以安装于电子设备中。根据实现的功能,所述模型调用装置100可以包括接收模块110、生成模块120及调用模块130。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
接收模块110,用于接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息。
在本实施例中,当用户需要调用已上线的模型时,用户可以开启终端上用于调用已上线模型的应用程序,通过该应用程序输入需要调用的模型的相关信息(例如,模型的标识或名称),用户输入需要调用的模型的相关信息后,可以将模型的相关信息提交并发出模型服务调用的请求,服务器接收到用户发出的调用模型服务的请求后,解析请求获取请求中携带的待调用模型的相关信息,其中,请求中可以包括待调用模型的相关信息,也可以包括待调用模型的相关信息的存储路径。也就是说,相关信息可以是用户在提交调用模型请求时一并录入,也可以是用户提交调用模型请求之后应用程序从请求指定的地址中获取的。之后,根据请求中携带的标识信息从预设数据库获取待调用模型的各项配置信息,其中,预设数据库可以是本地数据库,还可以是第三方数据库,模型配置信息包括:模型所在的服务器IP、模型服务端口、模型名称、模型的版本、模型参数等。
在一个实施例中,接收模块还用于:
获取所述客户端对应用户的身份信息,将所述身份信息与具备发起调用请求权限的白名单进行匹配,当匹配成功时,执行后续步骤,当匹配失败时,拒绝所述请求并反馈第二预设提示信息。
将用户的身份信息与预设数据库中的具备请求权限的白名单进行匹配,白名单可以是指具有调用模型权限的用户名单,当白名单中存在与用户身份信息匹配的数据时,认为用户具备发起模型调用请求的权限,允许该用户发起调用请求,当白名单中不存在与用户身份信息匹配的数据时,认为用户不具备权限,拒绝该用户的调用请求并发送第一预设提示信息,并发送预设的提示信息,提示信息可以是“无调用权限”等。
生成模块120,用于基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址。
在本实施例中,从预设数据库获取待调用模型的配置信息之后,可以根据预设的选取规则从预先配置的多个模型转发服务器中选取出目标服务器,将待调用模型的配置信息发送至目标服务器,由于各个模型转发服务器的负载可能出现不均衡的情况,为了避免某个模型转发服务器出现负载过低或者过高的情况,可以利用负载均衡器选择出资源使用率较低的模型转发服务器,并将待调用模型的配置信息发送至该目标服务器。模型转发服务器是指可以调用模型的服务器。
负载平衡也称负载共享,是指对系统中的负载情况进行动态调整,以尽量消除或减少系统中各节点负载不均衡的现象。具体实现方法是将过载节点上的任务转移到其他轻载节点上,尽可能实现系统各节点的负载平衡,从而提高系统的吞吐量,负载均衡有利于统筹管理分布式系统中的各种资源,便于利用共享信息及其服务机制扩大系统的处理能力。
在一个实施例中,所述基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,包括:
获取服务器IP地址集合中各个服务器的预设指标的指标值,基于各所述预设指标的指标值及预设计算规则,计算得到各个服务器的资源使用率,将所述资源使用率最低的服务器作为所述目标服务器。
模型转发服务器的预设指标可以包括服务器的CPU占用率、内存占用率、网络占用率等,获取服务器的各预设指标可以根据Linux内核中的文件查看服务器的性能以及消耗,该方法可以准确的获取服务器性能,且比其他获取方案更加精确,通过“cat/proc/stat”命令可以获取节点所有的CPU总体信息,以及CPU当前的使用情况,通过“cat/proc/meminfo”命令可以获取节点内存信息以及当前使用情况,通过“cat/proc/net/dev”命令可以获取相关的网络信息。预设计算规则可以是计算得到各个模型转发服务器的预设指标的均值作为该模型转发服务器的资源使用率,例如,A服务器的CPU占用率为30%,内存占用率为40%、网络占用率为50%,则A服务器的资源使用率为40%。
进一步地,所述预设计算规则还可以包括:
Li=1-(1-W1×Xi1)×(1-W2×Xi2)×(1-W3×Xi3)
其中,Li表示第i个服务器的资源使用率,Xi1表示第i个服务器的CPU的使用率,Xi2表示第i个服务器内存的使用率,Xi3表示第i服务器的网络使用率,W1表示第i服务器的CPU的预设权重,W2表示第i服务器内存的预设权重,W3表示第i服务器的网络的预设权重。
目标服务器接收到待调用模型的配置信息的配置信息之后,将待调用模型的配置信息拼接成调用请求的URL地址,该URL地址用于发起模型调用请求。
在一个实施例中,所述配置信息包括:模型所在的服务器信息、模型服务端口信息、模型名称信息及模型的版本信息,所述目标服务器基于所述配置信息生成所述请求对应的URL地址,包括:
将所述配置信息的模型所在的服务器信息、模型服务端口信息、模型名称信息、模型的版本信息依次填充至预设URL模板中得到所述请求对应的URL地址。
将所述配置信息的模型所在的服务器ip、模型服务端口port、模型名称modelName、模型的版本version依次填充至预设URL模板中得到所述请求对应的URL地址。
例如,目标URL地址为“http://ip:port/modelName/version”。使得模型对外提供服务的URL动态化和规范化,减少了维护成本及知道模型对外提供服务信息。
调用模块130,用于基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
在本实施例中,目标服务器拼接成所述请求对应的URL地址后,根据该URL地址向目标服务器发起调用请求,该调用请求为post请求,当调用到所述请求对应的模型时,将该模型反馈至客户端。
在一个实施例中,所述判断是否调用到所述请求对应的模型,包括:
当判断未调用到所述请求对应的模型时,从所述服务器IP地址集合中随机选取一个IP地址对应的服务器,基于所述URL地址向该服务器调用所述请求对应的模型。
当未从目标服务器调用到请求对应的模型时,即向目标服务器调用失败时,则调用IP地址集合中随机一个IP地址对应的服务器。
在一个实施例中,所述判断是否调用到所述请求对应的模型,包括:
当判断连续预设次数未调用到所述请求对应的模型时,生成第一预设提示信息并发送至预设终端。
调用次数配置默认为三次,如果连续三次都失败就记录日志,并生成第一提示信息(例如,调用失败)并发邮件通知相关业务方,供相关业务方查看是否模型服务性能存在问题。
参照图3所示,为本发明电子设备1较佳实施例的示意图。
该电子设备1包括但不限于:存储器11、处理器12、显示器13及网络接口14。所述电子设备1通过网络接口14连接网络,获取原始数据。其中,所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobilecommunication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述电子设备1的内部存储单元,例如该电子设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述电子设备1的外部存储设备,例如该电子设备1配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述电子设备1的内部存储单元也包括其外部存储设备。本实施例中,存储器11通常用于存储安装于所述电子设备1的操作系统和各类应用软件,例如模型调用程序10的程序代码等。此外,存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述电子设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行模型调用程序10的程序代码等。
显示器13可以称为显示屏或显示单元。在一些实施例中显示器13可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-EmittingDiode,OLED)触摸器等。显示器13用于显示在电子设备1中处理的信息以及用于显示可视化的工作界面,例如显示数据统计的结果。
网络接口14可选地可以包括标准的有线接口、无线接口(如WI-FI接口),该网络接口14通常用于在所述电子设备1与其它电子设备之间建立通信连接。
图3仅示出了具有组件11-14以及模型调用程序10的电子设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
可选地,所述电子设备1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
该电子设备1还可以包括射频(Radio Frequency,RF)电路、传感器和音频电路等等,在此不再赘述。
在上述实施例中,处理器12执行存储器11中存储的模型调用程序10时可以实现如下步骤:
接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
所述存储设备可以为电子设备1的存储器11,也可以为与电子设备1通讯连接的其它存储设备。
关于上述步骤的详细介绍,请参照上述图2关于模型调用装置100实施例的功能模块图以及图1关于模型调用方法实施例的流程图的说明。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质可以是非易失性的,也可以是易失性的。该计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等等中的任意一种或者几种的任意组合。所述计算机可读存储介质中包括存储数据区和存储程序区,存储数据区存储根据区块链节点的使用所创建的数据,存储程序区存储有模型调用程序10,所述模型调用程序10被处理器执行时实现如下操作:
接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
本发明之计算机可读存储介质的具体实施方式与上述模型调用方法的具体实施方式大致相同,在此不再赘述。
在另一个实施例中,本发明所提供的模型调用方法,为进一步保证上述所有出现的数据的私密和安全性,上述所有数据还可以存储于一区块链的节点中。例如配置信息及待调用模型等,这些数据均可存储在区块链节点中。
需要说明的是,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,电子装置,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种模型调用方法,其特征在于,所述方法包括:
接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
2.如权利要求1所述的模型调用方法,其特征在于,所述基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,包括:
获取服务器IP地址集合中各个服务器的预设指标的指标值,基于各所述预设指标的指标值及预设计算规则,计算得到各个服务器的资源使用率,将所述资源使用率最低的服务器作为所述目标服务器。
3.如权利要求2所述的模型调用方法,其特征在于,所述预设计算规则包括:
Li=1-(1-W1×Xi1)×(1-W2×Xi2)×(1-W3×Xi3)
其中,Li表示第i个服务器的资源使用率,Xi1表示第i个服务器的CPU的使用率,Xi2表示第i个服务器内存的使用率,Xi3表示第i服务器的网络使用率,W1表示第i服务器的CPU的预设权重,W2表示第i服务器内存的预设权重,W3表示第i服务器的网络的预设权重。
4.如权利要求1所述的模型调用方法,其特征在于,所述配置信息包括:模型所在的服务器信息、模型服务端口信息、模型名称信息及模型的版本信息,所述目标服务器基于所述配置信息生成所述请求对应的URL地址,包括:
将所述配置信息的模型所在的服务器信息、模型服务端口信息、模型名称信息、模型的版本信息依次填充至预设URL模板中得到所述请求对应的URL地址。
5.如权利要求1所述的模型调用方法,其特征在于,所述判断是否调用到所述请求对应的模型,包括:
当判断未调用到所述请求对应的模型时,从所述服务器IP地址集合中随机选取一个IP地址对应的服务器,基于所述URL地址向该服务器调用所述请求对应的模型。
6.如权利要求5所述的模型调用方法,其特征在于,所述判断是否调用到所述请求对应的模型,包括:
当判断连续预设次数未调用到所述请求对应的模型时,生成第一预设提示信息并发送至预设终端。
7.如权利要求1至6中任意一项所述的模型调用方法,其特征在于,在所述接收客户端发出的模型调用的请求之前,所述方法还包括:
获取所述客户端对应用户的身份信息,将所述身份信息与具备发起调用请求权限的白名单进行匹配,当匹配成功时,执行后续步骤,当匹配失败时,拒绝所述请求并反馈第二预设提示信息。
8.一种模型调用装置,其特征在于,所述装置包括:
接收模块:用于接收客户端发出的模型调用的请求,根据所述请求携带的标识从预设数据库获取待调用模型的配置信息;
生成模块:用于基于预设选取规则从预先配置的服务器IP地址集合中选取出目标服务器,将所述待调用模型的配置信息发送至所述目标服务器,所述目标服务器基于所述配置信息生成所述请求对应的URL地址;
调用模块:用于基于所述URL地址向所述目标服务器调用所述请求对应的模型,判断是否调用到所述请求对应的模型,当判断调用到所述请求对应的模型时,将该模型反馈至所述客户端。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的程序,所述程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的模型调用方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有模型调用程序,所述模型调用程序被处理器执行时,实现如权利要求1至7中任一项所述模型调用方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011478851.9A CN112596919A (zh) | 2020-12-15 | 2020-12-15 | 模型调用方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011478851.9A CN112596919A (zh) | 2020-12-15 | 2020-12-15 | 模型调用方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112596919A true CN112596919A (zh) | 2021-04-02 |
Family
ID=75195910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011478851.9A Pending CN112596919A (zh) | 2020-12-15 | 2020-12-15 | 模型调用方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112596919A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113259384A (zh) * | 2021-06-18 | 2021-08-13 | 航天云网数据研究院(广东)有限公司 | 基于区块链的机理模型调用信息处理方法、服务器及系统 |
CN114117317A (zh) * | 2021-11-26 | 2022-03-01 | 阿波罗智联(北京)科技有限公司 | 模型处理方法、装置、设备以及存储介质 |
CN114385268A (zh) * | 2022-01-14 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 算法模型的调用方法、装置、计算机设备和存储介质 |
CN114827161A (zh) * | 2022-04-20 | 2022-07-29 | 微位(深圳)网络科技有限公司 | 服务调用请求发送方法、装置、电子设备及可读存储介质 |
-
2020
- 2020-12-15 CN CN202011478851.9A patent/CN112596919A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113259384A (zh) * | 2021-06-18 | 2021-08-13 | 航天云网数据研究院(广东)有限公司 | 基于区块链的机理模型调用信息处理方法、服务器及系统 |
CN114117317A (zh) * | 2021-11-26 | 2022-03-01 | 阿波罗智联(北京)科技有限公司 | 模型处理方法、装置、设备以及存储介质 |
CN114385268A (zh) * | 2022-01-14 | 2022-04-22 | 中国平安人寿保险股份有限公司 | 算法模型的调用方法、装置、计算机设备和存储介质 |
CN114827161A (zh) * | 2022-04-20 | 2022-07-29 | 微位(深圳)网络科技有限公司 | 服务调用请求发送方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112596919A (zh) | 模型调用方法、装置、设备及存储介质 | |
CN109474578B (zh) | 报文消息校验方法、装置、计算机设备和存储介质 | |
CN111258725A (zh) | 一种基于区块链的数据处理方法、装置、设备和介质 | |
CN109617996B (zh) | 文件上传及下载方法、服务器及计算机可读存储介质 | |
CN111290742A (zh) | 参数验证方法、装置、电子设备及可读存储介质 | |
CN107993053B (zh) | 理赔数据审核方法、装置、计算机设备及存储介质 | |
CN112818270B (zh) | 数据跨域传递方法、装置及计算机设备 | |
CN112579453A (zh) | 任务测试方法、装置、设备及存储介质 | |
CN108418797B (zh) | 网页访问方法、装置、计算机设备和存储介质 | |
CN112860778A (zh) | 桌面应用程序的数据库管理方法、装置、设备和介质 | |
CN108600389A (zh) | 一种基于公共接口平台的数据传输方法及装置 | |
CN112991064B (zh) | 业务处理方法、装置、计算机设备和存储介质 | |
CN112817867A (zh) | 一种接口测试脚本生成方法、装置、计算机设备和介质 | |
CN113076112A (zh) | 数据库部署的方法、装置及电子设备 | |
CN111552942B (zh) | 身份认证方法、系统、装置及计算机存储介质 | |
CN109857748B (zh) | 一种合同数据处理方法、装置及电子设备 | |
CN115239450A (zh) | 财务数据处理方法、装置、计算机设备及存储介质 | |
CN107784548B (zh) | 订单处理方法和装置 | |
CN112083925A (zh) | 基于h5页面开发的数据获取方法、装置、设备及存储介质 | |
CN112069230A (zh) | 数据分析方法、装置、设备及存储介质 | |
CN113132400A (zh) | 业务处理方法、装置、计算机系统及存储介质 | |
CN112559352A (zh) | 接口测试的方法、装置、设备及存储介质 | |
CN111949363A (zh) | 业务访问的管理方法、计算机设备、存储介质及系统 | |
CN112350868B (zh) | 开墙处理方法、装置、服务器、系统及可读存储介质 | |
CN114331465A (zh) | 基于区块链的商品溯源方法、装置、终端设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |