WO2019184739A1

WO2019184739A1 - 一种数据查询方法、装置及设备

Info

Publication number: WO2019184739A1
Application number: PCT/CN2019/078418
Authority: WO
Inventors: 周祥; 李冰; 赵永春; 温绍锦
Original assignee: 阿里巴巴集团控股有限公司
Priority date: 2018-03-29
Filing date: 2019-03-18
Publication date: 2019-10-03
Also published as: US11556541B2; EP3779688A1; JP7511477B2; US20210011916A1; JP2021519460A; CN110321214A; EP3779688A4

Abstract

本申请提供一种数据查询方法、装置及设备，该方法包括：根据接收到的查询请求的特征信息获得资源开销；根据所述资源开销和计算节点资源动态调节资源池中的计算节点；通过所述计算节点查询与所述查询请求对应的数据。通过本申请的技术方案，可以动态调节资源池中的计算节点，使得资源池中的计算节点能够处理接收到的所有查询请求，更有效的提高计算节点的处理效率和资源利用率，使得计算节点能够更有效的并行处理多个查询请求，提高CPU资源、内存资源、网络带宽资源的利用率，从而从整体计算资源和用户查询负载角度达到一个更好的效果，提高用户使用感受。

Description

一种数据查询方法、装置及设备

本申请要求2018年03月29日递交的申请号为201810268968.0、发明名称为“一种数据查询方法、装置及设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及互联网技术领域，尤其涉及一种数据查询方法、装置及设备。

背景技术

开放分析服务(Open Analytics)用于为用户提供无服务器化(Serverless)的查询分析服务，能够对海量数据进行任意维度的分析和查询，支持高并发、低延时(毫秒级响应)、实时在线分析、海量数据查询等功能。开放分析服务系统中，可以包括数据源和计算节点，数据源用于存储大量数据，计算节点在接收到查询请求后，从数据源中查询与该查询请求对应的数据。

但是，在某些应用场景下(如地图数据的查询场景、画像数据的查询场景等)，计算节点可能在短时间内接收到多个查询请求(即并发数很高)，即需要在短时间内处理多个查询请求，导致CPU(Central Processing Unit，中央处理器)资源、内存资源、网络带宽等出现异常，从而导致查询超时或者查询失败。

发明内容

本申请提供一种数据查询方法，所述方法包括：

根据接收到的查询请求的特征信息获得资源开销；

根据所述资源开销和计算节点资源动态调节资源池中的计算节点；

通过所述计算节点查询与所述查询请求对应的数据。

本申请提供一种数据查询方法，所述方法包括：

根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；

根据分配组中的查询请求的特征信息获得所述分配组的资源开销；

根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；

通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

本申请提供一种一种数据查询装置，所述装置包括：

获得模块，用于根据接收到的查询请求的特征信息获得资源开销；

处理模块，根据资源开销和计算节点资源动态调节资源池中的计算节点；

查询模块，用于通过所述计算节点查询与所述查询请求对应的数据。

本申请提供一种数据查询装置，所述装置包括：

划分模块，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同分配组对应不同的子资源池；

获得模块，用于根据分配组中的查询请求的特征信息获得所述分配组的资源开销；

处理模块，用于根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；

查询模块，用于通过所述子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

本申请提供一种数据查询设备，包括：处理器，用于根据接收到的查询请求的特征信息获得资源开销；根据资源开销和计算节点资源动态调节资源池中的计算节点；通过所述计算节点查询与所述查询请求对应的数据。

本申请提供一种数据查询设备，包括：处理器，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；根据分配组中的查询请求的特征信息获得所述分配组的资源开销；根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

基于上述技术方案，本申请实施例中，可以根据接收到的查询请求的特征信息获得资源开销，并根据资源开销和计算节点资源动态调节资源池中的计算节点，使得资源池中的计算节点能够处理接收到的所有查询请求，更有效的提高计算节点的处理效率和资源利用率，可以使得计算节点能够更有效的并行处理多个查询请求，提高CPU资源、内存资源、网络带宽资源的利用率，从而从整体计算资源和用户查询负载角度达到一个更好的效果，提高用户使用感受。而且，通过动态调节资源池中的计算节点，使得各计算节点可以为用户提供无服务器化(Serverless)的查询分析服务，使得用户无需感知服务器或者服务实例，只需感知云服务提供的服务本身，基于云服务，用户只需要输入SQL查询请求，就可以由计算节点在数据源中进行数据查询和分析，可以无缝集成商业分析工具和应用程序。可以对资源进行智能分析和自动调整，更有效的提高云数据库和云数据分析服务集群的资源利用率和性价比。

附图说明

为了更加清楚地说明本申请实施例或者现有技术中的技术方案，下面将对本申请实施例或者现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据本申请实施例的这些附图获得其它的附图。

图1是本申请一种实施方式中的系统结构示意图；

图2是本申请一种实施方式中的数据查询方法的流程图；

图3是本申请另一种实施方式中的系统结构示意图；

图4是本申请另一种实施方式中的数据查询方法的流程图；

图5是本申请一种实施方式中的数据查询装置的结构图；

图6是本申请另一种实施方式中的数据查询装置的结构图。

具体实施方式

在本申请实施例使用的术语仅仅是出于描述特定实施例的目的，而非限制本申请。本申请和权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其它含义。还应当理解，本文中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，此外，所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

本申请实施例提出一种数据查询方法，该方法可以应用于包括客户端、负载均衡设备、前端节点(front node，也可以称为前端服务器)、计算节点(compute node，也可以称为计算服务器)和数据源的系统，如用于实现开放分析服务的系统。当然，还可以包括其它服务器，如资源调度服务器等，对此不做限制。

参见图1所示，为本申请实施例的应用场景示意图，在前端节点的资源池中，包括一个或多个前端节点，图1以3个前端节点为例。在计算节点的资源池中，包括一个或多个计算节点，图1以5个计算节点为例。实际应用中，可以对前端节点进行扩容(增加前端节点的数量)或者缩容(减少前端节点的数量)，也可以对计算节点进行扩容(增加计算节点的数量)或者缩容(减少计算节点的数量)，本实施例正是针对计算节点进行扩容或者缩容的方案。

其中，客户端用于从数据源中查询数据，如可以是终端设备(如PC(Personal Computer，个人计算机)、笔记本电脑、移动终端等)包括的APP(Application，应用)，也可以是终端设备包括的浏览器，对此客户端的类型不做具体限制。

其中，负载均衡设备用于对查询请求进行负载均衡，例如，在接收到大量查询请求后，可以将这些查询请求负载均衡到各前端节点，对此过程不做限制。

其中，数据源用于存储各种类型的数据，且能够将数据源中存储的数据提供给客户端。对于数据源中存储的数据的类型，本申请实施例中不做限制，如可以是用户数据、商品数据、地图数据、视频数据、图像数据、音频数据等。

其中，资源池中的多个前端节点用于提供相同的功能。具体的，前端节点用于接收客户端发送的查询请求，并对所述查询请求进行SQL(Structured Query Language，结构化查询语言)解析，利用SQL解析结果生成查询请求，并将该查询请求发送给计算节点，该查询请求用于请求与该查询请求对应的数据。然后，前端节点还用于接收计算节点返回的数据，并将该数据发送给客户端。

其中，资源池中的多个计算节点用于提供相同的功能。具体的，计算节点用于接收前端节点发送的查询请求，并利用该查询请求从数据源中读取与该查询请求对应的数据，对此读取过程不做限制，并将该数据发送给前端节点。

在一个例子中，若计算节点在短时间内接收到大量查询请求(即并发数很高)，则计算节点需要在短时间内处理大量查询请求，导致CPU资源、内存资源、网络带宽等出现异常，从而导致查询超时或者查询失败。与上述方式不同的是，本申请实施例中，可以动态调节资源池中的计算节点，即当存在大量查询请求时，可以增加资源池中的计算节点数量，减少每个计算节点的查询请求数量，从而避免某个计算节点在短时间内处理大量查询请求，更有效的提高计算节点的处理效率和资源利用率，减轻CPU资源、内存资源、网络带宽的占用，可以提高处理性能，并避免客户端查询超时或者失败，提高用户使用感受。

在上述应用场景下，参见图2所示，为本申请实施例中提出的数据查询方法的流程示意图，该方法可以应用于数据查询设备，该数据查询设备可以为图1中的负载均衡设备、或者前端节点、或者资源调度服务器，对此不做限制，本实施例中以应用于前端节点为例，该方法可以包括以下步骤：

步骤201，根据接收到的查询请求的特征信息获得资源开销。例如，可以根据预设时间窗内接收到的查询请求的特征信息获得资源开销。

步骤202，根据该资源开销和计算节点资源动态调节资源池中的计算节点。

步骤203，通过资源池中的计算节点查询与该查询请求对应的数据。

在一个例子中，上述执行顺序只是为了方便描述给出的一个示例，在实际应用中，还可以改变步骤之间的执行顺序，对此执行顺序不做限制。而且，在其它实施例中，并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤，其方法所包括的步骤可以比本说明书所描述的更多或更少。此外，本说明书中所描述的单个步骤，在其它实施例中可能被分解为多个步骤进行描述；本说明书中所描述的多个步骤，在其它实施例也可能被合并为单个步骤进行描述。

其中，当客户端需要请求数据源中的数据时，可以发送查询请求，负载均衡设备在接收到该查询请求后，可以将该查询请求发送给前端节点，前端节点在接收到该查询请求后，可以将该查询请求存储到查询队列(Query Queue)中。

其中，前端节点可以设置预设时间窗，该预设时间窗的时间可以根据经验配置，如3秒等。基于此，前端节点可以将预设时间窗内存储在查询队列中的所有查询请求，确定为预设时间窗内接收到的查询请求，如100个查询请求。

在执行步骤201之前，针对预设时间窗内接收到的所有查询请求，还可以先获取每个查询请求的特征信息，该特征信息可以包括但不限于以下之一或者任意组合：并发度、查询复杂度、查询数据量、查询时间、资源占用率。

一、并发度(Concurrency)，即预设时间窗内接收的查询请求数量，如100。

二、查询复杂度(Query_Complexity)，即执行查询请求的复杂程度，可以表示查询时间、CPU资源占用、内存资源占用、网络带宽占用等情况。其中，查询复杂度通常为一个数值，可以通过对查询时间、CPU资源占用、内存资源占用、网络带宽占用进行归一化，得到查询复杂度的数值。例如，若执行查询请求1时，需要占用大量CPU资源、内存资源、网络带宽，查询时间较长，则查询请求1的查询复杂度较高。若执行查询请求2时，需要占用少量CPU资源、内存资源、网络带宽，查询时间较短，则查询请求2的查询复杂度较低。

针对具有相同查询关键字的查询请求，其查询复杂度相同或者类似，因此，可以获取查询关键字与复杂度值的对应关系，并在第一映射表中记录查询关键字与复杂度值的对应关系。例如，假设查询请求1和查询请求2均是针对查询关键字A的查询请求，则查询请求1和查询请求2的查询复杂度相同。假设在第一映射表中记录查询关键字A与复杂度值A的对应关系，则对于查询请求1和查询请求2来说，查询请求1和查询请求2的查询复杂度均是复杂度值A。

其中，获取查询关键字与复杂度值的对应关系，可以包括但不限于：根据经验配置查询关键字与复杂度值的对应关系。或者，通过神经网络训练查询关键字与复杂度值的对应关系，对此训练过程不做限制。或者，在执行某查询请求时，获取该查询请求的查询关键字，并获取该查询请求的复杂度值，如执行该查询请求时，消耗1个核的CPU资源、消耗100M的内存资源，则复杂度值是1个核的CPU资源、100M的内存资源对应的复杂度值，对此不做限制。

在一个例子中，查询请求可以包括但不限于SQL查询请求；且查询关键字可以包括但不限于以下之一或者任意组合：加入关键字(即join，如SQL查询请求包括关键字join)、对结果集进行分组的关键字(即groupby，如SQL查询请求包括关键字groupby)、对结果集进行排序的关键字(即orderby，如SQL查询请求包括关键字orderby)、列出不同关键字(即distinct，如SQL查询请求包括关键字distinct)、行数计算关键字(即count，如SQL查询请求包括关键字count)、窗口函数关键字(即window，如SQL查询请求包括关键字window)。

参见表1所示，为第一映射表的一个示例，其用于记录查询关键字与复杂度值的对应关系，这里的复杂度值体现了查询请求的复杂度。例如，复杂度值5表示消耗1个核的CPU资源、消耗100M的内存资源，复杂度值10表示消耗2个核的CPU资源、消耗200M的内存资源，以此类推。当然，表1只是一个示例，对于查询关键字对应的复杂度值，与实际情况有关，在此不再赘述。

表1

查询关键字	复杂度值
join	复杂度值5
groupby	复杂度值10
orderby	复杂度值8

distinct	复杂度值12
count	复杂度值6
window	复杂度值15

进一步的，针对预设时间窗内接收到的每个查询请求，为了获取该查询请求的查询复杂度，可以采用如下方式：方式一、从该查询请求中获取查询关键字，并通过该查询关键字查询第一映射表，以得到与该查询关键字对应的复杂度值，并将该复杂度值确定为该查询请求对应的查询复杂度。方式二、从该查询请求的多个子查询中获取查询关键字，并通过获取的每个查询关键字查询第一映射表，以得到与每个查询关键字对应的复杂度值；然后，可以将得到的复杂度值之和(即所有复杂度值的和)确定为该查询请求对应的查询复杂度。

例如，针对方式一，假设查询请求是SQL的join语句，即该查询请求包括查询关键字“join”，则可以通过查询关键字“join”查询表1所示的第一映射表，得到复杂度值5，然后，可以确定该查询请求对应的查询复杂度为复杂度值5。

针对方式二，假设查询请求包括子查询1、子查询2、子查询3，该子查询1是SQL的join语句，该子查询2是SQL的groupby语句，该子查询3是SQL的distinct语句。子查询1包括查询关键字“join”，通过查询关键字“join”查询表1所示的第一映射表，得到复杂度值5；子查询2包括查询关键字“groupby”，通过查询关键字“groupby”查询表1所示的第一映射表，得到复杂度值10；子查询2包括查询关键字“distinct”，通过查询关键字“distinct”查询表1所示的第一映射表，得到复杂度值12。然后，可以确定该查询请求对应的查询复杂度为复杂度值5、复杂度值10与复杂度值12之间的和，即查询复杂度为复杂度值27。

三、查询数据量(也可以称为查询扫描数据量Query_DataScanned)，即执行查询请求时返回的数据量。例如，假设查询请求1用于请求数据A，而数据A的大小为10M，则查询数据量可以是10M，即向客户端返回的数据是10M。

在一个例子中，可以收集历史数据，并根据历史数据获取数据标识与查询数据量的对应关系；然后，在第二映射表中记录该数据标识与该查询数据量的对应关系。例如，在执行某查询请求时，若该查询请求用于请求数据A，而数据A的大小为10M，则前端节点可以收集到上述信息(即历史数据)，并获取数据A与查询数据量100的对应关系，并在第二映射表中记录该对应关系。参见表2所示，为第二映射表的一个示例，对此第二映射表的内容不做限制。

表2

数据标识	查询数据量
数据A	10M
数据B	20M

进一步的，针对预设时间窗内接收到的每个查询请求，为了获取该查询请求的查询数据量，可以采用如下方式：通过该查询请求的数据标识查询第二映射表，得到与该数据标识对应的查询数据量。例如，若该查询请求携带的数据标识为数据A，则确定与数据A对应的查询数据量10M。若该查询请求携带的数据标识为数据C，由于第二映射表未记录数据C对应的查询数据量10M，则可以将数据C对应的查询数据量设置为默认值(可以根据经验配置，如5M)。

四、查询时间(也可以称为查询耗时时间Query_ResponseTime)，即执行查询请求时所消耗的时间(从开始处理查询请求到查询请求处理结束所消耗的时间)。例如，假设执行查询请求1时，共消耗3秒，则查询时间是3秒。

其中，可以收集历史数据，根据历史数据获取数据标识与查询时间的对应关系，在第二映射表中记录该数据标识与查询时间的对应关系。针对预设时间窗内接收到的每个查询请求，为了获取该查询请求的查询时间，采用如下方式：通过查询请求的数据标识查询第二映射表，得到与该数据标识对应的查询时间。

五、资源占用率(也称为资源利用率Resource_Utilization)，即执行查询请求时所消耗的资源，如内存占用率、CPU占用率、网络带宽占用率等。假设执行查询请求1时，消耗1个核的CPU资源、100M的内存资源、100M的网络带宽，则资源占用率为1个核的CPU资源、100M的内存资源、100M的网络带宽。

其中，可以通过收集历史数据，并根据所述历史数据获取数据标识与资源占用率的对应关系。然后，还可以在第二映射表中记录该数据标识与该资源占用率的对应关系。进一步的，针对预设时间窗内接收到的每个查询请求，为了获取该查询请求的资源占用率，还可以采用如下方式：通过该查询请求的数据标识查询所述第二映射表，从而可以得到与该数据标识对应的资源占用率。

在一个例子中，前端节点还可以维护表3所示的第二映射表，该第二映射表用于记录数据标识、查询数据量、查询时间、资源占用率的对应关系。基于此，针对预设时间窗内接收到的每个查询请求，可以通过该查询请求的数据标识查询表3所示的第二映射表，从而得到与该数据标识对应的特征信息，该特征信息可以包括查询数据量、查询时间、资源占用率中的一个或者多个。

表3

综上所述，若上述查询请求携带的数据标识为数据A，则确定与数据A对应的查询数据量10M、查询时间3秒，资源占用率“CPU资源：1核；内存资源：100M；网络带宽：100M”。此外，若查询请求携带的数据标识为数据C，由于第二映射表未记录数据C对应的内容，则可以将查询数据量设置为默认值、并将查询时间设置为默认值、并将资源占用率设置为默认值，对此不做限制。

经过上述过程，可以得到预设时间窗内接收到的每个查询请求的特征信息，以特征信息为并发度、查询复杂度、查询数据量、查询时间、资源占用率为例。

在步骤201中，根据接收到的查询请求的特征信息获得资源开销，可以包括：针对预设时间窗内接收到的每个查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并根据每个查询请求的预测资源量确定资源开销，例如，资源开销可以为每个查询请求的预测资源量之和。

其中，在根据该查询请求的特征信息获得该查询请求的预测资源量时，假设该特征信息为查询复杂度，则查询复杂度的复杂度值越大时，预测资源量越大，查询复杂度的复杂度值越小时，预测资源量越小，对此确定过程不做限制，只要符合上述规律即可。假设该特征信息为查询数据量，则查询数据量越大时，预测资源量越大，查询数据量越小时，预测资源量越小，对此确定过程不做限制，只要符合上述规律即可。假设该特征信息为查询时间，则查询时间越大时，预测资源量越大，查询时间越小时，预测资源量越小，对此确定过程不做限制，只要符合上述规律即可。假设该特征信息为资源占用率，则资源占用率越大时，预测资源量越大，资源占用率越小时，预测资源量越小，对此确定过程不做限制，只要符合上述规律即可。当然，上述方式至少一个示例，对此不做限制。

例如，当该特征信息为并发度、查询复杂度、查询数据量、查询时间、资源占用率中的多个时，以包括这5个特征为例，则可以对并发度、查询复杂度、查询数据量、查询时间、资源占用率进行归一化，即将并发度、查询复杂度、查询数据量、查询时间、资源占用率归一化到同一数量级别，对此归一化方式不做限制。假设得到归一化后的并发度A、查询复杂度B、查询数据量C、查询时间D、资源占用率E，则可以对并发度A、查询复杂度B、查询数据量C、查询时间D、资源占用率E进行求和，若求和结果越大时，预测资源量越大，求和结果越小时，预测资源量越小，对此不做限制，只要符合上述规律即可。

又例如，还可以对(权重1*并发度A)、(权重2*查询复杂度B)、(权重3*查询数据量C)、(权重4*查询时间D)、(权重5*资源占用率E)进行求和，若求和结果越大时，预测资源量越大，求和结果越小时，预测资源量越小，对此不做限制，只要符合上述规律即可。其中，权重1、权重2、权重3、权重4和权重5均可以根据经验配置，对此不做限制。例如，权重1、权重2、权重3、权重4、权重5的和可以为1，当然也可以为其它数值，如2、3等。

在一个例子中，根据该查询请求的特征信息获得该查询请求的预测资源量，可以包括：通过预测模型对该查询请求的特征信息进行分析，得到该查询请求的预测资源量；该预测模型可以包括但不限于：Holt-Winter(三次指数平滑法)季节模型、ARMA(自回归与滑动平均)模型、线性回归模型、神经网络模型。

以预测模型是神经网络模型为例，则神经网络可以利用历史数据训练特征信息与预测资源量的对应关系。例如，特征信息是查询复杂度时，则可以训练查询复杂度与预测资源量的对应关系。例如，在执行某个查询请求时，假设其查询复杂度为复杂度值5，实际消耗的资源量为资源量A，则可以得到复杂度值5与预测资源量A的对应关系，当然，神经网络是通过大量历史数据训练查询复杂度与预测资源量的对应关系，对此训练过程不做限制，在训练结果中，查询复杂度的复杂度值越大，预测资源量越大，查询复杂度的复杂度值越小，预测资源量越小。对于并发度、查询数据量、查询时间、资源占用率等特征信息，其训练过程类似，在此不再赘述。当该特征信息为并发度、查询复杂度、查询数据量、查询时间、资源占用率中的多个时，其训练过程类似，在此不再赘述。

进一步的，在神经网络训练出特征信息与预测资源量的对应关系后，针对预设时间窗内接收到的每个查询请求，神经网络可以根据该查询请求的特征信息查询所述对应关系，获得该查询请求的预测资源量，对此过程不做限制。

当然，上述方式只是利用神经网络模型得到预测资源量的一个示例，对此不做限制。当预测模型是Holt-Winter季节模型、ARMA模型、线性回归模型时，其实现方式与神经网络模型的实现方式类似，在此不再重复赘述。总之，只要确定过程符合以下规律即可：查询复杂度的复杂度值越大时，预测资源量越大；查询数据量越大时，预测资源量越大；查询时间越大时，预测资源量越大；资源占用率越大时，预测资源量越大；并发数越大时，预测资源量越大。

在步骤202中，根据资源开销和计算节点资源动态调节资源池中的计算节点，可以包括但不限于：根据资源开销和计算节点资源获得计算节点数量；然后，可以在资源池中分配与所述计算节点数量匹配的计算节点。

其中，根据该资源开销和计算节点资源获得计算节点数量，可以包括但不限于如下方式：对该资源开销/计算节点资源向上取整，即可以得到计算节点数量。当然，还可以采用其它方式获得计算节点数量，只要计算节点数量大于等于资源开销/计算节点资源向上取整的结果即可，对此不做限制。

例如，当预设时间窗内接收到的所有查询请求的预测资源量之和为100个CPU核，即资源开销是100个CPU核时，假设计算节点资源为8个CPU核(即资源池中的每个计算节点均提供8个CPU核的计算节点资源)，则计算节点数量可以为13个。显然，当计算节点数量为13个时，由于13个计算节点可以提供104个CPU核，因此，13个计算节点能够满足100个CPU核的资源开销，也就是说，13个计算节点能够处理预设时间窗内接收到的所有查询请求。

又例如，当资源开销是20G内存时，假设计算节点资源为2G内存，则计算节点数量可以为10个。显然，当计算节点数量为10个时，由于10个计算节点可以提供20G内存，因此，10个计算节点能够满足20G内存的资源开销，也就是说，10个计算节点能够处理预设时间窗内接收到的所有查询请求。

又例如，当资源开销是100个CPU核、20G内存，计算节点资源为8个CPU核、2G内存时，则CPU核资源需要使用13个计算节点，内存资源需要使用10个计算节点，因此，可以将最大的计算节点数量13，确定为计算节点数量。

其中，在资源池中分配与该计算节点数量匹配的计算节点，可以包括：若资源池中已经存在的计算节点的数量小于该计算节点数量，则可以在资源池中扩容计算节点，以使扩容后的计算节点的数量大于等于该计算节点数量。若资源池中已经存在的计算节点的数量大于该计算节点数量，则可以在资源池中缩容计算节点，以使缩容后的计算节点的数量大于等于该计算节点数量。

例如，假设资源池中已经存在8个计算节点，而上述计算节点数量为13个，则可以在资源池中新扩容5个计算节点，这样，资源池中一共存在13个计算节点，而这13个计算节点用于处理预设时间窗内接收到的所有查询请求。

又例如，假设资源池中已经存在20个计算节点，而上述计算节点数量为13个，则可以在资源池中缩容7计算节点，这样，资源池中一共存在13个计算节点，而这13个计算节点用于处理预设时间窗内接收到的所有查询请求。

在一个例子中，前端节点在获得计算节点数量13后，可以向资源调度服务器发送携带计算节点数量13的资源扩缩容命令。资源调度服务器在接收到该资源扩缩容命令后，就可以在资源池中分配与该计算节点数量13匹配的计算节点。

例如，若存在一个前端节点，则资源调度服务器只接收到携带计算节点数量13的资源扩缩容命令，因此，在资源池中扩容/缩容计算节点，以使资源池中存在13个计算节点。又例如，若存在两个前端节点，假设资源调度服务器接收到携带计算节点数量13的资源扩缩容命令、携带计算节点数量8的资源扩缩容命令，则在资源池中扩容/缩容计算节点，以使资源池中存在21个计算节点。

其中，资源调度服务器在资源池中扩容/缩容计算节点时，性能可以是秒级(甚至能优化到百毫秒级)，即只需要数秒钟时间(甚至能优化到百毫秒级)，就可以在资源池中扩容计算节点或者缩容计算节点。

在步骤203中，通过资源池中的计算节点查询与上述查询请求对应的数据，可以包括：针对预设时间窗内接收到的每个查询请求，前端节点可以对该查询请求进行SQL解析，利用SQL解析结果生成查询请求，并将该查询请求发送给计算节点；计算节点在接收到查询请求后，可以从数据源读取与该查询请求对应的数据并进行计算，并将数据返回给前端节点；前端节点将接收到的数据返回给客户端。例如，前端节点将查询请求拆分成6个子查询请求，对此过程不做限制，并将6个子查询请求负载均衡到6个计算节点。对于每个计算节点来说，计算节点接收到子查询请求后，从数据源读取与该子查询请求对应的数据，并将数据返回给前端节点。前端节点在接收到针对6个子查询请求的数据后，将这些数据组合在一起，得到数据集合，而组合后的数据集合就是上述查询请求对应的数据。然后，将该数据集合发送给客户端，最终完成数据查询操作。

基于上述技术方案，本申请实施例中，可以根据接收到的查询请求的特征信息获得资源开销，并根据资源开销和计算节点资源获得计算节点数量，并在资源池中分配与该计算节点数量匹配的计算节点。这样，可以动态调节资源池中的计算节点，使得资源池中的计算节点能够处理接收到的所有查询请求，更有效的提高计算节点的处理效率和资源利用率，可以使得计算节点能够更有效的并行处理多个查询请求，提高CPU资源、内存资源、网络带宽资源的利用率，从而从整体计算资源和用户查询负载角度达到一个更好的效果，提高用户使用感受。通过对查询请求的特征进行分析和预测，可以对计算节点的资源进行智能分析和自动调整，更有效的提高云数据库和云数据分析服务集群的资源利用率和性价比。而且，通过动态调节资源池中的计算节点，使得各计算节点可以为用户提供无服务器化(Serverless)的查询分析服务，使得用户无需感知服务器或者服务实例，只需感知云服务提供的服务本身，基于云服务，用户只需要输入SQL查询请求，就可以由计算节点在数据库中进行数据查询和分析，可以无缝集成商业分析工具和应用程序。

参见图3所示，为本申请实施例的另一应用场景示意图，以下对图3和图1的不同之处进行说明。在图1中，所有计算节点都位于同一个资源池，在图3中，可以将计算节点的资源池划分为多个子资源池，以子资源池1、子资源池2、子资源池3为例，而计算节点是位于子资源池。例如，子资源池1包括2个计算节点，子资源池2包括2个计算节点，子资源池3包括4个计算节点，本实施例中，是对子资源池的计算节点进行扩容或者缩容处理，而不是针对资源池。

针对同一个子资源池，所有计算节点的计算节点资源相同；对于不同的子资源池，计算节点的计算节点资源可以相同或者不同。例如，子资源池1内的计算节点的计算节点资源为4个CPU核，子资源池2内的计算节点的计算节点资源为8个CPU核，子资源池3内的计算节点的计算节点资源为16个CPU核。

其中，可以根据不同用户的需求，为不同用户划分不同级别的子资源池，例如，可以基于用户的SLA(Service-Level Agreement，服务等级协议，即网络服务供应商和用户间的一份合同，定义了服务类型、服务质量和客户付款等术语)信息，为不同用户划分不同级别的子资源池，从而满足不同用户的需求。

在上述应用场景下，参见图4所示，为本申请实施例中提出的数据查询方法的流程示意图，以该方法应用于前端节点为例，该方法可以包括以下步骤：

步骤401，根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；不同的分配组对应不同的子资源池。如根据预设时间窗内接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组。

步骤402，根据分配组中的查询请求的特征信息获得该分配组的资源开销。

步骤403，根据该分配组的资源开销和该分配组对应的子资源池的计算节点资源，动态调节该子资源池中的计算节点。

步骤404，通过该子资源池中的计算节点查询与该分配组中的查询请求对应的数据，也就是说，不同的查询请求可能分配到不同的子资源池中的计算节点。

在执行步骤401之前，针对接收到的所有查询请求，还可以先获取每个查询请求的特征信息，该特征信息可以包括但不限于以下之一或者任意组合：并发度、查询复杂度、查询数据量、查询时间、资源占用率。其中，对于特征信息的获取方式，可以参见图2所示的流程，在此不再重复赘述。

在步骤401中，根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组，可以包括但不限于：针对接收到的每个查询请求，可以根据该查询请求的特征信息获得该查询请求的预测资源量，并确定该预测资源量所属的资源区间，并将该查询请求划分到该资源区间对应的分配组；其中，不同的分配组可以对应不同的资源区间。

其中，获得查询请求的预测资源量的过程可以参见步骤201，在此不再赘述。

其中，确定该预测资源量所属的资源区间，并将该查询请求划分到该资源区间对应的分配组，可以包括但不限于：预先为每个子资源池配置资源区间，对此配置方式不做限制，例如，当子资源池的计算节点资源越大时，该子资源池的资源区间可以越大，当子资源池的计算节点资源越小时，该子资源池的资源区间可以越小。例如，子资源池1的计算节点资源为4个CPU核，子资源池2的计算节点资源为8个CPU核，子资源池3的计算节点资源为16个CPU核，则子资源池1的资源区间为[0-1)个CPU核，子资源池2的资源区间为[1-2)个CPU核，子资源池3的资源区间为[2-无穷大)个CPU核。此外，还可以为每个资源区间配置一个分配组，如为子资源池1的资源区间配置分配组1，为子资源池2的资源区间配置分配组2，为子资源池3的资源区间配置分配组3。显然，分配组1对应子资源池1，分配组2对应子资源池2，分配组3对应子资源池3。

进一步的，假设查询请求的预测资源量为1个CPU核，则可以确定该预测资源量所属的资源区间为子资源池2的资源区间，并可以将该查询请求划分到分配组2。显然，在对预设时间窗内接收到的所有查询请求进行上述处理后，这些查询请求就可以被划分到各个分配组，如查询请求1-10被划分到分配组1，查询请求11-50被划分到分配组2，查询请求51-100被划分到分配组3。

在步骤402中，根据分配组中的查询请求的特征信息获得该分配组的资源开销，可以包括：针对分配组中的每个查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并根据该预测资源量获得分配组的资源开销。

其中，步骤402的实现过程可以参见步骤201，不同之处在于：在步骤201中，是针对接收到的所有查询请求进行处理，而步骤402中，是针对分配组中的所有查询请求进行处理，而其它过程类似，在此不再重复赘述。

在步骤403中，根据分配组的资源开销和该分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点，可以包括：根据分配组的资源开销和该分配组对应的子资源池的计算节点资源，获得该子资源池中的计算节点数量；在该子资源池中分配与该计算节点数量匹配的计算节点。

进一步的，在该子资源池中分配与该计算节点数量匹配的计算节点，可以包括：若该子资源池中已经存在的计算节点的数量小于该计算节点数量，则在该子资源池中扩容计算节点，扩容后的计算节点的数量大于等于计算节点数量；若该子资源池中已经存在的计算节点的数量大于计算节点数量，则在该子资源池中缩容计算节点，缩容后的计算节点的数量大于等于该计算节点数量。

其中，步骤403的实现过程可以参见步骤202，不同之处在于：在步骤202中，是根据接收到的所有查询请求的资源开销和计算节点资源，动态调节资源池中的计算节点，而步骤403中，是根据分配组的资源开销和该分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点。

例如，针对步骤403，可以根据分配组1的资源开销和子资源池1的计算节点资源，获得子资源池1中的计算节点数量10，并在子资源池1中分配10个计算节点。此外，可以根据分配组2的资源开销和子资源池2的计算节点资源，获得子资源池2中的计算节点数量8，并在子资源池1中分配8个计算节点。此外，可以根据分配组3的资源开销和子资源池3的计算节点资源，获得子资源池3中的计算节点数量13，并在子资源池3中分配13个计算节点。

其中，步骤404的实现过程可以参见步骤203，不同之处在于：在步骤203中，是将查询请求对应的查询请求发送给资源池的计算节点，步骤404中，是将分配组1的查询请求对应的查询请求发送给子资源池1的计算节点，将分配组2的查询请求对应的查询请求发送给子资源池2的计算节点，将分配组3的查询请求对应的查询请求发送给子资源池3的计算节点，在此不再重复赘述。

基于与上述方法同样的申请构思，本申请实施例还提供一种数据查询装置，如图5所示，为该装置的结构图，该装置包括：

获得模块501，用于根据接收到的查询请求的特征信息获得资源开销；处理模块502，根据资源开销和计算节点资源动态调节资源池中的计算节点；查询模块503，用于通过所述计算节点查询与所述查询请求对应的数据。

在一个例子中，所述获得模块501还用于：当特征信息包括查询复杂度时，从查询请求中获取查询关键字；通过所述查询关键字查询第一映射表，得到与所述查询关键字对应的复杂度值，将所述复杂度值确定为所述查询请求对应的查询复杂度；或者，从查询请求的多个子查询中获取查询关键字；通过获取的查询关键字查询第一映射表，得到与查询关键字对应的复杂度值；将得到的复杂度值之和确定为所述查询请求对应的查询复杂度；其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。

基于与上述方法同样的构思，本申请实施例提供一种数据查询设备，包括处理器，用于根据接收到的查询请求的特征信息获得资源开销；根据所述资源开销和计算节点资源动态调节资源池中的计算节点；通过所述计算节点查询与所述查询请求对应的数据。

基于与上述方法同样的申请构思，本申请实施例还提供一种机器可读存储介质，可以应用于数据查询设备，机器可读存储介质上存储有若干计算机指令；其中，所述计算机指令被执行时进行如下处理：根据接收到的查询请求的特征信息获得资源开销；根据所述资源开销和计算节点资源动态调节资源池中的计算节点；通过所述计算节点查询与所述查询请求对应的数据。

基于与上述方法同样的申请构思，本申请实施例还提供一种数据查询装置，如图6所示，为该装置的结构图，该装置包括：

划分模块601，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；不同分配组对应不同子资源池；获得模块602，用于根据分配组中的查询请求的特征信息获得所述分配组的资源开销；处理模块603，用于根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；查询模块604，用于通过所述子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

在一个例子中，所述划分模块603具体用于：针对接收到的查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并确定该预测资源量所属的资源区间；将该查询请求划分到所述资源区间对应的分配组；其中，不同的分配组对应不同的资源区间。

基于与上述方法同样的构思，本申请实施例提供一种数据查询设备，包括处理器，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；根据分配组中的查询请求的特征信息获得所述分配组的资源开销；根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

基于与上述方法同样的申请构思，本申请实施例还提供一种机器可读存储介质，可以应用于数据查询设备，机器可读存储介质上存储有若干计算机指令；其中，所述计算机指令被执行时进行如下处理：根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；根据分配组中的查询请求的特征信息获得所述分配组的资源开销；根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机，计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可以由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其它可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其它可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

而且，这些计算机程序指令也可以存储在能引导计算机或其它可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或者多个流程和/或方框图一个方框或者多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其它可编程数据处理设备上，使得在计算机或者其它可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其它可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

一种数据查询方法，其特征在于，所述方法包括：

根据接收到的查询请求的特征信息获得资源开销；

根据所述资源开销和计算节点资源动态调节资源池中的计算节点；

通过所述计算节点查询与所述查询请求对应的数据。
根据权利要求1所述的方法，其特征在于，所述特征信息包括以下之一或者任意组合：并发度、查询复杂度、查询数据量、查询时间、资源占用率。
根据权利要求1所述的方法，其特征在于，所述根据接收到的查询请求的特征信息获得资源开销之前，所述方法还包括：

若所述特征信息包括查询复杂度，从查询请求中获取查询关键字；

通过所述查询关键字查询第一映射表，得到与所述查询关键字对应的复杂度值，并将所述复杂度值确定为所述查询请求对应的查询复杂度；

其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。
根据权利要求1所述的方法，其特征在于，所述根据接收到的查询请求的特征信息获得资源开销之前，所述方法还包括：

若所述特征信息包括查询复杂度，则从查询请求的多个子查询中获取查询关键字；通过获取的查询关键字查询第一映射表，得到与查询关键字对应的复杂度值；将得到的复杂度值之和确定为所述查询请求对应的查询复杂度；

其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。
根据权利要求3或4所述的方法，其特征在于，

所述查询请求包括：结构化查询语言SQL查询请求；所述查询关键字包括以下之一或者任意组合：加入关键字、对结果集进行分组的关键字、对结果集进行排序的关键字、列出不同关键字、行数计算关键字、窗口函数关键字。
根据权利要求1所述的方法，其特征在于，所述根据接收到的查询请求的特征信息获得资源开销之前，所述方法还包括：

通过查询请求的数据标识查询第二映射表，得到与所述数据标识对应的特征信息；其中，所述第二映射表用于记录数据标识与特征信息的对应关系；所述特征信息包括查询数据量、查询时间、资源占用率中的一个或者多个。
根据权利要求6所述的方法，其特征在于，所述通过查询请求的数据标识查询第二映射表，得到与所述数据标识对应的特征信息之前，还包括：

收集历史数据，根据所述历史数据获取数据标识与特征信息的对应关系；

在所述第二映射表中记录数据标识与特征信息的对应关系。
根据权利要求1所述的方法，其特征在于，

所述根据接收到的查询请求的特征信息获得资源开销，包括：

针对接收到的查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并根据查询请求的预测资源量确定资源开销。
根据权利要求8所述的方法，其特征在于，

所述根据该查询请求的特征信息获得该查询请求的预测资源量，包括：

通过预测模型对该查询请求的特征信息进行分析，得到该查询请求的预测资源量；其中，所述预测模型包括：三次指数平滑法Holt-Winter季节模型、自回归与滑动平均ARMA模型、线性回归模型、神经网络模型。
根据权利要求1所述的方法，其特征在于，所述根据所述资源开销和计算节点资源动态调节资源池中的计算节点，包括：

根据所述资源开销和计算节点资源获得计算节点数量；

在资源池中分配与所述计算节点数量匹配的计算节点。
根据权利要求10所述的方法，其特征在于，

所述在资源池中分配与所述计算节点数量匹配的计算节点，包括：

若资源池中已经存在的计算节点的数量小于所述计算节点数量，则在资源池中扩容计算节点，扩容后的计算节点的数量大于等于所述计算节点数量；

若资源池中已经存在的计算节点的数量大于所述计算节点数量，则在资源池中缩容计算节点，缩容后的计算节点的数量大于等于所述计算节点数量。
一种数据查询方法，其特征在于，所述方法包括：

根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；

根据分配组中的查询请求的特征信息获得所述分配组的资源开销；

根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；

通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。
根据权利要求12所述的方法，其特征在于，所述特征信息包括以下之一或者任意组合：并发度、查询复杂度、查询数据量、查询时间、资源占用率。
根据权利要求12所述的方法，其特征在于，

所述将接收到的查询请求划分到至少一个分配组之前，所述方法还包括：

若所述特征信息包括查询复杂度，从查询请求中获取查询关键字；

通过所述查询关键字查询第一映射表，得到与所述查询关键字对应的复杂度值，并将所述复杂度值确定为所述查询请求对应的查询复杂度；

其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。
根据权利要求12所述的方法，其特征在于，

所述将接收到的查询请求划分到至少一个分配组之前，所述方法还包括：

若所述特征信息包括查询复杂度，则从查询请求的多个子查询中获取查询关键字；通过获取的查询关键字查询第一映射表，得到与查询关键字对应的复杂度值；将得到的复杂度值之和确定为所述查询请求对应的查询复杂度；

其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。
根据权利要求14或15所述的方法，其特征在于，

所述查询请求包括：结构化查询语言SQL查询请求；所述查询关键字包括以下之一或者任意组合：加入关键字、对结果集进行分组的关键字、对结果集进行排序的关键字、列出不同关键字、行数计算关键字、窗口函数关键字。
根据权利要求12所述的方法，其特征在于，

所述将接收到的查询请求划分到至少一个分配组之前，所述方法还包括：

通过查询请求的数据标识查询第二映射表，得到与所述数据标识对应的特征信息；其中，所述第二映射表用于记录数据标识与特征信息的对应关系；所述特征信息包括查询数据量、查询时间、资源占用率中的一个或者多个。
根据权利要求17所述的方法，其特征在于，所述通过查询请求的数据标识查询第二映射表，得到与所述数据标识对应的特征信息之前，还包括：

收集历史数据，根据所述历史数据获取数据标识与特征信息的对应关系；

在所述第二映射表中记录数据标识与特征信息的对应关系。
根据权利要求12所述的方法，其特征在于，根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组，包括：

针对接收到的查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并确定该预测资源量所属的资源区间；将该查询请求划分到所述资源区间对应的分配组；其中，不同的分配组对应不同的资源区间。
根据权利要求12所述的方法，其特征在于，

根据分配组中的查询请求的特征信息获得所述分配组的资源开销，包括：

针对分配组中的查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并根据该预测资源量获得所述分配组的资源开销。
根据权利要求19或20所述的方法，其特征在于，

所述根据该查询请求的特征信息获得该查询请求的预测资源量，包括：

通过预测模型对该查询请求的特征信息进行分析，得到该查询请求的预测资源量；其中，所述预测模型包括：三次指数平滑法Holt-Winter季节模型、自回归与滑动平均ARMA模型、线性回归模型、神经网络模型。
根据权利要求12所述的方法，其特征在于，

所述根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点，包括：

根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，获得所述子资源池中的计算节点数量；

在所述子资源池中分配与所述计算节点数量匹配的计算节点。
根据权利要求22所述的方法，其特征在于，

在所述子资源池中分配与所述计算节点数量匹配的计算节点，包括：

若子资源池中已经存在的计算节点的数量小于所述计算节点数量，则在子资源池中扩容计算节点，扩容后的计算节点的数量大于等于所述计算节点数量；

若子资源池中已经存在的计算节点的数量大于所述计算节点数量，则在子资源池中缩容计算节点，缩容后的计算节点的数量大于等于所述计算节点数量。
一种数据查询装置，其特征在于，所述装置包括：

获得模块，用于根据接收到的查询请求的特征信息获得资源开销；

处理模块，根据资源开销和计算节点资源动态调节资源池中的计算节点；

查询模块，用于通过所述计算节点查询与所述查询请求对应的数据。
根据权利要求24所述的装置，其特征在于，所述获得模块还用于：当特征信息包括查询复杂度时，从查询请求中获取查询关键字；通过所述查询关键字查询第一映射表，得到与所述查询关键字对应的复杂度值，将所述复杂度值确定为所述查询请求对应的查询复杂度；或者，从查询请求的多个子查询中获取查询关键字；通过获取的查询关键字查询第一映射表，得到与查询关键字对应的复杂度值；将得到的复杂度值之和确定为所述查询请求对应的查询复杂度；其中，所述第一映射表用于记录查询关键字与复杂度值的对应关系。
一种数据查询装置，其特征在于，应用于前端节点，所述装置包括：

划分模块，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同分配组对应不同的子资源池；

获得模块，用于根据分配组中的查询请求的特征信息获得所述分配组的资源开销；

处理模块，用于根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；

查询模块，用于通过所述子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。
根据权利要求26所述的装置，其特征在于，所述划分模块具体用于：针对接收到的查询请求，根据该查询请求的特征信息获得该查询请求的预测资源量，并确定该预测资源量所属的资源区间；将该查询请求划分到所述资源区间对应的分配组；其中，不同的分配组对应不同的资源区间。
一种数据查询设备，其特征在于，包括：

处理器，用于根据接收到的查询请求的特征信息获得资源开销；根据所述资源开销和计算节点资源动态调节资源池中的计算节点；通过所述计算节点查询与所述查询请求对应的数据。
一种数据查询设备，其特征在于，包括：处理器，用于根据接收到的查询请求的特征信息，将接收到的查询请求划分到至少一个分配组；其中，不同的分配组对应不同的子资源池；根据分配组中的查询请求的特征信息获得所述分配组的资源开销；根据所述分配组的资源开销和所述分配组对应的子资源池的计算节点资源，动态调节所述子资源池中的计算节点；通过子资源池中的计算节点查询与所述分配组中的查询请求对应的数据。