[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113127416B - 数据查询方法和装置 - Google Patents

数据查询方法和装置 Download PDF

Info

Publication number
CN113127416B
CN113127416B CN202010044001.1A CN202010044001A CN113127416B CN 113127416 B CN113127416 B CN 113127416B CN 202010044001 A CN202010044001 A CN 202010044001A CN 113127416 B CN113127416 B CN 113127416B
Authority
CN
China
Prior art keywords
cache
data
query
query request
data blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010044001.1A
Other languages
English (en)
Other versions
CN113127416A (zh
Inventor
祝江华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202010044001.1A priority Critical patent/CN113127416B/zh
Publication of CN113127416A publication Critical patent/CN113127416A/zh
Application granted granted Critical
Publication of CN113127416B publication Critical patent/CN113127416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据查询方法和装置,涉及计算机技术领域。其中,该方法包括:接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。通过以上步骤,能够提高数据查询效率,改善存储系统的查询性能。

Description

数据查询方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据查询方法和装置。
背景技术
为了快速响应访问请求,现有的存储系统中普遍设有缓存机制。如图1所述,在现有缓存机制下,内存中设有两个内存空间,具体为内存空间L1和内存空间L2。其中,内存空间L1用于存储部分索引(Index),内存空间L2用于存储与L1中的索引对应的数据(DataBlock)。在现有技术中,服务端在接收到数据查询请求后,先从内存空间L1中查找到相应的索引,再根据查找到的索引从内存空间L2中获取数据。如果在内存空间L2中获取不到数据,则需要在底层系统中获取数据。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:由于内存空间L2中存放的数据通常为底层系统中的文件的一部分。在现有的数据查询流程中,如果需要在底层系统中获取数据,则必须从底层系统文件的第1行开始检索,这样在查找过程中就会检索很多不必要的数据,进而拖慢了数据查询效率,降低了系统的查询性能。
发明内容
有鉴于此,本发明提供一种数据查询方法和装置,能够提高数据查询效率,改善存储系统的查询性能。
为实现上述目的,根据本发明的第一个方面,提供了一种数据查询方法。
本发明的数据查询方法包括:接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。
可选地,在所述根据所述查询请求查询第三缓存,以得到与所述查询请求对应的索引的步骤之前,还包括,将所述与其他数据块相对应的索引加载至第三缓存中。
可选地,所述方法还包括:将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移动至第一缓存。
可选地,所述方法还包括:在所述第一缓存存在与所述查询请求对应的索引的情况下,根据与所述查询请求对应的索引查询第二缓存,并将从第二缓存中查询出的数据返回至客户端。
可选地,所述方法应用于HBase服务端,所述文件系统为HDFS系统。
为实现上述目的,根据本发明的第二个方面,提供了一种数据查询装置。
本发明的数据查询装置包括:第一缓存查询模块,用于接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;第三缓存查询模块,用于响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;文件系统查询模块,用于根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。
可选地,所述装置还包括:加载模块,用于在第三缓存查询模块根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引之前,将所述与其他数据块相对应的索引加载至第三缓存中。
可选地,所述装置还包括:更新模块,用于将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移动至第一缓存。
上述发明中的一个实施例具有如下优点或有益效果:通过设置第一缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、与其他数据块相对应的索引,以及,响应于确定第一缓存不存在与查询请求对应的索引,根据所述查询请求查询第三缓存,并根据查询出的对应索引查询文件系统这些步骤,能够提高数据查询效率,改善存储系统的查询性能。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据现有技术的缓存机制原理示意图;
图2是根据本发明第一实施例的数据查询方法的主要流程示意图;
图3是根据本发明第二实施例的数据查询方法的主要流程示意图;
图4是根据本发明实施例的缓存机制原理示意图;
图5是根据本发明第三实施例的数据查询装置的主要模块的示意图;
图6是根据本发明第四实施例的数据查询装置的主要模块的示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明中的实施例以及实施例中的特征可以相互组合。
图2是根据本发明第一实施例的数据查询方法的主要流程示意图。如图2所示,本发明实施例的数据查询方法包括:
步骤S201、接收客户端的查询请求,根据所述查询请求查询第一缓存。
其中,所述第一缓存用于存储与第二缓存中的数据块相对应的索引。例如,第二缓存中存储了数据块1、数据块2,则第一缓存可存储数据块1对应的索引、数据块2对应的索引。示例性地,第一缓存中的索引可采用Key-Value(键值对)格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
其中,所述第二缓存中存储的数据块可具体为查询过的数据块。所述数据块,可理解为数据的最小存储单元。例如,在HDFS(全称为Hadoop Distributed File System,又可称为Hadoop分布式文件系统)中,一个文件可被划分为多个数据块进行存储。示例性地,第二缓存中的数据块可采用Key-Value格式进行存储,该数据块可具体包括:数据的键(key)、数据的键(key)长度、数据的值(value)、数据的值(value)长度。
步骤S202、响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引。
其中,第三缓存用于存储与其他数据块相对应的索引,所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块。例如,假设文件1由数据块1、数据块2、数据块3构成,且第二缓存中存储了文件1中的数据块1和数据块2,则在第三缓存中存储与数据块3对应的索引。例如,假设文件1由数据块1、数据块2、数据块3构成,文件2由数据块4、数据块5、数据块6构成,且第二缓存中存储了文件1中的数据块1和数据块2、以及文件2中的数据块6,则在第三缓存中存储与数据块3对应的索引、与数据块4对应的索引、以及与数据块5对应的索引。
示例性地,第三缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
步骤S203、根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。
在本发明实施例中,在通过步骤S202确定与查询请求对应的索引之后,可直接根据查找出的索引在文件系统进行数据定位,而无需从文件的第一行开始检索,提高了查询文件系统的效率。
在本发明实施例中,通过设置第一缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、与其他数据块相对应的索引,以及,在第一缓存不存在与查询请求对应的索引的情况下,根据所述查询请求查询第三缓存,并根据查询出的对应索引查询文件系统这些步骤,能够提高数据查询效率,改善存储系统的查询性能。
图3是根据本发明第二实施例的数据查询方法的主要流程示意图。本发明实施例的方法可由存储系统的服务端执行,比如HBase(HBase是一个开源的非关系型分布式数据库)服务端。如图3所示,本发明实施例的数据查询方法包括:
步骤S301、接收客户端的查询请求。
其中,所述查询请求可包括与数据查询相关的参数。比如,其可包括用户要查询的起始键(startkey)、用户要查询的结束键(endkey)、过滤条件等。
步骤S302、根据所述查询请求查询第一缓存。
其中,所述第一缓存用于存储与第二缓存中的数据块相对应的索引。例如,第二缓存中存储了数据块1、数据块2,则第一缓存可存储数据块1对应的索引、数据块2对应的索引。示例性地,第一缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
示例性地,在根据所述查询请求查询第一缓存时,可采用二分查找方法。二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。在第一缓存中存在与查询请求对应的索引的情况下,执行步骤S308;在第一缓存中不存在与查询请求对应的索引的情况下,执行步骤S303。
步骤S303、将与其他数据块对应的索引加载至第三缓存中。
其中,所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块。例如,假设文件1由数据块1、数据块2、数据块3构成,且第二缓存中存储了文件1中的数据块1和数据块2,则将与数据块3对应的索引加载至第三缓存中。例如,假设文件1由数据块1、数据块2、数据块3构成,文件2由数据块4、数据块5、数据块6构成,且第二缓存中存储了文件1中的数据块1和数据块2、以及文件2中的数据块6,则将与数据块3对应的索引、与数据块4对应的索引、以及与数据块5对应的索引加载至第三缓存中。
示例性地,第三缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
步骤S304、根据所述查询请求查询第三缓存,以确定与查询请求对应的索引。
其中,第三缓存用于存储与其他数据块相对应的索引。示例性地,在根据所述查询请求查询第三缓存时,可采用二分查找方法。二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。
步骤S305、根据所述对应的索引查询文件系统。
在本发明实施例中,在通过步骤S304确定与查询请求对应的索引之后,可直接根据查找出的索引在文件系统进行数据定位,而无需从文件的第一行开始检索,提高了查询文件系统的效率。
步骤S306、将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移动至第一缓存。
例如,假设从文件系统中查询出的数据为HDFS系统中某个文件中的数据块3,则将数据块3存储至第二缓存,并将第三缓存中与数据块3对应的索引移至第一缓存中。
步骤S307、将从文件系统查询出的数据返回至客户端。
在一个可选实施方式中,步骤S306与S307可采用异步操作。通过采用异步操作,能够进一步提高查询响应速度,提高用户的查询体验。
步骤S308、根据所述对应的索引查询第二缓存。
其中,所述第二缓存中存储的数据块可具体为查询过的数据块。所述数据块,可理解为数据的最小存储单元。例如,在HDFS系统中,一个文件可被划分为多个数据块进行存储。示例性地,第二缓存中的数据块可采用Key-Value格式进行存储,该数据块可具体包括:数据的键(key)、数据的键(key)长度、数据的值(value)、数据的值(value)长度。
步骤S309、将从第二缓存中查询出的数据返回至客户端。
在本发明实施例中,通过在存储系统的服务端中设置第一缓存、第二缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、查询过的数据块、与其他数据块相对应的索引,以及,在第一缓存不存在与查询请求对应的索引的情况下,根据所述查询请求查询第三缓存,并根据查询出的对应索引查询文件系统等步骤,能够提高数据查询效率,改善存储系统的查询性能。
图4是根据本发明实施例的缓存机制原理示意图。如图4所示,本发明实施例的数据查询方法可适用于HBase系统。其中,HBase系统包括客户端401、HBase服务端402、HDFS系统403。其中,HBase服务端402设有三层缓存机制。具体来说,可将HBase服务端402的内存中设置三个内存空间,分别为第一缓存、第二缓存、第三缓存。其中,第一缓存可用于存储与第二缓存中的数据块相对应的索引;第二缓存可用于存储用户查询过的数据块;第三缓存可用于存储与其他数据块相对应的索引,所述其他数据块为同一HDFS文件中除所述第二缓存中的数据块之外的数据块。
在本发明实施例中,通过在HBase服务端设置三层缓存机制,以分别用于存储与第二缓存中的数据块相对应的索引、查询过的数据块、与其他数据块相对应的索引,能够提高数据查询效率,改善HBase系统的查询性能。
图5是根据本发明第三实施例的数据查询装置的主要模块的示意图。如图5所示,本发明实施例的数据查询装置500包括:第一缓存查询模块501、第三缓存查询模块502、文件系统查询模块503。
第一缓存查询模块501,用于接收客户端的查询请求,根据所述查询请求查询第一缓存。
其中,所述第一缓存用于存储与第二缓存中的数据块相对应的索引。例如,第二缓存中存储了数据块1、数据块2,则第一缓存可存储数据块1对应的索引、数据块2对应的索引。示例性地,第一缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
其中,所述第二缓存中存储的数据块可具体为查询过的数据块。所述数据块,可理解为数据的最小存储单元。例如,在HDFS系统中,一个文件可被划分为多个数据块进行存储。示例性地,第二缓存中的数据块可采用Key-Value格式进行存储,该数据块可具体包括:数据的键(key)、数据的键(key)长度、数据的值(value)、数据的值(value)长度。
第三缓存查询模块502,用于响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引。
其中,第三缓存用于存储与其他数据块相对应的索引,所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块。例如,假设文件1由数据块1、数据块2、数据块3构成,且第二缓存中存储了文件1中的数据块1和数据块2,则在第三缓存中存储与数据块3对应的索引。例如,假设文件1由数据块1、数据块2、数据块3构成,文件2由数据块4、数据块5、数据块6构成,且第二缓存中存储了文件1中的数据块1和数据块2、以及文件2中的数据块6,则在第三缓存中存储与数据块3对应的索引、与数据块4对应的索引、以及与数据块5对应的索引。
示例性地,第三缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
文件系统查询模块503,用于根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。
在本发明实施例中,在通过第三缓存查询模块502确定与查询请求对应的索引之后,文件系统查询模块503可直接根据查找出的索引在文件系统进行数据定位,而无需从文件的第一行开始检索,提高了查询文件系统的效率。
在本发明实施例的装置中,通过设置第一缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、与其他数据块相对应的索引,以及,在第一缓存不存在与查询请求对应的索引的情况下,通过第三缓存查询模块根据所述查询请求查询第三缓存,通过文件系统查询模块根据查询出的对应索引查询文件系统,能够提高数据查询效率,改善存储系统的查询性能。
图6是根据本发明第四实施例的数据查询装置的主要模块的示意图。如图6所示,本发明实施例的数据查询装置600包括:第一缓存查询模块601、第二缓存查询模块602、加载模块603、第三缓存查询模块604、文件系统查询模块605、更新模块606。
第一缓存查询模块601,用于接收到客户端的查询请求,根据所述查询请求查询第一缓存。
其中,所述第一缓存用于存储与第二缓存中的数据块相对应的索引。例如,第二缓存中存储了数据块1、数据块2,则第一缓存可存储数据块1对应的索引、数据块2对应的索引。示例性地,第一缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
其中,所述第二缓存中存储的数据块可具体为查询过的数据块。所述数据块,可理解为数据的最小存储单元。例如,在HDFS系统中,一个文件可被划分为多个数据块进行存储。示例性地,第二缓存中的数据块可采用Key-Value格式进行存储,该数据块可具体包括:数据的键(key)、数据的键(key)长度、数据的值(value)、数据的值(value)长度。
第二缓存查询模块602,用于响应于确定第一缓存中存在与查询请求对应的索引,根据所述对应的索引查询第二缓存,并将从第二缓存中查询出的数据返回至客户端。
其中,所述第二缓存中存储的数据块可具体为查询过的数据块。所述数据块,可理解为数据的最小存储单元。例如,在HDFS系统中,一个文件可被划分为多个数据块进行存储。示例性地,第二缓存中的数据块可采用Key-Value格式进行存储,该数据块可具体包括:数据的键(key)、数据的键(key)长度、数据的值(value)、数据的值(value)长度。
加载模块603,用于响应于确定第一缓存中不存在与查询请求对应的索引,将与其他数据块对应的索引加载至第三缓存中。
其中,所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块。例如,假设文件1由数据块1、数据块2、数据块3构成,且第二缓存中存储了文件1中的数据块1和数据块2,则加载模块603将与数据块3对应的索引加载至第三缓存中。例如,假设文件1由数据块1、数据块2、数据块3构成,文件2由数据块4、数据块5、数据块6构成,且第二缓存中存储了文件1中的数据块1和数据块2、以及文件2中的数据块6,则加载模块603将与数据块3对应的索引、与数据块4对应的索引、以及与数据块5对应的索引加载至第三缓存中。
示例性地,第三缓存中的索引可采用Key-Value格式进行存储,该索引可具体包括:数据的起始位置(比如数据在文件中的起始键)、数据的结束位置(比如数据在文件中的结束键)、路径等信息。
第三缓存查询模块604,用于根据所述查询请求查询第三缓存,以确定与查询请求对应的索引。
其中,第三缓存用于存储与其他数据块相对应的索引。示例性地,在根据所述查询请求查询第三缓存时,第三缓存查询模块604可采用二分查找方法。二分查找也称折半查找(Binary Search),它是一种效率较高的查找方法。
文件系统查询模块605,用于根据从第三缓存中查询出的与查询请求对应的索引查询文件系统,并将从文件系统查询出的数据返回至客户端。
在本发明实施例中,在通过第三缓存查询模块确定与查询请求对应的索引之后,文件系统查询模块可直接根据查找出的索引在文件系统进行数据定位,而无需从文件的第一行开始检索,提高了查询文件系统的效率。
更新模块606,用于将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移至第一缓存。
例如,假设从文件系统中查询出的数据为HDFS系统中某个文件中的数据块3,则更新模块606将数据块3存储至第二缓存,并将第三缓存中与数据块3对应的索引移动至第一缓存中。
在本发明实施例的装置中,通过在存储系统的服务端中设置第一缓存、第二缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、查询过的数据块、与其他数据块相对应的索引,以及,在第一缓存中不存在与查询请求对应的索引的情况下,根据所述查询请求查询第三缓存,并通过查询出的对应索引从文件系统中获取数据,以及,在第一缓存中存在与查询请求对应的索引的情况下,根据查询出的对应索引从第二缓存中获取数据,能够提高数据查询效率,改善存储系统的查询性能。
图7示出了可以应用本发明实施例的数据查询方法或数据查询装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的网站或App提供支持的后台管理服务器。后台管理服务器可以对接收到的查询请求等数据进行分析等处理,并将处理结果(例如查询到的数据)反馈给终端设备。
需要说明的是,本发明实施例所提供的数据查询方法一般由服务器705执行,相应地,数据查询装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本发明实施例的电子设备的计算机系统800的结构示意图。图8示出的计算机系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括第一缓存查询模块、第三缓存查询模块、文件系统查询模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,第一缓存查询模块还可以被描述为“查询第一缓存的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端。
根据本发明实施例的技术方案,通过设置第一缓存、第三缓存,以分别用于存储与第二缓存中的数据块相对应的索引、与其他数据块相对应的索引,以及,在第一缓存不存在与查询请求对应的索引的情况下,根据所述查询请求查询第三缓存,并根据查询出的对应索引查询文件系统,能够提高数据查询效率,改善存储系统的查询性能。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (8)

1.一种数据查询方法,其特征在于,所述方法包括:
接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;所述第二缓存中存储的数据块为查询过的数据块;
响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;
根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端;
在所述根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引之前,还包括,将所述与其他数据块相对应的索引加载至第三缓存中。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移动至第一缓存。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述第一缓存存在与所述查询请求对应的索引的情况下,根据与所述查询请求对应的索引查询第二缓存,并将从第二缓存中查询出的数据返回至客户端。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法应用于HBase服务端,所述文件系统为HDFS系统。
5.一种数据查询装置,其特征在于,所述装置包括:
第一缓存查询模块,用于接收客户端的查询请求,根据所述查询请求查询第一缓存;所述第一缓存用于存储与第二缓存中的数据块相对应的索引;所述第二缓存中存储的数据块为查询过的数据块;
第三缓存查询模块,用于响应于确定所述第一缓存不存在与所述查询请求对应的索引,根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引;所述第三缓存用于存储与其他数据块相对应的索引;所述其他数据块为同一文件中除所述第二缓存中的数据块之外的数据块;
文件系统查询模块,用于根据与所述查询请求对应的索引查询文件系统,并将从文件系统中查询出的数据返回至客户端;
所述装置还包括:
加载模块,用于在第三缓存查询模块根据所述查询请求查询第三缓存,确定与所述查询请求对应的索引之前,将所述与其他数据块相对应的索引加载至第三缓存中。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
更新模块,用于将从文件系统中查询出的数据更新至第二缓存中,并将第三缓存中与所述查询出的数据相对应的索引移动至第一缓存。
7.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
8.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-4中任一所述的方法。
CN202010044001.1A 2020-01-15 2020-01-15 数据查询方法和装置 Active CN113127416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010044001.1A CN113127416B (zh) 2020-01-15 2020-01-15 数据查询方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010044001.1A CN113127416B (zh) 2020-01-15 2020-01-15 数据查询方法和装置

Publications (2)

Publication Number Publication Date
CN113127416A CN113127416A (zh) 2021-07-16
CN113127416B true CN113127416B (zh) 2024-10-18

Family

ID=76771973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010044001.1A Active CN113127416B (zh) 2020-01-15 2020-01-15 数据查询方法和装置

Country Status (1)

Country Link
CN (1) CN113127416B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116594758B (zh) * 2023-07-18 2023-09-26 山东三未信安信息科技有限公司 一种密码模块调用优化系统及优化方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918472A (zh) * 2019-02-27 2019-06-21 北京百度网讯科技有限公司 存储和查询数据的方法、装置、设备和介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011076120A1 (en) * 2009-12-25 2011-06-30 Shanghai Xin Hao Micro Electronics Co. Ltd. High-performance cache system and method
CN105354151B (zh) * 2014-08-19 2020-09-11 阿里巴巴集团控股有限公司 一种缓存管理方法与设备
CN104794162B (zh) * 2015-03-25 2018-02-23 中国人民大学 实时数据存储与查询方法
US10423583B1 (en) * 2016-12-27 2019-09-24 EMC IP Holding Company LLC Efficient caching and configuration for retrieving data from a storage system
CN110196818B (zh) * 2018-02-27 2021-07-16 华为技术有限公司 缓存数据的方法、缓存设备和存储系统
CN109299087A (zh) * 2018-08-14 2019-02-01 中国平安财产保险股份有限公司 数据缓存方法、装置、计算机设备及存储介质
CN110321325B (zh) * 2019-06-21 2024-05-10 腾讯科技(深圳)有限公司 文件索引节点查找方法、终端、服务器、系统及存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918472A (zh) * 2019-02-27 2019-06-21 北京百度网讯科技有限公司 存储和查询数据的方法、装置、设备和介质

Also Published As

Publication number Publication date
CN113127416A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
CN109614402B (zh) 多维数据查询方法和装置
CN110019080B (zh) 数据访问方法和装置
CN107704202B (zh) 一种数据快速读写的方法和装置
CN112597126B (zh) 一种数据迁移方法和装置
US9251227B2 (en) Intelligently provisioning cloud information services
CN110909022A (zh) 一种数据查询方法和装置
CN110110184B (zh) 信息查询方法、系统、计算机系统及存储介质
CN109086414B (zh) 用于搜索区块链数据的方法、装置及存储介质
CN113127416B (zh) 数据查询方法和装置
CN109213815B (zh) 控制执行次数的方法、装置、服务器终端以及可读介质
CN112711572B (zh) 适用于分库分表的在线扩容方法和装置
CN116775167A (zh) 一种业务处理方法、装置、电子设备及计算机可读介质
CN113704242B (zh) 一种数据处理方法和装置
CN114756173A (zh) 文件合并的方法、系统、设备和计算机可读介质
CN113760929A (zh) 数据同步方法、装置、电子设备和计算机可读介质
CN113760860B (zh) 一种数据读取方法和装置
CN113760965B (zh) 数据查询的方法和装置
CN112395510A (zh) 基于活跃度确定目标用户的方法和装置
CN113779450B (zh) 页面访问方法和页面访问装置
CN113760981B (zh) 一种数据查询方法和装置
CN113821519B (zh) 一种数据处理方法以及领域驱动设计架构
CN112115165B (zh) 一种数据处理方法和装置
CN111291038B (zh) 一种数据查询方法及装置
CN111061680B (zh) 一种数据检索的方法和装置
CN113986917A (zh) 处理业务数据的方法、装置、设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant