[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN113377791B - 一种数据处理方法、系统及计算设备 - Google Patents

一种数据处理方法、系统及计算设备 Download PDF

Info

Publication number
CN113377791B
CN113377791B CN202110645575.9A CN202110645575A CN113377791B CN 113377791 B CN113377791 B CN 113377791B CN 202110645575 A CN202110645575 A CN 202110645575A CN 113377791 B CN113377791 B CN 113377791B
Authority
CN
China
Prior art keywords
data
message
storage device
server
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110645575.9A
Other languages
English (en)
Other versions
CN113377791A (zh
Inventor
王华存
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Cheerbright Technologies Co Ltd
Original Assignee
Beijing Cheerbright Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Cheerbright Technologies Co Ltd filed Critical Beijing Cheerbright Technologies Co Ltd
Priority to CN202110645575.9A priority Critical patent/CN113377791B/zh
Publication of CN113377791A publication Critical patent/CN113377791A/zh
Application granted granted Critical
Publication of CN113377791B publication Critical patent/CN113377791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数据处理方法,包括:将一个或多个业务模块中的数据基于相应的数据表抽取到数据采集设备;在消息服务器中创建与每个数据表相对应的消息主题;实时获取每个数据表中的变更数据,将每个数据表中的变更数据封装为消息体,并将消息体基于相应的消息主题发送至消息服务器;从消息服务器中获取每个消息主题对应的一个或多个消息体,并将消息体处理为相应的变更数据存储到数据存储设备,以便更新数据存储设备中的数据;将数据存储设备中的变更数据发送至相应的业务模块对应的业务资源服务器。本发明一并公开了相应的数据处理系统和计算设备。根据本发明的技术方案,能实现各个业务模块的数据整合,并能保证数据的实时性和一致性。

Description

一种数据处理方法、系统及计算设备
技术领域
本发明涉及计算机及互联网技术领域,尤其涉及一种数据处理方法、数据处理系统及计算设备。
背景技术
目前,随着企业业务线的扩张与多元化发展,在积极推进业务数据化的同时,各个垂直业务也快速发展,从而形成了多个垂直的数据中心。因此,需要打通各个数据中心,将数据整合并提供统一的服务,形成统一的全业务线数据体系。
现有技术中,数据整合的实现方式可分为两种,一种是采用侵入式的接口调用方法,提供中心库数据整合接口,由业务方调接口写入。这种方案,由于整合各个业务线数据需要相关部门主动调接口推送,增加了沟通成本与实现成本,而且,这种方案避免不了会存在延时问题。
另一种是非侵入式的解析binlog的方法,解析业务库的实时binlog,统一采集。采用这种方案,在首次整合全量数据时,需要定时进行任务处理或者触发全量数据binlog,消耗时间过长,而且,存在业务库与中心库之间数据不一致的问题。
为此,需要一种数据处理方法及系统,来解决上述技术方案中存在的问题。
发明内容
为此,本发明提供一种数据处理方法、系统及计算设备,以解决或至少缓解上面存在的问题。
根据本发明的一个方面,提供一种数据处理方法,在数据处理服务器中执行,包括步骤:将一个或多个业务模块中的数据基于相应的数据表抽取到数据采集设备;在消息服务器中创建与每个数据表相对应的消息主题;实时获取每个数据表中的变更数据,将每个数据表中的变更数据封装为消息体,并将消息体基于相应的消息主题发送至消息服务器;从所述消息服务器中获取每个消息主题对应的一个或多个消息体,并将消息体处理为相应的变更数据存储到数据存储设备,以便更新数据存储设备中的数据;以及将所述数据存储设备中的变更数据发送至相应的业务模块对应的业务资源服务器。
可选地,在根据本发明的数据处理方法中,还包括步骤:将所述数据存储设备中的变更数据发送至资源服务器,以便基于搜索引擎搜索所述资源服务器中的变更数据。
可选地,在根据本发明的数据处理方法中,还包括步骤:将资源服务器中的变更数据实时发送至搜索引擎,以便搜索引擎基于变更数据生成相应的索引。
可选地,在根据本发明的数据处理方法中,还包括步骤:每隔预定时间比对所述数据存储设备与数据采集设备中的数据,确定数据存储设备中是否存在遗漏数据;如果存在遗漏数据,则基于遗漏数据生成补偿任务,并通过执行补偿任务将所述遗漏数据重新存储到所述数据存储设备。
可选地,在根据本发明的数据处理方法中,将消息体处理为相应的变更数据存储到数据存储设备的步骤包括:对消息体进行解析,以获取消息体对应的数据表中的变更数据和相应的业务模块标识;将所述变更数据与业务模块标相关联地存储到数据存储设备。
可选地,在根据本发明的数据处理方法中,将数据存储设备中的变更数据发送至相应的业务模块对应的业务资源服务器的步骤包括:将数据存储设备中的变更数据基于相关联的业务模块标识发送至相应的消息队列,以便基于消息队列将变更数据发送至相应的业务模块对应的业务资源服务器。
可选地,在根据本发明的数据处理方法中,将消息体处理为相应的变更数据存储到数据存储设备的步骤包括:创建包括多个线程的线程池;基于多个线程从所述消息服务器中获取消息体,并将消息体处理为相应的变更数据存储到数据存储设备。
可选地,在根据本发明的数据处理方法中,在将一个或多个业务模块中的数据基于相应的数据表抽取到数据采集设备之前,包括步骤:获取与一个或多个业务模块分别相对应的数据模型;在数据采集设备中创建与每个数据模型分别相对应的数据表。
根据本发明的一个方面,提供一种数据处理系统,包括:数据采集设备,适于基于相应的数据表抽取一个或多个业务模块的数据,并适于实时获取每个数据表中的变更数据,将每个数据表中的变更数据封装为消息体;消息服务器,与所述数据采集设备相连,适于创建与每个数据表相对应的消息主题,并适于接收所述数据采集设备基于相应的消息主题发送的消息体;数据处理服务器,与所述消息服务器相连,适于从消息服务器中获取每个消息主题对应的一个或多个消息体,并将消息体处理为相应的变更数据;数据存储设备,与所述数据处理服务器相连,适于从所述数据处理服务器获取所述变更数据并存储,以便更新数据存储设备中的数据;以及与每个业务模块分别相对应的业务资源服务器,与所述数据存储设备相连,适于从所述数据存储设备中获取相应的变更数据。
可选地,在根据本发明的数据处理系统中,还包括:资源服务器,与所述数据存储设备相连,适于从所述数据存储设备中获取变更数据;搜索引擎,与资源服务器相连,适于接收资源服务器实时发送的变更数据,并适于基于变更数据生成相应的索引。
可选地,在根据本发明的数据处理系统中,还包括:比对模块,分别与数据存储设备、数据采集设备相连,适于每隔预定时间比对所述数据存储设备与数据采集设备中的数据,确定数据存储设备中是否存在遗漏数据;如果存在遗漏数据,则基于遗漏数据生成补偿任务,并通过执行补偿任务将所述遗漏数据重新存储到所述数据存储设备。
根据本发明的一个方面,提供一种计算设备,包括:至少一个处理器;存储器,存储有程序指令,其中,程序指令被配置为适于由上述至少一个处理器执行,所述程序指令包括用于执行如上所述的数据处理方法的指令。
根据本发明的一个方面,提供一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得该计算设备执行如上所述的数据处理方法。
根据本发明的技术方案,提供了一种数据处理方法及系统,通过数据采集设备采集各个业务模块的数据,并实时获取各个业务模块的变更数据,通过将每个业务模块的变更数据封装成消息体,并基于与业务模块相对应的消息主题发送至消息服务器,由数据处理设备实时获取消息体,将解析后得到的变更数据与业务模块标识相关联地存储到数据存储设备。这样,本发明以非侵入式的方式实现了对各个业务模块的数据进行整合,不会影响各个业务模块的功能,并且,能将数据采集设备中的变更数据实时写入数据存储设备,保证数据存储设备中的数据实时更新,与数据采集设备数据保持一致。另外,数据存储设备中的数据可以分发给相应的业务资源服务器,使得每个业务资源服务器可以提供个性化的搜索和推荐服务。
此外,本发明通过定时对数据存储设备遗漏的数据进行补偿,能保证数据存储设备与数据采集设备中数据的一致性、实时性,使得系统数据更加稳定可靠。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的数据处理系统100的示意图;
图2示出了根据本发明一个实施例的计算设备200的示意图;以及
图3示出了根据本发明一个实施例的数据处理方法300的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的数据处理系统100的示意图。
如图1所示,数据处理系统100包括一个或多个业务模块110、数据采集设备120、消息服务器130、数据处理服务器140和数据存储设备150。其中,数据采集设备120与一个或多个业务模块110分别通信连接,且数据采集设备120与消息服务器130通信连接,例如通过有线或无线的方式网络连接。
数据采集设备120中可以创建与每个业务模块的数据模型分别相对应的数据表,并可以基于相应的数据表将一个或多个业务模块110中的数据基于抽取到数据采集设备120中。具体地,预先获取与一个或多个业务模块110分别相对应的数据模型,并在数据采集设备120中创建与每个业务模块的数据模型分别相对应的数据表。可以理解,每个业务模块110分别对应一个数据表。
消息服务器130中可以创建与每个数据表相对应的消息主题。可以理解,这里创建的每个消息主题也分别对应一个业务模块。并且,数据采集设备120通过采集与每个数据表相对应的binlog日志,可以获取数据采集设备120中的每个数据表中的变更数据,并可以将每个数据表中的变更数据封装为消息体,将消息体基于基于与数据表相对应的消息主题发送至消息服务器130,以便消息体基于相应的消息主题存放在消息服务器130中。这里,消息服务器130例如可以实现为kafka消息中间件,但不限于此。
数据处理服务器140分别与消息服务器130、数据存储设备150通信连接,数据处理服务器140通过监听消息服务器130中是否包括消息体,在监听到消息体时,从消息服务器130中获取每个消息主题对应的一个或多个消息体,并且,数据处理服务器140可以将获取到的消息体处理为相应的变更数据存储到数据存储设备150。数据存储设备150在从数据处理服务器140获取到变更数据后,可以更新数据存储设备150中的数据。
在一个实施例中,数据处理服务器140通过对消息体进行解析处理,可以获取到与消息体相对应的数据表中的变更数据和相应的业务模块的标识,并将变更数据与业务模块标相关联地存储到数据存储设备150。应当指出,数据表包括主表以及与主表相关联的副表。根据一种实施方式,在解析消息体时,可以利用Goodsld查询并获取采集数据设备120中的副表信息。
在一个实施例中,系统100还包括与每个业务模块分别相对应的业务资源服务器160、资源服务器170。数据存储设备150与每个业务模块110对应的业务资源服务器160分别通信连接,并与资源服务器170通信连接。
数据存储设备150中的数据及变更的数据可以提供给相应的业务模块110对应的业务资源服务器160。这里,数据存储设备150中的变更数据可以基于相关联的业务模块标识发送至相应的业务资源服务器160。在一个实施例中,系统100还包括消息队列服务器156,消息队列服务器156包括多个消息队列,数据存储设备150分别基于相应的消息队列与每个业务资源服务器160相连,从而,数据存储设备150中的变更数据可以基于相关联的业务模块标识、经由消息队列发送至与业务模块标识相对应的业务资源服务器160。业务资源服务器160在从数据存储设备150获取到相应的变更数据后,基于细分后的数据可用于相应业务模块的搜索推荐。这样,使得每个业务资源服务器160可以提供个性化的搜索与推荐服务。
另外,数据存储设备150中的数据及变更数据还可以不做区分、统一提供给资源服务器170。在一个实施例中,资源服务器170与搜索引擎175通信连接,例如通过有线或无线的方式网络连接。资源服务器170基于从数据存储设备150中获取到的变更数据,使得用户可以基于搜索引擎175搜索到资源服务器170中新增的变更数据。进一步地,资源服务器170可以将获取到的变更数据实时发送至搜索引擎175,搜索引擎175可以基于实时获取到的变更数据生成相应的索引,以便用户在搜素引擎页面基于相应的索引来搜索数据。这里,索引中的属性即是搜索数据时所需的查询条件。还应当指出,资源服务器170获取到的数据是涉及多个业务模块的全量数据,这样,可以利用资源服务器170中的数据进行画像和数据分析。
在一个实施例中,系统100还包括比对模块125,比对模块125分别与数据存储设备150、数据采集设备120通信连接。比对模块125具有定时功能,可以每隔预定时间对数据存储设备150与数据采集设备120中的数据进行比对,以便确定数据存储设备150中是否存在遗漏数据,遗漏数据具体可以包括与数据采集设备120相比缺少的数据、与数据采集设备120不同的数据。如果存在遗漏数据,则比对模块125基于遗漏数据生成补偿任务,通过执行补偿任务将遗漏数据重新存储到数据存储设备150中。这样,通过定时对数据存储设备150遗漏的数据进行补偿,保证数据存储设备150与数据采集设备120中数据的一致性、实时性。
在本发明的实施例中,数据处理服务器140适于执行数据处理方法300。本发明的数据处理方法300将在下文中详述。
根据本发明的系统100,通过数据采集设备采集各个业务模块的数据,并实时获取各个业务模块的变更数据,通过将每个业务模块的变更数据封装成消息体,并基于与业务模块相对应的消息主题发送至消息服务器,由数据处理设备实时获取消息体,将解析后得到的变更数据与业务模块标识相关联地存储到数据存储设备。这样,本发明以非侵入式的方式实现了对各个业务模块的数据进行整合,不会影响各个业务模块的功能,并且,能将数据采集设备中的变更数据实时写入数据存储设备,保证数据存储设备中的数据实时更新,与数据采集设备数据保持一致。另外,数据存储设备中的数据可以分发给相应的业务资源服务器,使得每个业务资源服务器可以提供个性化的搜索和推荐服务。此外,通过定时对数据存储设备遗漏的数据进行补偿,能保证数据存储设备与数据采集设备中数据的一致性、实时性,使得系统数据更加稳定可靠。
在一个实施例中,本发明中的数据采集设备120、消息服务器130、数据处理服务器140、数据存储设备150、业务资源服务器160、资源服务器170分别可以实现为一种计算设备。数据处理服务器140可以实现为一种计算设备,使得本发明的数据处理方法300可以在计算设备中执行。
图2示出了根据本发明一个实施例的计算设备200的结构图。
如图2所示,在基本的配置202中,计算设备200典型地包括系统存储器206和一个或者多个处理器204。存储器总线208可以用于在处理器204和系统存储器206之间的通信。
取决于期望的配置,处理器204可以是任何类型的处理,包括但不限于:微处理器(UP)、微控制器(UC)、数字信息处理器(DSP)或者它们的任何组合。处理器204可以包括诸如一级高速缓存210和二级高速缓存212之类的一个或者多个级别的高速缓存、处理器核心214和寄存器216。示例的处理器核心214可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器218可以与处理器204一起使用,或者在一些实现中,存储器控制器218可以是处理器204的一个内部部分。
取决于期望的配置,系统存储器206可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统220、一个或者多个应用222以及程序数据224。应用222实际上是多条程序指令,其用于指示处理器204执行相应的操作。在一些实施方式中,应用222可以布置为在操作系统上使得处理器204利用程序数据224进行操作。
计算设备200还可以包括储存接口总线234。储存接口总线234实现了从储存设备232(例如,可移除储存器236和不可移除储存器238)经由总线/接口控制器230到基本配置202的通信。操作系统220、应用222以及数据224的至少一部分可以存储在可移除储存器236和/或不可移除储存器238上,并且在计算设备200上电或者要执行应用222时,经由储存接口总线234而加载到系统存储器206中,并由一个或者多个处理器204来执行。
计算设备200还可以包括有助于从各种接口设备(例如,输出设备242、外设接口244和通信设备246)到基本配置202经由总线/接口控制器230的通信的接口总线240。示例的输出设备242包括图形处理单元248和音频处理单元250。它们可以被配置为有助于经由一个或者多个A/V端口252与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口244可以包括串行接口控制器254和并行接口控制器256,它们可以被配置为有助于经由一个或者多个I/O端口258和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备246可以包括网络控制器260,其可以被布置为便于经由一个或者多个通信端口264与一个或者多个其他计算设备262通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中以编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
在根据本发明的计算设备200中,应用222包括执行数据处理方法300的多条程序指令,这些程序指令可以指示处理器204执行本发明的数据处理方法300,以便计算设备200通过执行本发明的数据处理方法300。图3示出了根据本发明一个实施例的数据处理方法300的流程图。方法300适于在数据处理服务器140(例如前述计算设备200)中执行。
如图3所示,方法300始于步骤S310。
在步骤S310中,将一个或多个业务模块中的数据基于相应的数据表抽取到数据采集设备120中。这里,例如可以利用CDC同步工具将各个业务模块的数据抽取到数据采集设备120中,但不限于此,现有技术中所有的同步工具均在本发明的保护范围之内。
在一个实施例中,在执行步骤S310之前,可以预先获取与一个或多个业务模块110分别相对应的数据模型,并在数据采集设备120中创建与每个数据模型分别相对应的数据表。可以理解,每个业务模块110分别对应一个数据表。这样,可以将一个或多个业务模块110中的数据基于相应的数据表抽取到数据采集设备120中。
在步骤S320中,在消息服务器130中创建与每个数据表相对应的消息主题。可以理解,这里创建的每个消息主题也分别对应一个业务模块。
在步骤S330中,通过采集数据采集设备120中的每个数据表对应的binlog日志,来实时获取数据采集设备120中的每个数据表中的变更数据。并且,将每个数据表中的变更数据封装为消息体,将消息体基于与数据表相对应的消息主题发送至消息服务器130,以便消息体基于相应的消息主题存放在消息服务器130中。这里,消息服务器130例如可以实现为kafka消息中间件,但不限于此。
在步骤S340中,通过监听消息服务器130中的消息体,在监听到消息体时,从消息服务器130中获取每个消息主题对应的一个或多个消息体。进而,将获取到的消息体处理为相应的变更数据,并将变更数据发送至数据存储设备150并存储到数据存储设备150中。这样,数据存储设备150在获取到变更数据后,可以更新数据存储设备150中的相应数据。
根据上述步骤,能实现将数据采集设备120中的变更数据实时写入数据存储设备150,保证数据存储设备150中的数据实时更新,与数据采集设备数据保持一致。
在一个实施例中,在将消息体处理为相应的变更数据时,具体是通过对消息体进行解析处理,以获取消息体对应的数据表中的变更数据和相应的业务模块标识。随后将变更数据与业务模块标相关联地存储到数据存储设备150中。应当指出,数据表包括主表以及与主表相关联的副表。根据一种实施方式,在解析消息体时,可以利用Goodsld查询并获取采集数据设备120中的副表信息。
在一个实施例中,可以基于多线程将消息体处理为相应的变更数据,并将变更数据存储到数据存储设备。具体地,首先创建包括多个线程的线程池。随后,基于创建的多个线程从消息服务器130中获取消息体,并将消息体处理为相应的变更数据,将变更数据存储到数据存储设备150中。这里,本发明对创建的线程的数量不做具体限定。例如,在一种实施方式中,可以根据数据处理服务器140的CPU核数来确定所要创建的线程数量。应当指出,利用多线程处理消息体,有利于提高数据处理的效率,在数据变更时,可以保证数据存储设备150中的数据及时更新,确保数据的实时一致性。
在步骤S350中,将数据存储设备150中新增的变更数据发送至相应的业务模块对应的业务资源服务器170。
在一个实施例中,通过将数据存储设备150中的变更数据基于相关联的业务模块标识发送至相应的消息队列,以便经由消息队列将变更数据发送至与业务模块标识相对应的业务资源服务器170。应当理解,这里,在将变更数据发送至业务资源服务器160时,对数据存储设备150中的变更数据基于相关联的业务模块标识进行区分处理,每个业务模块标识关联的变更数据分别发送至与业务模块标识相对应的业务资源服务器160,业务资源服务器160在获取到相应的变更数据后,基于细分后的数据可用于相应业务模块的搜索推荐。这样,使得每个业务资源服务器160可以提供个性化的搜索和推荐服务。
另外,在一个实施例中,还可以将数据存储设备150中的变更数据不做区分、统一发送至资源服务器180,以便用户基于搜索引擎搜索资源服务器180中新增的变更数据。进一步地,可以将资源服务器180中的变更数据实时发送至与其相连的搜索引擎。搜索引擎可以基于实时获取的变更数据生成相应的索引。这样,用户可以在搜素引擎页面基于相应的索引来搜索数据。这里,索引中的属性即是搜索数据时所需的查询条件。还应当指出,资源服务器170获取到的数据是涉及多个业务模块的全量数据,这样,可以利用资源服务器170中的数据进行画像和数据分析。
另外,本发明还利用与数据存储设备150、数据采集设备120相连的比对模块125来定时比对校验数据是否一致。具体地,比对模块125每隔预定时间对数据存储设备150与数据采集设备120中的数据进行比对,以确定数据存储设备150中是否存在遗漏数据,这里,遗漏数据具体可以包括与数据采集设备120相比缺少的数据、与数据采集设备120不同的数据。如果存在遗漏数据,则比对模块125基于遗漏数据生成补偿任务,通过执行补偿任务将遗漏数据重新存储到数据存储设备150中。这样,通过定时对数据存储设备150遗漏的数据进行补偿,能保证数据存储设备150与数据采集设备120中数据的一致性、实时性,使得系统数据更加稳定可靠。
根据本发明的方法300,通过数据采集设备采集各个业务模块的数据,并实时获取各个业务模块的变更数据,通过将每个业务模块的变更数据封装成消息体,并基于与业务模块相对应的消息主题发送至消息服务器,由数据处理设备实时获取消息体,将解析后得到的变更数据与业务模块标识相关联地存储到数据存储设备。这样,本发明以非侵入式的方式实现了对各个业务模块的数据进行整合,不会影响各个业务模块的功能,并且,能将数据采集设备中的变更数据实时写入数据存储设备,保证数据存储设备中的数据实时更新,与数据采集设备数据保持一致。另外,数据存储设备中的数据可以分发给相应的业务资源服务器,使得每个业务资源服务器可以提供个性化的搜索和推荐服务。
此外,本发明通过定时对数据存储设备遗漏的数据进行补偿,能保证数据存储设备与数据采集设备中数据的一致性、实时性,使得系统数据更加稳定可靠。
A8、如A1-A7中任一项所述的方法,其中,在将一个或多个业务模块中的数据基于相应的数据表抽取到数据采集设备之前,包括步骤:获取与一个或多个业务模块分别相对应的数据模型;在数据采集设备中创建与每个数据模型分别相对应的数据表。
B10、如B9所述的系统,其中,还包括:资源服务器,与所述数据存储设备相连,适于从所述数据存储设备中获取变更数据;搜索引擎,与资源服务器相连,适于接收资源服务器实时发送的变更数据,并适于基于变更数据生成相应的索引。
B11、如B9所述的系统,其中,还包括:比对模块,分别与数据存储设备、数据采集设备相连,适于每隔预定时间比对所述数据存储设备与数据采集设备中的数据,确定数据存储设备中是否存在遗漏数据;如果存在遗漏数据,则基于遗漏数据生成补偿任务,并通过执行补偿任务将所述遗漏数据重新存储到所述数据存储设备。
这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。
在程序代码在可编程计算机上执行的情况下,移动终端一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的数据处理方法。
以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。
在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

Claims (10)

1.一种数据处理方法,在数据处理服务器中执行,所述数据处理服务器分别与消息服务器、数据存储设备通信连接,所述消息服务器与数据采集设备通信连接,所述数据采集设备与多个业务模块分别通信连接,所述方法包括步骤:
获取与每个业务模块分别相对应的数据模型,在数据采集设备中创建与每个数据模型分别相对应的数据表,将多个业务模块中的数据基于相应的数据表抽取到数据采集设备;
在消息服务器中创建与每个数据表相对应的消息主题;
通过采集所述数据采集设备中的每个数据表对应的binlog日志,来实时获取每个数据表中的变更数据,将每个数据表中的变更数据封装为消息体,并将消息体基于相应的消息主题发送至消息服务器;
从所述消息服务器中获取每个消息主题对应的一个或多个消息体,并将消息体处理为相应的变更数据存储到数据存储设备,以便更新数据存储设备中的数据;以及
将所述数据存储设备中的变更数据发送至相应的业务模块对应的业务资源服务器,以便所述业务资源服务器提供搜索和推荐服务;
通过比对模块,每隔预定时间比对所述数据存储设备与数据采集设备中的数据,确定数据存储设备中是否存在遗漏数据;如果存在遗漏数据,则基于遗漏数据生成补偿任务,并通过执行补偿任务将所述遗漏数据重新存储到所述数据存储设备。
2.如权利要求1所述的方法,其中,还包括步骤:
将所述数据存储设备中的变更数据发送至资源服务器,以便基于搜索引擎搜索所述资源服务器中的变更数据。
3.如权利要求2所述的方法,其中,还包括步骤:
将资源服务器中的变更数据实时发送至搜索引擎,以便搜索引擎基于变更数据生成相应的索引。
4.如权利要求1-3中任一项所述的方法,其中,将消息体处理为相应的变更数据存储到数据存储设备的步骤包括:
对消息体进行解析,以获取消息体对应的数据表中的变更数据和相应的业务模块标识;
将所述变更数据与业务模块标相关联地存储到数据存储设备。
5.如权利要求4所述的方法,其中,将数据存储设备中的变更数据发送至相应的业务模块对应的业务资源服务器的步骤包括:
将数据存储设备中的变更数据基于相关联的业务模块标识发送至相应的消息队列,以便基于消息队列将变更数据发送至相应的业务模块对应的业务资源服务器。
6.如权利要求1-3中任一项所述的方法,其中,将消息体处理为相应的变更数据存储到数据存储设备的步骤包括:
创建包括多个线程的线程池;
基于多个线程从所述消息服务器中获取消息体,并将消息体处理为相应的变更数据存储到数据存储设备。
7.一种数据处理系统,包括:
数据采集设备,与多个业务模块分别通信连接,适于创建与每个业务模块的数据模型分别相对应的数据表,基于相应的数据表抽取多个业务模块的数据,并适于实时获取每个数据表中的变更数据,将每个数据表中的变更数据封装为消息体;
消息服务器,与所述数据采集设备相连,适于创建与每个数据表相对应的消息主题,并适于接收所述数据采集设备基于相应的消息主题发送的消息体;
数据处理服务器,与所述消息服务器相连,适于执行如权利要求1-6中任一项所述的方法;
数据存储设备,与所述数据处理服务器相连,适于从所述数据处理服务器获取所述变更数据并存储,以便更新数据存储设备中的数据;以及
与每个业务模块分别相对应的业务资源服务器,与所述数据存储设备相连,适于从所述数据存储设备中获取相应的变更数据;
比对模块,分别与数据存储设备、数据采集设备相连,适于每隔预定时间比对所述数据存储设备与数据采集设备中的数据,确定数据存储设备中是否存在遗漏数据;如果存在遗漏数据,则基于遗漏数据生成补偿任务,并通过执行补偿任务将所述遗漏数据重新存储到所述数据存储设备。
8.如权利要求7所述的系统,其中,还包括:
资源服务器,与所述数据存储设备相连,适于从所述数据存储设备中获取变更数据;
搜索引擎,与资源服务器相连,适于接收资源服务器实时发送的变更数据,并适于基于变更数据生成相应的索引。
9.一种计算设备,包括:
至少一个处理器;以及
存储器,存储有程序指令,其中,所述程序指令被配置为适于由所述至少一个处理器执行,所述程序指令包括用于执行如权利要求1-6中任一项所述数据处理方法的指令。
10.一种存储有程序指令的可读存储介质,当所述程序指令被计算设备读取并执行时,使得所述计算设备执行如权利要求1-6中任一项所述数据处理方法。
CN202110645575.9A 2021-06-10 2021-06-10 一种数据处理方法、系统及计算设备 Active CN113377791B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110645575.9A CN113377791B (zh) 2021-06-10 2021-06-10 一种数据处理方法、系统及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110645575.9A CN113377791B (zh) 2021-06-10 2021-06-10 一种数据处理方法、系统及计算设备

Publications (2)

Publication Number Publication Date
CN113377791A CN113377791A (zh) 2021-09-10
CN113377791B true CN113377791B (zh) 2024-11-08

Family

ID=77573435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110645575.9A Active CN113377791B (zh) 2021-06-10 2021-06-10 一种数据处理方法、系统及计算设备

Country Status (1)

Country Link
CN (1) CN113377791B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114461415A (zh) * 2021-12-27 2022-05-10 苏州浪潮智能科技有限公司 消息数据处理方法、装置、计算机设备及存储介质
CN115543652B (zh) * 2022-09-16 2024-11-05 中国人民财产保险股份有限公司 信息推送方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN111651464A (zh) * 2020-04-15 2020-09-11 北京皮尔布莱尼软件有限公司 数据处理方法、系统及计算设备
CN112738182A (zh) * 2020-12-24 2021-04-30 海南车智易通信息技术有限公司 数据推送系统、数据推送方法及计算设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107729366B (zh) * 2017-09-08 2021-01-05 广东省建设信息中心 一种普适多源异构大规模数据同步系统
CN111752939A (zh) * 2019-03-28 2020-10-09 北京京东尚科信息技术有限公司 用于多个系统的数据处理方法、装置、计算机系统、介质
US20210158174A1 (en) * 2019-11-25 2021-05-27 International Business Machines Corporation Equipment maintenance assistant training based on digital twin resources
CN111258971A (zh) * 2020-01-10 2020-06-09 北京农信互联科技集团有限公司 一种基于访问日志的应用状态监控报警系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107783975A (zh) * 2016-08-24 2018-03-09 北京京东尚科信息技术有限公司 分布式数据库同步处理的方法和装置
CN111651464A (zh) * 2020-04-15 2020-09-11 北京皮尔布莱尼软件有限公司 数据处理方法、系统及计算设备
CN112738182A (zh) * 2020-12-24 2021-04-30 海南车智易通信息技术有限公司 数据推送系统、数据推送方法及计算设备

Also Published As

Publication number Publication date
CN113377791A (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
US11308031B2 (en) Resolving in-memory foreign keys in transmitted data packets from single-parent hierarchies
CN109144493A (zh) 业务规则的生成方法、电子装置及可读存储介质
CN111737443B (zh) 答案文本的处理方法和装置、关键文本的确定方法
CN113377791B (zh) 一种数据处理方法、系统及计算设备
CN110362968B (zh) 信息检测方法、装置及服务器
CN109617647A (zh) 报文转换方法、装置、计算机设备及计算机可读存储介质
CN110765750B (zh) 报表数据录入方法及终端设备
CN113377289B (zh) 一种缓存管理方法、系统、计算设备及可读存储介质
CN112417175A (zh) 面向维修工单的文档检索方法、系统、计算机及存储介质
CN110968765A (zh) 书籍搜索方法、计算设备及计算机存储介质
CN113010542A (zh) 业务数据处理方法、装置、计算机设备及存储介质
CN111445319A (zh) 一种凭证生成方法、装置、计算机设备及存储介质
CN110955719B (zh) 一种数据存取处理设备、系统和方法
CN111159213A (zh) 一种数据查询方法、装置、系统和存储介质
CN114064712A (zh) 数据访问方法、装置、电子设备及计算机可读存储介质
CN111241100B (zh) 一种工作流配置系统和方法
CN113360517A (zh) 数据处理方法、装置、电子设备及存储介质
CN112738182A (zh) 数据推送系统、数据推送方法及计算设备
CN111814029A (zh) 一种数据查询方法、系统及计算设备
CN107508705B (zh) 一种http元素的资源树构建方法及计算设备
CN111221817B (zh) 业务信息数据存储方法、装置、计算机设备及存储介质
CN112632266B (zh) 数据写入方法、装置、计算机设备及可读存储介质
CN114818645B (zh) 基于数据主体的自动化报告生成方法、装置、设备及介质
CN115292351A (zh) 金融业务数据处理方法、装置及存储介质
CN112231292B (zh) 文件处理方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant