CN108038216A - 信息处理方法、装置及服务器集群 - Google Patents
信息处理方法、装置及服务器集群 Download PDFInfo
- Publication number
- CN108038216A CN108038216A CN201711404167.4A CN201711404167A CN108038216A CN 108038216 A CN108038216 A CN 108038216A CN 201711404167 A CN201711404167 A CN 201711404167A CN 108038216 A CN108038216 A CN 108038216A
- Authority
- CN
- China
- Prior art keywords
- information
- data
- various dimensions
- basic data
- dimensional object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种信息处理方法,装置及服务器集群,本发明实施例将利用第三应用平台中的行业动态信息,对企业内部的待处理历史信息进行数据融合,得到多维度基础数据,从而利用机器学习算法,对该多维度基础数据进行计算,得到多维度目标数据,还可以通过终端设备将其直观展示出来,方便企业工作人员据此快速且准确制定营销策略,确定企业未来市场方向、潜在客户等,减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
Description
技术领域
本申请主要涉及企业市场分析技术领域,更具体地说是涉及一种信息处理方法、装置及服务器集群。
背景技术
在如今经济全球化和信息大爆炸的时代,企业通常是通过客户关系管理分析,精准掌握客户价值和客户创利能力,从而指定合理的营销策略,扩大企业市场,增大客户群体,使企业获得更多效益以及市场竞争优势。
目前,企业通常是由工作人员经过市场调研,确定当前阶段客户的需求,挖掘老客户以及潜在客户,这种传统调研方式的工作量非常大,且要求工作人员具有较强的信息洞察力,综合分析能力等,导致工作效率非常低。
发明内容
有鉴于此,本发明提供了一种信息处理方法、装置及服务器集群,通过爬取第三方应用平台的行业动态信息,对本应用平台的待处理历史信息进行数据融合以及机器学习运算,得到能够预测行业最新情况的多维度目标数据,并直观展示出来,不需要工作人员人工调研,大大减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
为了实现上述发明目的,本申请提供了以下技术方案:
本发明实施例提供了一种信息处理方法,所述方法包括:
爬取第三方应用平台中的行业动态信息;
利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维目标数据用于进行展示。
可选的,所述利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据,包括:
利用所述行业动态信息,对待处理历史信息进行分组聚合;
基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。
可选的,所述对所述多维度基础数据进行机器学习计算,得到多维度目标数据,包括
获取制定的计划内容;
基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
可选的,所述方法还包括:利用所述多维度目标数据,生成相应的多维度散点图;
将所述多维度散点图发送至至少一个终端设备进行展示。
可选的,所述方法还包括:
获取本应用平台各子系统的历史信息;
对所述历史信息进行过滤与转换处理,得到待处理历史信息。
本发明实施例还提供了一种信息处理装置,所述装置包括:
信息爬取模块,用于爬取第三方应用平台中的行业动态信息;
数据融合模块,用于利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
计算模块,用于对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维度目标数据用于进行展示。
可选的,所述数据融合模块包括:
分组聚合单元,用于利用所述行业动态信息,对待处理历史信息进行分组聚合;
数据融合单元,用于基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。
可选的,所述计算模块包括:
获取单元,用于获取制定的计划内容;
计算单元,用于基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
可选的,所述装置还包括:
散点图生成模块,用于利用所述多维度目标数据,生成相应的多维度散点图;
数据传输模块,用于将所述多维度散点图发送至至少一个终端设备进行展示。
本发明实施例还提供了一种服务器集群,其特征在于,所述服务器集群包括:
通信接口;
存储器,用于存储实现如上所述的信息处理方法的计算机程序;
处理器,用于加载并执行所述计算机程序,包括:
爬取第三方应用平台中的行业动态信息;
利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维度目标数据用于进行展示。
由此可见,与现有技术相比,本发明提供了一种信息处理方法,装置及服务器集群,本发明实施例将利用第三应用平台中的行业动态信息,对企业内部的待处理历史信息进行数据融合,得到多维度基础数据,从而利用机器学习算法,对该多维度基础数据进行计算,得到多维度目标数据,还可以通过终端设备将其直观展示出来,方便企业工作人员据此快速且准确制定营销策略,确定企业未来市场方向、潜在客户等,减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种信息处理方法的流程图;
图2为本发明实施例提供的另一种信息处理方法的流程图;
图3为本发明实施例提供的一种多维度散点图的应用示意图;
图4为本发明实施例提供的一种信息处理装置的结构图;
图5为本发明实施例提供的另一种信息处理装置的结构图;
图6为本发明实施例提供的又一种信息处理装置的结构图;
图7为本发明实施例提供的又一种信息处理装置的结构图;
图8为本发明实施例提供的一种服务器集群的硬件结构图;
图9为本发明实施例提供的一种信息处理系统的结构图。
具体实施方式
正所谓知己知彼方能百战百胜,机会总是青睐有准备的人,如在销售行业中,只有有效掌握目标客户的动向才能抓住目标客户的需求,为销售做好准备。若为销售企业,若等到对方将产品标书放到面前,该产品单子往往也就不会属于该销售企业,也就是说,若向把产品或服务销售出去,需要主动捕捉战机,随时能够洞察老客户或潜在客户的销售商机。
在如今经济全球化和信息大爆炸的时代,传统的销售模式面临市场全球化的挑战,管理者需要以全球的视角来考虑问题,且传统的销售模式,要求销售人员具有很强的信息洞察力以及综合分析处理能力,但这往往是需要多年磨砺出来的,对于大部分普通的销售人员很难做到,这就导致企业无法准确且及时洞察老客户或潜在客户的销售商机,影响企业市场拓展;而且,由于这种通过人工调研的传统销售模式,销售人员的工作量非常大,工作效率也较低。
为了改善上述问题,本发明实施例的发明人提出一种基于互联网信息收集、大数据分析处理等方式的,新的信息处理方案,该方案拓展销售人员获取有效信息的方式,即通过服务器集群直接抓取第三方应用平台的行业动态信息,并据此对企业内部的待处理历史信息进行数据融合,得到多维度基础数据,之后利用机器学习算法,对该多维度基础数据进行计算,得到多维度目标数据,不需要销售人员进行人工调研,就能够快速且准确了解市场行情,方便企业工作人员据此快速且准确制定营销策略,确定企业未来市场方向、潜在客户等,且减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,为本发明实施例提供的一种信息处理方法的流程图,该方法可以包括:
步骤S11,爬取第三方应用平台中的行业动态信息;
本发明实施例可以利用爬虫技术,爬取第三方应用平台中的各种行业动态信息,具体爬取过程以及爬取的行业动态信息的内容不作限定。
可选的,第三方应用平台可以包括政府部门或企事业单位的应用平台、各企业的应用平台、国家各部门或各行业权威部门的应用平台、主流媒体的新闻发布平台等等,相应爬取的行业动态信息可以包括:政府部门或企事业单位发布的相关招标信息、各企业的投资关系图谱、国家各部门或各行业权威部门发布的行业统计信息以及主流媒体发布的相关新闻信息等等。
其中,爬虫技术即网络爬虫,其是一种按照一定的规则,自动地抓取万维网信息的程序或脚本,被广泛应用于互联网搜索引擎或其他类似网站,自动采集所有能够访问到的页面内容,以获取或更新这些网站的内容或检索方式。
在实际应用中,可以按照预设条件进行网络爬取,从而获取指定行业的行业动态信息,或者该指定行业的某方便的动态信息等等,具体可以根据实际需要结合爬虫技术实现,本发明实施例在此不再一一详述。
需要说明的是,对于爬取的行业动态信息是不断积累和更新的,服务器集群可以实时或周期性地进行爬取操作,以获得最新的行业动态信息。如上文描述,可以爬取各第三应用平台的所有行业动态数据,也可以按照预设要求爬取各第三应用平台相应的行业动态数据,本发明实施例对此不作限定。
步骤S12,利用该行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
其中,待处理历史信息可以是企业内部数据,比如客户资料信息、合同订单以及售后信息等历史记录信息,对于不同行业的企业来说,获得的待处理历史信息的内容通常是不同的,本发明实施例对该待处理历史信息包含的内容以及获取方式不作限定。
可选的,本发明实施例可以在获取本应用平台各子系统(即企业所在应用平台的各部门系统)的历史信息后,可以对其进行过滤以及转换等预处理,得到所需的待处理历史信息,保证所得待处理历史信息真实、有效、及时性,即尽可能得到准确的历史信息。本发明实施例对获取的大量历史信息的预处理方法不做限定。
之后,本发明实施例将对待处理历史信息进行深度挖掘,利用获取的行业动态信息进行综合分析处理,得到有效的商机信息。在该过程中,可以结合行业动态信息,使用相似性分类等算法,将待处理历史信息进行多维度(比如地域、投资关系、行业等)分组聚合,并根据分组聚合的结果,对待处理历史信息进行融合,如将企业的合同订单以及售后信息进行融合,将爬取的统计信息、招投标信息等进行融合,从而形成具有多维度层级关系的数据信息,即多维度基础数据。
需要说明,本发明实施例对数据融合处理过程的具体实现方法不作限定,并不局限于上文描述的方式。
步骤S13,对该多维度基础数据进行机器学习计算,得到多维度目标数据。
本发明实施例通过机器学习算法,对融合后得到的多维度基础数据进行挖掘,从而获得动态多维度的商机销售信息,即多维度目标数据。
以待处理历史信息包括企业内部的客户数据(如所购产品保修到期时间、销售金额、销售数量等)为例,机器学习算法经过不断的训练学习后,不仅能够对现有客户数据进行分析挖掘,而且能够通过相似或相关行业的招投标信息和竞品动态信息等,进行商机预警。例如,通过某企业要进行数据中心建设,或某大数据相关的软件系统建设发布的招投标信息,能够自动判定对服务器硬件的关联需求,从而使销售人员根据该需求,预先做出相应准确,提高招投标的成功率。
其中,对于得到的多维度目标数据通常用于进行展示,比如,服务器集群发送至至少一个终端设备进行展示,从而使终端设备侧的销售人员能够直观、快速且准确地得知产品有效的多维度信息,不需要销售人员人工总结分析,简化了消息综合分析的复杂度,降低了销售人员的工作强度,能够更好地辅助企业管理者进行可靠决策。
综上所述,本发明实施例通过大数据分析技术,爬取与本企业相关的第三应用平台的行业动态信息,从而据此对企业内部的待处理历史信息进行有效融合,得到能够预测商机的多维度目标数据,与传统销售模式相比,不需要工作人员人工进行市场调查,并综合分析调查结果,挖掘老客户以及潜在客户,确定企业未来市场方向,本发明实施例将由服务器集群按照上述方式自动得到多维度目标数据,企业终端直接获取并展示该多维度目标数据,即可了解目前行业最新动态,洞察老客户或潜在客户的销售商机,省时省力,从而使企业能够获得更多效益以及市场竞争优势。
如图2所示,为本发明实施例提供的另一种信息处理方法的流程图,该方法可以包括:
步骤S21,爬取第三方应用平台中的行业动态信息;
其中,步骤S21的实现与上述步骤S11的实现相同,本实施例在此不再详述。
步骤S22,获取本应用平台各子系统的历史信息,并对该历史信息进行过滤与转换处理,得到待处理历史信息;
需要说明,通常情况下,获取的本应用平台各子系统的历史信息是大量数据,且通常存在不一致、重复、含噪声以及维度高等方面的问题,通常需要对这些数据进行预处理,但所采用的预处理方法并不局限于步骤S22记载的过滤与转换(即数据清洗和数据变换)处理方法,且对该数据清洗和数据变换这两种数据预处理方法的具体实现方式也不作限定,可以根据实际爬取的数据内容进行确定。
步骤S23,利用该行业动态信息,对待处理历史信息进行分组聚合;
可选的,本发明实施例可以利用预设的聚合函数对待处理历史信息进行分组处理,具体实现过程不作限定。
在实际应用中,利用爬取的行业动态信息包含的主题,可以将待处理历史信息划分成多个维度,比如地域、投资关系、行业等等,从而按照这几个维度对行业动态信息进行分组聚合,从相应维度了解目前市场的具体行业情况。
步骤S24,基于分组聚合结果,对该行业动态信息以及待处理历史信息进行数据融合,得到多维度基础数据;
数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。
在本发明实施例中,利用数据融合技术实现了企业、事业、政府等多源数据的综合分析,形成有效的分析数据集,且该分析数据集还能够随数据源的变化重组、调整和更新,保证了所得多维度基础数据的可靠性。
可选的,数据融合处理过程通常可以包括获取多源数据(即各第三应用平台的行业动态信息、企业内容的待处理历史信息),研究和理解所获得的数据,梳理和清理数据,数据转换和建立结构,数据组合,建立分析数据集等六个基本步骤,在本发明实施例中,步骤S24记载的数据融合主要是指建立分析数据集这个步骤,可以用来追踪互联网购物的营销数据以及勾画消费行为等等,实现老客户以及潜在客户的挖掘,但并不局限于此。
步骤S25,获取制定的计划内容;
其中,该计划内容可以用来表征企业需要了解的信息,对于企业的不同需求,该计划内容包含的信息通常是不同的,而且,随着企业需求的变更,该计划内容也可以随之改变,本发明实施例对该计划内容包含的信息以及输出方式不作限定。
可选的,上述计划内容可以在企业终端设备完成制定,并将其上传至服务器集群,以使得服务器集群按照上述方法获取符合该计划内容的多维度目标数据。
步骤S26,基于该计划内容,对多维度基础数据进行机器学习计算,得到与计划内容相匹配的预测信息;
机器学习是一门多领域交叉学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
在本发明实施例中,该预测信息可以是上文实施例的多维度目标数据,其包含的具体数据基于上述计划内容的不同而不同。如上述描述,计划内容相当于是对多维度基础数据进行机器学习的训练目标,本发明实施例对该机器学习算法的具体内容不作限定,可以采用逻辑回归、决策树、K最近邻算法,或降维算法等等算法,实现对多维度基础数据的处理,得到所需的预测信息,具体实现过程不再详述。
步骤S27,将得到的预测信息发送给至少一个终端设备进行展示。
可选的,为了方便直观且快速得知所得预测信息表示的含义,可以对其进行处理,生成相应的多维度散点图,即在坐标系中,由保修到期时间、销售金额、销售数量,竞品动态,相关行业招投标信息等多个维度的数据,确定散点位置以及大小,构成的可视图,如图3所示,该多维度散点图中,通常有两个维度的数据需要比较,如图3所示由销售金额、销售数量以及地域这三个维度构成的多维度散点图,前两个维度需要比较,其中,为了识别地域这个维度的数据,可以设置不同地域对应的散点颜色或添加相应的文字标记等,但并不局限于此,图3仅是一种多维度散点图的示意图。
之后,将该多维度散点图发送至至少一个终端设备进行展示,以使企业工作人员直接查看终端设备展示的多维度散点图,即可准确且快速得知与计划内容对应的信息。
当然,服务器集群也可以直接将得到的预测信息反馈给至少一个终端设备,由终端设备利用得到的预测信息,生成多维度散点图进行展示,本发明实施例对生成多维度散点图的执行主体不作限定。
另外,对于预测信息的展示方式,并不局限于上位描述的多维度散点图,也可以通过其他方式进行展示,也可以采用如曲线图、柱形图、饼图、气泡图等其他数据可视图的方式展示预测信息,有效改进了现有的电子报表和简单图形展示的单一性、滞后性的问题。
如图4所示,为本发明实施例提供的一种信息处理装置的结构图,该装置可以应用服务器集群,具体可以包括:
信息爬取模块410,用于爬取第三方应用平台中的行业动态信息;
本发明实施例中,可以利用爬虫技术爬取所需的至少一个第三方应用平台的行业动态信息,对该行业动态信息包含的内容不作限定,且通常情况下,该行业动态信息通常是随着时间而不断更新。数据融合模块420,用于利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
可选的,如图5所示,该数据融合模块420可以包括:
分组聚合单元421,用于利用所述行业动态信息,对待处理历史信息进行分组聚合;
数据融合单元422,用于基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。计算模块430,用于对多维度基础数据进行机器学习计算,得到多维度目标数据。
其中,计算模块得到的多维度目标数据可以用于进行展示,具体可以发送至至少一个终端设备进行展示,比如通过多维度散点图方式进行展示,但并不局限于此。
基于此,如图6所示,该装置还可以包括:
散点图生成模块440,用于利用所述多维度目标数据,生成相应的多维度散点图;
数据传输模块450,用于将所述多维度散点图发送至至少一个终端设备进行展示。
可选的,在上述各实施例的基础上,如图7所示,计算模块430可以包括:
获取单元431,用于获取制定的计划内容;
计算单元432,用于基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
综上所述,本发明实施例将利用第三应用平台中的行业动态信息,对企业内部的待处理历史信息进行数据融合,得到多维度基础数据,从而利用机器学习算法,对该多维度基础数据进行计算,得到多维度目标数据,还可以通过终端设备将其直观展示出来,方便企业工作人员据此快速且准确制定营销策略,确定企业未来市场方向、潜在客户等,减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
上述信息处理装置可以包括处理器和存储器,上述信息爬取模块、数据融合模块、计算模块、散点图生成模块以及数据传输模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来爬取第三应用平台的行业动态信息,通过对待处理历史信息的数据融合处理,得到多维度基础数据,再利用机器学习算法进行数据处理,得到多维度目标数据,并将其直观展示到终端设备中,方便企业工作人员据此快速且准确制定营销策略,确定企业未来市场方向、潜在客户等,减少了工作人员的工作量,提高了工作效率,并使企业能够获得更多效益以及市场竞争优势。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行实现上述信息处理方法,具体步骤可以参照上述方法实施例相应部分的描述,本实施例在此不再详述。
本发明实施例提供了一种处理器,该处理器用于运行计算机程序,其中,该计算机程序运行时执行上述信息处理方法,具体步骤可以参照上述方法实施例相应部分的描述,本实施例在此不再详述。
上文装置实施例主要是对服务器集群的虚拟结构进行的描述,下面将从服务器集群的实体结构来描述该服务器集群的硬件组成。如图8所示,该服务器集群可以包括:
通信接口810;
存储器820,用于存储实现如上所述的信息处理方法的计算机程序;
处理器830,用于加载并执行所述计算机程序,包括:
爬取第三方应用平台中的行业动态信息;
利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维度目标数据用于进行展示。
可选的,处理器830还可以执行实现以下步骤的程序:
利用所述行业动态信息,对待处理历史信息进行分组聚合;
基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。
可选的,处理器830还可以执行实现以下步骤的程序:
获取制定的计划内容;
基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
可选的,处理器830还可以执行实现以下步骤的程序:
利用所述多维度目标数据,生成相应的多维度散点图;
将所述多维度散点图发送至至少一个终端设备进行展示。
可选的,处理器830还可以执行实现以下步骤的程序:
获取本应用平台各子系统的历史信息;
对所述历史信息进行过滤与转换处理,得到待处理历史信息。
结合上述方法实施例对信息处理流程的描述的,本发明实施例还提供了一种信息处理系统,如图9所示的结构图,该系统可以包括数据采集设备910、数据存储设备920以及上述服务器集群930,其中,该服务器集群可以通过无线或有线方式连接至少一个具有显示功能的终端设备940,用来展示处理结果。
在本发明实施例中,数据采集设备可以包括集成爬虫系统,其可以通过互联网爬取第三方应用平台的行业动态数据,并发送至数据处理设备,本发明实施例对其包含的爬虫系统组成结构不作限定。
数据存储设备可以是数据库服务器,可以用来存储企业内部数据,比如客户资料,合同订单以及售后等历史记录信息等等,本发明实施例对该数据存储设备的组成结构不作限定。
服务器集群构成可以是具有数据处理功能的大数据平台,可以实现数据清洗、转换等预处理,以及结合获取的行业动态信息,对企业内容待处理历史信息进行深度挖掘、综合分析,以得到所需的多维度目标数据,具体处理过程可以参照上述方法实施例相应部分的描述,本实施例在此不再详述。
本领域内的技术人员应明白,本申请的实施例可提供为方法、装置、服务器集群。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,关于上述各实施例中,诸如第一、第二等之类的关系术语仅仅用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者系统中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、服务器集群而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种信息处理方法,其特征在于,所述方法包括:
爬取第三方应用平台中的行业动态信息;
利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维目标数据用于进行展示。
2.根据权利要求1所述的方法,其特征在于,所述利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据,包括:
利用所述行业动态信息,对待处理历史信息进行分组聚合;
基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。
3.根据权利要求1所述的方法,其特征在于,所述对所述多维度基础数据进行机器学习计算,得到多维度目标数据,包括
获取制定的计划内容;
基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:利用所述多维度目标数据,生成相应的多维度散点图;
将所述多维度散点图发送至至少一个终端设备进行展示。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取本应用平台各子系统的历史信息;
对所述历史信息进行过滤与转换处理,得到待处理历史信息。
6.一种信息处理装置,其特征在于,所述装置包括:
信息爬取模块,用于爬取第三方应用平台中的行业动态信息;
数据融合模块,用于利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
计算模块,用于对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维度目标数据用于进行展示。
7.根据权利要求6所述的装置,其特征在于,所述数据融合模块包括:
分组聚合单元,用于利用所述行业动态信息,对待处理历史信息进行分组聚合;
数据融合单元,用于基于分组聚合结果,对所述行业动态信息以及所述待处理历史信息进行数据融合,得到多维度基础数据。
8.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
获取单元,用于获取制定的计划内容;
计算单元,用于基于所述计划内容,对所述多维度基础数据进行机器学习计算,得到与所述计划内容相匹配的预测信息。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
散点图生成模块,用于利用所述多维度目标数据,生成相应的多维度散点图;
数据传输模块,用于将所述多维度散点图发送至至少一个终端设备进行展示。
10.一种服务器集群,其特征在于,所述服务器集群包括:
通信接口;
存储器,用于存储实现如权利要求1-5任意一项所述的信息处理方法的计算机程序;
处理器,用于加载并执行所述计算机程序,包括:
爬取第三方应用平台中的行业动态信息;
利用所述行业动态信息,对待处理历史信息进行数据融合,得到多维度基础数据;
对所述多维度基础数据进行机器学习计算,得到多维度目标数据,其中,所述多维度目标数据用于进行展示。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711404167.4A CN108038216A (zh) | 2017-12-22 | 2017-12-22 | 信息处理方法、装置及服务器集群 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711404167.4A CN108038216A (zh) | 2017-12-22 | 2017-12-22 | 信息处理方法、装置及服务器集群 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108038216A true CN108038216A (zh) | 2018-05-15 |
Family
ID=62100550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711404167.4A Pending CN108038216A (zh) | 2017-12-22 | 2017-12-22 | 信息处理方法、装置及服务器集群 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108038216A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874762A (zh) * | 2018-06-05 | 2018-11-23 | 北京圣康汇金科技有限公司 | 一种投资研究报告在线显示系统和方法 |
CN109241223A (zh) * | 2018-08-23 | 2019-01-18 | 中国电子科技集团公司电子科学研究院 | 行为行踪识别方法及平台 |
CN109284463A (zh) * | 2018-08-15 | 2019-01-29 | 山东鲁能软件技术有限公司 | 一种基于动态模板的数据收集方法及系统 |
CN109741102A (zh) * | 2018-12-28 | 2019-05-10 | 上海德启信息科技有限公司 | 一种信息获取方法及装置 |
CN110163661A (zh) * | 2019-04-23 | 2019-08-23 | 上海淇玥信息技术有限公司 | 营销信息推广方法、装置、电子设备及计算机可读介质 |
CN110413682A (zh) * | 2019-08-09 | 2019-11-05 | 云南电网有限责任公司 | 一种数据的分类展示方法及系统 |
CN110428311A (zh) * | 2019-07-17 | 2019-11-08 | 麦格创科技(深圳)有限公司 | 招投标信息推荐方法及相关产品 |
CN110968611A (zh) * | 2018-09-29 | 2020-04-07 | 北京国双科技有限公司 | 数据分析方法、装置及系统 |
CN112101816A (zh) * | 2020-09-28 | 2020-12-18 | 中国银行股份有限公司 | 审计计划智能推荐方法及装置 |
CN112241864A (zh) * | 2019-07-16 | 2021-01-19 | 中移(苏州)软件技术有限公司 | 一种信息处理方法、装置和计算机可读存储介质 |
WO2021068607A1 (zh) * | 2019-10-12 | 2021-04-15 | 苏宁云计算有限公司 | 多系统多店铺订单融合方法、装置、计算机设备和存储介质 |
CN113268474A (zh) * | 2021-04-23 | 2021-08-17 | 广东履安实业有限公司 | 多维数据融合的行为分析系统、方法 |
CN113781074A (zh) * | 2020-05-22 | 2021-12-10 | 治略资讯整合股份有限公司 | 消费数据处理方法与系统 |
CN113901125A (zh) * | 2021-09-17 | 2022-01-07 | 盐城金堤科技有限公司 | 数据展示方法和装置、及存储介质和电子设备 |
CN115147161A (zh) * | 2022-07-20 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于存量客户的行业指引方法、装置、电子设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104574127A (zh) * | 2013-10-21 | 2015-04-29 | 北京中海纪元数字技术发展股份有限公司 | 创新营销平台 |
CN106372188A (zh) * | 2016-08-31 | 2017-02-01 | 成都九鼎瑞信科技股份有限公司 | 水务数据分析方法及装置 |
CN106909931A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种用于机器学习模型的特征生成方法、装置和电子设备 |
CN107292672A (zh) * | 2017-07-05 | 2017-10-24 | 上海数道信息科技有限公司 | 一种餐饮行业销售预测的实现系统与方法 |
-
2017
- 2017-12-22 CN CN201711404167.4A patent/CN108038216A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104574127A (zh) * | 2013-10-21 | 2015-04-29 | 北京中海纪元数字技术发展股份有限公司 | 创新营销平台 |
CN106909931A (zh) * | 2015-12-23 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 一种用于机器学习模型的特征生成方法、装置和电子设备 |
CN106372188A (zh) * | 2016-08-31 | 2017-02-01 | 成都九鼎瑞信科技股份有限公司 | 水务数据分析方法及装置 |
CN107292672A (zh) * | 2017-07-05 | 2017-10-24 | 上海数道信息科技有限公司 | 一种餐饮行业销售预测的实现系统与方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874762A (zh) * | 2018-06-05 | 2018-11-23 | 北京圣康汇金科技有限公司 | 一种投资研究报告在线显示系统和方法 |
CN109284463B (zh) * | 2018-08-15 | 2021-02-02 | 山东鲁能软件技术有限公司 | 一种基于动态模板的数据收集方法及系统 |
CN109284463A (zh) * | 2018-08-15 | 2019-01-29 | 山东鲁能软件技术有限公司 | 一种基于动态模板的数据收集方法及系统 |
CN109241223A (zh) * | 2018-08-23 | 2019-01-18 | 中国电子科技集团公司电子科学研究院 | 行为行踪识别方法及平台 |
CN109241223B (zh) * | 2018-08-23 | 2022-06-28 | 中国电子科技集团公司电子科学研究院 | 行为行踪识别方法及系统 |
CN110968611A (zh) * | 2018-09-29 | 2020-04-07 | 北京国双科技有限公司 | 数据分析方法、装置及系统 |
CN109741102A (zh) * | 2018-12-28 | 2019-05-10 | 上海德启信息科技有限公司 | 一种信息获取方法及装置 |
CN110163661A (zh) * | 2019-04-23 | 2019-08-23 | 上海淇玥信息技术有限公司 | 营销信息推广方法、装置、电子设备及计算机可读介质 |
CN112241864B (zh) * | 2019-07-16 | 2022-12-16 | 中移(苏州)软件技术有限公司 | 一种信息处理方法、装置和计算机可读存储介质 |
CN112241864A (zh) * | 2019-07-16 | 2021-01-19 | 中移(苏州)软件技术有限公司 | 一种信息处理方法、装置和计算机可读存储介质 |
CN110428311B (zh) * | 2019-07-17 | 2022-04-22 | 麦格创科技(深圳)有限公司 | 招投标信息推荐方法及相关产品 |
CN110428311A (zh) * | 2019-07-17 | 2019-11-08 | 麦格创科技(深圳)有限公司 | 招投标信息推荐方法及相关产品 |
CN110413682A (zh) * | 2019-08-09 | 2019-11-05 | 云南电网有限责任公司 | 一种数据的分类展示方法及系统 |
WO2021068607A1 (zh) * | 2019-10-12 | 2021-04-15 | 苏宁云计算有限公司 | 多系统多店铺订单融合方法、装置、计算机设备和存储介质 |
CN113781074A (zh) * | 2020-05-22 | 2021-12-10 | 治略资讯整合股份有限公司 | 消费数据处理方法与系统 |
CN112101816A (zh) * | 2020-09-28 | 2020-12-18 | 中国银行股份有限公司 | 审计计划智能推荐方法及装置 |
CN112101816B (zh) * | 2020-09-28 | 2024-04-23 | 中国银行股份有限公司 | 审计计划智能推荐方法及装置 |
CN113268474A (zh) * | 2021-04-23 | 2021-08-17 | 广东履安实业有限公司 | 多维数据融合的行为分析系统、方法 |
CN113901125A (zh) * | 2021-09-17 | 2022-01-07 | 盐城金堤科技有限公司 | 数据展示方法和装置、及存储介质和电子设备 |
CN115147161A (zh) * | 2022-07-20 | 2022-10-04 | 平安科技(深圳)有限公司 | 基于存量客户的行业指引方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108038216A (zh) | 信息处理方法、装置及服务器集群 | |
Hain et al. | Let’s get physical: Comparing metrics of physical climate risk | |
CN110390465A (zh) | 业务数据的风控分析处理方法、装置和计算机设备 | |
US20200192894A1 (en) | System and method for using data incident based modeling and prediction | |
CN111340246A (zh) | 用于企业智能决策分析的处理方法、装置和计算机设备 | |
CN110223155A (zh) | 投资推荐信息的推送方法、装置及计算机设备 | |
US8510080B2 (en) | System and method for monitoring and managing utility devices | |
CN109102394A (zh) | 风险评估方法、装置及计算机可读存储介质 | |
CN110472815A (zh) | 一种供应链金融业务中对融资企业的风险控制方法及系统 | |
CN106779278A (zh) | 资产信息的评价系统及其信息的处理方法和装置 | |
CN105631612A (zh) | 基于大数据的公职人员个人绩效及能力评估系统及方法 | |
Niu et al. | iConViz: Interactive visual exploration of the default contagion risk of networked-guarantee loans | |
Li et al. | A GIS‐based site selection system for real estate projects | |
CN110110172A (zh) | 信息展示方法和装置 | |
CN110414926A (zh) | 台账管理方法、装置及计算机可读存储介质 | |
US8392313B2 (en) | Financial options system and method | |
Verma et al. | Data mining: next generation challenges and futureDirections | |
US10627984B2 (en) | Systems, devices, and methods for dynamic virtual data analysis | |
CN107093018A (zh) | 基于健康模型的电信工程项目信息可视化方法及装置 | |
CN115630221A (zh) | 终端应用界面展示数据处理方法、装置及计算机设备 | |
CN108805603A (zh) | 营销活动质量评估方法、服务器及计算机可读存储介质 | |
JP7043248B2 (ja) | 休廃業予測システム | |
ALBESCU et al. | Marketing intelligence–the last frontier of business information technologies. | |
Wang et al. | Geography matters in online hotel reviews | |
CN116228402A (zh) | 一种金融征信特征仓库技术支持系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |