[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN118158090B - 云平台宿主机网络链路冗余状态判别方法及装置 - Google Patents

云平台宿主机网络链路冗余状态判别方法及装置 Download PDF

Info

Publication number
CN118158090B
CN118158090B CN202410579305.6A CN202410579305A CN118158090B CN 118158090 B CN118158090 B CN 118158090B CN 202410579305 A CN202410579305 A CN 202410579305A CN 118158090 B CN118158090 B CN 118158090B
Authority
CN
China
Prior art keywords
sample
low
network link
feature
cloud platform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410579305.6A
Other languages
English (en)
Other versions
CN118158090A (zh
Inventor
杨结生
周佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yiqiyin Hangzhou Technology Co ltd
China Zheshang Bank Co Ltd
Original Assignee
Yiqiyin Hangzhou Technology Co ltd
China Zheshang Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yiqiyin Hangzhou Technology Co ltd, China Zheshang Bank Co Ltd filed Critical Yiqiyin Hangzhou Technology Co ltd
Priority to CN202410579305.6A priority Critical patent/CN118158090B/zh
Publication of CN118158090A publication Critical patent/CN118158090A/zh
Application granted granted Critical
Publication of CN118158090B publication Critical patent/CN118158090B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/085Retrieval of network configuration; Tracking network configuration history
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0895Configuration of virtualised networks or elements, e.g. virtualised network function or OpenFlow elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种云平台宿主机网络链路冗余状态判别方法及装置。本发明方法包括:获取训练样本并构建训练数据表,进行样本标记;对非数字特征进行数字特征处理;计算各类样本集合的典型特征表达;构建目标函数,并进行简化求解,计算低维投影矩阵;计算每个样本在低维投影矩阵下的低维特征表达,根据训练样本的低维特征表达及样本标签,训练判别模型;利用训练好的判别模型预测待测样本的样本标签,完成宿主机网络链路冗余状态判别。本发明方法不依赖、无需嵌入、寄生于云平台运行,无需人员登录生产云平台,不依赖管理人员运行管理技术水准、独立于云平台外运行、可实现云平台宿主机网络链路冗余状态离线、自主判别。

Description

云平台宿主机网络链路冗余状态判别方法及装置
技术领域
本发明属于金融科技领域,涉及金融领域云计算平台中,一种云平台宿主机网络链路冗余状态判别方法及装置。
背景技术
金融领域VMware云平台作为金融系统、平台、产品的一个重要的运行载体,承载着这些系统的运行,为系统平台提供着计算、存储、网络等算力资源及运行环境,如何做好云平台的运行管理,精准判别宿主机网络链路冗余状态,保障宿主机网络不中断、服务不中断,确保宿主机提供稳定的网络运行环境变得尤为重要。
传统的宿主机网络链路冗余状态判别方法一般为登录到云平台管理界面,在不依赖平台中自定义的告警设置的情况下,需要针对平台中的每个宿主机集群、每台宿主机进行逐一点击、逐个查看、分析、人工判别,这种手工判别方式存在如下问题:1.宿主机网络链路状态需要人工判别,判别准确性、判别效果严重依赖管理人员的运行管理经验、技术水准、能力水平,存在漏分析、误分析的可能;2.操作人员不易替代,需要配备专职技术人员;3.需要手工操作,操作步骤多,随着平台体量增大、计算节点变多,工作量成倍增加,严重消耗人力,降低工作能效;尤其在金融机构中,其云平台规模大、云主机数量多,手动判别方式耗时长,难以满足云平台运行管理的时效性要求;4.需要登录云平台,平台中查看操作手动,有误操作的风险,对云平台的运行具有一定操作隐患和风险。
除此之外,很多金融机构在云平台中针对宿主机网络链路冗余状态监测中配置监控告警,该方式耦合、寄生在平台中,依赖平台运行及平台本身告警设置的准确性、敏捷度,在告警配置失效、云管理主机运行出现问题下,无法实现链路冗余状态判别分析;告警模块嵌入、运行在云平台中,无法实现离线分析,无法满足场外分析、巡检需求;此外,该方式仍需要人员登录云平台中,进行手动操作,依然存在手工误操作的风险及隐患。
另外,一些方法局限于对原始的宿主机网络链路冗余状态的高维信息进行分析,这种方式由于原始信息数据维度较高,特征与特征之间存在线性关系、特征之间会有冗余,部分维度上特征对判别低贡献甚至是无用,并且原始信息在某些维度上的特征非数字,无法直接算式计算,判别效果不显著。如何对原始高维特征进行初步的数字处理,进行特征降维、约束低维投影方向,选取有益分类的特征,对提高分类效果具有重要意义。
因此,一种能够实现无需嵌入、寄生于云平台运行,无需人员登录生产云平台,不依赖管理人员运行管理技术水准、独立于云平台外运行、可实现离线分析、并能够对原始特征进行数字特征处理,变得可算式计算,且可处理剔除无效、冗余、线性、低贡献效果的特征维度,选取有益分类的特征的云平台宿主机网络链路冗余状态判别方法,变得切实重要。
发明内容
本发明的目的在于针对传统金融领域云平台宿主机网络链路冗余状态判别方法需要登录云生产环境、依赖管理人员分析、无法离线判别、操作多、耗时费力或监测模块耦合、寄生于平台中、依赖平台运行、不可离线分析等缺陷,提出了一种不依赖、无需嵌入、寄生于云平台运行,无需人员登录生产云平台,不依赖管理人员运行管理技术水准、能力水平、独立于云平台外运行、可实现离线、自主分析的云平台宿主机网络链路冗余状态判别方法及装置。
根据本发明的第一方面,提供一种云平台宿主机网络链路冗余状态判别方法,包括:
获取训练样本并构建训练数据表,根据宿主机网络链路冗余状态情况进行样本标记;
对样本中的非数字特征进行数字特征处理,建立各个非数字特征维度的数字字典;
根据样本标签将样本归为正常样本集合和异常样本集合,根据每类样本集合的样本特征,计算各类样本集合的典型特征表达;
构建目标函数,基于不同类别样本集合的典型特征表达在低维投影矩阵下的低维特征表达差异最大化,选取不同类别样本集合最具有区分度的方向对高维样本进行投影降维;保持同类样本朝着所属样本集合的典型特征的方向进行投影降维,使同类样本间在低维投影空间差异最小;根据所述目标函数求解得到低维投影矩阵的迭代表达式,设置调节参数,不断迭代计算得到低维投影矩阵;
计算每个样本在低维投影矩阵下的低维特征表达,根据训练样本的低维特征表达及样本标签,训练基于支持向量机的判别模型;
利用训练好的判别模型预测待测样本的样本标签,完成宿主机网络链路冗余状态判别。
进一步地,所述获取训练样本并构建训练数据表具体为:
通过RVTools工具获取云平台运行数据,将数据的导出格式选择为excel,将导出的excel簿中记录宿主机网络链路数据的第16张数据表进行行列转换作为训练数据表,将宿主机网络链路冗余状态正常的样本标签记为1,异常的样本标签记为-1。
进一步地,所述训练数据表的不同行代表不同特征维度,表示宿主机不同属性网络链路信息,不同列代表不同样本,当宿主机网络链路为n上联时,根据各宿主机的n列网络链路数据构建一个样本。
进一步地,根据宿主机网络链路数据在训练数据表中的列号顺序,依次输入存储器中,记录每一个特征维度的特征输入至存储器的先后顺序,统计各个特征的输入顺序及出现次数;
对非数字特征维度建立对应的数字字典,所述数字字典的建立具体为:针对某非数字特征维度上的特征,依据特征的输入顺序,分别映射不同数值;
依据建立的数字字典,通过特征与其映射的数值之间进行替代,对样本中的非数字特征进行数字特征处理。
进一步地,所述样本集合的典型特征表达具体为:各类样本集合对应的典型特征表达中的每一特征维度的特征为其对应类别样本集合中所有样本位于相同特征维度下,出现次数最多的特征即众数特征,如果某个特征维度存在多个众数特征,取最先到达最多次数的众数特征。
进一步地,所述目标函数对低维投影矩阵进行求导的过程中,引入拉格朗日乘子以确保低维投影矩阵的每个元素为非负值,引入拉格朗日乘子条件进行乘子迭代,计算得到低维投影矩阵。
进一步地,在迭代计算低维投影矩阵的过程中,初始化低维投影矩阵为值全为1的矩阵,设置调节参数,当迭代次数达到预设的最大迭代次数或相邻两次迭代的低维投影矩阵之间的差异小于预设的差异阈值,则停止迭代并输出当前低维投影矩阵。
进一步地,所述判别模型的训练具体为:
根据训练样本的低维特征表达及样本标签,训练基于支持向量机的判别模型得到判别模型的权重向量和截距;
根据所述判别模型的权重向量和截距计算,以及训练样本的低维特征表达计算训练样本标签,并与样本真实标签进行对比,计算判别模型的判别准确率;
如果判别准确率达到预设的准确率阈值,则输出判别模型;否则,调整调节参数,重新迭代求解低维投影矩阵、低维特征表达、训练判别模型,直至判别准确率达到预设的准确率阈值。
进一步地,将待测样本进行数字特征处理后,计算待测样本在低维投影矩阵下的低维特征表达,将低维特征表达输入训练好的判别模型中预测样本标签,完成宿主机网络链路冗余状态判别。
根据本发明的第二方面,提供一种云平台宿主机网络链路冗余状态判别装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现上述云平台宿主机网络链路冗余状态判别方法。
本发明的优点及有益效果是:
本发明方法通过对宿主机原始的网络链路数据进行非数字特征的数字化特征处理,实现原始特征可算式计算。通过特征分解进行数据降维,并剔除无效、冗余、线性、低贡献效果的特征维度,约束低维投影方向,选取异类样本区分度最大的低维投影方向,构造有益分类的低维特征,实现同类样本数据在低维空间中尽可能聚集,异类样本数据在低维空间中尽可能区分开,从而实现样本易区分。并以此训练判别模型,通过判别模型输入需判别样本,经过特征处理后,可直接计算获得样本标签即宿主机网络链路冗余状态。本发明方法不依赖、无需嵌入、寄生于云平台运行,无需人员登录生产云平台,不依赖管理人员运行管理技术水准、独立于云平台外运行、可实现离线、自主分析。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一示例性实施例示出的云平台宿主机网络链路冗余状态判别方法流程图;
图2为一示例性实施例示出的输入样本在原始高维空间第1特征维度下样本分布散点图;
图3为一示例性实施例示出的输入样本在原始高维空间第2特征维度下样本分布散点图;
图4为一示例性实施例示出的输入样本在原始高维空间第3特征维度下样本分布散点图;
图5为一示例性实施例示出的输入样本在低维投影空间样本分布散点图;
图6为一示例性实施例示出的云平台宿主机网络链路冗余状态判别装置结构图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
如图1所示,本发明实施例提供一种云平台宿主机网络链路冗余状态判别方法。本发明方法可以实现对VMware云平台宿主机网络链路冗余状态的有效判别,但不仅限于VMware。本发明方法包括以下步骤:
步骤1:获取训练样本并构建训练数据表,根据训练样本中宿主机网络链路冗余状态实际情况,进行样本标记,该标记即为样本标签。
获取训练样本具体为:通过RVTools工具,输入云平台IP地址、用户名及密码(部署了RVTools工具的平台需能够访问云平台),点击收集数据,并将数据的导出格式选择为excel,即可获取云平台运行数据。该工具可以将云平台的图形化数据转变成excel数据,其中宿主机网络链路数据在excel簿中第16张数据表中,表名称为vNIC。将vNIC表进行行列转换作为训练数据表。
以RVTools版本为4.3.1.0为例,其导出的云平台运行数据中,excel簿中第16张数据表中(表名称为vNIC)为宿主机网络链路数据信息,其中宿主机的网络链路为双上联。
vNIC表共14列,表的第1列为宿主机的主机名(vNicHostName),第2列至第14列代表着宿主机网络链路信息,第2列为宿主机上层的数据中心名称(vNicDatacenter)、第3列为宿主机上层的群集名称(vNicCluster)、第4列为虚拟网卡设备名称(vNicDevice)、第5列为虚拟网卡驱动器名称(vNicDriver)、第6列为虚拟网卡速率(vNicSpeed)、第7列虚拟网卡是否双工(vNicDuplex)、第8列为虚拟网卡的Mac地址(vNicMac)、第9列为虚拟交换机名称(vNicSwitch)、第10列为虚拟网卡链路端口名称(vNicUplinkPort)、第11列为虚拟网卡位置(vNicPci)、第12列为虚拟网卡唤醒(vNicWakeOn)、第13列为云平台服务器IP地址(vNICVISDKServer)、第14列为虚拟网卡实例的通用唯一标志符(vNICInstanceUUID)。样本的第1列为具体的宿主机的主机名,第2列至第14列为该宿主机的网络链路信息,因此每一台宿主机的网络链路信息的特征维度为13。当宿主机网络链路为n上联时,该宿主机的n行网络链路数据为一个数据样本,因此,第1行至第n行、第2列至第14列数据为云平台第1台宿主机的网络链路数据即为第1个样本;第n+1行至第2n行、第2列至第14列数据为云平台第2台宿主机的网络链路数据即为第2个样本;以此类推。当宿主机网络链路为双上联时,每一个样本为一个2行13列的数据,对样本进行行列转换作为训练样本,因此针对双上联,训练样本为一个13行2列的数据。
对样本进行人工标记,具体为:根据宿主机网络链路冗余状态实际情况,记录样本 对应的链路冗余情况,该情况即为样本标签。其中,宿主机网络链路冗余状态正常的样本, 其样本标签记为;宿主机网络链路冗余状态异常的样本,其样本标签记为
原始表进行行列转换后作为训练数据表,以示例样本的网络链路数据展示如表1所示。
表1
表1中第2行至第14行的数据为宿主机的网络链路特征。每一行代表一个特征维度,表示着宿主机某一属性网络链路信息。第1列为宿主机网络链路信息各特征维度的名称,第2列和第3列为具体维度下的具体特征值,某一维度的特征成对出现(在本次实施过程中,宿主机网络链路为双上联,针对更多上联的网络链路冗余状态判别,亦可分析);因此表1中第2行至第14行、第2列及第3列数据即为宿主机网络链路冗余状态的原始特征信息。
本次实施过程分为建模过程与判别测试过程。本次实施过程中,样本总数共600个。建模过程中共400个样本,前200个样本的宿主机网络链路冗余状态正常,后200个样本的宿主机网络链路冗余状态异常。判别测试过程中共200个样本,前100个样本的宿主机网络链路冗余状态正常,后100个样本的宿主机网络链路冗余状态异常。
建模过程中,前4个样本的原始特征信息如表2、表3所示。
表2
表3
其中:“XSZX”为某某中心、“XSZX_SC01”为某某中心生产区01、vmnic为VMware网卡、“qfle3”为一种虚拟网卡驱动器的名称、“True”为是、“VDS-Domain”为生产分布式虚拟交换机、“VDS-BACKUP”为备份分布式虚拟交换机、“VDS-MGMT”为管理分布式虚拟交换机、“uplink1”为虚拟网卡链路端口1、“uplink2”为虚拟网卡链路端口2。
步骤2:对原始输入样本进行样本数字特征处理。
根据宿主机网络链路数据在训练数据表中的列号顺序,依次输入存储器中。例如针对宿主机网络链路为双上联,第1台宿主机的第1列网络链路数据首先输入存储器中,其次为第1台宿主机的第2列网络链路数据输入存储器中,以此类推。
记录每一个特征维度的特征输入至存储器的先后顺序,如某特征最先输入至存储器,则记录该特征的输入顺序为1,其次输入的特征则记录输入顺序为2,以此类推,得到每一个特征维度中特征的输入顺序。统计各个特征的输入顺序及出现次数。
步骤2.1:对于样本中的非数字特征,建立各个非数字特征维度的数字字典,该字典能够形成特征与数字的一一映射关系。数字字典的建立方法具体为:针对某一特征维度上的特征,依据特征的输入顺序,分别映射数值1、2、3、4、5、……。
如表2所示,表2中第2列与第3列及第2行至第14行这块数据为样本特征,体现某一宿主机网络链路的原始数据。在本次实施过程中,原始宿主机的网络链路为双上联,因此,针对某一特征维度,特征成对出现。第2行的第2列与第3列为第1特征维度,第3行的第2列与第3列为第2特征维度,除了第6行的特征外,其余维度上的特征均为非数字特征。
以本次仿真实验的600个样本为例,各个特征维度的数字字典建立方法如下:
在600个样本中,同一特征维度上的特征有600对,共1200个。考虑不同样本在同一特征维度上的特征值可能会相同,因此这600个样本中,某一特征维度上的特征,其出现的特征值类别数会少于等于1200个,根据在这600个样本中某一特征维度上的特征,其特征值类别输入至存储器的输入顺序,分别映射数值1、2、3、4、5、……。
以第1特征维度,宿主机上层的数据中心名称(vNicDatacenter)为例。在这600个 样本中,该特征维度的特征值有600对,共1200个,特征值类别只有1种,对应的特征值为 “XSZX”。因此,第1特征维度的数字字典,这里称之为1.dict,具体为:
同样以第2特征维度,宿主机上层的群集名称(vNicCluster)为例。在这600个样本 中,该特征维度的特征值有600对,共1200个,特征值类别共11种,具体为“XSZX_SC01”、 “XSZX_SC04”、“XSZX_SC02”、“XSZX_SC03”、“XSZX_DMZ01”、“XSZX_ZYUY01”、“XSZX_DMZ02”、 “XSZX_MGMT01”、“XSZX_BG01”、“XSZX_BG02”、“XSZX_ZCTG01”。其中,特征值“XSZX_SC01”最 先输入至存储器,其映射的数值为1;特征值“XSZX_SC04”其次输入至存储器,其映射的数值 为2;以此类推,特征值“XSZX_ZCTG01”最后输入至存储器,其映射的数值为11。因此,第2特 征维度的数字字典,这里称之为2.dict,具体为:
同理,第3特征维度,虚拟网卡设备名称(vNicDevice),在这600个样本中,该特征的特征值有600对,共1200个,特征值类别共8种,具体为vmnic0、vmnic1、vmnic2、vmnic3、vmnic4、vmnic5、vmnic6、vmnic7。其中,特征值vmnic0最先输入至存储器,在数字特征处理中,其映射的数值为1;特征值vmnic1其次输入至存储器,在数字特征处理中,其映射的数值为2;以此类推,vmnic7最后输入至存储器,其映射的数值为8。因此,第3特征维度的数字字典,这里称之为3.dict,具体为:
同上述处理过程,以此类推。
第4特征维度为虚拟网卡驱动器名称(vNicDriver)。第4特征维度的数字字典,这 里称之为4.dict,具体为:
第5特征维度为虚拟网卡速率(vNicSpeed),该特征维度上的特征值本身为数字,保持原数字特征即可,无需建立数字字典。
第6特征维度为虚拟网卡是否双工(vNicDuplex)。第6特征维度的数字字典,这里 称之为6.dict,具体为:
第7特征维度为虚拟网卡的Mac地址(vNicMac)。这里与之前的特征映射有所不同, 因网卡的Mac地址每个特征值都不相同,其区分在于数值的有无,而非具体的地址信息,因 此,针对该特征维度的数字字典的映射原则为:有数值则特征值映射为1,无数值则特征值 映射为0;第7特征维度的数字字典,这里称之为7.dict,具体为:
第8特征维度为虚拟交换机名称(vNicSwitch)。第8特征维度的数字字典,这里称 之为8.dict,具体为:
第9特征维度为虚拟网卡链路端口名称(vNicUplinkPort)。第9特征维度的数字字 典,这里称之为9.dict,具体为:
第10特征维度为虚拟网卡位置(vNicPci)。因虚拟网卡位置每个特征值都有可能 不相同,其区分在于数值的有无,而非具体的位置信息,因此,针对该特征维度的数字字典 的映射原则为:有数值则特征值映射为1,无数值则特征值映射为0;第10特征维度的数字字 典,这里称之为10.dict,具体为:
第11特征维度为虚拟网卡唤醒(vNicWakeOn)。第11特征维度的数字字典,这里称 之为11.dict,具体为:
第12特征维度为云平台服务器IP地址(vNICVISDKServer)。第12特征维度的数字 字典,这里称之为12.dict,具体为:
第13特征维度为虚拟网卡实例的通用唯一标志符(vNICInstanceUUID)。第13特征 维度的数字字典,这里称之为13.dict,具体为:
步骤2.2:依据步骤2.1中建立的每个特征维度的数字字典,通过特征与其相映射 的数字之间进行一一替代,对样本中的非数字特征进行数字处理,通过这种方式,样本中的 每一个特征皆为数字,变得可算式计算处理。此时的样本记为,针对第个输入样本,记为,其样本标签记为
以表2、表3所示的前4个样本的原始特征信息为例,通过特征转换后,前4个样本的输入特征如表4所示。
表4
建模过程中,输入样本在原始高维空间任意一特征维度下样本分布散点图如图2、图3、图4所示,图2为以第1特征维度为例,图3为以第2特征维度为例,图4为以第3特征维度为例,其中圆圈点表示正常样本,三角点表示异常样本。从图2、图3、图4可见,输入样本在原始高维空间的第1、第2、第3特征维度上,正常样本与异常样本都有存在重合、无法完全区分的情况。
步骤3:依据样本标签,样本标签同为的样本归为正常样本集合,该样本集 合中样本数量记为;样本标签同为的样本归为异常样本集合,该样本集合中样 本数量记为
本次实施过程中,样本总数共600个。建模过程中共400个样本,前200个样本的宿 主机网络冗余状态正常,后200个样本的宿主机网络链路冗余状态异常;判别测试过程中共 200个样本,前100个样本宿主机网络链路冗余状态正常,后100个样本的宿主机网络链路冗 余状态异常。因此,样本标签同为1的正常样本集合,各样本对应的 标签及该正常样本集合的样本数量;样本标签同为-1的异常样 本集合,各样本对应的标签及该异常样本 集合的样本数量
步骤4:根据每类样本集合的样本特征,计算样本集合(其中,)的典型特 征表达中的每一特征维度的特征为样本集合中所有样本位于相同特征维度下,出 现次数最多的特征即众数特征,如果某个特征维度存在多个众数特征,取最先到达最多次 数的众数特征即可。
根据本次实施过程中的所有样本,可得正常样本集合的典型特征表达、异常 样本集合的典型特征表达如表5所示。
表5
步骤5:构建目标函数,目标函数建立过程如下:
原始样本数据特征维度较高,部分特征对数据分类无益,且有些特征与特征之间存在线性关系,特征是冗余的,对原始样本特征进行数据降维,整理出对数据分类方向有益的特征。
本发明提出如下目标函数:
其中,为目标函数,总的目标函数求最小,意图为在原始样本进行低维特征分解 时,尽可能反馈原始信息;为调节参数,为样本数量,为第个样本,的矩阵;为低维投影矩阵,的矩阵;为样本在低维投影矩阵下的 低维特征表达,的矩阵;因此,13维度的原始数据通过低维投影转变成1维特征,实 现数据降维;为矩阵的范数,其结果为矩阵中所有元素的平方和,再求平方根;为 矩阵的范数的平方,因此其结果为矩阵中所有元素的平方和,也就是之间的距离, 其距离越小越好。涉及矩阵当中的每个元素都为非负值。
上述样本特征的矩阵分解仅做到降维,未引导降维方向且求解不唯一。为使得投影矩阵稀疏,提高泛化能力,且引导数据降维方向,使样本特征朝着异类样本间差异最大的方向进行降维,本发明提出如下目标函数:
其中,为调节参数,为样本数量;(其中,)为样本 集合(其中,)的典型特征表达(其中,)在低维投影矩阵下的低维特 征表达。上述目标函数在对样本进行降维的同时,需要保持异类样本间的差异最大化。因此 上述目标函数可进一步改写为如下形式:
分别为宿主机网络链路冗余状态正常样本集合、宿主机网络链路 冗余状态异常样本集合的典型特征的低维特征表达,同类样本在进行样本降维时,应选取 最相似的特征,即选取代表这类样本典型特征的方向进行投影。异类样本选取差异最大方 向投影,即在低维空间中,选取最具有区分度的方向进行投影;这样,数据即实现同类筛选、 异类分离的效果。基于上述想法,本发明提出总的目标函数如下:
其中,为调节参数,为样本数量,在本次建模过 程中,为第个样本;为低维投影矩阵;为样本类别;类样本集 合;分别为类样本、类样本的典型特征表达,在本次建模过程中的取值如表5所 示。在本次建模过程中,
本发明对目标函数进行简化分解如下:
对目标函数优化并进一步分解如下:
其中,类样本集合的样本数量,为矩阵的迹。
上述总的目标函数对低维投影矩阵进行求导,为保证对低维投影矩阵进行 求导过程中,矩阵的每个元素为非负值,本发明引入拉格朗日乘子的矩阵,中的i表示第i行,j表示第j列。总的目标函数更新如下:
步骤6:目标函数求解,求取低维投影矩阵,目标函数对低维投影矩阵求导可 得:
引入拉格朗日乘子条件,进行乘子迭代,求解得到低维投影矩阵
其中,中的i表示第i行,j表示第j列。
低维投影矩阵的最终迭代表达简化如下:
步骤7:初始化低维投影矩阵为值全为1的矩阵,即输入样本的每一特征维度处 于相同权重,具有同样的判别效果,设置调节参数的大小,当迭代次数达到预设的 最大迭代次数或相邻两次迭代的之间的差异小于预设的差异阈值,则停止迭代并输出当 前的低维投影矩阵
在本次建模过程中,且迭代次数为100次,低维投影矩阵如 表6所示。
表6
步骤8:计算每个样本在低维投影矩阵下的低维特征表达,其中样 本的样本标签为
在本次建模过程中,。其中,前4个输入 样本的低维特征表达如表7所示。
表7
通过数据降维,输入样本投影至低维投影空间,输入样本在低维投影空间样本分布散点图如图5所示,其中圆圈点表示正常样本,三角点表示异常样本,从图5可见,正常样本与异常样本在低维投影空间上完全区分。
步骤9:输入建模过程中所有样本的低维特征表达及其样本标签,训练基于 支持向量机的判别模型,得到判别模型的权重向量和截距
在本次建模过程中,
步骤10:通过训练完成的判别模型计算训练样本标签,其中为符号函数,与样本真实标签进行对比,计算该判别模型的判别准确率。如果准确率 达到预设的准确率阈值,则说明判别效果优,输出判别模型,执行步骤11;反之,依次执行步 骤7、步骤8、步骤9、步骤10,直到准确率达到预设的准确率阈值,即说明判别效果达到预期 要求,计算得到最终输出的低维投影矩阵以及判别模型的权重向量和截距
在本次建模过程中,且迭代次数为100次时,判别模型的判别 准确率为100%,判别效果好。
步骤11:获取原始测试样本,对原始测试样本进行数字特征处理得到输入测试样本,计算输入测试样本在低维投影矩阵下的低维特征表达,将低维特征表达输入至判别模型中预测样本标签。在本次判别测试过程中,具体包括以下步骤:
步骤11.1:通过步骤1输入判别测试过程中原始样本,前4个原始测试样本如表8、表9所示。
表8
表9
其中:“”为某某中心、“”为某某中心隔离区02、vmnic为 VMware网卡、“”为一种虚拟网卡驱动器的名称、“”为是、“”为生产 分布式虚拟交换机、“”为备份分布式虚拟交换机、“”为管理 分布式虚拟交换机、“”为虚拟网卡链路端口1、“”为虚拟网卡链路端口2。
步骤11.2:通过步骤2预先建立的数字字典,能够获取到特征与数字的映射关系, 通过特征与其相映射的数字之间进行一一替代,对样本中非数字特征进行数字处理,得到 判别测试过程中的输入测试样本
判别测试过程的前4个输入测试样本如表10所示,其对应标签为
表10
步骤11.3:计算判别测试过程的输入测试样本的低维特征表达
具体地,根据步骤7得到的低维投影矩阵以及步骤11.2得到的输入测试样本,可计算得到输入测试样本的低维特征表达
判别测试过程的前4个样本的低维特征表达如表11所示。
表11
步骤11.4:根据步骤10中求得的判别模型的权重向量和截距,计算判别测试 过程中,样本的预测标签
的前4个样本的预测标签计算如下:
同步骤11.4,完成判别测试过程中所有样本的标签预测:
由步骤3可知,本次实施过程中,样本总数共600个。建模过程中共400个样本,前200个样本的宿主机网络链路冗余状态正常,后200个样本的宿主机网络链路冗余状态异常;判别测试过程中共200个样本,前100个样本宿主机网络链路冗余状态正常,后100个样本的宿主机网络链路冗余状态异常。宿主机网络链路冗余状态正常的样本,其样本标签记为1;宿主机网络链路冗余状态异常的样本,其样本标签记为-1。因此判别测试过程中,100%准确预测了样本标签,即100%准确判别了样本代表的宿主机网络链路冗余状态的实际情况。
与前述云平台宿主机网络链路冗余状态判别方法的实施例相对应,本发明还提供了云平台宿主机网络链路冗余状态判别装置的实施例。
参见图6,本发明实施例提供的云平台宿主机网络链路冗余状态判别装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,用于实现上述实施例中的云平台宿主机网络链路冗余状态判别方法。
本发明云平台宿主机网络链路冗余状态判别装置的实施例可以应用在任意具备数据处理能力的设备上,该任意具备数据处理能力的设备可以为诸如计算机等设备或装置。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在任意具备数据处理能力的设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图6所示,为本发明云平台宿主机网络链路冗余状态判别装置所在任意具备数据处理能力的设备的一种硬件结构图,除了图6所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的任意具备数据处理能力的设备通常根据该任意具备数据处理能力的设备的实际功能,还可以包括其他硬件,对此不再赘述。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例还提供一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时,实现上述实施例中的云平台宿主机网络链路冗余状态判别方法。
所述计算机可读存储介质可以是前述任一实施例所述的任意具备数据处理能力的设备的内部存储单元,例如硬盘或内存。所述计算机可读存储介质也可以是任意具备数据处理能力的设备的外部存储设备,例如所述设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、SD卡、闪存卡(Flash Card)等。进一步的,所述计算机可读存储介质还可以既包括任意具备数据处理能力的设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述任意具备数据处理能力的设备所需的其他程序和数据,还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。

Claims (9)

1.一种云平台宿主机网络链路冗余状态判别方法,其特征在于,包括:
获取训练样本并构建训练数据表,根据宿主机网络链路冗余状态情况进行样本标记;
对样本中的非数字特征进行数字特征处理,建立各个非数字特征维度的数字字典;
根据样本标签将样本归为正常样本集合和异常样本集合,根据每类样本集合的样本特征,计算各类样本集合的典型特征表达;所述样本集合的典型特征表达具体为:各类样本集合对应的典型特征表达中的每一特征维度的特征为其对应类别样本集合中所有样本位于相同特征维度下,出现次数最多的特征即众数特征,如果某个特征维度存在多个众数特征,取最先到达最多次数的众数特征;
构建目标函数,基于不同类别样本集合的典型特征表达在低维投影矩阵下的低维特征表达差异最大化,选取不同类别样本集合最具有区分度的方向对高维样本进行投影降维;保持同类样本朝着所属样本集合的典型特征的方向进行投影降维,使同类样本间在低维投影空间差异最小;根据所述目标函数求解得到低维投影矩阵的迭代表达式,设置调节参数,不断迭代计算得到低维投影矩阵;
计算每个样本在低维投影矩阵下的低维特征表达,根据训练样本的低维特征表达及样本标签,训练基于支持向量机的判别模型;
利用训练好的判别模型预测待测样本的样本标签,完成宿主机网络链路冗余状态判别。
2.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,所述获取训练样本并构建训练数据表具体为:
通过RVTools工具获取云平台运行数据,将数据的导出格式选择为excel,将导出的excel簿中记录宿主机网络链路数据的第16张数据表进行行列转换作为训练数据表,将宿主机网络链路冗余状态正常的样本标签记为1,异常的样本标签记为-1。
3.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,所述训练数据表的不同行代表不同特征维度,表示宿主机不同属性网络链路信息,不同列代表不同样本,当宿主机网络链路为n上联时,根据各宿主机的n列网络链路数据构建一个样本。
4.根据权利要求3所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,根据宿主机网络链路数据在训练数据表中的列号顺序,依次输入存储器中,记录每一个特征维度的特征输入至存储器的先后顺序,统计各个特征的输入顺序及出现次数;
对非数字特征维度建立对应的数字字典,所述数字字典的建立具体为:针对某非数字特征维度上的特征,依据特征的输入顺序,分别映射不同数值;
依据建立的数字字典,通过特征与其映射的数值之间进行替代,对样本中的非数字特征进行数字特征处理。
5.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,所述目标函数对低维投影矩阵进行求导的过程中,引入拉格朗日乘子以确保低维投影矩阵的每个元素为非负值,引入拉格朗日乘子条件进行乘子迭代,计算得到低维投影矩阵。
6.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,在迭代计算低维投影矩阵的过程中,初始化低维投影矩阵为值全为1的矩阵,设置调节参数,当迭代次数达到预设的最大迭代次数或相邻两次迭代的低维投影矩阵之间的差异小于预设的差异阈值,则停止迭代并输出当前低维投影矩阵。
7.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,所述判别模型的训练具体为:
根据训练样本的低维特征表达及样本标签,训练基于支持向量机的判别模型得到判别模型的权重向量和截距;
根据所述判别模型的权重向量和截距计算,以及训练样本的低维特征表达计算训练样本标签,并与样本真实标签进行对比,计算判别模型的判别准确率;
如果判别准确率达到预设的准确率阈值,则输出判别模型;否则,调整调节参数,重新迭代求解低维投影矩阵、低维特征表达、训练判别模型,直至判别准确率达到预设的准确率阈值。
8.根据权利要求1所述的云平台宿主机网络链路冗余状态判别方法,其特征在于,将待测样本进行数字特征处理后,计算待测样本在低维投影矩阵下的低维特征表达,将低维特征表达输入训练好的判别模型中预测样本标签,完成宿主机网络链路冗余状态判别。
9.一种云平台宿主机网络链路冗余状态判别装置,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,其特征在于,所述处理器执行所述可执行代码时,用于实现如权利要求1-8中任一项所述的云平台宿主机网络链路冗余状态判别方法。
CN202410579305.6A 2024-05-11 2024-05-11 云平台宿主机网络链路冗余状态判别方法及装置 Active CN118158090B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410579305.6A CN118158090B (zh) 2024-05-11 2024-05-11 云平台宿主机网络链路冗余状态判别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410579305.6A CN118158090B (zh) 2024-05-11 2024-05-11 云平台宿主机网络链路冗余状态判别方法及装置

Publications (2)

Publication Number Publication Date
CN118158090A CN118158090A (zh) 2024-06-07
CN118158090B true CN118158090B (zh) 2024-09-17

Family

ID=91285669

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410579305.6A Active CN118158090B (zh) 2024-05-11 2024-05-11 云平台宿主机网络链路冗余状态判别方法及装置

Country Status (1)

Country Link
CN (1) CN118158090B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1347606A (zh) * 1999-02-19 2002-05-01 艾利森电话股份有限公司 无线通信系统中使得能够进行灵活的链路自适应的控制信令的方法和系统
CN116028822A (zh) * 2023-03-30 2023-04-28 国网福建省电力有限公司 一种电能表误差状态评估方法、系统、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7145898B1 (en) * 1996-11-18 2006-12-05 Mci Communications Corporation System, method and article of manufacture for selecting a gateway of a hybrid communication system architecture
KR100772186B1 (ko) * 2005-12-08 2007-11-01 한국전자통신연구원 Atca 시스템에서의 고속 시리얼 링크 자동 활성화장치 및 방법과, 이를 이용한 atca 시스템
KR101216682B1 (ko) * 2012-07-17 2013-01-10 주식회사 테크모 네트워크상에서의 지능형 액세스 이중화 시스템 및 그 방법
CN109840530A (zh) * 2017-11-24 2019-06-04 华为技术有限公司 训练多标签分类模型的方法和装置
WO2020112756A1 (en) * 2018-11-26 2020-06-04 Arrcus Inc. Logical router comprising disaggregated network elements
CN111860612B (zh) * 2020-06-29 2021-09-03 西南电子技术研究所(中国电子科技集团公司第十研究所) 无监督高光谱图像隐低秩投影学习特征提取方法
US12061985B2 (en) * 2020-07-02 2024-08-13 Mitsubishi Electric Research Laboratories, Inc. Automated construction of neural network architecture with Bayesian graph exploration
CN112116017B (zh) * 2020-09-25 2024-02-13 西安电子科技大学 基于核保持的图像数据降维方法
CN112966649B (zh) * 2021-03-25 2022-06-03 南京工程学院 基于核扩展字典稀疏表示的遮挡人脸识别方法
CN117375879A (zh) * 2023-09-06 2024-01-09 中国人民银行数字货币研究所 一种冗余检测方法、装置、电子设备及存储介质
CN117201567B (zh) * 2023-11-06 2024-02-13 理工雷科智途(北京)科技有限公司 一种井工矿场景感知融合技术的出入罐笼控制系统及方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1347606A (zh) * 1999-02-19 2002-05-01 艾利森电话股份有限公司 无线通信系统中使得能够进行灵活的链路自适应的控制信令的方法和系统
CN116028822A (zh) * 2023-03-30 2023-04-28 国网福建省电力有限公司 一种电能表误差状态评估方法、系统、设备及存储介质

Also Published As

Publication number Publication date
CN118158090A (zh) 2024-06-07

Similar Documents

Publication Publication Date Title
US20230195845A1 (en) Fast annotation of samples for machine learning model development
US10719301B1 (en) Development environment for machine learning media models
US11537506B1 (en) System for visually diagnosing machine learning models
Kobayashi et al. Explainable, interpretable, and trustworthy AI for an intelligent digital twin: A case study on remaining useful life
WO2023116111A1 (zh) 一种磁盘故障预测方法及装置
CN104798043B (zh) 一种数据处理方法和计算机系统
CN107220217A (zh) 基于逻辑回归的特征系数训练方法和装置
CN107346286A (zh) 一种基于核主成分分析和极限学习机的软件缺陷预测方法
KR101948634B1 (ko) 스마트 컴퓨팅을 위한 시스템 자원의 장애 예측 방법
CN110781970B (zh) 分类器的生成方法、装置、设备及存储介质
CN113344700B (zh) 一种基于多目标优化的风控模型构建方法、装置和电子设备
CN114448657B (zh) 一种配电通信网络安全态势感知与异常入侵检测方法
CN116861924A (zh) 基于人工智能的项目风险预警方法及系统
CN112424784A (zh) 用于使用神经网络的改进的表标识的系统、方法和计算机可读介质
CN117056166A (zh) 数据异常检测方法、装置、存储介质及电子设备
CN116523284A (zh) 基于机器学习的业务操作流程自动化评估方法、系统
KR20220151650A (ko) 대용량 고속 스트림 데이터로부터 예측 분석들을 동적으로 발생시키기 위한 알고리즘적 학습 엔진
CN116340726A (zh) 一种能源经济大数据清洗方法、系统、设备及存储介质
CN113610107B (zh) 特征优化方法及装置
CN118158090B (zh) 云平台宿主机网络链路冗余状态判别方法及装置
CN111863135A (zh) 一种假阳性结构变异过滤方法、存储介质及计算设备
CN117196800A (zh) 一种用于银行网点员工行为的数字化管理方法
Shi et al. Medical cloud computing risk prediction method based on analytic hierarchy process and MRHGA-RBF neural networking optimization
CN111598159B (zh) 机器学习模型的训练方法、装置、设备及存储介质
Quah et al. Gauzing software readiness using metrics

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant