[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

CN116489001A - 交换机故障诊断及恢复方法、装置、交换机及存储介质 - Google Patents

交换机故障诊断及恢复方法、装置、交换机及存储介质 Download PDF

Info

Publication number
CN116489001A
CN116489001A CN202310443014.XA CN202310443014A CN116489001A CN 116489001 A CN116489001 A CN 116489001A CN 202310443014 A CN202310443014 A CN 202310443014A CN 116489001 A CN116489001 A CN 116489001A
Authority
CN
China
Prior art keywords
layer
switch
recovery
diagnosis
middle layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310443014.XA
Other languages
English (en)
Inventor
李昭星
陈翔
张连聘
张锡鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202310443014.XA priority Critical patent/CN116489001A/zh
Publication of CN116489001A publication Critical patent/CN116489001A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • H04L41/065Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis involving logical or physical relationship, e.g. grouping and hierarchies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Monitoring And Testing Of Exchanges (AREA)

Abstract

本发明涉及交换机领域,公开了交换机故障诊断及恢复方法、装置、交换机及存储介质。本发明根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层;分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果;根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置;根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。上述方法,节约了时间成本,且降低了对交换机的故障进行诊断及恢复的门槛,且提高了对交换机的故障进行诊断及恢复效率。

Description

交换机故障诊断及恢复方法、装置、交换机及存储介质
技术领域
本发明涉及交换机领域,具体涉及交换机故障诊断及恢复方法、装置、交换机及存储介质。
背景技术
交换机是网络中非常重要的设备,负责将网络中的数据包转发到正确的目的地。在交换机工作过程中,可能会出现一些问题,如网络拥塞、端口故障、链路闪烁等,这时需要对交换机进行故障诊断及恢复。
现有技术中,通常需要专业人员检查交换机的硬件,查看交换机的日志,使用网络分析工具分析交换机的数据流和网络拓扑结构,才可以对交换机的故障进行诊断和恢复。
上述方法,由于需要专业人员对交换机进行一步一步的排查检测,因此时间成本比较高,且对专业人员的专业度要求较高,且对交换机的故障诊断及恢复效率较低。
发明内容
有鉴于此,本发明提供了一种交换机故障诊断及恢复方法,以解决现有技术中,时间成本比较高,且对专业人员的专业度要求较高,且对交换机的故障诊断及恢复效率较低的问题。
第一方面,本发明提供了一种交换机故障诊断及恢复方法,该方法包括:
根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层;其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序;
分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果;
根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置;
根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层,保证了划分的应用层、中间层和驱动层的准确性。从而便于对交换机中各个软件程序以及硬件设备进行分层监控。分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果,保证了生成的应用层、中间层以及驱动层各层对应的检测结果的准确性。根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置,保证了确定的故障发生位置的准确性。然后,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。实现了对交换机的故障进行恢复,且保证了目标人员可以接收到诊断恢复报告。上述方法,不需要专业人员对交换机进行一步一步的排查检测,因此节约了时间成本,且降低了对交换机的故障进行诊断及恢复的门槛,且提高了对交换机的故障进行诊断及恢复效率。
在一种可选的实施方式中,分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果,包括:
对应用层进行检测,生成应用层检测结果;
根据应用层检测结果,对中间层进行检测,生成中间层检测结果;
根据中间层检测结果,对驱动层进行检测,生成驱动层检测结果。
本申请实施例提供的交换机故障诊断及恢复方法,对应用层进行检测,生成应用层检测结果,保证了生成的应用层检测结果的准确性。根据应用层检测结果,对中间层进行检测,生成中间层检测结果,保证了生成的中间层检测结果的准确性。根据中间层检测结果,对驱动层进行检测,生成驱动层检测结果,保证了生成的驱动层检测结果的准确性。进而保证了根据应用层、中间层以及驱动层各层对应的检测结果,确定的交换机的故障发生位置的准确性。
在一种可选的实施方式中,对应用层进行检测,生成应用层检测结果,包括:
对应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果;
对应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
本申请实施例提供的交换机故障诊断及恢复方法,对应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果,保证了生成的第一通用检测结果的准确性。对应用层中的各个第一运行进程进行检测,生成第一特定检测结果,保证了生成的第一特定检测结果的准确性。进而可以保证根据应用层检测结果,对中间层进行检测,生成的中间层检测结果的准确性。
在一种可选的实施方式中,第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息,根据应用层检测结果,对中间层进行检测,生成中间层检测结果,包括:
根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息;
根据各个第二进程功能模块的标识信息,对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果;
对中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果。
本申请实施例提供的交换机故障诊断及恢复方法,第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息。根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息,保证了确定的至少一个第二进程功能模块的标识信息的准确性,实现了缩小中间层的检索范围的效果,从而可以提高对交换机的故障进行诊断和恢复的效率。然后,根据各个第二进程功能模块的标识信息,对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果,保证了生成的第二特定检测结果的准确性。对中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果,保证了生成的第二通用检测结果的准确性。进而保证了根据中间层检测结果,对驱动层进行检测,生成的驱动层检测结果的准确性。
在一种可选的实施方式中,第二特定检测结果中包括发生异常的第二进程功能模块的标识信息,根据中间层检测结果,对驱动层进行检测,生成驱动层检测结果,包括:
根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一个第三进程功能模块的标识信息;
根据各个第三进程功能模块的标识信息,对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果;
对驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果。
本申请实施例提供的交换机故障诊断及恢复方法,第二特定检测结果中包括发生异常的第二进程功能模块的标识信息,根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一个第三进程功能模块的标识信息,保证了确定的至少一个第三进程功能模块的标识信息的准确性,实现了缩小驱动层的检索范围效果,从而可以提高对交换机的故障进行诊断和恢复的效率。然后,根据各个第三进程功能模块的标识信息,对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果,保证了生成的第三特定检测结果的准确性。对驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果,保证了生成的第三通用检测结果的准确性。
在一种可选的实施方式中,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员,包括:
当应用层发生故障时,对故障进行恢复,生成第一诊断恢复结果;
根据第一诊断恢复结果,生成第一诊断恢复报告,将第一诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,当应用层发生故障时,对故障进行恢复,生成第一诊断恢复结果,保证了生成的第一诊断恢复结果的准确性。然后,根据第一诊断恢复结果,生成第一诊断恢复报告,将第一诊断恢复报告发送至目标人员,保证了生成的第一诊断恢复报告的准确性,且保证了目标人员可以接收到第一诊断恢复报告。
在一种可选的实施方式中,上述方法还包括:
当中间层以及应用层均发生故障时,对中间层的故障进行恢复;
当中间层的故障恢复成功时,对应用层中的故障进行恢复;
当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第二诊断恢复结果;
根据第二诊断恢复结果,生成第二诊断恢复报告,将第二诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,当中间层以及应用层均发生故障时,对中间层的故障进行恢复,保证了对中间层的故障进行恢复的准确性。当中间层的故障恢复成功时,对应用层中的故障进行恢复;当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第二诊断恢复结果,实现了应用层跨层调用驱动层,在可能的情况下实现交换机的热恢复,可减少服务的宕机时间,提升系统的可用性以及健壮性,提升用户满意度。然后,根据第二诊断恢复结果,生成第二诊断恢复报告,将第二诊断恢复报告发送至目标人员,保证了生成的第二诊断恢复报告的准确性,且保证了目标人员可以接收到第二诊断恢复报告。
在一种可选的实施方式中,上述方法还包括:
当驱动层、中间层以及应用层均发生故障时,对驱动层的故障进行恢复;
当驱动层的故障恢复失败时,生成第三诊断恢复结果;
当驱动层的故障恢复成功时,对中间层的故障进行恢复;
当中间层的故障恢复成功时,对应用层中的故障进行恢复;
当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第四诊断恢复结果;
根据第三诊断恢复结果或者第四诊断恢复结果,生成第三诊断恢复报告,将第三诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,当驱动层、中间层以及应用层均发生故障时,对驱动层的故障进行恢复,当驱动层的故障恢复失败时,生成第三诊断恢复结果,保证了生成的第三诊断恢复结果的准确性。当驱动层的故障恢复成功时,对中间层的故障进行恢复,当中间层的故障恢复成功时,对应用层中的故障进行恢复,从而实现了对交换机的故障进行恢复。当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第四诊断恢复结果。实现了应用层跨层调用驱动层,在可能的情况下实现交换机的热恢复,可减少服务的宕机时间,提升系统的可用性以及健壮性,提升用户满意度,且保证了生成的第四诊断恢复结果的准确性。根据第三诊断恢复结果或者第四诊断恢复结果,生成第三诊断恢复报告,将第三诊断恢复报告发送至目标人员,保证了生成的第三诊断恢复报告的准确性,且保证了目标人员可以接收到第三诊断恢复报告。
第二方面,本发明提供了一种交换机故障诊断及恢复装置,该装置包括:
划分模块,用于根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层;其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序;
检测模块,用于分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果;
确定模块,用于根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置;
恢复模块,用于根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复装置,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层,保证了划分的应用层、中间层和驱动层的准确性。从而便于对交换机中各个软件程序以及硬件设备进行分层监控。分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果,保证了生成的应用层、中间层以及驱动层各层对应的检测结果的准确性。根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置,保证了确定的故障发生位置的准确性。然后,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。实现了对交换机的故障进行恢复,且保证了目标人员可以接收到诊断恢复报告。上述装置,不需要专业人员对交换机进行一步一步的排查检测,因此节约了时间成本,且降低了对交换机的故障进行诊断及恢复的门槛,且提高了对交换机的故障进行诊断及恢复效率。
第三方面,本发明提供了一种交换机,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的交换机故障诊断及恢复方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的交换机故障诊断及恢复方法的流程示意图;
图2是根据本发明实施例的另一交换机故障诊断及恢复方法的流程示意图;
图3是根据本发明实施例的又一交换机故障诊断及恢复方法的流程示意图;
图4是根据本发明实施例的交换机故障诊断及恢复装置的结构框图;
图5是本发明实施例的交换机的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
交换机是网络中非常重要的设备,负责将网络中的数据包转发到正确的目的地。在交换机工作过程中,可能会出现一些问题,如网络拥塞、端口故障、链路闪烁等,这时需要对交换机进行故障诊断及恢复。
相关技术中,通常需要专业人员首先需要检查交换机的硬件状态,例如电源、风扇、端口等是否正常工作。如果发现硬件故障,需要更换或修复硬件设备。其次需要检查交换机的配置是否正确,例如VLAN配置、端口速率、链路聚合等。如果发现配置错误,需要按照正确的配置进行修改。然后,通过查看交换机的日志,可以了解交换机的运行状态、事件和错误信息,进而定位故障所在。可以通过命令行界面或网络管理工具查看日志。最后通过使用网络分析工具,例如Wireshark、tcpdump等,可以分析交换机的数据流和网络拓扑结构,进一步定位网络问题的根本原因。
因此,本发明实施例提供了一种交换机故障诊断及恢复方法方法,通过对交换机中的交换机中各个软件程序以及硬件设备进行检测,确定交换机的故障发生位置,然后,根据交换机的故障发生位置,对交换机的故障进行恢。实现了交换机的自动检测以及恢复。
根据本发明实施例,提供了一种交换机故障诊断及恢复方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种交换机故障诊断及恢复方法,其执行主体可以是交换机故障诊断及恢复的装置,该交换机故障诊断及恢复的装置可以通过软件、硬件或者软硬件结合的方式实现成为交换机的部分或者全部。均以执行主体是交换机为例来进行说明。
在本实施例中提供了一种交换机故障诊断及恢复方法,可用于上述的交换机,图1是根据本发明实施例的交换机故障诊断及恢复方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层。
其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序。
应用层是整个系统的最上层,负责实现系统的具体功能。其中,应用层通常包括用户界面、业务逻辑、数据处理等模块。应用层的任务是根据需求实现相应的功能,并通过中间层和驱动层与硬件交互。
中间层用于提供了通用的软件组件以及接口,屏蔽不同产品硬件驱动层差异,以方便应用层进行开发。
驱动层是硬件和软件之间的接口层,负责处理底层硬件的访问和控制。驱动层通常直接与硬件交互,提供了一组API(应用程序接口)供上层模块调用。通过这些API,上层模块可以完成硬件的初始化、数据读写等操作。驱动层的主要任务是确保硬件能够正确地工作,同时提供一组简单易用的接口,方便上层模块进行开发。
具体地,驱动层的划分依据是硬件设备的类型和功能,主要抽象硬件的功能,一般是一个硬件对应一份驱动程序,例如网络驱动、USB驱动、CPLD驱动、传感器驱动等。
中间层划分依据是规范化驱动层接口的一层,遵循通用规范来实现驱动层的统一。因为不同产品硬件和芯片设计不同,驱动层的差异较大,使用中间层来规范统一化接口。
应用层的划分依据是软件系统的业务需求和功能模块,例如为用户提供相关的功能的,例如转发数据包、网络隔离等的业务功能模块。
步骤S102,分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果。
具体地,交换机可以根据应用层、中间层以及驱动层的软件程序之间的调用关系,分别对应用层、中间层以及驱动层进行检测,从而分别生成分别对应用层、中间层以及驱动层进行检测。
关于该步骤将在下文进行详细介绍。
步骤S103,根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置。
具体地,交换机可以将应用层的对应的检测结果和中间层对应的检测结果以及驱动层对应的检测结果,进行横向对比,根据对比结果,确定交换机的故障发生位置。
步骤S104,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
具体地,在确定了故障发生位置后,交换机可以对故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层,保证了划分的应用层、中间层和驱动层的准确性。从而便于对交换机中各个软件程序以及硬件设备进行分层监控。分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果,保证了生成的应用层、中间层以及驱动层各层对应的检测结果的准确性。根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置,保证了确定的故障发生位置的准确性。然后,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。实现了对交换机的故障进行恢复,且保证了目标人员可以接收到诊断恢复报告。上述方法,不需要专业人员对交换机进行一步一步的排查检测,因此节约了时间成本,且降低了对交换机的故障进行诊断及恢复的门槛,且提高了对交换机的故障进行诊断及恢复效率。
在本实施例中提供了一种交换机故障诊断及恢复方法,可用于上述的交换机,图2是根据本发明实施例的交换机故障诊断及恢复方法的流程图,如图2所示,该流程包括如下步骤:
步骤S201,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层。
其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序。
详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S202,分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果。
具体地,上述步骤S202包括:
步骤S2021,对应用层进行检测,生成应用层检测结果。
在一些可选的实施方式中,上述步骤S2021包括:
步骤a1,对应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果。
具体地,交换机可以调用API读取应用层中的包括的各个第一固件版本以及各个第一软件版本,然后从配置文件中读取各个第一固件版本对应的第一标准固件版本,以及各个第一软件版本对应的第一标准软件版本。
交换机可以将各个第一固件版本与对应的第一标准固件版本进行对比,当各个第一固件版本与对应的第一标准固件版本之间的差别小于预设差别阈值时,对各个第一固件版本与对应的第一标准固件版本之间的差别进行记录。当各个第一固件版本与对应的第一标准固件版本之间的差别大于预设差别阈值时,输出告警信息。
同理,交换机可以将各个第一软件版本与对应的第一标准软件版本进行对比,当各个第一软件版本与对应的第一标准软件版本之间的差别小于预设差别阈值时,对各个第一软件版本与对应的第一标准软件版本之间的差别进行记录。当各个第一软件版本与对应的第一标准软件版本之间的差别大于预设差别阈值时,输出告警信息。
步骤a2,对应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
可选地,交换机可以实时查看应用层中的各个第一运行进程对应的进程日志,从而对应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
可选地,交换机还可以利用进程检测工具对应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
当应用层中的各个第一运行进程正常运行时,第一特定检测结果可以是全部第一运行进程检测正常。
当应用层中存在发生异常的第一运行进程时,交换机可以根据各个第一运行进程与第一进程功能模块之间的对应关系,确定发生异常的第一运行进程对应的第一进程功能模块的标识信息,因此,第一特定检测结果中可以包括发生异常的第一运行进程对应的第一进程功能模块的标识信息。
步骤S2022,根据应用层检测结果,对中间层进行检测,生成中间层检测结果。
在一些可选的实施方式中,第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息,上述步骤S2022包括:
步骤b1,根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息。
具体地,在第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息时,交换机确定应用层中的第一进程功能模块存在故障,为了准确判断故障发生的位置以及原因。
交换机可以根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息。
步骤b2,根据各个第二进程功能模块的标识信息,对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果。
具体地,在从中间层中确定了各个第二进程功能模块的标识信息之后,交换机可以对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果。
示例性的,假设第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块为交换机风扇对应的模块,则交换机根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,确定中间层中交换机风扇对应的至少一个第二进程功能模块的标识信息。
然后,对中间层中交换机风扇对应的至少一个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果。
可选的,当第二进程功能模块中包括的各个第二运行进程均正常运行时,第二特定检测结果可以是各个第二运行进程均检测正常,那么交换机确定故障仅发生在应用层。
可选的,当第二进程功能模块中存在发生异常的第二运行进程时,交换机根据发生异常的第二运行进程与第二进程功能模块之间的对应关系,确定发生异常的第二进程功能模块。因此,第二特定检测结果中可以包括发生异常的第二进程功能模块的标识信息。
步骤b3,对中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果。
具体地,交换机可以调用API读取中间层中的包括的各个第二固件版本以及各个第二软件版本,然后从配置文件中读取各个第二固件版本对应的第二标准固件版本,以及各个第二软件版本对应的第二标准软件版本。
交换机可以将各个第二固件版本与对应的第二标准固件版本进行对比,当各个第二固件版本与对应的第二标准固件版本之间的差别小于预设差别阈值时,对各个第二固件版本与对应的第二标准固件版本之间的差别进行记录。当各个第二固件版本与对应的第二标准固件版本之间的差别大于预设差别阈值时,输出告警信息。
同理,交换机可以将各个第二软件版本与对应的第二标准软件版本进行对比,当各个第二软件版本与对应的第二标准软件版本之间的差别小于预设差别阈值时,对各个第二软件版本与对应的第二标准软件版本之间的差别进行记录。当各个第二软件版本与对应的第二标准软件版本之间的差别大于预设差别阈值时,输出告警信息。
步骤S2023,根据中间层检测结果,对驱动层进行检测,生成驱动层检测结果。
在一些可选的实施方式中,第二特定检测结果中包括发生异常的第二进程功能模块的标识信息,上述步骤S2023包括:
步骤c1,根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一个第三进程功能模块的标识信息。
具体地,在第二特定检测结果中包括发生异常的第二进程功能模块的标识信息时,交换机确定中间层中的第二进程功能模块存在故障,为了准确判断故障发生的位置以及原因。
交换机可以根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一二个第三进程功能模块的标识信息。
步骤c2,根据各个第三进程功能模块的标识信息,对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果。
具体地,在从驱动层中确定各个第三进程功能模块的标识信息之后,交换机可以对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果。
可选的,当第三进程功能模块中包括的各个加载驱动进程均正常运行时,第三特定检测结果可以是各个加载驱动进程均检测正常,那么交换机确定故障仅发生在应用层和中间层。
可选的,当第三进程功能模块中存在发生异常的加载驱动进程时,交换机根据发生异常的加载驱动进程与第三进程功能模块之间的对应关系,确定发生异常的第三进程功能模块。那么,交换机确定故障发生在驱动层、中间层以及应用层,并确定可能是由于驱动层中发生异常的第三进程功能模块,导致中间层存在异常,进而导致应用层存在异常。
步骤c3,对驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果。
具体地,交换机可以调用API读取驱动层中的包括的各个第三固件版本以及各个第三软件版本,然后从配置文件中读取各个第三固件版本对应的第三标准固件版本,以及各个第三软件版本对应的第三标准软件版本。
交换机可以将各个第三固件版本与对应的第三标准固件版本进行对比,当各个第三固件版本与对应的第三标准固件版本之间的差别小于预设差别阈值时,对各个第三固件版本与对应的第三标准固件版本之间的差别进行记录。当各个第三固件版本与对应的第三标准固件版本之间的差别大于预设差别阈值时,输出告警信息。
同理,交换机可以将各个第三软件版本与对应的第三标准软件版本进行对比,当各个第三软件版本与对应的第三标准软件版本之间的差别小于预设差别阈值时,对各个第三软件版本与对应的第三标准软件版本之间的差别进行记录。当各个第三软件版本与对应的第三标准软件版本之间的差别大于预设差别阈值时,输出告警信息。
步骤S203,根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置。
详细请参见图1所示实施例的步骤S103,在此不再赘述。
步骤S204,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
详细请参见图1所示实施例的步骤S104,在此不再赘述。
本申请实施例提供的交换机故障诊断及恢复方法,对应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果,保证了生成的第一通用检测结果的准确性。对应用层中的各个第一运行进程进行检测,生成第一特定检测结果,保证了生成的第一特定检测结果的准确性。进而可以保证根据应用层检测结果,对中间层进行检测,生成的中间层检测结果的准确性。
当第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息时,根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息,保证了确定的至少一个第二进程功能模块的标识信息的准确性,实现了缩小中间层的检索范围的效果,从而可以提高对交换机的故障进行诊断和恢复的效率。然后,根据各个第二进程功能模块的标识信息,对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果,保证了生成的第二特定检测结果的准确性。对中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果,保证了生成的第二通用检测结果的准确性。进而保证了根据中间层检测结果,对驱动层进行检测,生成的驱动层检测结果的准确性。
当第二特定检测结果中包括发生异常的第二进程功能模块的标识信息,根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一个第三进程功能模块的标识信息,保证了确定的至少一个第三进程功能模块的标识信息的准确性,实现了缩小驱动层的检索范围效果,从而可以提高对交换机的故障进行诊断和恢复的效率。然后,根据各个第三进程功能模块的标识信息,对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果,保证了生成的第三特定检测结果的准确性。对驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果,保证了生成的第三通用检测结果的准确性。
在本实施例中提供了一种交换机故障诊断及恢复方法,可用于上述的交换机,图3是根据本发明实施例的交换机故障诊断及恢复方法的流程图,如图3所示,该流程包括如下步骤:
步骤S301,根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层。
其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序。
详细请参见图2所示实施例的步骤S201,在此不再赘述。
步骤S302,分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果。
详细请参见图2所示实施例的步骤S202,在此不再赘述。
步骤S303,根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置。
详细请参见图2所示实施例的步骤S203,在此不再赘述。
步骤S304,根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
在一些可选的实施方式中,上述步骤304可以包括如下情况:
其中一种情况,步骤3041,当应用层发生故障时,对故障进行恢复,生成第一诊断恢复结果。
步骤3042,根据第一诊断恢复结果,生成第一诊断恢复报告,将第一诊断恢复报告发送至目标人员。
具体地,当应用层发生故障时,交换机可以利用预设恢复方法对应用层的故障进行恢复,根据恢复结果,生成第一诊断恢复结果。
其中,预审恢复方法可以是重新启动发生故障的第一运行进程,也可以是采用其他方法,本申请实施例对预设恢复方法不做具体限定。
当对应用层的故障恢复成功之后,第一诊断恢复结果可以用于表明故障发生在应用层,已恢复成功。当对应用层的故障恢复失败之后,第一诊断恢复结果可以用于表明故障发生在应用层,恢复失败。
然后,交换机根据第一诊断恢复结果,生成第一诊断恢复报告,并将第一诊断恢复报告发送至目标人员。
其中另一种情况,步骤3043,当中间层以及应用层均发生故障时,对中间层的故障进行恢复。
步骤3044,当中间层的故障恢复成功时,对应用层中的故障进行恢复。
步骤3045,当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第二诊断恢复结果。
步骤3046,根据第二诊断恢复结果,生成第二诊断恢复报告,将第二诊断恢复报告发送至目标人员。
具体地,当中间层以及应用层均发生故障时,由于中间层的故障可能会影响到应用层的故障,因此,交换机可以首先利用预设恢复方法对中间层的故障进行恢复。
当中间层的故障恢复成功时,交换机利用预设恢复方法对应用层中的故障进行恢复。
当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,避免中间层对应用层的影响。然后,交换机利用预设恢复方法对应用层中的故障进行恢复,生成第二诊断恢复结果。
其中,预审恢复方法可以是重新启动发生故障的第一运行进程,也可以是采用其他方法,本申请实施例对预设恢复方法不做具体限定。
其中,第二诊断恢复结果可以用于表征故障发生在中间层以及应用层,中间层恢复成功,且应用层也恢复成功;第二诊断恢复结果还可以用于表征故障发生在中间层以及应用层,中间层恢复成功,且应用层也恢复失败;第二诊断恢复结果也可以用于表征故障发生在中间层以及应用层,中间层恢复失败,且应用层恢复成功;第二诊断恢复结果也可以用于表征故障发生在中间层以及应用层,中间层恢复失败,且应用层恢复失败。
然后,交换机根据第二诊断恢复结果,生成第二诊断恢复报告,并将第二诊断恢复报告发送至目标人员。
其中另一种情况,步骤3047,当驱动层、中间层以及应用层均发生故障时,对驱动层的故障进行恢复。
步骤3048,当驱动层的故障恢复失败时,生成第三诊断恢复结果。
步骤3049,当驱动层的故障恢复成功时,对中间层的故障进行恢复。
步骤30410,当中间层的故障恢复成功时,对应用层中的故障进行恢复。
步骤30411,当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第四诊断恢复结果。
步骤30412,根据第三诊断恢复结果或者第四诊断恢复结果,生成第三诊断恢复报告,将第三诊断恢复报告发送至目标人员。
具体地,当驱动层、中间层以及应用层均发生故障时,由于驱动层的故障会影响到中间层的故障,而中间层的故障还可能影响到应用层的故障。因此,交换机可以首先利用预设恢复方法对驱动层的故障进行恢复。
当驱动层的故障恢复失败时,生成第三诊断恢复结果。其中,第三诊断恢复结果可以用于表征驱动层、中间层以及应用层均发生故障,且驱动层的故障恢复失败。
当驱动层的故障恢复成功时,交换机可以利用预设恢复方法对中间层的故障进行恢复;当中间层的故障恢复成功时,交换机可以利用预设恢复方法对应用层中的故障进行恢复,当应用层恢复成功之后,可以生成第四诊断恢复结果。其中,第四诊断恢复结果可以用于表征驱动层、中间层以及应用层均发生故障,且驱动层的故障恢复成功,中间层的故障恢复成功,且应用层的故障恢复成功。
当驱动层的故障恢复成功时,交换机可以利用预设恢复方法对中间层的故障进行恢复;当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,避免中间层对应用层的影响。然后,交换机利用预设恢复方法对应用层中的故障进行恢复,当应用层恢复成功后,交换机可以生成第四诊断恢复结果。其中,第四诊断恢复结果可以用于表征驱动层、中间层以及应用层均发生故障,且驱动层的故障恢复成功,中间层已屏蔽掉,且应用层的故障恢复成功。
当驱动层的故障恢复成功时,交换机可以利用预设恢复方法对中间层的故障进行恢复;当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,避免中间层对应用层的影响。然后,交换机利用预设恢复方法对应用层中的故障进行恢复,当应用层恢复失败后,交换机可以生成第四诊断恢复结果。其中,第四诊断恢复结果可以用于表征驱动层、中间层以及应用层均发生故障,且驱动层的故障恢复成功,中间层已屏蔽掉,且应用层的故障恢复失败。
然后,交换机根据交换机根据第二诊断恢复结果,生成第二诊断恢复报告,并将第二诊断恢复报告发送至目标人员。
本申请实施例提供的交换机故障诊断及恢复方法,当应用层发生故障时,对故障进行恢复,生成第一诊断恢复结果,保证了生成的第一诊断恢复结果的准确性。然后,根据第一诊断恢复结果,生成第一诊断恢复报告,将第一诊断恢复报告发送至目标人员,保证了生成的第一诊断恢复报告的准确性,且保证了目标人员可以接收到第一诊断恢复报告。
当中间层以及应用层均发生故障时,对中间层的故障进行恢复,保证了对中间层的故障进行恢复的准确性。当中间层的故障恢复成功时,对应用层中的故障进行恢复;当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第二诊断恢复结果,实现了应用层跨层调用驱动层,在可能的情况下实现交换机的热恢复,可减少服务的宕机时间,提升系统的可用性以及健壮性,提升用户满意度。然后,根据第二诊断恢复结果,生成第二诊断恢复报告,将第二诊断恢复报告发送至目标人员,保证了生成的第二诊断恢复报告的准确性,且保证了目标人员可以接收到第二诊断恢复报告。
当驱动层、中间层以及应用层均发生故障时,对驱动层的故障进行恢复,当驱动层的故障恢复失败时,生成第三诊断恢复结果,保证了生成的第三诊断恢复结果的准确性。当驱动层的故障恢复成功时,对中间层的故障进行恢复,当中间层的故障恢复成功时,对应用层中的故障进行恢复,从而实现了对交换机的故障进行恢复。当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第四诊断恢复结果。实现了应用层跨层调用驱动层,在可能的情况下实现交换机的热恢复,可减少服务的宕机时间,提升系统的可用性以及健壮性,提升用户满意度,且保证了生成的第四诊断恢复结果的准确性。根据第三诊断恢复结果或者第四诊断恢复结果,生成第三诊断恢复报告,将第三诊断恢复报告发送至目标人员,保证了生成的第三诊断恢复报告的准确性,且保证了目标人员可以接收到第三诊断恢复报告。
在本实施例中还提供了一种交换机故障诊断及恢复装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种交换机故障诊断及恢复装置,如图4所示,包括:
划分模块401,用于根据交换机中各个软件程序以及硬件设备的功能,对交换机中的软件程序以及硬件设备进行划分,划分为应用层、中间层和驱动层;其中,应用层中的软件程序可以调用中间层的软件程序,中间层的软件程序可以调用驱动层的软件程序;
检测模块402,用于分别对应用层、中间层以及驱动层进行检测,生成应用层、中间层以及驱动层各层对应的检测结果。
确定模块403,用于根据应用层、中间层以及驱动层各层对应的检测结果,确定交换机的故障发生位置。
恢复模块404,用于根据交换机的故障发生位置,对交换机的故障进行恢复,生成诊断恢复报告,将诊断恢复报告发送至目标人员。
在一些可选的实施方式中,检测模块402包括:
第一检测单元4021,用于对应用层进行检测,生成应用层检测结果。
第二检测单元4022,用于根据应用层检测结果,对中间层进行检测,生成中间层检测结果。
第三检测单元4023,用于根据中间层检测结果,对驱动层进行检测,生成驱动层检测结果。
在一些可选的实施方式中,第一检测单元4021包括:
第一检测子单元40211,用于对应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果。
第二检测子单元40212,用于对应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
在一些可选的实施方式中,第一特定检测结果中包括发生异常的第一运行进程对应的第一进程功能模块的标识信息,第二检测单元4022包括:
第一确定子单元40221,用于根据应用层的软件程序与中间层的软件程序之间的调用关系以及第一进程功能模块的标识信息,从中间层中确定第一进程功能模块调用的至少一个第二进程功能模块的标识信息。
第三检测子单元40222,用于根据各个第二进程功能模块的标识信息,对各个第二进程功能模块的配置信息以及第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果。
第四检测子单元40223,用于对中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果。
在一些可选的实施方式中,第二特定检测结果中包括发生异常的第二进程功能模块的标识信息,第三检测单元4023包括:
第二确定子单元40231,用于根据中间层的软件程序与驱动层的软件程序之间的调用关系以及第二进程功能模块的标识信息,从驱动层中确定第二进程功能模块调用的至少一个第三进程功能模块的标识信息。
第五检测子单元40232,用于根据各个第三进程功能模块的标识信息,对各个第三进程功能模块的配置信息以及第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果。
第六检测子单元40233,用于对驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果。
在一些可选的实施方式中,恢复模块404包括:
第一恢复单元4041,用于当应用层发生故障时,对故障进行恢复,生成第一诊断恢复结果。
第一生成单元4042,用于根据第一诊断恢复结果,生成第一诊断恢复报告,将第一诊断恢复报告发送至目标人员。
在一些可选的实施方式中,恢复模块404还包括:
第二恢复单元4043,用于当中间层以及应用层均发生故障时,对中间层的故障进行恢复。
第三恢复单元4044,用于当中间层的故障恢复成功时,对应用层中的故障进行恢复。
第四恢复单元4045,用于当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第二诊断恢复结果。
第二生成单元4046,用于根据第二诊断恢复结果,生成第二诊断恢复报告,将第二诊断恢复报告发送至目标人员。
在一些可选的实施方式中,恢复模块404还包括:
第五恢复单元4047,用于当驱动层、中间层以及应用层均发生故障时,对驱动层的故障进行恢复。
第三生成单元4048,用于当驱动层的故障恢复失败时,生成第三诊断恢复结果。
第六恢复单元4049,用于当驱动层的故障恢复成功时,对中间层的故障进行恢复。
第七恢复单元40410,用于当中间层的故障恢复成功时,对应用层中的故障进行恢复。
第八恢复单元40411,用于当中间层的故障恢复失败时,对中间层设置标识位,将中间层屏蔽掉,对应用层中的故障进行恢复,生成第四诊断恢复结果。
第四生成单元40412,用于根据第三诊断恢复结果或者第四诊断恢复结果,生成第三诊断恢复报告,将第三诊断恢复报告发送至目标人员。
本实施例中的交换机故障诊断及恢复装置是以功能单元的形式来呈现,这里的单元是指ASIC电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本发明实施例还提供一种交换机,具有上述图4所示的交换机故障诊断及恢复装置。
请参阅图5,图5是本发明可选实施例提供的一种交换机的结构示意图,如图5所示,该交换机包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在交换机内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个交换机,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图5中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据一种小程序落地页的展现的交换机的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该交换机。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该交换机还包括输入装置30和输出装置40。处理器10、存储器20、输入装置30和输出装置20可以通过总线或者其他方式连接,图5中以通过总线连接为例。
输入装置30可接收输入的数字或字符信息,以及产生与该交换机的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等。输出装置40可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。上述显示设备包括但不限于液晶显示器,发光二极管,显示器和等离子体显示器。在一些可选的实施方式中,显示设备可以是触摸屏。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种交换机故障诊断及恢复方法,其特征在于,所述方法包括:
根据交换机中各个软件程序以及硬件设备的功能,对交换机中的所述软件程序以及所述硬件设备进行划分,划分为应用层、中间层和驱动层;其中,所述应用层中的软件程序可以调用所述中间层的软件程序,所述中间层的软件程序可以调用所述驱动层的软件程序;
分别对所述应用层、所述中间层以及所述驱动层进行检测,生成所述应用层、所述中间层以及所述驱动层各层对应的检测结果;
根据所述应用层、所述中间层以及所述驱动层各层对应的检测结果,确定所述交换机的故障发生位置;
根据所述交换机的故障发生位置,对所述交换机的故障进行恢复,生成诊断恢复报告,将所述诊断恢复报告发送至目标人员。
2.根据权利要求1所述的方法,其特征在于,所述分别对所述应用层、所述中间层以及所述驱动层进行检测,生成所述应用层、所述中间层以及所述驱动层各层对应的检测结果,包括:
对所述应用层进行检测,生成应用层检测结果;
根据所述应用层检测结果,对所述中间层进行检测,生成中间层检测结果;
根据所述中间层检测结果,对所述驱动层进行检测,生成驱动层检测结果。
3.根据权利要求2所述的方法,其特征在于,所述对所述应用层进行检测,生成应用层检测结果,包括:
对所述应用层中的包括的各个第一固件版本以及各个第一软件版本进行检测,生成第一通用检测结果;
对所述应用层中的各个第一运行进程进行检测,生成第一特定检测结果。
4.根据权利要求3所述的方法,其特征在于,所述第一特定检测结果中包括发生异常的所述第一运行进程对应的第一进程功能模块的标识信息,所述根据所述应用层检测结果,对所述中间层进行检测,生成中间层检测结果,包括:
根据所述应用层的软件程序与所述中间层的软件程序之间的调用关系以及所述第一进程功能模块的标识信息,从所述中间层中确定所述第一进程功能模块调用的至少一个第二进程功能模块的标识信息;
根据各个所述第二进程功能模块的标识信息,对各个所述第二进程功能模块的配置信息以及所述第二进程功能模块中包括的各个第二运行进程进行检测,生成第二特定检测结果;
对所述中间层中包括的各个第二固件版本以及各个第二软件版本进行检测,生成第二通用检测结果。
5.根据权利要求4所述的方法,其特征在于,所述第二特定检测结果中包括发生异常的所述第二进程功能模块的标识信息,所述根据所述中间层检测结果,对所述驱动层进行检测,生成驱动层检测结果,包括:
根据所述中间层的软件程序与所述驱动层的软件程序之间的调用关系以及所述第二进程功能模块的标识信息,从所述驱动层中确定所述第二进程功能模块调用的至少一个第三进程功能模块的标识信息;
根据各个所述第三进程功能模块的标识信息,对各个所述第三进程功能模块的配置信息以及所述第三进程功能模块中包括的各个加载驱动进程进行检测,生成第三特定检测结果;
对所述驱动层中包括的各个第三固件版本以及各个第三软件版本进行检测,生成第三通用检测结果。
6.根据权利要求1所述的方法,其特征在于,所述根据所述交换机的故障发生位置,对所述交换机的故障进行恢复,生成诊断恢复报告,将所述诊断恢复报告发送至目标人员,包括:
当所述应用层发生故障时,对所述故障进行恢复,生成第一诊断恢复结果;
根据所述第一诊断恢复结果,生成第一诊断恢复报告,将所述第一诊断恢复报告发送至所述目标人员。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
当所述中间层以及所述应用层均发生故障时,对所述中间层的故障进行恢复;
当所述中间层的故障恢复成功时,对所述应用层中的故障进行恢复;
当所述中间层的故障恢复失败时,对所述中间层设置标识位,将所述中间层屏蔽掉,对所述应用层中的故障进行恢复,生成第二诊断恢复结果;
根据所述第二诊断恢复结果,生成第二诊断恢复报告,将所述第二诊断恢复报告发送至所述目标人员。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
当所述驱动层、所述中间层以及所述应用层均发生故障时,对所述驱动层的故障进行恢复;
当所述驱动层的故障恢复失败时,生成第三诊断恢复结果;
当所述驱动层的故障恢复成功时,对所述中间层的故障进行恢复;
当所述中间层的故障恢复成功时,对所述应用层中的故障进行恢复;
当所述中间层的故障恢复失败时,对所述中间层设置标识位,将所述中间层屏蔽掉,对所述应用层中的故障进行恢复,生成第四诊断恢复结果;
根据所述第三诊断恢复结果或者所述第四诊断恢复结果,生成第三诊断恢复报告,将所述第三诊断恢复报告发送至所述目标人员。
9.一种交换机故障诊断及恢复装置,其特征在于,所述装置包括:
划分模块,用于根据交换机中各个软件程序以及硬件设备的功能,对交换机中的所述软件程序以及所述硬件设备进行划分,划分为应用层、中间层和驱动层;其中,所述应用层中的软件程序可以调用所述中间层的软件程序,所述中间层的软件程序可以调用所述驱动层的软件程序;
检测模块,用于分别对所述应用层、所述中间层以及所述驱动层进行检测,生成所述应用层、所述中间层以及所述驱动层各层对应的检测结果;
确定模块,用于根据所述应用层、所述中间层以及所述驱动层各层对应的检测结果,确定所述交换机的故障发生位置;
恢复模块,用于根据所述交换机的故障发生位置,对所述交换机的故障进行恢复,生成诊断恢复报告,将所述诊断恢复报告发送至目标人员。
10.一种交换机,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至8中任一项所述的交换机故障诊断及恢复方法。
CN202310443014.XA 2023-04-23 2023-04-23 交换机故障诊断及恢复方法、装置、交换机及存储介质 Pending CN116489001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310443014.XA CN116489001A (zh) 2023-04-23 2023-04-23 交换机故障诊断及恢复方法、装置、交换机及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310443014.XA CN116489001A (zh) 2023-04-23 2023-04-23 交换机故障诊断及恢复方法、装置、交换机及存储介质

Publications (1)

Publication Number Publication Date
CN116489001A true CN116489001A (zh) 2023-07-25

Family

ID=87215126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310443014.XA Pending CN116489001A (zh) 2023-04-23 2023-04-23 交换机故障诊断及恢复方法、装置、交换机及存储介质

Country Status (1)

Country Link
CN (1) CN116489001A (zh)

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
JP6333410B2 (ja) 障害処理方法、関連装置、およびコンピュータ
WO2021169260A1 (zh) 一种系统板卡电源检测方法、装置、设备及存储介质
US11163623B2 (en) Serializing machine check exceptions for predictive failure analysis
US7281040B1 (en) Diagnostic/remote monitoring by email
WO2017063505A1 (zh) 一种服务器硬件故障检测方法及其装置和服务器
CN105468484A (zh) 用于在存储系统中确定故障位置的方法和装置
KR101712172B1 (ko) 컴퓨터 장애 증상의 사전 진단 및 분석 복구 시스템 및 방법
CN117389790B (zh) 可恢复故障的固件检测系统、方法、存储介质及服务器
CN110704228A (zh) 一种固态硬盘异常处理方法及系统
CN110781053A (zh) 一种检测内存降级错误的方法和装置
US20140201566A1 (en) Automatic computer storage medium diagnostics
CN104239174A (zh) Bmc远程调试系统及方法
WO2024124862A1 (zh) 基于服务器的内存处理方法和装置、处理器及电子设备
JP2001005692A (ja) 計算機システムおよびその保守管理システム並びに障害通知方法
CN116489001A (zh) 交换机故障诊断及恢复方法、装置、交换机及存储介质
CN115878430A (zh) Pcie设备故障监控方法、装置、通信设备及存储介质
CN209343321U (zh) 一种计算机故障检测装置
CN115827298A (zh) 一种服务器开机故障定位方法、装置、终端及存储介质
CN106610878A (zh) 双控制器系统的故障调试方法
CN116382968B (zh) 外部设备的故障检测方法以及装置
CN113886165B (zh) 一种固件诊断功能的验证方法、装置、设备及可读介质
CN111045899A (zh) 在计算机系统开机自检的早期显示bios信息的方法
CN116610481A (zh) 故障诊断方法、装置、计算机设备、存储介质及系统
CN117555719A (zh) 一种系统异常定位的方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination