CN103092746A - 线程异常的定位方法及系统 - Google Patents
线程异常的定位方法及系统 Download PDFInfo
- Publication number
- CN103092746A CN103092746A CN2013100468750A CN201310046875A CN103092746A CN 103092746 A CN103092746 A CN 103092746A CN 2013100468750 A CN2013100468750 A CN 2013100468750A CN 201310046875 A CN201310046875 A CN 201310046875A CN 103092746 A CN103092746 A CN 103092746A
- Authority
- CN
- China
- Prior art keywords
- thread
- abnormal
- monitored
- monitored thread
- dump file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种线程异常的定位方法及系统,所述方法包括:监控各被监控线程的运行状态,判断被监控线程运行是否异常;在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;通过调试所述转储文件,定位被监控线程异常所在的代码位置。本发明不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种线程异常的定位方法及系统。
背景技术
线程是操作系统分配处理器时间的基本单元,进程中可以有多个线程同时执行代码。每个线程都维护异常处理程序、调度优先级和一组系统用于在调度该线程前保存线程上下文的结构。现有监控线程运行状态的方法有两种:
心跳检测:建立一个监控线程,监控各个线程是否有心跳,如果一段时间内某个线程没心跳,则认为这个线程异常;
状态轮询:建立一个监控线程,每隔一段时间查询各个线程的运行状态,如果发现某个线程运行停止,则认为这个线程异常;
以上两种现有技术共有的主要缺点是:
只能监控线程的状态,如果线程异常并不能确定线程异常的具体位置;
当线程在进行复杂耗时运算时,采用以上两种技术可能存在误判线程运行状态的情况。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:提供一种线程异常的定位方法及系统,以快速定位引起线程异常的代码位置。
(二)技术方案
为解决上述问题,一方面,本发明提供了一种线程异常的定位方法,包括:
监控各被监控线程的运行状态,判断被监控线程运行是否异常;
在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
通过调试所述转储文件,定位被监控线程异常所在的代码位置。
优选地,在所述监控被监控线程的运行状态的步骤之前还包括增加监控线程的步骤,通过所述监控线程来监控各被监控线程的运行状态。
优选地,通过所述监控线程来监控各被监控线程的运行状态,判断被监控线程运行是否异常的步骤包括:
所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
各被监控线程在正常运行过程中更新自身的计数器;
若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,并将该被监控线程对应的计数器和异常次数重置为对应的初始值。
优选地,所述如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常的步骤包括:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常。
优选地,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值。
优选地,在判断该被监控线程发生异常的步骤之后还包括在日志中记录异常线程的识别号的步骤。
优选地,所述调试转储文件的步骤包括:根据所述异常线程的识别号找到对应的异常线程。
优选地,所述转储文件为dmp文件。
另一方面,本发明还提供了一种线程异常的定位系统,包括:
监控模块,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
(三)有益效果
本发明不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
本发明被监控线程对应的连续异常次数大于所述设定的异常次数限值时才判断该被监控线程发生异常,可以降低某些复杂并耗时线程误判的概率。
本发明的方法增加监控线程即可完成,适用范围较广,对已发布的软件也适用。
附图说明
图1为根据本发明实施例的一种线程异常的定位方法的流程示意图;
图2为根据本发明实施例的一种线程异常的定位方法的流程示意图;
图3为根据本发明实施例监控线程和被监控线程之间的时序图;
图4为根据本发明实施例一种线程异常的定位系统的结构示意框图。
具体实施方式
下面结合附图及实施例对本发明进行详细说明如下。
实施例一:
图1所示为本实施例记载的一种线程异常的定位方法的流程示意图,所述方法包括:
S110:监控各被监控线程的运行状态,判断被监控线程运行是否异常;
S120:在判断得到被监控线程发生异常时生成转储文件;
S130:通过调试所述转储文件,定位被监控线程异常所在的代码位置。
在本实施例中,所述转储文件包括进程内各线程的内存、堆栈信息。
本实施例的方法不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
实施例二:
图2所示为本实施例记载的另一种线程异常的定位方法的流程示意图,所述方法包括:
S210:在应用中增加监控线程;
S220:所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
S230:各被监控线程在正常运行过程中更新自身的计数器;
S240:若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
S250:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,生成所述转储文件,并将该被监控线程对应的计数器和异常次数重置为对应的初始值,在日志中记录异常线程的识别号;其中,为了获得被监控线程的连续异常次数,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值;所述异常线程的识别号用于在调试转储文件时根据所述异常线程的识别号找到对应的异常线程;
S260:通过调试所述转储文件,定位被监控线程异常所在的代码位置。
在本实施例中,所述转储文件为dmp文件,本实施例中在判断到被监控线程发生异常时,通过调用MiniDump WriteDump函数生成所述dmp文件;生成dmp文件后,通过WinDBG工具调试dmp文件,即可快速定位异常线程运行代码位置。
图3为本实施例监控线程和被监控线程之间的时序图,如图3所示,在该实现方式中包含一个监控线程Monitor和三个被监控线程ThreadA、ThreadB和ThreadC。其中,前两个被监控线程ThreadA和ThreadB先后经过初始化,注册到所述监控线程,并设定了超时时间Ti、计数器C1i的初始值、异常次数C2i的初始值和异常次数限值;被监控线程ThreadC还没有进行初始化。
在两个被监控线程ThreadA和ThreadB的运行过程中不断的更新自身的计数器C1i,监控线程发现某个被监控线程在设定的超时时间Ti内,未能更新其计数器C1i,则认为这个线程异常,其异常次数C2i加1;
在被监控线程连续异常次数C2i大于设定的异常次数限值时,生成所述dmp文件,并且重置计数器C1i和异常次数C2i为初始值。
被监控线程对应的连续异常次数大于所述设定的异常次数限值时才判断该被监控线程发生异常,可以降低某些复杂并耗时线程误判的概率。
实施例三:
图4所示为本实施例记载的一种线程异常的定位系统的结构示意框图,所述系统包括:
监控模块410,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块420,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块430,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
本实施例的系统不仅能监控线程运行状态,而且当线程运行异常时,通过转储文件自动记录线程当前运行的内存和堆栈信息,开发人员根据记录的内存和堆栈信息,就可以快速定位引起线程异常的代码位置,方便线程的调试和修复。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
Claims (9)
1.一种线程异常的定位方法,其特征在于,包括:
监控各被监控线程的运行状态,判断被监控线程运行是否异常;
在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
通过调试所述转储文件,定位被监控线程异常所在的代码位置。
2.如权利要求1所述的方法,其特征在于,在所述监控被监控线程的运行状态的步骤之前还包括增加监控线程的步骤,通过所述监控线程来监控各被监控线程的运行状态。
3.如权利要求2所述的方法,其特征在于,通过所述监控线程来监控各被监控线程的运行状态,判断被监控线程运行是否异常的步骤包括:
所述各被监控线程在初始化时注册到所述监控线程,并设定各被监控线程的超时时间、计数器的初始值、异常次数的初始值和异常次数限值;
各被监控线程在正常运行过程中更新自身的计数器;
若监控线程发现某个被监控线程在所述设定的超时时间内未更新自身的计数器,则为该被监控线程的异常次数加1;
如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常,并将该被监控线程对应的计数器和异常次数重置为对应的初始值。
4.如权利要求3所述的方法,其特征在于,所述如果被监控线程对应的异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常的步骤包括:如果被监控线程对应的连续异常次数大于所述设定的异常次数限值,则判断该被监控线程发生异常。
5.如权利要求4所述的方法,其特征在于,若监控线程发现某个被监控线程在前一个超时时间内未更新自身的计数器,但是在当前超时时间内更新了自身的计数器,则将所述被监控线程对应的异常次数重置为对应的初始值。
6.如权利要求3所述的方法,其特征在于,在判断该被监控线程发生异常的步骤之后还包括在日志中记录异常线程的识别号的步骤。
7.如权利要求6所述的方法,其特征在于,所述调试转储文件的步骤包括:根据所述异常线程的识别号找到对应的异常线程。
8.如权利要求1所述的方法,其特征在于,所述转储文件为dmp文件。
9.一种线程异常的定位系统,其特征在于,包括:
监控模块,用于监控各被监控线程的运行状态,判断被监控线程运行是否异常;
转储文件生成模块,用于在判断得到被监控线程发生异常时生成转储文件,所述转储文件包括进程内各线程的内存、堆栈信息;
异常定位模块,用于通过调试所述转储文件,定位被监控线程异常所在的代码位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310046875.0A CN103092746B (zh) | 2013-02-05 | 2013-02-05 | 线程异常的定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310046875.0A CN103092746B (zh) | 2013-02-05 | 2013-02-05 | 线程异常的定位方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103092746A true CN103092746A (zh) | 2013-05-08 |
CN103092746B CN103092746B (zh) | 2015-12-02 |
Family
ID=48205347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310046875.0A Active CN103092746B (zh) | 2013-02-05 | 2013-02-05 | 线程异常的定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103092746B (zh) |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810099A (zh) * | 2013-11-21 | 2014-05-21 | 北京奇虎科技有限公司 | 代码跟踪方法及其系统 |
CN103984898A (zh) * | 2014-05-29 | 2014-08-13 | 北京神州绿盟信息安全科技股份有限公司 | 一种喷射模式攻击的检测方法和装置 |
CN104932964A (zh) * | 2014-03-17 | 2015-09-23 | 无锡天脉聚源传媒科技有限公司 | 一种计算机功能程序的监控处理方法和装置 |
CN105740080A (zh) * | 2016-03-11 | 2016-07-06 | 深圳市茁壮网络股份有限公司 | 一种程序卡死检测方法及处理器 |
CN105824749A (zh) * | 2016-03-09 | 2016-08-03 | 上海博达数据通信有限公司 | 一种linux系统下用户态进程异常的分析方法 |
CN106445769A (zh) * | 2015-08-11 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 计算机运行监测方法、装置和系统 |
CN106708710A (zh) * | 2015-11-12 | 2017-05-24 | 高德软件有限公司 | 用于识别线程卡顿的方法及装置 |
CN106980555A (zh) * | 2017-03-24 | 2017-07-25 | 山东浪潮商用系统有限公司 | 一种超时线程处理方法及装置 |
CN107479986A (zh) * | 2017-07-03 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 业务流量的控制方法和装置 |
CN107704356A (zh) * | 2017-06-12 | 2018-02-16 | 平安科技(深圳)有限公司 | 异常堆栈信息获取方法、装置及计算机可读存储介质 |
CN108153651A (zh) * | 2016-12-06 | 2018-06-12 | 阿里巴巴集团控股有限公司 | 卡慢异常定位方法、电子设备及系统 |
CN108243056A (zh) * | 2016-12-27 | 2018-07-03 | 大唐移动通信设备有限公司 | 一种获取异常信息的方法及装置 |
CN108415806A (zh) * | 2018-02-07 | 2018-08-17 | 深圳市亿联智能有限公司 | 一种高效率线程生命监测方式 |
CN108959015A (zh) * | 2017-05-19 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 判断系统或系统模块是否阻塞的方法和装置 |
CN109542632A (zh) * | 2018-11-30 | 2019-03-29 | 郑州云海信息技术有限公司 | 一种处理访问请求的方法及装置 |
CN109947636A (zh) * | 2017-12-20 | 2019-06-28 | 浙江宇视科技有限公司 | 异常线程定位方法及装置 |
CN110032435A (zh) * | 2019-03-25 | 2019-07-19 | 北京和利时系统工程有限公司 | 控制系统中管理线程的方法和装置 |
CN110413432A (zh) * | 2019-07-02 | 2019-11-05 | Oppo广东移动通信有限公司 | 一种信息处理方法、电子设备及存储介质 |
CN111125008A (zh) * | 2019-12-20 | 2020-05-08 | 浪潮电子信息产业股份有限公司 | 一种异常inode的动态修复方法、系统及相关组件 |
CN112948158A (zh) * | 2021-02-19 | 2021-06-11 | 山东英信计算机技术有限公司 | 一种文件共享方法、装置、设备及计算机可读存储介质 |
CN113407368A (zh) * | 2020-03-16 | 2021-09-17 | 广东龙芯中科电子科技有限公司 | 进程管理方法、装置和电子设备 |
CN113672449A (zh) * | 2021-07-07 | 2021-11-19 | 浙江大华技术股份有限公司 | 智能运维异常监测方法、装置、计算机设备和存储介质 |
CN114003390A (zh) * | 2021-11-16 | 2022-02-01 | 平安养老保险股份有限公司 | 一种确定异常线程的方法、装置、计算机设备及存储介质 |
CN114625428A (zh) * | 2020-12-10 | 2022-06-14 | 荣耀终端有限公司 | 一种应用异常的处理方法及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930470A (en) * | 1996-09-03 | 1999-07-27 | Kabushiki Kaisha Toshiba | Debugging system and debugging method |
CN1996257A (zh) * | 2006-12-26 | 2007-07-11 | 华为技术有限公司 | 对进程进行监控的方法和系统 |
CN102855160A (zh) * | 2012-08-22 | 2013-01-02 | 北京奇虎科技有限公司 | 软件修复方法、装置及系统 |
-
2013
- 2013-02-05 CN CN201310046875.0A patent/CN103092746B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5930470A (en) * | 1996-09-03 | 1999-07-27 | Kabushiki Kaisha Toshiba | Debugging system and debugging method |
CN1996257A (zh) * | 2006-12-26 | 2007-07-11 | 华为技术有限公司 | 对进程进行监控的方法和系统 |
CN102855160A (zh) * | 2012-08-22 | 2013-01-02 | 北京奇虎科技有限公司 | 软件修复方法、装置及系统 |
Cited By (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103810099A (zh) * | 2013-11-21 | 2014-05-21 | 北京奇虎科技有限公司 | 代码跟踪方法及其系统 |
CN103810099B (zh) * | 2013-11-21 | 2017-05-24 | 北京奇虎科技有限公司 | 代码跟踪方法及其系统 |
CN104932964A (zh) * | 2014-03-17 | 2015-09-23 | 无锡天脉聚源传媒科技有限公司 | 一种计算机功能程序的监控处理方法和装置 |
CN103984898B (zh) * | 2014-05-29 | 2017-02-01 | 北京神州绿盟信息安全科技股份有限公司 | 一种喷射模式攻击的检测方法和装置 |
CN103984898A (zh) * | 2014-05-29 | 2014-08-13 | 北京神州绿盟信息安全科技股份有限公司 | 一种喷射模式攻击的检测方法和装置 |
CN106445769A (zh) * | 2015-08-11 | 2017-02-22 | 腾讯科技(深圳)有限公司 | 计算机运行监测方法、装置和系统 |
CN106445769B (zh) * | 2015-08-11 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 计算机运行监测方法、装置和系统 |
CN106708710A (zh) * | 2015-11-12 | 2017-05-24 | 高德软件有限公司 | 用于识别线程卡顿的方法及装置 |
CN105824749A (zh) * | 2016-03-09 | 2016-08-03 | 上海博达数据通信有限公司 | 一种linux系统下用户态进程异常的分析方法 |
CN105824749B (zh) * | 2016-03-09 | 2019-06-25 | 上海博达数据通信有限公司 | 一种linux系统下用户态进程异常的分析方法 |
CN105740080B (zh) * | 2016-03-11 | 2019-02-22 | 深圳市茁壮网络股份有限公司 | 一种程序卡死检测方法及处理器 |
CN105740080A (zh) * | 2016-03-11 | 2016-07-06 | 深圳市茁壮网络股份有限公司 | 一种程序卡死检测方法及处理器 |
CN108153651A (zh) * | 2016-12-06 | 2018-06-12 | 阿里巴巴集团控股有限公司 | 卡慢异常定位方法、电子设备及系统 |
CN108243056A (zh) * | 2016-12-27 | 2018-07-03 | 大唐移动通信设备有限公司 | 一种获取异常信息的方法及装置 |
CN106980555A (zh) * | 2017-03-24 | 2017-07-25 | 山东浪潮商用系统有限公司 | 一种超时线程处理方法及装置 |
CN106980555B (zh) * | 2017-03-24 | 2020-04-07 | 山东浪潮商用系统有限公司 | 一种超时线程处理方法及装置 |
CN108959015A (zh) * | 2017-05-19 | 2018-12-07 | 北京京东尚科信息技术有限公司 | 判断系统或系统模块是否阻塞的方法和装置 |
CN107704356B (zh) * | 2017-06-12 | 2019-06-28 | 平安科技(深圳)有限公司 | 异常堆栈信息获取方法、装置及计算机可读存储介质 |
US11010227B2 (en) | 2017-06-12 | 2021-05-18 | Ping An Technology (Shenzhen) Co., Ltd. | Exception stack information acquisition method and device and computer-readable storage medium |
CN107704356A (zh) * | 2017-06-12 | 2018-02-16 | 平安科技(深圳)有限公司 | 异常堆栈信息获取方法、装置及计算机可读存储介质 |
CN107479986A (zh) * | 2017-07-03 | 2017-12-15 | 阿里巴巴集团控股有限公司 | 业务流量的控制方法和装置 |
CN109947636A (zh) * | 2017-12-20 | 2019-06-28 | 浙江宇视科技有限公司 | 异常线程定位方法及装置 |
CN109947636B (zh) * | 2017-12-20 | 2022-11-04 | 浙江宇视科技有限公司 | 异常线程定位方法及装置 |
CN108415806A (zh) * | 2018-02-07 | 2018-08-17 | 深圳市亿联智能有限公司 | 一种高效率线程生命监测方式 |
CN109542632A (zh) * | 2018-11-30 | 2019-03-29 | 郑州云海信息技术有限公司 | 一种处理访问请求的方法及装置 |
CN110032435B (zh) * | 2019-03-25 | 2021-06-08 | 北京和利时系统工程有限公司 | 控制系统中管理线程的方法和装置 |
CN110032435A (zh) * | 2019-03-25 | 2019-07-19 | 北京和利时系统工程有限公司 | 控制系统中管理线程的方法和装置 |
CN110413432A (zh) * | 2019-07-02 | 2019-11-05 | Oppo广东移动通信有限公司 | 一种信息处理方法、电子设备及存储介质 |
CN110413432B (zh) * | 2019-07-02 | 2023-09-01 | Oppo广东移动通信有限公司 | 一种信息处理方法、电子设备及存储介质 |
CN111125008B (zh) * | 2019-12-20 | 2022-04-22 | 浪潮电子信息产业股份有限公司 | 一种异常inode的动态修复方法、系统及相关组件 |
CN111125008A (zh) * | 2019-12-20 | 2020-05-08 | 浪潮电子信息产业股份有限公司 | 一种异常inode的动态修复方法、系统及相关组件 |
US11650875B2 (en) | 2019-12-20 | 2023-05-16 | Inspur Electronic Information Industry Co., Ltd. | Abnormal inode dynamic repair method and system, and related component |
CN113407368A (zh) * | 2020-03-16 | 2021-09-17 | 广东龙芯中科电子科技有限公司 | 进程管理方法、装置和电子设备 |
CN114625428A (zh) * | 2020-12-10 | 2022-06-14 | 荣耀终端有限公司 | 一种应用异常的处理方法及电子设备 |
CN114625428B (zh) * | 2020-12-10 | 2024-03-26 | 荣耀终端有限公司 | 一种应用异常的处理方法及电子设备 |
CN112948158A (zh) * | 2021-02-19 | 2021-06-11 | 山东英信计算机技术有限公司 | 一种文件共享方法、装置、设备及计算机可读存储介质 |
CN113672449A (zh) * | 2021-07-07 | 2021-11-19 | 浙江大华技术股份有限公司 | 智能运维异常监测方法、装置、计算机设备和存储介质 |
CN114003390A (zh) * | 2021-11-16 | 2022-02-01 | 平安养老保险股份有限公司 | 一种确定异常线程的方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103092746B (zh) | 2015-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103092746B (zh) | 线程异常的定位方法及系统 | |
CN111818159B (zh) | 数据处理节点的管理方法、装置、设备及存储介质 | |
CN114328102A (zh) | 设备状态监控方法、装置、设备及计算机可读存储介质 | |
CN105095001A (zh) | 分布式环境下虚拟机异常恢复方法 | |
CN103415840A (zh) | 跨硬件层和软件层的错误管理 | |
EP3591485B1 (en) | Method and device for monitoring for equipment failure | |
WO2017220013A1 (zh) | 业务处理方法及装置、存储介质 | |
CN111104283B (zh) | 一种分布式存储系统的故障检测方法、装置、设备及介质 | |
US8332069B2 (en) | Fault tolerance method and apparatus for robot software component | |
US8230446B2 (en) | Providing a computing system with real-time capabilities | |
US20140201566A1 (en) | Automatic computer storage medium diagnostics | |
CN110659147B (zh) | 一种基于模块自检行为的自修复方法和系统 | |
CN104834584A (zh) | 一种监测主机硬件负载的方法和系统 | |
CN111611048A (zh) | 云计算环境中虚拟机的迁移方法、装置和计算机设备 | |
CN112905375B (zh) | 双芯智能电表管理单元的自恢复方法、装置和计算机设备 | |
CN103733181A (zh) | 系统中的故障处理 | |
JP6880961B2 (ja) | 情報処理装置、およびログ記録方法 | |
CN101131657A (zh) | 一种辅助cpu对芯片进行驱动的系统及方法 | |
CN104158843A (zh) | 分布式文件存储系统的存储单元失效检测方法及装置 | |
CN117608908A (zh) | 大模型训练容错方法、系统、终端及存储介质 | |
CN108021463B (zh) | 一种基于有限状态机的gpu故障管理方法 | |
CN111625185B (zh) | 一种磁盘故障监控的方法、系统及相关组件 | |
CN117349127B (zh) | Gpu掉卡检测方法及装置 | |
JP3596744B2 (ja) | 資源利用状況監視制御方法およびそのプログラムを記録した記録媒体 | |
US20140047102A1 (en) | Network monitoring |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |