CN109558287B - 一种固态硬盘寿命预测方法、装置和系统 - Google Patents
一种固态硬盘寿命预测方法、装置和系统 Download PDFInfo
- Publication number
- CN109558287B CN109558287B CN201811526734.8A CN201811526734A CN109558287B CN 109558287 B CN109558287 B CN 109558287B CN 201811526734 A CN201811526734 A CN 201811526734A CN 109558287 B CN109558287 B CN 109558287B
- Authority
- CN
- China
- Prior art keywords
- solid state
- state disk
- data
- prediction
- life
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000007787 solid Substances 0.000 title claims abstract description 318
- 238000000034 method Methods 0.000 title claims abstract description 209
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000012806 monitoring device Methods 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 12
- 238000012417 linear regression Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 claims description 7
- 230000008859 change Effects 0.000 claims description 4
- 238000003860 storage Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 11
- 230000002159 abnormal effect Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 7
- 238000013500 data storage Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 238000007781 pre-processing Methods 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000002790 cross-validation Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000013403 standard screening design Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2273—Test methods
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种固态硬盘寿命预测方法、装置和系统,涉及计算机技术领域,用于提高固态硬盘寿命预测的精度。该方法包括:从固态硬盘的所有历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测所述固态硬盘剩余寿命的预测数据;根据所述预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘剩余寿命进行预测。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种固态硬盘寿命预测方法、装置和系统。
背景技术
目前,由于固态硬盘(Solid State Disk,SSD)所具备的高读写性能的特性,在各类服务器中广泛应用。同时,SSD还具备着写入次数受限和寿命可预知的特性,具体而言,由于SSD独特的数据读写原理,使得SSD闪存有擦写次数限制,在硬盘自监测、分析和报告技术(Self-Monitoring Analysis and Reporting Technology,SMART)信息中,记录了SSD的剩余寿命比,剩余寿命比代表剩余擦写次数/理论总擦写次数(P/E),当剩余寿命比低于一定阈值时,SSD的写入性能及数据安全性急剧下降,当剩余寿命比为1%时,这个盘的寿命就耗尽了,需要及时更换硬盘,由此可见,对于SSD寿命的预测有利于及时对SSD进行处理,避免对数据存储以及数据安全产生影响。
目前,可以通过用户写入数据量基于机器学习的方法对SSD的剩余寿命进行预测,但是,由于SSD所应用的场景较多,不同的场景中SSD的寿命差距较大,单一的预测方式可能在一种业务使用场景中能够适用,而在另一业务使用场景中的准确度就较低,因此目前的寿命预测方法适用范围较小。
发明内容
本发明实施例提供一种固态硬盘寿命预测方法、装置和系统,用于提高固态硬盘寿命预测的精度。
一方面,提供一种固态硬盘寿命预测方法,所述方法包括:
从固态硬盘的历史使用数据中,选择用于预测所述固态硬盘剩余寿命的预测数据;
根据所述预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;
根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘剩余寿命进行预测。
一方面,提供一种固态硬盘寿命预测装置,所述装置包括:
信息获取单元,用于从固态硬盘的历史使用数据中,选择用于预测所述固态硬盘剩余寿命的预测数据;
策略单元,用于根据所述预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;
寿命预测单元,用于根据所述测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘的剩余寿命进行预测。
一方面,提供一种固态硬盘寿命预测系统,所述系统包括:
设置在各服务器上的监控装置,用于采集自身所在服务器中的固态硬盘的历史使用数据,并将所述历史使用数据存储至数据库中;
数据库,用于存储监控装置采集的固态硬盘的历史使用数据;
寿命预测装置,用于从所述数据库存储的历史使用数据中,选择用于预测所述固态硬盘剩余寿命的预测数据;根据所述预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘的剩余寿命进行预测。
一方面,提供一种计算机设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的固态硬盘寿命预测方法。
一方面,提供一种计算机存储介质;
所述计算机存储介质存储有计算机指令,当所述计算机指令在计算机上运行时,使得计算机执行上述所述的固态硬盘寿命预测方法。
本发明实施例中,可以从固态硬盘的历史使用数据中获取到用于当前预测需要的预测数据,再基于预测数据所满足的选择策略,选择用于预测当前剩余寿命的预测方法,进而通过选择出的预测方法来对该固态硬盘的剩余寿命进行预测。这样,根据预测数据所满足的选择策略,能够选择出更适合该固态硬盘的预测方法,这样,固态硬盘不管处于怎么样的业务使用场景或者处于何种使用阶段,都可以根据预测数据为其选择最优的预测方法,使得预测结果更加准确,提高了预测精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例中的应用场景示意图;
图2为本发明实施例中固态硬盘寿命预测方法的流程示意图;
图3为本发明实施例中选择策略的示意图;
图4为本发明实施例中剩余寿命比曲线的示意图;
图5为本发明实施例中固态硬盘寿命预测装置的一种结构示意图;
图6为本发明实施例中固态硬盘寿命预测系统的一种结构示意图;
图7为本发明实施例中计算机设备的一种结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
为便于理解本发明实施例提供的技术方案,这里先对本发明实施例使用的一些关键名词进行解释:
SSD:是用固态电子存储芯片阵列而制成的硬盘,由控制单元和存储单元(FLASH芯片或者DRAM芯片)组成。SSD在接口的规范和定义、功能及使用方法上与传统机械硬盘完全相同,在产品外形和尺寸上也完全与传统机械硬盘一致,但是SSD具有传统机械硬盘不具备的快速读写、质量轻以及能耗低等优点。虽然SSD拥有着传统机械硬盘不具备的许多优点,但是SSD同样存在着缺点,例如SSD闪存具有擦写次数限制的问题,使得SSD寿命存在限制。其中,SSD闪存完全擦写一次叫做1次P/E,例如,一款120G的SSD,当写入120G的文件就算做一次P/E。
写入放大(Write amplification,WA):指SSD的实际写入的物理数据量是写入数据量的多倍,是SSD的工作原理引起的一种不良的现象。具体的,由于闪存在可重新写入数据前必须先擦除,而擦除操作的粒度与写入操作相比低得多,执行这些操作就会多次移动用户数据和元数据,因此,要改写数据,就需要读取闪存某些已使用的部分,更新它们,并写入到新的位置,如果新位置在之前已使被用过,还需连同先擦除;由于闪存的这种工作方式,必须擦除改写的闪存部分比新数据实际需要的大得多,此倍增效应会增加请求写入的次数,缩短SSD的寿命,从而减小SSD能可靠运行的时间。增加的写入也会消耗闪存的带宽,降低SSD的随机写入性能。一般而言,WA可以通过如下公式进行计算:
写入放大系数=闪存写入的数据量÷主控写入的数据量
其中,闪存写入的数据量即包括SSD中主控写入的数据量(即用户需要写入到SSD的数据量)和增加的写入数据量。
SMART:是一种SSD的普遍采用的数据安全技术,支持SMART技术的SSD可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析、比较,当出现安全值范围以外的情况时,就会自动向用户发出警告,部分还能够支持自动降速并备份数据,以保证SSD的数据安全。SMART信息保留在SSD的系统保留区(service area)内,这个区域一般位于硬盘0物理面的最前面几十个物理磁道,由厂商写入相关内部管理程序,除了SMART信息表外还包括低级格式化程序、加密解密程序、自监控程序以及自动修复程序等,用户可在用户设备上安装监测软件,并通过特定命令,例如“SMART RETURN STATUS”命令,对SMART信息进行读取。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,在不做特别说明的情况下,一般表示前后关联对象是一种“或”的关系。
目前,由于固态硬盘(Solid State Disk,SSD)所具备的高读写性能的特性,在各类服务器中广泛应用。同时,SSD还具备着写入次数受限和寿命可预知的特性,在SMART信息中记录了SSD的剩余寿命比,当剩余寿命比低于一定阈值时,SSD的写入性能及数据安全性急剧下降,当剩余寿命比为1%时,这个盘的寿命就耗尽了,需要及时更换硬盘,由此可见,对于SSD寿命的预测有利于及时对SSD进行处理,避免对数据存储以及数据安全产生影响。其中,目前可以通过用户写入数据量基于机器学习的方法对SSD的剩余寿命进行预测,但是,由于SSD所应用的场景较多,不同的场景中SSD的寿命差距较大,单一的预测方式可能在一种业务使用场景中能够适用,而在另一业务使用场景中的准确度就较低,因此目前的寿命预测方法适用范围较窄。
本发明人对现有技术进行分析后发现,现有技术中由于在进行SSD的剩余寿命预测时,都是基于数据写入量通过单一的预测方式进行预测,而在实际情况中,由于SSD应用环境的不同,SSD的写入量差异较大,并且在SSD使用的不同阶段中写入量差异也较大,单一的预测方式并不足以应付所有的应用环境和使用阶段,因而使得现有技术的预测方式适用范围有限。鉴于此,本发明实施例提供了一种固态硬盘寿命预测方法,在该方法中,本发明实施例中,可以从固态硬盘的历史使用数据中获取到用于当前预测需要的预测数据,再基于预测数据所满足的选择策略,选择用于预测当前剩余寿命的预测方法,进而通过选择出的预测方法来对该固态硬盘的剩余寿命进行预测。这样,根据预测数据所满足的选择策略,能够选择出更适合该固态硬盘的预测方法,这样,固态硬盘不管处于怎么样的业务使用场景或者处于何种使用阶段,都可以根据预测数据为其选择最优的预测方法,使得预测结果更加准确,提高了预测精度。
在介绍完本发明实施例的设计思想之后,下面对本发明实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本发明实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本发明实施例提供的技术方案。
请参见图1所示,为本发明实施例中的技术方案能够适用的一种应用场景,在该场景中,包括多个服务器10、数据库20和固态硬盘寿命预测装置30。
服务器10中包括一个或者多个固态硬盘,且在每个服务器10中包括监控装置101,用于收集自身所在服务器10中的固态硬盘的历史使用数据,并将历史使用数据存储至数据库20中。其中,监控装置例如可以是运行在服务器10上的代理(agent)监控程序。
其中,图1中所示的虚线框中的服务器10可以划分为一个服务器组,分组例如可以按照企业或者部分进行划分,例如一个服务器组为一个企业所包括的所有服务器,或者一个服务器组为企业中一个部门所包括的所有服务器,那么主服务器则为该企业或者部门的管理服务器,用于管理其余的服务器。在划分组时,也可以按照服务器的地域信息、类型或者用途等进行划分,例如一个服务器组中所包括的服务器均为文件服务器。当然,还可以包括其他的划分方式,本发明实施例对此不做限制。
数据库20用于存储监控装置上报的各个服务器中固态硬盘的历史使用数据。数据库20可以包括离线数据库和实时数据库,这两种数据库分别采用不同的存储方式,离线数据库采用数据离线入库的方式存储数据,实时数据库采用数据实时入库的方式存储数据。
固态硬盘寿命预测装置30用于根据数据库中存储的固态硬盘的历史使用数据来对固态硬盘的剩余寿命进行预测,并能够针对预测结果给出对服务器的处理建议。其中,固态硬盘寿命预测装置30可以通过服务器来实现。
其中,服务器10、数据库20和固态硬盘寿命预测装置30之间均通过网络进行连接,网络可以是有线形式的网络,也可以是无线形式的网络,例如无线局域网(Wireless LocalArea Networks,WLAN)或者移动蜂窝网络,当然也可以是其他无线网络,本发明实施例对此不做限制。
在实际应用中,服务器10、数据库20和固态硬盘寿命预测装置30可以通过同一设备来实现,例如只有一台服务器10中,数据库20和固态硬盘寿命预测装置30均可以设置在该服务器10中,仅用于对这一台服务器10的剩余寿命进行预测,当存在多台服务器10时,数据库20和固态硬盘寿命预测装置30均可以设置在主服务器中,以便于获取除主服务器之外的其他服务器的历史使用数据,进而进行剩余寿命的预测。
当然,本发明实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其他可能的应用场景,本发明实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
为进一步说明本发明实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本发明实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本发明实施例提供的执行顺序。所述方法在实际的处理过程中或者装置执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。
请参见图2,为本发明实施例提供的固态硬盘寿命预测方法的流程示意图,该方法例如可以应用于图1中所示的应用场景中,下面以图1所示的应用场景为例,对该方法的流程进行描述。
步骤201:在服务器的运行过程中,采集服务器中固体硬盘的历史使用数据。
本发明实施例中,为给后续的固态硬盘的剩余寿命预测提供数据基础,可以在服务器运行过程中,通过部署在服务器上的监控装置,也就是运行在服务器上的监控程序采集该服务器上的固体硬盘的历史使用数据。
其中,历史使用数据可以包括SMART信息和非易失性存储器的传输规范(Non-Volatile Memory express,NVME)信息,SMART信息除包括剩余寿命比信息之外,还可以包括温度信息、坏块率等信息,这些信息可以通过NVME命令或SMART命令进行采集,历史使用数据还可以包括固态硬盘所在的服务器的配置信息和固体硬盘的配置信息,服务器的配置信息例如可以包括服务器的位置信息、编号、版本信息、所在部门和业务模块等信息中的一种或者多种,固体硬盘的配置信息例如可以包括固态硬盘的型号和容量等信息。
本发明实施例中,还可以基于采集的历史使用数据,对固态硬盘的至少一种运行参数进行监控,当监控到固态硬盘的任意一种运行参数的值不满足预先设定的所述固态硬盘运行所需的条件时,则触发告警。运行参数例如可以包括温度、坏块率以及剩余寿命比等。以运行参数为剩余寿命比为例,可以确定剩余寿命比是否小于设定的阈值,若是小于,则表明该固态硬盘的寿命即将耗尽,不再满足使用条件,为保证用户数据存储的可靠性,需要及时提醒用户更换固态硬盘,因此可以触发故障告警。
步骤202:将采集的历史使用数据存储在数据库中。
本发明实施例中,为给各种剩余寿命预测方法提供更佳的数据支持,本发明实施例中的数据库可以包括离线数据库和实时数据库。
对于离线数据库,监控装置采集的历史使用数据可以先进行缓存,再在设定的时刻到达时,将缓存的历史使用数据以离线数据入库的方式上传到离线数据库中。例如,设定的时刻为每天的11点,那么在每天的11点则会将已缓存的历史使用数据上传到离线数据库中。
对于实时数据库,则可以采用实时数据入库的方式将采集的历史使用数据上传到实时数据库中,实时数据库的数据上传间隔远远小于离线数据库。
步骤203:对数据库中的数据进行数据预处理。
本发明实施例中,数据存储到离线数据库中时,可以对数据进行一定的预处理,以便于应用于后续的预测方法,数据预处理可以包括数据清洗和数据收敛过程,当然,还可以包括其他的数据预处理过程,本发明实施例对此不做限制。
具体的,由于固态硬盘的制造厂商以及所使用的接口类型有所不同,例如,不同制造厂商可能表示剩余寿命比数据的字段不同,为方便后续进行预测是数据的查找,因此,需要对采集到的数据中的相同类型的数据通过统一的字段进行存储,例如将剩余寿命比数据通过相同的字段进行表示。并且,所采集的历史使用数据中可能存在异常数据,在进行数据清洗时,还可以将异常数据进行剔除。例如,若是剩余寿命比数据长期不发生变化,则其中可能部分数据存在异常,则可以将异常的数据剔除;或者,剩余寿命比数据只会持续下降,而不会出现不降反增的情况,因此若是出现了剩余寿命比数据反而增加的情况,则表明该剩余寿命比数据显然是异常的,因此也可以将该剩余寿命比数据剔除。
具体的,数据收敛是指对所采集的到的数据进行整理,以便用户查看或者后台人员的查看,例如可以将固态硬盘的配置信息、固态硬盘所在服务器的配置信息以及剩余寿命比数据整理成方便查看的表格,并对同一个固态硬盘的数据进行收敛,只保留最优数据,例如数据存储一次的周期为1天时,则由于一天之内剩余寿命比变化并不大,因此,可以只取部分数据存储在数据库中,例如最优数据可以是一天内最新一次获取的数据或者一天内剩余寿命比最小的数据。如表1所示,为一种整理后可能得到的表格。
表1
其中,表1中表示了架平部的3台服务器中固态硬盘的剩余寿命比收据,其中,这三台服务器的固体资产号为“TYSV1110011”~“TYSV1110013”,互联网协议(InternetProtocol,IP)地址为“1.1.1.1”~“1.1.1.3”,维护人为“abc”,固态硬盘符号依次为“sda”、“sdb”、“sdb”和“sdc”,固态硬盘的序列号(Serial Numbe,SN)分别为IC35L180AVV207-1、IC35L180AVV207-2、IC35L180AV V208-1和IC35L180AVV209-1,剩余寿命比依次为10%、13%、12%和10%。
本发明实施例中,为保证预测系统的稳定运行,需要保证采集的数据的覆盖率,除了数据的预处理之外,还可以基于数据库中的历史使用数据建立覆盖指标,覆盖指标可以包括采集覆盖率和寿命覆盖率。
具体的,采集覆盖率包括采集固态硬盘的历史使用数据的成功率,采集覆盖率可以是针对一个固态硬盘而言,那么采集覆盖率则是指采集到该固态硬盘的历史使用数据的成功率,或者,采集覆盖率还可以是针对多个固态硬盘而言,那么采集覆盖率则是指多个固态硬盘的综合成功率,当一个固态硬盘或者多个固态硬盘的采集覆盖率低于一定阈值时,则表明监控装置可能存在故障,那么则可以触发告警,以及时对监控装置进行修复。
具体的,因为在实际应用中,针对剩余寿命比难免会出现漏采集的情况,若是漏采集的情况出现较多,数据不全,显然会对后续的预测过程产生影响,因此需要监控寿命覆盖率,寿命覆盖率既是指采集到一个固态硬盘的剩余寿命比数据与采集总次数之比,当寿命覆盖率低于一定阈值时,也可以表明监控装置可能存在故障,那么则可以触发告警,以及时对监控装置进行修复。
步骤204:从固态硬盘的所有历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测固态硬盘剩余寿命的预测数据。
本发明实施例中,由于固态硬盘的使用周期通常较长,因此对于固态硬盘的剩余寿命的预测并不需要实时的进行预测,因此可以为寿命预测设定触发条件,只有当满足触发条件时,才进行一次固态硬盘的剩余寿命的预测。
具体的,固态硬盘的剩余寿命的预测可以是周期性的,例如每天进行一次预测,或者每月进行一次预测等等,那么满足触发条件则为距离上一次剩余寿命的预测达到了预测周期。
具体的,固态硬盘的剩余寿命的预测还可以是用户主动触发的,例如可以用户可以输入用于指示开始寿命预测的命令,在接收命令之后,则可以开始执行剩余寿命的预测过程。
当然,还可以是其他可能的触发条件,例如当历史使用数据满足一设定的条件时,则开始对固态硬盘进行剩余寿命的预测,本发明实施例对此不做限制。
本发明实施例中的,当确定满足触发条件时,则可以从数据库存储的固态硬盘的历史使用数据中,用于预测所述固态硬盘剩余寿命的预测数据。
优选的,预测数据可以是距离当前时刻预设时长范围内的历史使用数据,这样,预测数据更能够体现出固态硬盘最近的状态,从而基于预测数据进行预测的结果更加准确。其中,预设时长范围可以根据经验进行设定,例如预设时长范围可以设定为3个月,也可以通过多次实验尝试的结果进行选择,本发明实施例对此不做限制。
其中,获取预测数据的数据库可以是离线数据库,也可以是实时数据库,当然也可以是同时从离线数据库和实时数据库中获取,本发明实施例对此不做限制。
在实际应用中,监控装置、数据库以及固态硬盘寿命预测装置可以设置于同一设备中,这样,监控装置可直接将采集的历史使用数据存储至数据库中,固态硬盘寿命预测装置需要进行剩余寿命预测时,可直接从数据库存储的历史使用数据中,选择预测数据,从而进行预测。当然,监控装置、数据库以及固态硬盘寿命预测装置也可以设置于不同的设备中,例如,监控装置设置于固态硬盘所在的服务器中,数据库和固态硬盘寿命预测装置设置在相同的设备中,这样,监控装置将采集的历史使用数据存上传至数据库中后,固态硬盘寿命预测装置也可以从数据库中存储的历史使用数据中,选择预测数据,从而进行预测。
步骤205:根据预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为固态硬盘选择至少一种固态硬盘剩余寿命预测方法。
本发明实施例中,可以根据预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为固态硬盘选择至少一种固态硬盘剩余寿命预测方法。其中,预测数据中可以包括写入数据量、剩余寿命比或者其他可能的种类的数据,写入数据量可以包括用户写入数据量和闪存写入量数据,用户写入数据量是指用户存储到固态硬盘中的数据量,闪存写入数据量包括用户写入数据量,以及为写入数据而产生的额外写入数据量。
其中,多种固态硬盘剩余寿命预测方法可以包括写入量预测方法、基于上架时间的预测方法、时间序列预测方法和线性回归预测方法等,当然,还可以包括其他可能的预测方法,本发明实施例对此不做限制。
具体的,在不同的业务使用场景中,不同的预测方法的适用业务使用场景不同,换句话说,适用于第一业务使用场景的预测方法可能并不能适用于第二业务使用场景的预测方法,因此为适用于更多的业务使用场景,本发明实施例综合了多种剩余寿命预测方法进行剩余寿命的预测。其中,业务使用场景不仅仅是指固态硬盘被应用于的业务模块,还可以是指固态硬盘的不同使用状态,例如固态硬盘在一个时间段内被频繁使用,则写入数据量较多,根据写入数据量进行剩余寿命的预测可能就较佳,而若是固态硬盘在一个时间段内完全未被使用,那么就不存在写入数据量,那么根据写入数据量进行剩余寿命的预测,显然是不合理的,那么就可以寻求其他合适的预测方法。
具体的,可以针对于不同的业务使用场景,制定适应性的选择策略,从而可以根据选择策略来选择当前业务使用场景所适用的最优预测方法。具体而言,因为固态硬盘在使用过程中,其业务使用场景也可能发生变化,且在不同业务使用场景中,使用数据也会有所不同,那么就可以根据预设时长范围内的预测数据估计固态硬盘当前的业务使用场景,从而选择出当前最优预测算法,即适用于预测固态硬盘当前剩余寿命的剩余寿命预测方法。
具体的,选择出的至少一种固态硬盘剩余寿命预测方法的数量可以是一个,也可以是多个,具体可根据具体的场景制定的相应的选择结果。
请参见图3,为本发明实施例提供的一种选择策略的示意图。
本发明实施例中,固态硬盘在一个时间段内被频繁使用,则写入数据量较多,根据写入数据量进行剩余寿命的预测可能就较佳,因此获取预测数据后,可以确定预测数据中是否包含有新写入固态硬盘的写入数据量,若是确定该固态硬盘存在写入数据量,则确定当前的最优预测方法为写入量预测方法。
具体的,根据在设定的时间段内的闪存写入量数据和用户写入量数据,可以获得每天的平均闪存写入量以及写放大系数。
每天的平均闪存写入量的计算公式如下:
每天的平均用户写入量的计算公式如下:
写放大系数的计算公式如下:
其中,λ为写放大系数。
相同类型的固态硬盘的理论总闪存写入量是一定的,但是为了避免受剩余寿命比的精度的影响,本发明实施例中根据相同类型的多个固态硬盘的当前剩余寿命比和当前闪存写入量,来确定这种类型的固态硬盘的理论总闪存写入量。其中,所指的相同类型的固态硬盘为型号和容量相同的固态硬盘。
具体的,理论总闪存写入量的计算公式如下:
其中,X总为理论总闪存写入量,Xti为相同类型的M个固态硬盘中第i个固态硬盘的当前闪存写入量,Yti为相同类型的M个固态硬盘中第i个固态硬盘的当前剩余寿命比。
那么,根据固态硬盘所属类型的理论总闪存写入量、当前的闪存写入量以及闪存平均写入量就可以得到固态硬盘的剩余寿命,具体计算公式如下:
P总=Pt+T
其中,Pt为预测固态硬盘的当前剩余寿命,T为固态硬盘所在服务器的上架时间,P总为预测固态硬盘的总寿命。
本发明实施例中,在确定预测数据中是否包含有新写入固态硬盘的写入数据量之后,若是确定该固态硬盘不存在写入数据量,那么则可以根据固态硬盘的剩余寿命比在预设时长范围内的变化量确定当前的最优预测算法,其中,预设时长范围例如可以是三个月,或者半年等等,本发明实施例对此不做限制。
具体的,当确定变化量大于预设变化量阈值且变化量呈非线性变化,则确定当前最优预测方法为时间序列预测方法。其中,时间序列预测算法例如可以是基于Prophet模型或者ARIMA(autoregressive integrated moving average)模型的时间序列预测方法,优选的,时间序列预测算法为基于Prophet模型的时间序列预测方法,当然,也可以是其他可能的时间序列预测方法。
其中,时间序列预测方法能够以往一段时间内的剩余寿命比,形成时间序列,进而当前时刻之后的剩余寿命进行预测,并对算法效果进行交叉验证,效果不好就自动调整参数。固态硬盘的使用业务场景多样,会造成数据出现多阶段变化、数据缺失、数据异常记忆寿命百分比的精度低等特点,而基于Prophet模型的时间序列预测方法对于这种特点的数据的预测结果较佳。
在实际应用中,在时间序列预测方法投入实际使用之前,需要对时间序列预测方法的算法参数进行训练,并通过交叉验证的方式对预测结果进行验证,若是预测结果不理想则对算法参数进行调整,直至达到较为理想的预测结果,然后就可以将训练得到时间序列预测模型投入实际使用,以对固态硬盘的剩余寿命进行预测。
具体的,当确定变化量不大于预设变化量阈值,则确定当前最优预测方法为线性回归预测方法。
其中,线性回归预测方法可以根据过去一段时间内的剩余寿命比,通过采集时刻和剩余寿命比数据形成的曲线,进行线性回归,求得曲线斜率,然后根据斜率计算得到剩余寿命比为1%的时刻,从而得到固态硬盘的剩余寿命,即剩余寿命比为1%的时刻与当前时刻之间的时间差。
具体的,当确定变化量为零时,则可以确定当前最优预测方法为基于上架时间的预测方法。其中,基于上架时间的预测方法可以根据当前的剩余寿命比和固态硬盘所在服务器的上架时间,推算出固态硬盘的剩余寿命,计算公式如下:
本发明实施例中,图3中所示的选择策略存在一定的优先级,即从上到下优先级依次降低,也就是说,当满足有写入数据量条件时,优先选择写入量预测算法,依次类推。
步骤206:根据预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对固态硬盘的剩余寿命进行预测。
本发明实施例中,预测过程可参见步骤205部分的描述,在此不再过多赘述。其中,当最优预测方法为写入量预测方法、线性回归预测方法或者基于上架时间的预测方法,则用于预测的预测数据可以是从离线数据库或者实时数据库中获取的,而当最优预测方法为时间序列预测方法,则用于预测的预测数据为从实时数据库中获取的,那么若是用于确定最优预测方法的预测数据是从离线数据库中获取的,那么在进行预测时可以将数据源切换为实时数据库。
本发明实施例中,上述过程中均为针对一个固态硬盘的寿命预测过程,但是需要知道的是,在固态硬盘寿命预测装置中,可以同时对很多个固态硬盘的寿命进行预测。
步骤207:根据固态硬盘所在服务器的分组情况,根据每一组服务器包括的固态硬盘的预测结果,生成对每一组服务器的使用分析报告。
本发明实施例中,可以根据固态硬盘所在服务器的分组情况,根据每一组服务器包括的固态硬盘的预测结果,生成对每一组服务器的使用分析报告。其中,可以根据实际需求对固态硬盘所在服务器进行分组,例如按照企业或者企业内的部门进行划分,或者按照地域信息或者服务器类型进行划分。下面以按照企业内的部门进行划分为例进行描述。
具体的,根据上述预测得到各个固态硬盘的剩余寿命可以得到各个固态硬盘的总寿命,再根据每一组服务器包括的固态硬盘的已使用时间,以及预测得到的每一组服务器包括的固态硬盘剩余寿命和总使用寿命,则可以生成对每一组服务器的使用分析报告。其中,使用分析报告用于表征对各服务器的推荐处理方式。
本发明实施例中,使用分析报告可以包括各固态硬盘的剩余寿命比曲线图和异常分析报告。
剩余寿命曲线图中可以提供每个固态硬盘从上架到当前记录时间的剩余寿命比曲线,及预测剩余寿命耗尽时间的预测曲线。请参见图4所示,为一固态硬盘的剩余寿命曲线图的示意图,其中,在横坐标为时间,纵坐标为剩余寿命比。
异常分析报告中可以包括对同一组内的服务器的推荐处理方式,其中,若固态硬盘的剩余寿命大于第一预设寿命阈值且总使用寿命小于第二预设寿命阈值,则异常分析报告指示推荐降低固态硬盘的输入输出,其中,第一预设寿命阈值例如可以是0.5年,第二预设寿命阈值例如可以是4年,当然,也可以是其他可能的值,本发明实施例对此不做限制;或者,若固态硬盘的剩余寿命小于或者等于第一预设寿命阈值,或者固态硬盘的剩余寿命比小于或者等于预设寿命比阈值且已使用时间小于或者等于预设时间阈值,则异常分析报告指示推荐置换服务器中的固态硬盘,其中,预设寿命比阈值例如可以为5%,预设时间阈值例如可以为4年,当然,也可以是其他可能的值,本发明实施例对此不做限制;或者,若固态硬盘的剩余寿命小于或者等于第一预设寿命阈值,或者固态硬盘的剩余寿命比小于或者等于预设寿命比阈值且已使用时间大于预设时间阈值,则异常分析报告指示推荐置换服务器。
如表2所示,为一异常分析报告的汇总表格。其中,在该汇总表格中,同一组内的服务器为架平部的服务器,该组内的服务器总数量为60台,其中,所推荐的处理方式为其中10台服务器寿命不足,建议将这10台服务器退役,20台服务器中的固态硬盘超标使用,建议置换这20台服务器中的固态硬盘,30台服务器中的固态硬盘超标使用,建议降低固态硬盘的输入输出(Input Output,IO)。
部门 | 维护人 | 设备总量 | 建议退役 | 建议置换 | 建议降低IO |
架平部 | abc | 60台 | 10台 | 20台 | 30台 |
表2
如表3所示,为一异常分析报告的明细表格。其中,在该明细表格中,将存在异常的固态硬盘,按照固态硬盘所在服务器进行收敛,即针对每一个服务器生成一条异常记录,表3中具体以此为例,当服务器中多个固态硬盘存在异常时,可以将数值最小的固态硬盘的数据作为该服务器的异常报告。当然,也可以按照每个异常的固态硬盘的信息进行展示,即针对每一个固态硬盘生成一条异常记录。其中,表格中可以列出存在异常的固态硬盘所在服务器的配置信息以及固态硬盘的配置信息,以及固态硬盘的剩余寿命和总寿命,表3中涉及盘符即为存在异常的固态硬盘。
表3
本发明实施例中,可以提供给用户一可视化界面,例如用户可以在自身的用户设备中安装一监控软件,监控软件为用户提供了各种查询接口,用户通过监控软件的查询页面的相关接口可以主动查询每一台服务器上固态硬盘的相关数据,例如剩余寿命、剩余寿命曲线图以及使用分析报告等信息。
步骤208:将使用分析报告推送给与每一组服务器关联的用户设备。
本发明实施例中,获取使用分析报告之后,可以直接将使用分析报告推送给每一组服务器关联的用户设备,辅助用户进行决策,或者,可以定期的进行推送,又或者,可以在一组内的服务器存在异常时,例如存在需要退役或者置换固态硬盘的服务器是,将使用分析报告推送给与服务器关联的用户设备,例如,对于企业而言,则可以是将使用分析报告发送给该企业的管理服务器。
其中,推送的方式例如可以是通过邮件、或者客户端推送的方式,或者是其他可能的方式,本发明实施例对此不做限制。
综上所述,本发明实施例中,可以从固态硬盘的历史使用数据中获取到用于当前预测需要的预测数据,再基于预测数据所满足的选择策略,选择用于预测当前剩余寿命的预测方法,进而通过选择出的预测方法来对该固态硬盘的剩余寿命进行预测。这样,根据预测数据所满足的选择策略,能够选择出更适合该固态硬盘的预测方法,这样,固态硬盘不管处于怎么样的业务使用场景或者处于何种使用阶段,都可以根据预测数据为其选择最优的预测方法,使得预测结果更加准确,提高了预测精度。
此外,本发明实施例中可以将基于预测结果得到的分析报告推送给用户,为用户提供SSD数据预警,这样,用户可以根据分析报告提前对服务器进行处理,降低潜在的数据风险。可见,本发明实施例通过对固态硬盘进行寿命分析,完善了固态硬盘的全生命周期的监控预警体系,能够对固态硬盘使用是否符合预期进行评估和对固态硬盘的剩余寿命进行精准预测。
请参见图5,基于同一发明构思,本发明实施例还提供了一种固态硬盘寿命预测装置,包括:
信息获取单元501,用于从固态硬盘的历史使用数据中,选择用于预测固态硬盘剩余寿命的预测数据;
策略单元502,用于根据预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为固态硬盘选择至少一种固态硬盘剩余寿命预测方法;
寿命预测单元503,用于根据预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对固态硬盘剩余寿命进行预测。
上述历史使用数据中包括至少一种运行参数,以及该装置还包括监控单元504,用于对固态硬盘的至少一种运行参数进行监控;在监控到固态硬盘的任意一种运行参数的值不满足预先设定的固态硬盘运行所需的条件时,触发告警。
策略单元502,具体用于:根据预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为固态硬盘选择至少一种固态硬盘剩余寿命预测方法。
固态硬盘历史使用数据包括写入数据量,则策略单元502,具体用于:
确定预测数据中是否包含有新写入固态硬盘的写入数据量;
若确定固态硬盘存在新的写入数据量,则确定选择写入量预测方法作为用于预测当前剩余寿命的预测方法。
固态硬盘历史使用数据包括剩余寿命比,则策略单元502,还用于:
若确定固态硬盘不存在新的写入数据量,则根据固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法。
策略单元502,具体用于:
若确定变化量为零,则选择基于上架时间的预测方法作为用于预测当前剩余寿命的预测方法;
若确定变化量大于预设变化量阈值,则选择时间序列预测方法作为用于预测当前剩余寿命的预测方法;
若确定变化量不为零且不大于预设变化量阈值,则选择线性回归预测方法作为用于预测当前剩余寿命的预测方法。
数据库包括离线数据库和实时数据库,则若选择出的预测方法为写入量预测方法、线性回归预测方法或者基于上架时间的预测方法,则预测数据为从离线数据库或者实时数据库中获取的数据;或者,
若选择出的预测方法为时间序列预测方法,则预测数据为从实时数据库中获取的数据。
若选择出的预测方法为写入量预测方法,则寿命预测单元503,具体用于:
根据固态硬盘所属类型的多个固态硬盘当前的剩余寿命比和闪存写入量,确定固态硬盘所属类型的理论总闪存写入量;其中,相同类型的固态硬盘的型号和容量相同;
根据固态硬盘所属类型的理论总闪存写入量、当前的闪存写入量以及闪存平均写入量对固态硬盘进行剩余寿命的预测。
该装置还包括推送单元505,用于:
根据固态硬盘的剩余寿命确定固态硬盘的总使用寿命;
根据固态硬盘所在服务器的分组情况、每一组服务器包括的固态硬盘的已使用时间,以及预测得到的每一组服务器包括的固态硬盘剩余寿命和总使用寿命,生成对每一组服务器的使用分析报告,使用分析报告用于表征对各服务器的推荐处理方式;
分别将生成的使用分析报告推送给与每一组服务器关联的用户设备。
该装置可以用于执行图1~图3所示的实施例中各设备或者装置所能执行的方法,因此,对于该装置的各功能模块所能够实现的功能等可参考图1~图3所示的实施例的描述,不多赘述。其中,监控单元504和推送单元505虽然在图5中一并示出,但需要知道的是,监控单元504和推送单元505并不是必选的功能单元,因此在图5中以虚线示出。
请参见图6,基于同一技术构思,本发明实施例还提供了一种固态硬盘寿命预测系统,包括:
设置在各服务器上的监控装置601,用于采集自身所在服务器中的固态硬盘的历史使用数据,并将历史使用数据存储至数据库中;
数据库602,用于存储监控装置采集的固态硬盘的历史使用数据;
寿命预测装置603,用于从数据库存储的所有历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测所述固态硬盘剩余寿命的预测数据;根据预测数据满足的选择策略,从多种固态硬盘剩余寿命预测方法中,为固态硬盘选择至少一种固态硬盘剩余寿命预测方法;根据预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对固态硬盘的剩余寿命进行预测。
该系统还包括故障告警装置604,用于基于监控装置601采集的历史使用数据产生的故障告警信息,进行故障告警。
该系统还包括数据服务装置605,用于为用户提供数据查询页面以及对接其它系统的数据查询接口。
寿命预测装置603还用于提供针对不同用户的分析报告,包括寿命数据统计、数据预警和策略建议等。
该系统还包括采集指标装置606,用于获取采集覆盖率和寿命覆盖率,并在采集覆盖率和寿命覆盖率异常时通知故障告警模块进行故障告警,以确保数据的覆盖率。
该系统可以用于执行图1~图3所示的实施例中各设备或者装置所能执行的方法,因此,对于该系统的各功能模块所能够实现的功能等可参考图1~图3所示的实施例的描述,不多赘述。其中,上述装置可以根据实际情况进行合理的部署,例如,数据服务装置605和故障告警装置604可以设置在同一设备中。
请参见图7,基于同一技术构思,本发明实施例还提供了一种计算机设备,可以包括存储器701和处理器702。
所述存储器701,用于存储处理器702执行的计算机程序。存储器701可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机设备的使用所创建的数据等。处理器702,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等等。本发明实施例中不限定上述存储器701和处理器702之间的具体连接介质。本发明实施例在图7中以存储器701和处理器702之间通过总线703连接,总线703在图7中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线703可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器701可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器701也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器701是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器701可以是上述存储器的组合。
处理器702,用于调用所述存储器701中存储的计算机程序时执行如图1~图3中所示的实施例中设备所执行的方法,例如计算机设备可以为固态硬盘寿命预测装置。
在一些可能的实施方式中,本发明提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤,例如,所述计算机设备可以执行如图1~图3中所示的实施例中设备所执行的方法。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (8)
1.一种固态硬盘寿命预测方法,其特征在于,所述方法包括:
从固态硬盘的历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测所述固态硬盘剩余寿命的预测数据;其中,所述距离当前时刻预设时长范围内的历史使用数据包括剩余寿命比;
根据所述预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;其中,若确定所述固态硬盘不存在新的写入数据量,则根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法;所述根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法,包括:若确定所述变化量大于预设变化量阈值,则选择时间序列预测方法作为用于预测当前剩余寿命的预测方法;若确定所述变化量不为零且不大于预设变化量阈值,则选择线性回归预测方法作为用于预测当前剩余寿命的预测方法;
根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘剩余寿命进行预测。
2.如权利要求1所述的方法,其特征在于,所述历史使用数据中包括至少一种运行参数,在从固态硬盘的历史使用数据中,选择用于预测所述固态硬盘剩余寿命的预测数据之前,所述方法还包括:
对所述固态硬盘的至少一种运行参数进行监控;
在监控到所述固态硬盘的任意一种运行参数的值不满足预先设定的所述固态硬盘运行所需的条件时,触发告警。
3.如权利要求1所述的方法,其特征在于,所述固态硬盘历史使用数据包括写入数据量;以及
所述根据所述预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法,具体包括:
确定所述预测数据中是否包含有新写入所述固态硬盘的写入数据量;
若确定所述固态硬盘存在新的写入数据量,则选择基于写入数据量的预测方法作为用于预测当前剩余寿命的预测方法。
4.如权利要求1所述的方法,其特征在于,所述根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法,还包括:
若确定所述变化量为零,则选择基于上架时间的预测方法作为用于预测当前剩余寿命的预测方法;
若确定所述变化量大于预设变化量阈值且变化量非线性变化,则选择时间序列预测方法作为用于预测当前剩余寿命的预测方法。
5.如权利要求3所述的方法,其特征在于,若用于预测当前剩余寿命的预测方法为基于写入数据量的预测方法,则所述根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘剩余寿命进行预测,包括:
根据所述固态硬盘所属类型的多个固态硬盘当前的剩余寿命比和闪存写入量,确定所述固态硬盘所属类型的理论总闪存写入量;其中,相同类型的固态硬盘的型号和容量相同;
根据所述固态硬盘所属类型的理论总闪存写入量、当前的闪存写入量以及闪存平均写入量对所述固态硬盘进行剩余寿命的预测。
6.如权利要求1~5任一所述的方法,其特征在于,在根据所述预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法之后,所述方法还包括:
根据固态硬盘的剩余寿命确定固态硬盘的总使用寿命;
根据固态硬盘所在服务器的分组情况、每一组服务器包括的固态硬盘的已使用时间,以及预测得到的每一组服务器包括的固态硬盘剩余寿命和总使用寿命,生成对每一组服务器的使用分析报告,所述使用分析报告用于表征对各服务器的推荐处理方式;
分别将生成的使用分析报告推送给与每一组服务器关联的用户设备。
7.一种固态硬盘寿命预测装置,其特征在于,包括:
信息获取单元,用于从固态硬盘的历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测所述固态硬盘剩余寿命的预测数据;其中,所述距离当前时刻预设时长范围内的历史使用数据包括剩余寿命比;
策略单元,用于根据所述预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;其中,若确定所述固态硬盘不存在新的写入数据量,则根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法;所述根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法,包括:若确定所述变化量大于预设变化量阈值,则选择时间序列预测方法作为用于预测当前剩余寿命的预测方法;若确定所述变化量不为零且不大于预设变化量阈值,则选择线性回归预测方法作为用于预测当前剩余寿命的预测方法;
寿命预测单元,用于根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘的剩余寿命进行预测。
8.一种固态硬盘寿命预测系统,其特征在于,包括:
设置在各服务器上的监控装置,用于采集自身所在服务器中的固态硬盘的历史使用数据,并将所述历史使用数据存储至数据库中;
数据库,用于存储监控装置采集的固态硬盘的历史使用数据;
寿命预测装置,用于从所述数据库存储的历史使用数据中,选择距离当前时刻预设时长范围内的历史使用数据,作为用于预测所述固态硬盘剩余寿命的预测数据;其中,所述距离当前时刻预设时长范围内的历史使用数据包括剩余寿命比;
根据所述预测数据中包括的数据的种类,以及多种固态硬盘剩余寿命预测方法的优先级,从多种固态硬盘剩余寿命预测方法中,为所述固态硬盘选择至少一种固态硬盘剩余寿命预测方法;其中,若确定所述固态硬盘不存在新的写入数据量,则根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法;所述根据所述固态硬盘的剩余寿命比在设定的时间段内的变化量,选择用于预测当前剩余寿命的预测方法,包括:若确定所述变化量大于预设变化量阈值,则选择时间序列预测方法作为用于预测当前剩余寿命的预测方法;若确定所述变化量不为零且不大于预设变化量阈值,则选择线性回归预测方法作为用于预测当前剩余寿命的预测方法;
根据所述预测数据,采用选择出的至少一种固态硬盘剩余寿命预测方法对所述固态硬盘的剩余寿命进行预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526734.8A CN109558287B (zh) | 2018-12-13 | 2018-12-13 | 一种固态硬盘寿命预测方法、装置和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811526734.8A CN109558287B (zh) | 2018-12-13 | 2018-12-13 | 一种固态硬盘寿命预测方法、装置和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109558287A CN109558287A (zh) | 2019-04-02 |
CN109558287B true CN109558287B (zh) | 2020-10-30 |
Family
ID=65869872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811526734.8A Active CN109558287B (zh) | 2018-12-13 | 2018-12-13 | 一种固态硬盘寿命预测方法、装置和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109558287B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111913649B (zh) * | 2019-05-09 | 2022-05-06 | 深圳大普微电子科技有限公司 | 一种固态硬盘的数据处理方法及装置 |
CN111913650B (zh) * | 2019-05-09 | 2022-01-21 | 深圳大普微电子科技有限公司 | 一种确定预测窗口期的方法及装置 |
CN112905404B (zh) * | 2019-11-19 | 2024-01-30 | 中国电信股份有限公司 | 固态硬盘的状态监控方法和装置 |
CN111142796A (zh) * | 2019-12-20 | 2020-05-12 | 北京浪潮数据技术有限公司 | 一种ssd寿命预测方法、装置、设备及可读存储介质 |
CN111258789B (zh) * | 2020-01-19 | 2022-03-08 | 苏州浪潮智能科技有限公司 | 非易失内存器件剩余寿命预测方法、装置、设备及介质 |
CN113590378A (zh) * | 2020-04-30 | 2021-11-02 | 伊姆西Ip控股有限责任公司 | 存储管理的方法、设备和计算机程序产品 |
CN111736768B (zh) * | 2020-05-29 | 2022-07-08 | 苏州浪潮智能科技有限公司 | 服务器硬盘剩余使用时间的预测方法、系统及存储介质 |
US11556257B2 (en) * | 2020-08-14 | 2023-01-17 | Micron Technology, Inc. | Selectable wear life indicator based on data retention |
CN113849807B (zh) * | 2021-08-18 | 2024-06-25 | 北京市大数据中心 | 基于私有云的数据安全开放沙箱 |
CN113485653B (zh) * | 2021-09-08 | 2021-11-19 | 苏州浪潮智能科技有限公司 | 一种ssd及其应用场景识别方法、装置和存储介质 |
CN115687038B (zh) * | 2022-08-23 | 2023-09-26 | 江苏臻云技术有限公司 | 一种基于大数据的硬盘故障预测系统及方法 |
CN117037887B (zh) * | 2023-10-10 | 2024-01-23 | 苏州元脑智能科技有限公司 | 固态硬盘寿命预测方法及装置 |
CN118093324B (zh) * | 2024-04-28 | 2024-07-30 | 深圳市领德创科技有限公司 | 一种固态硬盘的寿命预测方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559115A (zh) * | 2013-09-29 | 2014-02-05 | 记忆科技(深圳)有限公司 | 基于smart的ssd智能监控系统 |
CN106909482A (zh) * | 2017-03-01 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种固态硬盘寿命检测的方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778295B (zh) * | 2014-01-26 | 2017-02-15 | 南京航空航天大学 | 多失效模式下多模型集成航空发动机运行可靠性评估方法 |
CN104376875B (zh) * | 2014-11-19 | 2017-09-05 | 华为数字技术(苏州)有限公司 | 存储设备寿命预测、确定方法及装置 |
US10514973B2 (en) * | 2016-03-01 | 2019-12-24 | Georgia Tech Research Corporation | Memory and logic lifetime simulation systems and methods |
CN108986869B (zh) * | 2018-07-26 | 2021-04-30 | 南京群顶科技有限公司 | 一种使用多模型预测的磁盘故障检测方法 |
-
2018
- 2018-12-13 CN CN201811526734.8A patent/CN109558287B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103559115A (zh) * | 2013-09-29 | 2014-02-05 | 记忆科技(深圳)有限公司 | 基于smart的ssd智能监控系统 |
CN106909482A (zh) * | 2017-03-01 | 2017-06-30 | 郑州云海信息技术有限公司 | 一种固态硬盘寿命检测的方法及装置 |
Non-Patent Citations (1)
Title |
---|
"选择适当的机器学习算法";CDA数据分析师(成都);《搜狐 https://www.sohu.com/a/247524716_420744》;20180816;第1-8页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109558287A (zh) | 2019-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558287B (zh) | 一种固态硬盘寿命预测方法、装置和系统 | |
US10147048B2 (en) | Storage device lifetime monitoring system and storage device lifetime monitoring method thereof | |
US9646256B2 (en) | Automated end-to-end sales process of storage appliances of storage systems using predictive modeling | |
US8751463B1 (en) | Capacity forecasting for a deduplicating storage system | |
CN110413227B (zh) | 一种硬盘设备的剩余使用寿命在线预测方法和系统 | |
JP6165886B2 (ja) | 動的ストレージサービスレベル・モニタリングの管理システムおよび方法 | |
JP4896593B2 (ja) | 性能監視方法、計算機及び計算機システム | |
US9058109B2 (en) | System and method for identifying failing drives or media in media library | |
US9971777B2 (en) | Smart archiving of real-time performance monitoring data | |
CN102841849B (zh) | 用于操作计算机化存储器的方法和系统 | |
US9372734B2 (en) | Outage window scheduler tool | |
US11734103B2 (en) | Behavior-driven die management on solid-state drives | |
US11449376B2 (en) | Method of determining potential anomaly of memory device | |
CN111104342A (zh) | 用于存储的方法、电子设备和计算机程序产品 | |
US10146449B1 (en) | Purchase planning for data storage processing systems | |
US10146612B1 (en) | Historical disk error monitoring | |
CN117971488A (zh) | 分布式数据库集群的存储管理方法及相关装置 | |
US9558783B2 (en) | System and method for displaying tape drive utilization and performance data | |
CN110837529B (zh) | 大数据分析监察方法、装置、服务器及可读存储介质 | |
US8595198B1 (en) | Compression forecasting for a deduplicating storage system | |
CN111382041B (zh) | 一种故障检测、数据处理方法、装置及设备 | |
US11556451B2 (en) | Method for analyzing the resource consumption of a computing infrastructure, alert and sizing | |
CN110991945B (zh) | 设备备件的信息处理方法及装置、存储介质和处理器 | |
CN118585836A (zh) | 数据热度的识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |