JPH1011701A - Magnetic disk device and fault predicting method for the same device - Google Patents
Magnetic disk device and fault predicting method for the same deviceInfo
- Publication number
- JPH1011701A JPH1011701A JP16578196A JP16578196A JPH1011701A JP H1011701 A JPH1011701 A JP H1011701A JP 16578196 A JP16578196 A JP 16578196A JP 16578196 A JP16578196 A JP 16578196A JP H1011701 A JPH1011701 A JP H1011701A
- Authority
- JP
- Japan
- Prior art keywords
- diagnosis
- failure
- function
- magnetic disk
- diagnostic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Recording Or Reproducing By Magnetic Means (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、回転する円盤状の
磁気ディスクに対し、磁気ヘッドがシーク動作すること
によりデータ記録(または読み出し)を行なう磁気ディ
スク装置、特に、故障診断機能を有する磁気ディスク装
置及び同装置の故障予測方法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a magnetic disk drive for performing data recording (or reading) on a rotating disk-shaped magnetic disk by performing a seek operation of a magnetic head, and more particularly to a magnetic disk having a failure diagnosis function. The present invention relates to a device and a failure prediction method for the device.
【0002】[0002]
【従来の技術】従来から知られているこの種の磁気ディ
スク装置は、コンピュータの外部記憶装置として広く普
及している。回転する円盤状の磁気ディスク(以下、メ
ディアと称する)に対し、磁気ヘッドがメディアの半径
方向にシーク動作することによりデータ記録(または読
み出し)を行なう磁気ディスク装置は、機械的な動作部
分を有しているため例えば半導体装置等に比べて故障率
が高い。したがって、例えばユーザが定期的にデータの
バックアップを取るといった人為的な故障対策が必要で
あった。2. Description of the Related Art Conventionally, this kind of magnetic disk device is widely used as an external storage device of a computer. A magnetic disk drive that performs data recording (or reading) on a rotating disk-shaped magnetic disk (hereinafter referred to as a medium) by a seek operation of a magnetic head in a radial direction of the medium has a mechanically operating part. Therefore, the failure rate is higher than that of, for example, a semiconductor device. Therefore, there has been a need for an artificial failure countermeasure, for example, in which a user periodically backs up data.
【0003】このような事態をふまえて、装置自らが故
障を診断する機能を備えた磁気ディスク装置が製品化さ
れてきている。このような磁気ディスク装置における故
障の自己診断機能によれば、RAWエラーレート(生エ
ラーレート、以下単に「エラーレート」と称する)、C
SS(Contact Start Stop)回数、起動リトライ、シー
クパフォーマンス等、装置の故障につながる要因を示す
パラメータが定期的にチェックされ、故障の発生が予測
され得るような危険な状態にあるか否かが診断される。
そして危険な状態にあると診断された際には、ホストシ
ステムに対して事前に警告を出すことが行われる。ホス
トシステムに警告を出すタイミングとしては、あまり早
くても都合が悪く、遅ければ意味がない。In consideration of such a situation, magnetic disk drives having a function of diagnosing a failure by the apparatus itself have been commercialized. According to such a failure self-diagnosis function in the magnetic disk device, the RAW error rate (raw error rate, hereinafter simply referred to as “error rate”), C
Parameters such as SS (Contact Start Stop) count, start-up retry, seek performance, and other parameters that indicate equipment failures are periodically checked to determine if there is a dangerous state where failures can be predicted. Is done.
Then, when it is diagnosed that there is a dangerous state, a warning is issued to the host system in advance. It is inconvenient to issue a warning to the host system if it is too early, and it is meaningless if it is too late.
【0004】[0004]
【発明が解決しようとする課題】このような故障の自己
診断機能を有する磁気ディスク装置には次のような問題
がある。すなわち、多数のパラメータをチェックするよ
うにすれば、より正確な故障診断を行えるという反面、
磁気ディスク装置本来の機能であるところの、データの
読み書きに係るデータ転送能力(パフォーマンス)が低
下してしまうという問題がある。そこで、本発明は上記
の問題を解決するためになされたものであり、パフォー
マンスを低下させることなく正確な故障診断が行える磁
気ディスク装置及び同装置の故障予測方法を提供するこ
とを目的とする。The magnetic disk drive having the self-diagnosis function for such a failure has the following problems. In other words, if a large number of parameters are checked, a more accurate failure diagnosis can be performed.
There is a problem that the data transfer capability (performance) for reading and writing data, which is an essential function of the magnetic disk device, is reduced. SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and has as its object to provide a magnetic disk drive capable of performing accurate failure diagnosis without deteriorating performance and a failure prediction method for the same.
【0005】[0005]
【課題を解決するための手段】本発明の請求項1に係る
磁気ディスク装置は、故障の可能性が高いかどうかを診
断し得る第1の診断機能およびこの第1の診断機能より
も処理時間が短い第2の診断機能を有する診断手段と、
前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
決定手段と、を具備することを特徴とする。According to a first aspect of the present invention, there is provided a magnetic disk drive, comprising: a first diagnostic function capable of diagnosing whether there is a high possibility of a failure; and a processing time shorter than the first diagnostic function. Diagnostic means having a second diagnostic function,
Determining means for determining whether or not to perform the diagnosis by the first diagnosis function, according to a diagnosis result of the second diagnosis function of the diagnosis means.
【0006】本発明の請求項4に係る磁気ディスク装置
は、故障の可能性が高いかどうかを診断し得る複数の診
断手段と、前記複数の診断手段のうち、幾つかの診断手
段による診断結果に基づいて、他の診断手段による診断
を選択する選択手段と、を具備することを特徴とする。According to a fourth aspect of the present invention, there is provided a magnetic disk drive, comprising: a plurality of diagnostic means capable of diagnosing whether there is a high possibility of failure; and a diagnostic result by some of the plurality of diagnostic means. And selecting means for selecting a diagnosis by another diagnostic means based on the above.
【0007】本発明の請求項6に係る磁気ディスク装置
は、故障予測に関する自己診断機能を有する磁気ディス
ク装置において、前記自己診断機能による診断結果に基
づいて、当該自己診断機能による診断内容を変化させる
ことを特徴とする。A magnetic disk drive according to a sixth aspect of the present invention is a magnetic disk drive having a self-diagnosis function relating to failure prediction, wherein the content of diagnosis by the self-diagnosis function is changed based on the result of diagnosis by the self-diagnosis function. It is characterized by the following.
【0008】本発明の請求項7に係る磁気ディスク装置
の故障予測方法は、故障の可能性が高いかどうかを診断
し得る第1の診断機能およびこの第1の診断機能よりも
処理時間が短い第2の診断機能を有する診断手段を有
し、前記診断手段の第2の診断機能の診断結果に応じ
て、前記第1の診断機能による診断を行なうか否かを決
定することを特徴とする。According to a seventh aspect of the present invention, there is provided a method for predicting a failure of a magnetic disk drive, wherein the first diagnostic function is capable of diagnosing whether there is a high possibility of failure and the processing time is shorter than the first diagnostic function. Diagnosing means having a second diagnostic function, wherein it is determined whether or not to perform a diagnosis by the first diagnostic function according to a diagnosis result of the second diagnostic function of the diagnostic means. .
【0009】本発明の請求項10に係る磁気ディスク装
置の故障予測方法は、故障の可能性が高いかどうかを診
断し得る複数の診断手段と、前記複数の診断手段のう
ち、幾つかの診断手段による診断結果に基づいて、他の
診断手段による診断を選択することを特徴とする。According to a tenth aspect of the present invention, there is provided a failure prediction method for a magnetic disk drive, wherein a plurality of diagnostic means capable of diagnosing whether or not there is a high possibility of failure, and some diagnostic means among the plurality of diagnostic means. The diagnosis by another diagnosis means is selected based on the diagnosis result by the means.
【0010】本発明の請求項12に係る磁気ディスク装
置の故障予測方法は、故障予測に関する自己診断機能を
有する磁気ディスク装置において、前記自己診断機能に
よる診断結果に基づいて、当該自己診断機能による診断
内容を変化させることを特徴とする。A magnetic disk drive failure prediction method according to a twelfth aspect of the present invention is a magnetic disk drive having a self-diagnosis function related to failure prediction. The content is changed.
【0011】[0011]
【発明の実施の形態】以下、図面を参照しながら本発明
の実施形態を説明する。 (第1実施形態)図1は、本発明の第1の実施形態に係
る磁気ディスク装置のハードウェア構成を示すブロック
図である。同図に示される磁気ディスク装置において
は、複数のメディア(ここでは二枚)1がスピンドルモ
ータ17により高速に回転運動可能な如く設けられてい
る。メディア1の各データ面には、対向する一対のヘッ
ド2が設けられている。メディア1が一枚の場合には、
二つのヘッド2がメディア1の両面に対向して設けられ
る。Embodiments of the present invention will be described below with reference to the drawings. (First Embodiment) FIG. 1 is a block diagram showing a hardware configuration of a magnetic disk drive according to a first embodiment of the present invention. In the magnetic disk device shown in the figure, a plurality of media (here, two media) 1 are provided so as to be able to rotate at high speed by a spindle motor 17. A pair of heads 2 facing each other is provided on each data surface of the medium 1. In the case of one media 1,
Two heads 2 are provided to face both sides of the medium 1.
【0012】ヘッド2は、キャリッジと称されるヘッド
移動機構3に取り付けられている。またヘッド2は、キ
ャリッジ3の動作によりメディア1の半径方向に移動可
能となっている。ヘッド2は、サーボ処理システム(ヘ
ッド位置決め制御機構)により、指定された目標シリン
ダ(目標トラック)上に位置決め制御される。通常はセ
クタ単位でデータのリード/ライトが行なわれる。The head 2 is mounted on a head moving mechanism 3 called a carriage. The head 2 is movable in the radial direction of the medium 1 by the operation of the carriage 3. The positioning of the head 2 is controlled on a specified target cylinder (target track) by a servo processing system (head positioning control mechanism). Normally, data is read / written in sector units.
【0013】キャリッジ3は、ボイスコイルモータ(V
CM)16により駆動され、VCM16はドライバ15
により駆動される。またスピンドルモータ17もドライ
バ15により駆動される。ドライバ15は、モータドラ
イバおよびVCMドライバ(ダブルドライバと称され
る)を構成するドライバIC(集積回路)である。The carriage 3 is provided with a voice coil motor (V
CM) 16 and the VCM 16 is a driver 15
Driven by The spindle motor 17 is also driven by the driver 15. The driver 15 is a driver IC (integrated circuit) constituting a motor driver and a VCM driver (referred to as a double driver).
【0014】リード/ライト回路8は、ヘッドアンプ4
により増幅されたヘッド2からのリード信号を入力し、
データ再生動作に必要な信号処理を行なう。また、リー
ド/ライト回路8は、データ記録動作に必要な信号処理
を行ない、ライトデータに応じたライト電流をヘッドア
ンプ4を介してヘッド2に供給する。The read / write circuit 8 includes a head amplifier 4
Input the read signal from the head 2 amplified by
Performs signal processing necessary for data reproduction operation. The read / write circuit 8 performs signal processing necessary for the data recording operation, and supplies a write current corresponding to the write data to the head 2 via the head amplifier 4.
【0015】リード/ライト回路8は、通常のユーザデ
ータの記録再生処理と共に、ヘッド位置決め制御のサー
ボ処理に必要なサーボデータの再生処理を実行する。サ
ーボデータには、ヘッド2の現在位置を示すシリンダア
ドレス及びシリンダ内の位置誤差を示すためのバースト
データ(バースト信号)が含まれている。サーボ回路5
は、サーボ処理に必要な信号処理を実行する回路であっ
て、リード/ライト回路8から出力されたデータパルス
からシリンダアドレスを抽出して保持する。また、サー
ボ回路5は、バースト信号を抽出するためのサンプルタ
イミング信号をパスル生成回路6に対し出力し、あるい
はセクタパルスの抽出処理を行なう。The read / write circuit 8 executes a recording process of the user data and a reproducing process of the servo data necessary for the servo process of the head positioning control, in addition to a normal recording process of the user data. The servo data includes a cylinder address indicating the current position of the head 2 and burst data (burst signal) for indicating a position error in the cylinder. Servo circuit 5
Is a circuit for executing signal processing necessary for servo processing, and extracts and holds a cylinder address from a data pulse output from the read / write circuit 8. Further, the servo circuit 5 outputs a sample timing signal for extracting a burst signal to the pulse generation circuit 6 or performs a process of extracting a sector pulse.
【0016】CPU9は、サーボ回路5と共にヘッド位
置決め制御を実行するサーボ処理システムを構成する。
さらに、CPU9は、ヘッド位置決め制御以外に、リー
ド/ライトデータの転送制御を含む磁気ディスク装置の
各種駆動制御を実行する。CPU9は、ROM10に格
納された制御プログラムに基づいて各種駆動制御を実行
する。ROM10は、外部バスを介してCPU9に接続
されている。このROM10には、磁気ディスク装置の
故障診断のためのファームウェアが格納されている。ま
たROM10には、データの出力レベルの変動、繰返し
行われたリード処理の回数(リトライ回数)、ECC等
のエラー訂正機能によりデータが正確に読み出されたこ
と等の条件が記憶されている。The CPU 9 constitutes a servo processing system for executing head positioning control together with the servo circuit 5.
Further, the CPU 9 executes various drive controls of the magnetic disk drive, including read / write data transfer control, in addition to head positioning control. The CPU 9 executes various drive controls based on a control program stored in the ROM 10. The ROM 10 is connected to the CPU 9 via an external bus. The ROM 10 stores firmware for failure diagnosis of the magnetic disk device. The ROM 10 also stores conditions such as a change in the output level of data, the number of repeated read processes (the number of retries), and the fact that data was correctly read by an error correction function such as ECC.
【0017】CPU9はワンチップのマイクロプロセッ
サであり、入出力部としてA/DコンバータおよびD/
Aコンバータを内蔵し、更に、命令RAMと称する内部
リード/ライトメモリを有する。尚、同実施形態では、
CPU9は、A/Dコンバータを用い、供給されるバー
スト信号BSをディジタルデータに変換する。又、CP
U9はD/Aコンバータを用い、サーボ処理に必要な制
御量(ヘッド位置決め制御等に必要な制御量)をアナロ
グ信号に変換してドライバ15に出力する。The CPU 9 is a one-chip microprocessor, and has an A / D converter and a D /
A built-in A converter and an internal read / write memory called an instruction RAM. In the embodiment,
The CPU 9 converts the supplied burst signal BS into digital data using an A / D converter. Also, CP
U9 uses a D / A converter to convert a control amount required for servo processing (a control amount required for head positioning control and the like) into an analog signal and output the analog signal to the driver 15.
【0018】HDC12は、磁気ディスク装置とホスト
システムとのインターフェースを構成し、主としてリー
ド/ライトデータの転送を行なうコントローラである。
HDC12は、メディア1から読出されたセクタ単位の
リードデータ及びメディア1に書き込むためのライトデ
ータをバッファーRAM14に一時的に格納する。HD
C12とCPU9はデータ転送制御を行なうシステムを
構成している。また、HDC12には、エラー検知回路
が設けられている。このエラー検知回路は、メディア1
から読み出されたデータに基づいてデータエラーを検知
するほか、所定の狭い領域であれば、エラーを回復する
機能、すなわちECC(Error Correction Code )機能
を有している。EEPROM7はCPU9に接続され、
各種のデータを記憶する。The HDC 12 constitutes an interface between the magnetic disk drive and the host system, and is a controller for mainly transferring read / write data.
The HDC 12 temporarily stores in the buffer RAM 14 read data read from the medium 1 in sector units and write data for writing to the medium 1. HD
The C12 and the CPU 9 constitute a system for performing data transfer control. Further, the HDC 12 is provided with an error detection circuit. This error detection circuit is used for media 1
In addition to detecting a data error based on the data read out from the memory, it has a function of recovering the error in a predetermined narrow area, that is, an ECC (Error Correction Code) function. The EEPROM 7 is connected to the CPU 9,
Various types of data are stored.
【0019】以上のように構成された本実施形態にかか
る磁気ディスク装置の動作を説明する。図2は、本実施
形態に係る磁気ディスク装置の動作を示すフローチャー
トである。ここで説明する動作は、ROM10内に格納
されたファームウェアにより実現される。The operation of the magnetic disk drive according to the embodiment configured as described above will be described. FIG. 2 is a flowchart showing the operation of the magnetic disk drive according to the embodiment. The operation described here is realized by firmware stored in the ROM 10.
【0020】まずステップS0において、初期化処理が
行われる。このステップS0は磁気ディスク装置の電源
投入直後に実行される。初期化処理では、HDC12、
リード/ライト回路8、警戒モードフラグ等が初期化
(リセット)される。そしてステップS2に移行する。First, in step S0, an initialization process is performed. This step S0 is executed immediately after the power of the magnetic disk drive is turned on. In the initialization process, HDC12,
The read / write circuit 8, the alert mode flag, and the like are initialized (reset). Then, control goes to a step S2.
【0021】ステップS2はアイドルルーチンであっ
て、ホストシステムからのコマンドを待ち受ける処理で
ある。ホストシステムからコマンドを受領すると、コマ
ンドインタラプトが発行され、ステップS10(コマン
ド処理)に移行する。Step S2 is an idle routine for waiting for a command from the host system. When a command is received from the host system, a command interrupt is issued, and the flow shifts to step S10 (command processing).
【0022】ステップS2のアイドル状態において、一
定時間以上(例えば5秒間)ホストシステムからコマン
ドが到来しない場合は、ステップS4に移行する。ステ
ップS4において、警戒モードフラグに基づき故障警戒
中であるか否かが判定される。警戒モードフラグはRA
M11内に記憶保持されるフラグである。故障警戒中で
ある場合は、ステップS6に移行する。ステップS6に
おいては、正確に故障の発生を予測し得るような高精度
の故障診断、ここではエラーレートの測定、が行われ
る。エラーレートは装置の故障につながる要因を示す有
効なパラメータとされているが、統計的手法を含むデー
タ計測であるため比較的長時間(数十秒以上)の測定時
間を要する。エラーレートの測定後は、パワーセーブモ
ードに係るパワーダウン処理に移行する。In the idle state in step S2, if no command arrives from the host system for a certain period of time (for example, 5 seconds), the process proceeds to step S4. In step S4, it is determined based on the alert mode flag whether or not a failure alert is on. The alert mode flag is RA
This is a flag stored and held in M11. If a failure alert is being made, the process proceeds to step S6. In step S6, a high-precision failure diagnosis that can accurately predict the occurrence of a failure, here, measurement of an error rate, is performed. Although the error rate is an effective parameter indicating a factor leading to a failure of the device, a relatively long measurement time (several tens of seconds or more) is required because it is a data measurement including a statistical method. After the measurement of the error rate, the process shifts to a power down process in the power save mode.
【0023】また、故障警戒中でない場合は、ステップ
S6を実行せず単にパワーダウン処理に移行する。これ
により故障警戒中でない正常な状態において上記エラー
レート測定を行なうことによるパフォーマンスの低下を
抑えることができる。パワーダウン処理については、こ
こでは説明を省略する。If no alert is issued, the process simply shifts to the power down process without executing step S6. As a result, it is possible to suppress a decrease in performance due to the measurement of the error rate in a normal state in which no alert is issued. The description of the power down processing is omitted here.
【0024】なお、エラーレート測定中にホストシステ
ムからコマンドを受領した際は、測定を中断してコマン
ド実行を行なう場合と、測定が完了するまでコマンドの
実行を遅延させる場合とが考えられる。コマンドの実行
を遅延させることは、パフォーマンスの低下を招く。測
定を中断する場合でも、オーバーヘッドが生じるためパ
フォーマンスの低下を招く。したがって、当該エラーレ
ート測定は頻繁に実行するべきではない。When a command is received from the host system during the measurement of the error rate, the measurement may be interrupted to execute the command, or the command execution may be delayed until the measurement is completed. Delaying the execution of a command causes performance degradation. Even when the measurement is interrupted, performance is reduced due to overhead. Therefore, the error rate measurement should not be performed frequently.
【0025】ところが本実施形態は、特定の条件下(故
障警戒中)においてのみ上記エラーレート測定を行なう
ため好ましい。図3はコマンド処理(S10)を示すフ
ローチャート図である。However, the present embodiment is preferable because the error rate measurement is performed only under specific conditions (during alert). FIG. 3 is a flowchart showing the command processing (S10).
【0026】まずステップS11において、コマンドコ
ードに基づきコマンドの種類が判定される。次にステッ
プS12において、“リードコマンド”と判定された場
合は、ステップS20におけるリードコマンド処理に移
行する。First, in step S11, the type of command is determined based on the command code. Next, when it is determined in step S12 that the command is a “read command”, the process proceeds to a read command process in step S20.
【0027】また、ステップS13において、“ドライ
ブステータスリードコマンド”と判定された場合は、ス
テップS30におけるドライブステータスリード処理に
移行する。If it is determined in step S13 that the command is "drive status read command", the process proceeds to the drive status read process in step S30.
【0028】コマンド処理S10は、上記以外の“他の
コマンド”を処理するものとなっているがここでは説明
を省略する。図4は、リードコマンド処理(S20)を
示すフローチャート図である。The command processing S10 is for processing "other commands" other than the above, but the description is omitted here. FIG. 4 is a flowchart showing the read command processing (S20).
【0029】まずステップS21において、ホストシス
テムから送られてきたコマンドに応じたリード/ライト
回路8およびHDC12等の動作によるリード処理が行
われる。First, in step S21, a read process is performed by operations of the read / write circuit 8 and the HDC 12 according to the command sent from the host system.
【0030】次にステップS22において、磁気ディス
ク装置のパフォーマンスにそれほど影響を与えることが
なく、かつ上記エラーレートの変動特性に近似するよう
な診断、すなわちECCコレクション数の取得が行われ
る。このECCコレクション数は、HDC12によるE
CCコレクションがイネーブルの状態にある場合のリー
ド処理においてコレクションされたデータ(コレクテッ
ドデータ)数である。そしてステップS221に移行す
る。ステップS221においては、警戒モードに入って
から一定時間以上経過しているか否かが判定される。こ
こで、YESと判定された場合は、ステップS23に移
行し、警戒モードフラグがリセットされる。警戒モード
フラグはRAM11内に記憶保持される。Next, in step S22, a diagnosis is performed so as not to significantly affect the performance of the magnetic disk device and to approximate the error rate fluctuation characteristics, that is, to obtain the number of ECC collections. The number of ECC collections is E
This is the number of data (collected data) collected in the read processing when the CC correction is enabled. Then, control goes to a step S221. In step S221, it is determined whether or not a predetermined time has elapsed after entering the alert mode. Here, if the determination is YES, the process moves to step S23, and the alert mode flag is reset. The alert mode flag is stored and held in the RAM 11.
【0031】次にステップS24において、コレクテッ
ドデータ数(ECCコレクション数)が、所定のスレッ
ショルドよりも大きいか否かを判定する。ここで所定の
スレッショルドよりも大きい(具体的にはオンザフライ
コレクションが103 に一回の割合で行われた、等)場
合は、ステップS25において上記警戒モードフラグを
セットする。これにより、磁気ディスク装置は故障警戒
状態となる。Next, in step S24, it is determined whether or not the number of collected data (the number of ECC collections) is larger than a predetermined threshold. Here, if the threshold value is larger than the predetermined threshold (specifically, the on-the-fly collection is performed once every 10 3 ), the alert mode flag is set in step S25. As a result, the magnetic disk device enters a failure alert state.
【0032】図5は、ドライブステータスリードコマン
ド処理(S30)を示すフローチャートである。まずス
テップS31において、警戒モードフラグを調べること
により警戒モード(故障警戒中)であるか否かが判定さ
れる。警戒モードフラグはRAM11内に記憶保持され
ている。警戒モードである場合はステップS32に移行
する。また警戒モードでない場合はステップS34に移
行する。FIG. 5 is a flowchart showing the drive status read command processing (S30). First, in step S31, it is determined whether or not the apparatus is in the alert mode (fault alert) by checking the alert mode flag. The alert mode flag is stored and held in the RAM 11. If the mode is the alert mode, the process proceeds to step S32. If the mode is not the alert mode, the process proceeds to step S34.
【0033】ステップS32においては、先のステップ
S6におけるエラーレートの測定結果に基づく故障診断
が行われる。続くステップS33において、上記エラー
レートが所定のスレッショルドよりも大きい場合(例え
ばエラーレートが10-3以上)は“異常”と判定され、
ステップS36に移行する。また上記エラーレートがス
レッショルドよりも小さい場合はステップS34に移行
する。In step S32, a failure diagnosis is performed based on the measurement result of the error rate in step S6. In the following step S33, when the error rate is larger than a predetermined threshold (for example, when the error rate is 10 -3 or more), it is determined to be "abnormal",
Move to step S36. If the error rate is smaller than the threshold, the process moves to step S34.
【0034】ステップS34においては、ECCコレク
ション数に基づく故障診断が行われる。続くステップS
35において、上記ECCコレクション数が所定のスレ
ッショルドよりも大きい場合(例えばオンザフライコレ
クションが103 に一回の割合で行われた)は“異常”
と判定され、ステップS36に移行する。また上記EC
Cコレクション数がスレッショルドよりも小さい場合は
ステップS37に移行する。In step S34, a failure diagnosis based on the number of ECC collections is performed. Subsequent step S
At 35, if the number of ECC collections is larger than a predetermined threshold (for example, on-the-fly collection is performed once every 10 3 ), “abnormal”
And the process moves to step S36. Also the above EC
If the number of C collections is smaller than the threshold, the process moves to step S37.
【0035】ステップS36においては、ホストインタ
ーフェース13を介して、ホストシステムに対しドライ
ブステータスが異常である旨を報告する。また、ステッ
プS37においては、同インターフェース13を介して
ホストシステムに対しドライブステータスが正常である
旨を報告する。なお、ステップS34およびステップS
35におけるECCコレクション数による診断は、非故
障警戒モード中の場合、あるいはエラーレートを用いる
診断結果が“正常”である場合にも実行され得るが、場
合によっては省略しても構わない。In step S36, the host system 13 is notified via the host interface 13 that the drive status is abnormal. In step S37, the drive status is reported to the host system via the interface 13 that the drive status is normal. Step S34 and step S34
The diagnosis based on the number of ECC collections at 35 may be executed in the non-failure alert mode or when the diagnosis result using the error rate is “normal”, but may be omitted in some cases.
【0036】このような第1実施形態によれば、通常時
(非警戒モード時)においてECCコレクション数によ
る第1の診断を行ない、この第1の診断結果に基づく故
障警戒中、すなわちステップS25による警戒フラグの
セット中は、エラーレートによる第2の診断を行なうこ
とにより、必要最小限の診断処理によって的確な故障予
測を行なうことが可能となる。According to the first embodiment, the first diagnosis based on the number of ECC collections is performed in the normal state (in the non-warning mode), and during the failure warning based on the first diagnosis result, that is, in step S25. While the warning flag is being set, the second diagnosis based on the error rate is performed, so that an accurate failure prediction can be performed by the minimum necessary diagnostic processing.
【0037】したがって、磁気ディスク装置が接続され
るホストシステムは、磁気ディスク装置の故障予測を適
切なタイミングでユーザに知らせることが可能となり、
これによりユーザは適切な故障対策を講じることができ
る。Therefore, the host system to which the magnetic disk device is connected can notify the user of the failure prediction of the magnetic disk device at an appropriate timing.
This allows the user to take appropriate countermeasures.
【0038】なお、上記第1の診断は、ECCコレクシ
ョン数による診断に限定されず、磁気ディスク装置のパ
フォーマンスにそれほど影響を与えず、かつエラーレー
トの変動特性に近似するような他のパラメータを用いて
も良い。The first diagnosis is not limited to the diagnosis based on the number of ECC collections, but uses other parameters that do not significantly affect the performance of the magnetic disk drive and approximate the error rate fluctuation characteristics. May be.
【0039】また故障警戒中において故障を高精度に診
断する診断パラメータとしては、エラーレートの一種類
のみに限定されない。本実施形態では、エラーレートに
対しその近似特性を与えるECCコレクション数を組み
合わせることとしたが、例えば第1の診断をCSS起動
時間の測定、第2の診断をCSS起動電流値およびリト
ライ回数とするような他の診断パラメータの組み合わせ
に置き換えても良い。すなわち、第1実施形態の場合、
第1の診断は磁気ディスク装置のパフォーマンスにそれ
ほど影響がないような診断、第2の診断は正確に故障の
発生を予測し得るような高精度の診断、とすれば良い。The diagnostic parameter for diagnosing a failure with high accuracy during failure alerting is not limited to only one type of error rate. In the present embodiment, the error rate is combined with the number of ECC collections giving its approximate characteristics. For example, the first diagnosis is a measurement of the CSS activation time, and the second diagnosis is the CSS activation current value and the number of retries. Such a combination of other diagnostic parameters may be used. That is, in the case of the first embodiment,
The first diagnosis may be a diagnosis that does not significantly affect the performance of the magnetic disk device, and the second diagnosis may be a high-precision diagnosis that can accurately predict the occurrence of a failure.
【0040】(第2実施形態)第2実施形態は、第1実
施形態の変形例に係り、第1実施形態と同様部分につい
ては説明を省略する。(Second Embodiment) The second embodiment relates to a modification of the first embodiment, and a description of the same parts as in the first embodiment will be omitted.
【0041】第1実施形態は、通常時(非警戒モード
時)においてECCコレクション数による第1の診断を
行ない、この第1の診断結果に基づく故障警戒中はエラ
ーレートによる第2の診断を行なうものであったが、第
2の実施形態は、第1の診断結果に応じて故障警戒のレ
ベル(故障警戒度)を定め、故障警戒中において、かか
るレベルに応じた種々の診断(第2の診断)を行なうも
のである。すなわち、第1実施形態においては故障警戒
レベルは1であってが、第2実施形態においては故障警
戒レベルを複数としている。言い替えれば第1の診断に
よる診断結果に基づいて第2の診断を選択可能となって
いる。In the first embodiment, a first diagnosis is performed based on the number of ECC collections in a normal state (in a non-warning mode), and a second diagnosis is performed based on an error rate during a warning based on a result of the first diagnosis. However, in the second embodiment, a failure alert level (failure alert level) is determined according to the first diagnosis result, and various types of diagnosis (second alert) corresponding to the level are determined during the alert alert. Diagnosis). That is, in the first embodiment, the failure alert level is 1, but in the second embodiment, a plurality of failure alert levels are provided. In other words, the second diagnosis can be selected based on the diagnosis result of the first diagnosis.
【0042】このような第2実施形態の具体例によれ
ば、ECCコレクション数、すなわちHDC12による
ECCコレクションがイネーブルの状態にある場合のリ
ード処理においてコレクションされたデータ(コレクテ
ッドデータ)数を用いる第1の診断結果に基づいて、例
えば三段階の故障警戒レベルが決定される。故障警戒レ
ベル決定に係るステップは、図4のステップS24およ
びステップS25に対して置き換えられる。そして、故
障警戒レベル1においてはエラーレートによる診断、故
障警戒レベル2においてはエラーレートおよびCSS
(起動電流、リトライ回数)を用いる診断、そして故障
警戒レベル3においてはエラーレートおよびCSSおよ
びシークパフォーマンスを用いる診断、が行なわれる。
これらの診断処理に係るステップは、図2のステップS
4およびステップS6に置き換えられる。なお、故障警
戒レベル2および故障警戒レベル3における“異常”の
診断は、当該レベルにおいて何れか一のパラメータが異
常を示す場合、あるいは全てのパラメータが異常を示す
場合を意味する。According to the specific example of the second embodiment, the number of ECC collections, that is, the number of data (collected data) collected in the read process when the HDC 12 is enabled for ECC collection is used. Based on one diagnosis result, for example, three levels of failure alert levels are determined. Steps related to the failure alert level determination are replaced with steps S24 and S25 in FIG. Then, at the failure alert level 1, diagnosis based on the error rate is performed, and at the failure alert level 2, the error rate and the CSS are determined.
Diagnosis using (starting current, number of retries), and at failure alert level 3, diagnosis using error rate and CSS and seek performance.
Steps related to these diagnostic processes are performed in step S in FIG.
4 and step S6. The diagnosis of “abnormal” at the failure alert level 2 and the failure alert level 3 means a case where any one of the parameters indicates an abnormality at that level or a case where all the parameters indicate an abnormality.
【0043】なお第1の診断は、ECCコレクション数
による診断に限定されず、第1実施形態と同様に、磁気
ディスク装置のパフォーマンスにそれほど影響を与えな
いような診断、例えばCSS起動時間の測定等であって
も良い。また、第2の診断の故障警戒レベルは三段階に
限定されず何段階でも良い。また第2の診断の種類も上
記したものに限定されず、所要の診断精度が最低限得ら
れるような任意の診断を行なうようにしても良い。Note that the first diagnosis is not limited to the diagnosis based on the number of ECC collections, but is a diagnosis that does not significantly affect the performance of the magnetic disk drive, such as the measurement of the CSS startup time, as in the first embodiment. It may be. Further, the failure alert level of the second diagnosis is not limited to three levels, and may be any level. Further, the type of the second diagnosis is not limited to the above, and any diagnosis may be performed so that the required diagnosis accuracy is obtained at a minimum.
【0044】このような第2実施形態によれば、第1実
施形態よりも柔軟かつ多様な故障診断を高精度に行える
という利点がある。本発明は上述した実施形態に限定さ
れず、例えば第1実施形態と第2実施形態とを組み合わ
せる等、種々変形して実施可能である。According to the second embodiment, there is an advantage that a more flexible and diverse failure diagnosis can be performed with higher accuracy than the first embodiment. The present invention is not limited to the above-described embodiment, and can be implemented in various modifications, for example, by combining the first embodiment and the second embodiment.
【0045】[0045]
【発明の効果】本発明によれば、故障の兆候が認められ
ない初期の段階においては必要最小限の自己診断のみを
行ない、これによりパフォーマンス低下を抑制し、故障
の兆候が認められる警戒段階においては、危険度に応じ
て自己診断を拡張し、これにより精度良く診断を行なう
磁気ディスク装置及び同装置の故障予測方法を提供でき
る。According to the present invention, only the necessary minimum self-diagnosis is performed in the initial stage where no sign of failure is observed, thereby suppressing a decrease in performance, and in the warning stage where a sign of failure is observed. Can extend the self-diagnosis according to the degree of danger, and thereby provide a magnetic disk device and a failure prediction method for performing the diagnosis with high accuracy.
【図1】本発明の第1実施形態に係る磁気ディスク装置
の概略構成を示すブロック図。FIG. 1 is a block diagram showing a schematic configuration of a magnetic disk drive according to a first embodiment of the present invention.
【図2】第1実施形態に係る磁気ディスク装置の動作を
示すフローチャート。FIG. 2 is a flowchart showing the operation of the magnetic disk drive according to the first embodiment.
【図3】第1実施形態に係る磁気ディスク装置のコマン
ド処理を示すフローチャート。FIG. 3 is a flowchart illustrating command processing of the magnetic disk device according to the first embodiment.
【図4】第1実施形態に係る磁気ディスク装置のリード
コマンド処理を示すフローチャート。FIG. 4 is a flowchart showing a read command process of the magnetic disk device according to the first embodiment.
【図5】第1実施形態に係る磁気ディスク装置のドライ
ブステータスリードコマンド処理を示すフローチャー
ト。FIG. 5 is a flowchart showing a drive status read command process of the magnetic disk device according to the first embodiment.
1…メディア(磁気ディスク) 2…磁気ヘッド 3…キャリッジ 4…ヘッドアンプ 5…サーボ回路 6…パルス生成回路 7…EEPROM 8…リード/ライト回路 9…CPU 10…ROM 11…RAM 12…HDC 13…ホストインターフェース 14…バッファRAM 15…ドライバ 16…VCM 17…スピンドルモータ DESCRIPTION OF SYMBOLS 1 ... Media (magnetic disk) 2 ... Magnetic head 3 ... Carriage 4 ... Head amplifier 5 ... Servo circuit 6 ... Pulse generation circuit 7 ... EEPROM 8 ... Read / write circuit 9 ... CPU 10 ... ROM 11 ... RAM 12 ... HDC 13 ... Host interface 14 Buffer RAM 15 Driver 16 VCM 17 Spindle motor
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G11B 20/18 572 G11B 20/18 572F ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 6 Identification number Agency reference number FI Technical display location G11B 20/18 572 G11B 20/18 572F
Claims (12)
る第1の診断機能およびこの第1の診断機能よりも処理
時間が短い第2の診断機能を有する診断手段と、 前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
決定手段と、 を具備することを特徴とする磁気ディスク装置。A diagnostic means having a first diagnostic function capable of diagnosing whether there is a high possibility of a failure and a second diagnostic function having a shorter processing time than the first diagnostic function; Determining means for determining whether or not to perform a diagnosis by the first diagnosis function according to a diagnosis result of the second diagnosis function.
測定することにより故障の可能性を診断することを特徴
とする請求項1に記載の磁気ディスク装置。2. The magnetic disk drive according to claim 1, wherein the first diagnosis function diagnoses a possibility of a failure by measuring an error rate.
診断は、前記第2の診断機能による故障可能性の診断よ
りも、診断精度が高いことを特徴とする請求項1に記載
の磁気ディスク装置。3. The magnetic field according to claim 1, wherein the diagnosis of the possibility of failure by the first diagnosis function has a higher diagnosis accuracy than the diagnosis of the possibility of failure by the second diagnosis function. Disk device.
る複数の診断手段と、 前記複数の診断手段のうち、幾つかの診断手段による診
断結果に基づいて、他の診断手段による診断を選択する
選択手段と、 を具備することを特徴とする磁気ディスク装置。4. A plurality of diagnosing means capable of diagnosing whether there is a high possibility of a failure, and diagnosing by other diagnosing means based on a diagnosis result by some of the plurality of diagnosing means. A magnetic disk drive, comprising: selecting means for selecting.
せることで、診断精度を上げることを特徴とする請求項
4に記載の磁気ディスク装置。5. The magnetic disk drive according to claim 4, wherein the selection unit changes the number of diagnosis units to increase diagnosis accuracy.
磁気ディスク装置において、 前記自己診断機能による診断結果に基づいて、当該自己
診断機能による診断内容を変化させることを特徴とする
磁気ディスク装置。6. A magnetic disk drive having a self-diagnosis function related to failure prediction, wherein the content of diagnosis by the self-diagnosis function is changed based on a diagnosis result by the self-diagnosis function.
る第1の診断機能およびこの第1の診断機能よりも処理
時間が短い第2の診断機能を有する診断手段を有し、 前記診断手段の第2の診断機能の診断結果に応じて、前
記第1の診断機能による診断を行なうか否かを決定する
ことを特徴とする磁気ディスク装置の故障予測方法。7. A diagnostic device comprising: a first diagnostic function capable of diagnosing whether there is a high possibility of a failure; and a diagnostic means having a second diagnostic function having a shorter processing time than the first diagnostic function. A failure predicting method for a magnetic disk drive, comprising: determining whether to perform a diagnosis by the first diagnosis function according to a diagnosis result of a second diagnosis function of the means.
測定することにより故障の可能性を診断することを特徴
とする請求項7に記載の磁気ディスク装置の故障予測方
法。8. The method according to claim 7, wherein the first diagnosis function diagnoses a possibility of a failure by measuring an error rate.
診断は、前記第2の診断機能による故障可能性の診断よ
りも、診断精度が高いことを特徴とする請求項7に記載
の磁気ディスク装置の故障予測方法。9. The magnetic apparatus according to claim 7, wherein the diagnosis of the possibility of failure by the first diagnosis function has a higher diagnosis accuracy than the diagnosis of the possibility of failure by the second diagnosis function. Disk device failure prediction method.
得る複数の診断手段と、 前記複数の診断手段のうち、幾つかの診断手段による診
断結果に基づいて、他の診断手段による診断を選択する
ことを特徴とする磁気ディスク装置の故障予測方法。10. A plurality of diagnosing means capable of diagnosing whether there is a high possibility of failure, and diagnosing by other diagnosing means based on a diagnosis result by some of the plurality of diagnosing means. A method for predicting a failure of a magnetic disk drive, comprising:
させることで、診断精度を上げることを特徴とする請求
項10に記載の磁気ディスク装置の故障予測方法。11. The failure prediction method according to claim 10, wherein the selection unit changes the number of diagnosis units to increase diagnosis accuracy.
る磁気ディスク装置において、 前記自己診断機能による診断結果に基づいて、当該自己
診断機能による診断内容を変化させることを特徴とする
磁気ディスク装置の故障予測方法。12. A magnetic disk drive having a self-diagnosis function related to failure prediction, wherein the content of diagnosis by the self-diagnosis function is changed based on a diagnosis result by the self-diagnosis function. Method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16578196A JPH1011701A (en) | 1996-06-26 | 1996-06-26 | Magnetic disk device and fault predicting method for the same device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16578196A JPH1011701A (en) | 1996-06-26 | 1996-06-26 | Magnetic disk device and fault predicting method for the same device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1011701A true JPH1011701A (en) | 1998-01-16 |
Family
ID=15818900
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16578196A Pending JPH1011701A (en) | 1996-06-26 | 1996-06-26 | Magnetic disk device and fault predicting method for the same device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1011701A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005081247A1 (en) * | 2004-02-19 | 2005-09-01 | Ricoh Company, Ltd. | Defect management information setting method, recording method, defect management method, program, recording medium, and information recording device |
JP2009170034A (en) * | 2008-01-16 | 2009-07-30 | Sony Corp | Fault diagnostic device and fault diagnostic method |
-
1996
- 1996-06-26 JP JP16578196A patent/JPH1011701A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005081247A1 (en) * | 2004-02-19 | 2005-09-01 | Ricoh Company, Ltd. | Defect management information setting method, recording method, defect management method, program, recording medium, and information recording device |
JP2009170034A (en) * | 2008-01-16 | 2009-07-30 | Sony Corp | Fault diagnostic device and fault diagnostic method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8327193B2 (en) | Data storage device including a failure diagnostic log | |
US6219814B1 (en) | Method and apparatus for selectively varying error correcting code (ECC) power in a direct access storage device (DASD) | |
US6401214B1 (en) | Preventive recovery action in hard disk drives | |
JP2548480B2 (en) | Disk device diagnostic method for array disk device | |
US5751947A (en) | Magnetic disk apparatus having inspection function of recording medium and method of inspecting recording medium in magnetic disk apparatus | |
JP2004525433A (en) | Critical event log for disk drive | |
US8259406B2 (en) | Head/disk contact determination | |
US8151167B2 (en) | Program processing device and program processing method | |
JP5521926B2 (en) | Storage system, control device, and storage device | |
JP3887062B2 (en) | Disk device and throughput / performance measuring method applied to the same | |
US5841260A (en) | Disk device with failure prediction function and motor start error prediction method in the device | |
US6263462B1 (en) | Testing method and tester | |
JPH1011701A (en) | Magnetic disk device and fault predicting method for the same device | |
JP2003263703A5 (en) | ||
US6710963B2 (en) | Disk controller for detecting hang-up of disk storage system | |
US20060212777A1 (en) | Medium storage device and write path diagnosis method | |
JP3457602B2 (en) | Disk unit | |
JPH09245419A (en) | Magnetic disk apparatus | |
JP2880701B2 (en) | Disk subsystem | |
JP5692577B2 (en) | Magnetic disk apparatus and self-diagnosis method | |
JPH10188451A (en) | Disk device, and failure predicting method based on defect in the device | |
JP3150242B2 (en) | Disk unit | |
JPH06309118A (en) | Information processor | |
JP2003123419A (en) | Non-repeatable run out abnormality detecting method and disk device | |
JP2001307435A (en) | Magnetic disk device, fault predictive diagnosing method of the same device, and recording medium with recorded program thereof |