硬盘损坏
硬盘损坏指硬盘由于种种原因导致硬盘不能正常工作,硬盘维修就是针对因不同原因
损坏的硬盘进行修复。硬盘损坏大至可分为线路板损坏和盘体损坏。电子线路板损坏时一
般要采用更换电子原器件(集成电路或三极管)的方法来修复硬盘。当电子线路故障时硬
盘便不能正常工作,一般情况下电子线路板最常见故障是驱动芯片或给主控电机供电的三
极管损坏。盘体故障时表现就更复杂,有些可以修复,有些就不一定能修复。
盘体损坏包括磁头组件损坏、扇区物理性损坏和综合性损坏。
磁头组件损坏:主要指硬盘中磁头组件的某部分被损坏,造成部分或全部磁头无法正
常读写的情况。磁头组件损坏的方式和可能性非常多,主要包括磁头脏、磁头磨损、磁头
悬臂变形、磁线圈受损、移位等。
扇区物理性损坏:是指因为制造工艺、碰撞、摩擦或其他原因导致磁盘盘面出现的物
理损坏,如划伤、掉磁等。
综合损坏:指因为一些微小的变化使硬盘发生种种异常的表现。如发热过度或者其他
原因导致部电子原器件老化;使用过程中受到冲击震动,外壳或盘面或马达主轴产生了微
小的变化或位移;某些硬盘本身在设计方面如在散热、摩擦或结构上存在缺陷;导致硬盘
不稳定,经常发生读写不正常、读写速度慢、丢数据或者出现逻辑错误,工作噪音大,有
时能正常工作但有时又不能正常工作等。
硬盘的安装
硬盘一般可采用垂直和水平两种方法安装,把它安稳的装在机架的适当位置上就可以
了,如果用多块硬盘,还要考虑散热因素;采用水平方向安装时,硬盘上有线路板一面应
朝下。
硬盘的物理结构
硬盘由电子线路板和盘体两个主要部分组成,电子线路板将收到的信号翻译成控制硬
盘中主控电机转动伺服电机寻道和碰头读写等一系列动作。
硬盘盘体通常有一到几片盘片组成,盘片固定在盘片可以是双面用也有的只被利用一
面。目前由于硬盘存储技术的提高,单片容量已经很大,许多硬盘用一片就已经够了。这
样就简化了机械结构,降低成本的同时又提高了性能。硬盘内部有圆形的盘片,在盘片的
两面有一个由伺服电机控制的移动滑动臂,前端为读写磁头,盘面被划分成密密麻麻的同
心圆即磁道,每个磁道又被划分成63个区即扇区。也就是硬盘盘片的每一条磁道都具有相
同的扇区数,由此产生了所谓的硬盘柱面数(Cylinders)、磁头数(Heads)、扇区数
(Sectors)CHS 3D参数,以及相应的3D寻址方式。其中:柱面数表示硬盘每一面盘片上
有几条磁道,最大为1024(0-1023),用10个二进制位存储来表达,高二位借用扇区数的高
二位,扇区数仅用6位;磁头数表示硬盘总共有几个磁头,即为盘面数,最大为255,用8个
二进制位存储来表达;扇区数表示每一条磁道上有几个扇区,最大为63,用6个二进制位存
储来表达;每个扇区规定为512个可用字节。
所以磁盘最大容量为:1024×255×63×512/1048576=8032MB(1M=1048576Bytes)
或硬盘厂商常用的单位:1024×255×63×512/1000000=8423MB(1M=1000000Bytes)
8G成了第1个瓶颈。随后使用了28位寻址方式,但随着硬盘容量的不断增大,现在又遇
到了137G的瓶颈。目前最新的已使用48位寻址方式,再次突破了硬盘容量瓶颈。
老式磁盘造成了硬盘内圈磁道密外圈磁道疏。现在硬盘技术已不再这样来处理,改变
了硬盘的管理方式,使硬盘盘片上的扇区均匀分布,充分利用了空间,提高了容量。硬盘
不再具有实际的3D参数,寻址方式也改为线性LAB寻址,以扇区为单位进行寻址。
为了与使用3D寻址的老软件兼容,硬盘厂商通常在硬盘控制器内部安装了一个地址翻
译器,负责将老式3D参数翻译成新的线性参数。这就是为什么现在硬盘的可以有多种工作
模式选择的原因,如LBA、LARGE、NORMAL。
随着磁盘密度的增加、性能和速的提高,现今的硬盘前端都能会划出一定容量的“系统
保留区”,用来储存硬盘的各种信息、参数和控制程序,有的甚至把硬盘的固件
Fireware也做到了系统保留区里面,原来这些信息被储存在硬盘控制电路板的“BIOS”芯
片上的(一般是EPROM芯片)。
硬盘高速动转后依靠空气动力,磁头和盘片不再接触,保证磁头在读写时不和盘面撞
击(这点和软驱不一样,软驱的磁头和软盘是接触的)。因此,不要企图在普通的环境下
把硬盘拆开,一旦打开,空气中的尘埃就可以进入硬盘内部,盘面和磁头的距离极其微小,
磁头和盘面之间的尘埃就可导致硬盘盘面和碰头的物理损坏。
注:普通环境下的空气约为10万级(10万个颗粒/立方米),硬盘生产的净环境为100级。差距是何具大?
硬盘重要概念
以下引用高朋先生的文章
如果经检测发现某个硬盘不能完全正常工作,则称这个硬盘是“有缺陷的硬盘”(Defect Hard
Disk)。
根据维修经验,笔者将硬盘的缺陷分为六大类
①坏扇区(Bad sector),也称缺陷扇区(Defect sector)
②磁道伺服缺陷(Track Servo defect)
③磁头组件缺陷(Heads assembly defect)
④系统信息错乱(Service information destruction)
⑤电子线路缺陷(The board of electronics defect)
⑥综合性能缺陷(Complex reliability defect)
1.坏扇区(也称缺陷扇区)
指不能被正常访问或不能被正确读写的扇区。一般表现为:高级格式化后发现有“坏簇(Bad
Clusters);用SCANDISK等工具检查发现有“B”标记;或用某些检测工具发现有“扇区错误提示”等。
一般每个扇区可以记录512字节的数据,如果其中任何一个字节不正常,该扇区就属于缺陷扇区。每个扇区除了记录512字节的数据外,另外还记录有一些信息:标志信息、校验码、地址信息等,其中任何一部分信息不正常都导致该扇区出现缺陷。
多数专业检测软件在检测过程中发现缺陷时,都有类似的错误信息提示,常见的扇区缺陷主要有几种情况:
①校验错误(ECC uncorrectable
errors,又称ECC错误)。系统每次在往扇区中写数据的同时,都根据这些数据经过一定的算法运算生成一个校验码(ECC=Error
Correction Code),并将这个校验码记录在该扇区的信息区内。以后从这个扇区读取数据时,都会同时读取其校检码,并对数据重新运算以检查结果是否与校检码一致。如果一致,则认为这个扇区正常,存放的数据正确有效;如果不一致,则认为该扇区出错,这就是校验错误。这是硬盘最主要的缺陷类型。导致这种缺陷的原因主要有:磁盘表面磁介质损伤、硬盘写功能不正常、校验码的算法差异。
②IDNF错误(sector ID not found),即扇区标志出错,造成系统在需要读写时找不到相应的扇区。造成这个错误的原因可能是系统参数错乱,导致内部地址转换错乱,系统找不到指定扇区;也有可能是某个扇区记录的标志信息出错导致系统无法正确辨别扇区。
③AMNF错误(Address Mark Not Found),即地址信息出错。一般是由于某个扇区记录的地址信息出错,系统在对它访问时发现其地址信息与系统编排的信息不一致。
④坏块标记错误(Bad block mark)。某些软件或病毒程序可以在部分扇区强行写上坏块标记,让系统不使用这些扇区。这种情况严格来说不一定是硬盘本身的缺陷,但想清除这些坏块标记却不容易。
2.磁道伺服缺陷
现在的硬盘大多采用嵌入式伺服,硬盘中每个正常的物理磁道都嵌入有一段或几段信息作为伺服信息,以便磁头在寻道时能准确定位及辨别正确编号的物理磁道。如果某个物理磁道的伺服信息受损,该物理磁道就可能无法被访问。这就是“磁道伺服缺陷”。一般表现为,分区过程非正常中断;格式化过程无法完成;用检测工具检测时,中途退出或死机,等等。
3.磁头组件缺陷
指硬盘中磁头组件的某部分不正常,造成部分或全部物理磁头无法正常读写的情况。包括磁头磨损、磁头接触面脏、磁头摆臂变形、音圈受损、磁铁移位等。一般表现为通电后,磁头动作发出的声音明显不正常,硬盘无法被系统BIOS检测到;无法分区格式化;格式化后发现从前到后都分布有大量的坏簇,等等。
4.系统信息错乱
每个硬盘内部都有一个系统保留区(service area),里面分成若干模块保存有许多参数和程序。硬盘在通电自检时,要调用其中大部分程序和参数。如果能读出那些程序和参数模块,而且校验正常的话,硬盘就进入准备状态。如果某些模块读不出或校验不正常,则该硬盘就无法进入准备状态。一般表现为,PC系统的BIOS无法检测到该硬盘或检测到该硬盘却无法对它进行读写操作。如某些系列硬盘的常见问题:美钻二代系列硬盘通电后,磁头响一声,马达停转;Fujitsu MPG系列在通电后,磁头正常寻道,但BIOS却检测不到;火球系列,系统能正常认出型号,却不能分区格式化;Western
Digital的EB、BB系列,能被系统检测到,却不能分区格式化,等等。
5.电子线路缺陷
指硬盘的电子线路板中部分线路断路或短路,某些电气元件或IC芯片损坏等。有部分可以通过观察线路板发现缺陷所在,有些则要通过仪器测量后才能确认缺陷部位。一般表现为硬盘在通电后不能正常起转,或者起转后磁头寻道不正常,等等。
6.综合性能缺陷
有些硬盘在使用过程中部分芯片特性改变;或者有些硬盘受震动后物理结构产生微小变化(如马达主轴受损);或者有些硬盘在设计上存在缺陷……最终导致硬盘稳定性差,或部分性能达不到标准要求。一般表现为,工作时噪音明显增大;读写速度明显太慢;同一系列的硬盘大量出现类似故障;某种故障时有时无等等。
P-list(永久缺陷表)
现在的硬盘密度越来越高,单张盘片上存储的数据量超过40Gbytes. 硬盘厂家在生产盘片过程极其精密,但也极难做到100%的完美,硬盘盘面上或多或少存在一些缺陷。厂家在硬盘出厂前把所有的硬盘都进行低级格式化,在低级格式化过
程中将自动找出所有defect track和defect sector,记录在P-list中。并且在对所有磁道和扇区的编号过程中,将skip(跳过)这些缺陷部分,让用户永远不能用到它们。这样
,用户在分区、格式化、检查刚购买的新硬盘时,很难发现有问题。一般的硬盘都在P-list中记录有一定数量的defect,
少则数百,多则数以万计。如果是SCSI硬盘的话可以找到多种通用软件查看到P-list,因为各种牌子的SCSI硬盘使用兼容的SCSI指令集。而不同
牌子不同型号的IDE硬盘,使用各自不同的指令集,想查看其P-list要用针对性的专业软件。
G-list(增长缺陷表) 用户在使用硬盘过程中,有可能会发现一些新的defect
sector。 按“三包”规定,只要出现一个defect sector,商家就应该为用户换或修。现
在大容量的硬盘出现一个defect sector概率实在很大,这样的话硬盘商家就要为售后服务忙碌不已了。于是,硬盘厂商设计了一个自动修复机制,叫做Automatic
Reallcation。
有大多数型号的硬盘都有这样的功能:在对硬盘的读写过程中,如果发现一个defect sector,则自动分配一个备用扇区替换该扇区,并将该扇区及其替换情况记录在G-list中。这样一来,少量的defect
sector对用户的使用没有太大的影响。
也有一些硬盘自动修复机制的激发条件要严格一些,需要用某些软件来判断defect sector,并通过某个端口(据说是50h)调用自动修复机制。比如常用的Lformat,
ADM,DM中的Zero fill,Norton中的Wipeinfo和校正工具,西数工具包中的wddiag, IBM的
DFT中的Erase等。这些工具之所以能在运行过后消除了一些“坏道”,很重要的原因就在这Automatic Reallcation(当然还有其它原因),而不能简单地概括这些“坏道”是什么“逻辑坏道”或“假坏道”。
如果哪位被误导中毒太深的读者不相信这个事实,等他找
到能查看G-list的专业工具后就知道,这些工具运行过后,G-list将会增加多少记录!“逻辑坏道”或“假坏道”有必要记录在G-list中并用其它扇区替换么?
当然,G-list的记录不会无限制,所有的硬盘都会限定在一定数量范围内。如火球系列限
度是500,美钻二代的限度是636,西数BB的限度是508,等等。超过限度,Automatic Reallcation就不能再起作用。这就是为何少量的“坏道”可以通过上述工具修复(有人就概括为:“逻辑坏道”可以修复),而坏道多了不能通过这些工具修复(又有人概括为:“物理坏道”不可以修复)。
其它List 某些硬盘用其它的LIST来定义坏扇区,如IBM的硬盘用X-List。
硬盘固件和硬盘参数
正常情况下,硬盘在接通电源之后,都要进行“初始化”过程(也可以称为“自检”)。这时,会发出一阵子自检声音,这些声音长短和规律视不同牌子硬盘而各不一样,但同型号的正常硬盘的自检声音是一样的。
有经验的人都知道,这些自检声音是由于硬盘内部的磁头
寻道及归位动作而发出的。为什么硬盘刚通电就需要执行这么多动作呢?简单地说,是硬盘在读取的记录在盘片中的初始化参数。
一般熟悉硬盘的人都知道,硬盘有一系列基本参数,包括:牌子、型号、容量、柱面数、磁头数、每磁道扇区数、系列号、缓存大小、转速、S.M.A.R.T值等。其中一部分参数就写在硬盘的标签上,有些则要通过软件才能测出来。但是,高朋告诉你,这些参数仅仅是初始化
参数的一小部分,盘片中记录的初始化参数有数十甚至数百个!硬盘的CPU在通电后自动寻找BIOS中的启动程序,然后根据启动程序的要求,依次在盘片中指定的位置读取相应的参数。如果某一项重要参数找不到或出错,启动程序无法完成启动过程,硬盘就进入保护模式
。在保护模式下,用户可能看不到硬盘的型号与容量等参数,或者无法进入任何读写操作。近来有些系列的硬盘就是这个原因而出现类似的通病,如:FUJITSU
MPG系列自检声正常却不认盘,MAXTOR美钻系列认不出正确型号及自检后停转,WD BB EB系列能正常认盘却拒绝读写操作等。
不同牌子不同型号的硬盘有不同的初始化参数集,以较熟悉的Fujitsu硬盘为例,高朋简要地讲解其中一部分参数,以便读者理解内部初始化参数的原理。
通过专用的程序控制硬盘的CPU,根据BIOS程序的需要,依次读出初始化参数集,按模块分别存放为69个不同的文件,文件名也与BIOS程序中调用到的参数名称一致。其中部分参数模块的简要说明如下:
DM硬盘内部的基本管理程序
- PL永久缺陷表
- TS缺陷磁道表
- HS实际物理磁头数及排列顺序
- SM最高级加密状态及密码
- SU用户级加密状态及密码
- CI 硬件信息,包括所用的CPU型号,BIOS版本,磁头种类,磁盘碟片种类等
- FI生产厂家信息
- WE写错误记录表
- RE读错误记录表
- SI容量设定,指定允许用户使用的最大容量(MAX LBA),转换为外部逻辑磁头数(一般为16)和逻辑每磁道扇区数(一般为63)
- ZP区域分配信息,将每面盘片划分为十五个区域,各个区域上分配的不同的扇区数量,从而计算出最大的物理容量。
这些参数一般存放在普通用户访问不到的位置,有些是在物理零磁道以前,可以认为是在负磁道的位置。可能每个参数占用一个模块,也可能几个参数占用同一模块。模块大小不一样,有些模块才一个字节,有些则达到64K字节。这些参数并不是连续存放的,而是各有各的固定位置。
读出内部初始化参数表后,就可以分析出每个模块是否处于正常状态。当然,也可以修正这些参数,重新写回盘片中指定的位置。这样,就可以把一些因为参数错乱而无法正常使用的硬盘“修复”回正常状态。
如果读者有兴趣进一步研究,不妨将硬盘电路板上的ROM芯片取下,用写码机读出其中的BIOS程序,可以在程序段中找到以上所列出的参数名称。
硬盘的低级格式化
不同的工具所做的低格对硬盘的作用各不一样。有些人觉得低格可以修复一部分硬盘,有些人则觉得低格十分危险,会严重损害硬盘。高朋用过多种低格工具,认为低格是修复硬盘的一个有效手段。下面总结一些关于低格的看法,与广大网友交流。
大家关心的一个问题:“低格过程到底对硬盘进行了什么操作?”实践表明低格过程有可能进行下列几项工作,不同的硬盘的低格过程相差很大,不同的软件的低格过程也相差很大。
A. 对扇区清零和重写校验值。低格过程中将每个扇区的所有字节全部置零,并将每个扇区
的校验值也写回初始值,这样可以将部分缺陷纠正过来。譬如,由于扇区数据与该扇区的校验值不对应,通常就被报告为校验错误(ECC
Error)。如果并非由于磁介质损伤,清
零后就很有可能将扇区数据与该扇区的校验值重新对应起来,而达到“修复”该扇区的功效。这是每种低格工具和每种硬盘的低格过程最基本的操作内容,同时这也是为什么通过低格能“修复大量坏道”的基本原因。另外,DM中的Zero
Fill(清零)操作与IBM DFT工具中的Erase操作,也有同样的功效。
B. 对扇区的标识信息重写。在多年以前使用的老式硬盘(如采用ST506接口的硬盘),需要在低格过程中重写每个扇区的标识(ID)信息和某些保留磁道的其他一些信息,当时低格工具都必须有这样的功能。但现在的硬盘结构已经大不一样,如果再使用多年前的工具来
做低格会导致许多令人痛苦的意外。难怪经常有人在痛苦地高呼:“危险!切勿低格硬盘!我的硬盘已经毁于低格!”
C. 对扇区进行读写检查,并尝试替换缺陷扇区。有些低格工具会对每个扇区进行读写检查,如果发现在读过程或写过程出错,就认为该扇区为缺陷扇区。然后,调用通用的自动替换扇区(Automatic
reallocation sector)指令,尝试对该扇区进行替换,也可以达到“修复”的功效。
D. 对所有物理扇区进行重新编号。编号的依据是P-list中的记录及区段分配参数(该参数决定各个磁道划分的扇区数),经过编号后,每个扇区都分配到一个特定的标识信息(ID)。编号时,会自动跳过P-list中所记录的缺陷扇区,使用户无法访问到那些缺陷扇区
(用户不必在乎永远用不到的地方的好坏)。如果这个过程半途而废,有可能导致部分甚至所有扇区被报告为标识不对(Sector
ID not found, IDNF)。要特别注意的是,这个编号过程是根据真正的物理参数来进行的,如果某些低格工具按逻辑参数(以
16heads 63sector为最典型)来进行低格,是不可能进行这样的操作。
E. 写磁道伺服信息,对所有磁道进行重新编号。有些硬盘允许将每个磁道的伺服信息重写,并给磁道重新赋予一个编号。编号依据P-list或TS记录来跳过缺陷磁道(defect
track),使用户无法访问(即永远不必使用)这些缺陷磁道。这个操作也是根据真正的物理参数来进行。
F. 写状态参数,并修改特定参数。有些硬盘会有一个状态参数,记录着低格过程是否正常结束,如果不是正常结束低格,会导致整个硬盘拒绝读写操作,这个参数以富士通IDE硬盘和希捷SCSI硬盘为典型。有些硬盘还可能根据低格过程的记录改写某些参数。
下面我们来看看一些低格工具做了些什么操作:
1. DM中的Low level format:进行了A和B操作。速度较快,极少损坏硬盘,但修复效果不明显。
2. Lformat:进行了A、B、C操作。由于同时进行了读写检查,操作速度较慢,可以替换部分缺陷扇区。但其使用的是逻辑参数,所以不可能进行D、E和F的操作。遇到IDNF错误或伺服错误时很难通过,半途会中断。
3. SCSI卡中的低格工具:由于大部SCSI硬盘指令集通用,该工具可以对部分SCSI硬盘进行A、B、C、D、F操作,对一部分SCSI硬盘(如希捷)修复作用明显。遇到缺陷磁道无法通过。同时也由于自动替换功能,检查到的缺陷数量超过G-list限度时将半途结束,硬盘进入拒绝读写状态。
4. 专业的低格工具:一般进行A、B、D、E、F操作。通常配合伺服测试功能(找出缺陷磁道记入TS),介质测试功能(找出缺陷扇区记入P-list),使用的是厂家设定的低格程序(通常存放在BIOS或某一个特定参数模块中),自动调用相关参数进行低格。一般不对缺陷扇区进行替换操作。低格完成后会将许多性能参数设定为刚出厂的状态。
在这里, 高朋顺便回答一些读者常重复问到的问题:
问1:低格能不能修复硬盘?
答:合适的低格工具能在很大程度上修复硬盘缺陷。
问2:低格会不会损伤硬盘?
答:正确的低格过程绝不会在物理上损伤硬盘。用不正确的低格工具则可能严重破坏硬盘的信息,而导致硬盘不能正常使用。
问3:什么时候需要对硬盘进行低格?
答:在修改硬盘的某些参数后必须进行低格,如添加P-list记录或TS记录,调整区段参数,调整磁头排列等。另外,
每个用户都可以用适当低格工具修复硬盘缺陷,注意:必须是适当的低格工具。
问4:什么样的低格工具才可以称为专业低格工具?
答:能调用特定型号的记录在硬盘内部的厂家低格程序,并能调用到正确参数集对硬盘进行低格,这样的低格工具均可称为专业低格工具。
|