viernes, 30 de agosto de 2013

Entendiendo los valores S.M.A.R.T. de los discos duros

En varias ocasiones ya he mencionado la tecnolog铆a S.M.A.R.T. (Self Monitoring Analysis and Reporting Technology) de los discos duros y que quiz谩s ya conozcas, en caso contrario es m谩s que recomendable que le dediques unos minutos para leer esta entrada y entender qu茅 es y c贸mo funciona, y de paso c贸mo puede salvarte de la cat谩strofe de perder un disco duro y los datos que en 茅l residan..


S.M.A.R.T. es una tecnolog铆a que monitoriza el funcionamiento del disco y va recopilando valores que superada una tasa de errores en ciertas acciones nos da a entender la pr贸xima falla del disco duro. Para poder acceder a esta informaci贸n se requiere que el disco duro lo admita (los discos actuales lo soportan), debe ser compatible con los sistemas BIOS/Open Firmware/EFI y adem谩s estar activado, l贸gicamente.

Mientras S.M.A.R.T. est谩 en funcionamiento (no repercute en el rendimiento del disco) se van registrando valores como velocidad de los platos internos, errores de calibraci贸n y CRC, sectores defectuosos que se van generando, temperatura del disco y un largo etc. Toda esta informaci贸n se registra en una escala comprendida entre 1 y 253, generalmente a mayor valor mejor estado del disco, y se ofrece en los siguientes valores:

  • Value (Valor): Valor de un atributo determinado
  • Threshold / Warning (Umbral): Es valor el l铆mite que puede alcanzar el atributo, si el registro de Value es menor a este valor se considera que se est谩n recogiendo un n煤mero de errores m谩s alto de lo normal y que predicen un pr贸ximo fallo f铆sico del disco.
  • Worst (Peor): Es el peor valor recogido por el atributo durante su funcionamiento


ID/HexAtributoDescripci贸n
1/01Raw Read Error RateFrecuencia de errores en una lectura RAW desde disco.
2/02Throughput performanceEficiencia media del disco duro.
3/03Spin up timeTiempo necesario para girar.
4/04Start/Stop countN煤mero de inicios y paradas del eje del disco.
5/05Reallocated sector countCantidad de sectores remapeados por defectos.
6/06Read channel marginReserva de canales en operaciones de lectura.
7/07Seek error rateFrecuencia de errores en posicionamiento.
8/08Seek timer performanceEficiencia media de operaciones de posicionamiento.
9/09Power-on hours countN煤mero de horas transcurridas en funcionamiento.
10/0ASpin retry countN煤mero de intentos de giro.
11/0BCalibration retry countN煤mero de intentos de calibraci贸n del dispositivo.
12/0CPower cycle countN煤mero de eventos de encendido.
13/0DSoft read error rateFrecuencia de errores de lectura v铆a software.
191/BFG-sense error rateFrecuencia de errores como resultado de impactos internos.
192/C0Power-off retract countN煤mero de eventos de apagado.
193/C1Load/Unload cycle countN煤mero de ciclos Load/Unload.
194/C2HDA temperaturaInformativo. Muestra la temperatura del disco.
195/C3Hardware ECC recoveredN煤mero de errores recuperados on-the-fly (En discos MAXTOR).
196/C4Reallocation countN煤mero de operaciones de remapeado.
197/C5Current pending sector countN煤mero de sectores inestables (esperando por remapeado).
198/C6Offline scan uncorrectable countN煤mero de errores sin corregir.
199/C7UDMA CRC error rateN煤mero de errores de CRC durante modo UltraDMA.
200/C8Write error rateFrecuencia de errores en operaciones de escritura.
201/C9Soft read error rateN煤mero de errores al intentar acceder a la pista siguiente.
202/CAData Address Mark errorsN煤mero de errores de Marca de datos (DAM).
203/CBRun out cancelN煤mero de errores de detecci贸n de memoria.
204/CCSoft ECC correctionN煤mero de errores corregidos por un software de detecci贸n de errores.
205/CDThermal asperity rate (TAR)N煤mero de errores de temperatura.
206/CEFlying heightAltura de las cabezas sobre la superficie del disco.
207/CFSpin high currentCantidad m谩s alta actual para girar el dispositivo.
208/D0Spin buzzN煤mero de rutinas para girar el dispositivo.
209/D1Offline seek performanceRendimiento de b煤squeda durante operaciones de apagado.
220/DCDisk shiftCambio de disco.
221/DDG-sense error rateN煤mero de errores como resultado de impactos detectados.
222/DELoaded hoursN煤mero de horas en estado operacional.
223/DFLoad/unload retry countCarga causada por operaciones de recurrencia (lectura, grabaci贸n, posicionamiento, …).
224/E0Load frictionCarga causada por la fricci贸n mec谩nica.
225/E1Load/Unload cycle countN煤mero total de ciclos de carga.
226/E2Load-in timeTiempo de carga en disco.
227/E3Torque amplification countCantidad de rotaciones.
228/E4Power-off retract countN煤mero de eventos de apagado.
230/E6GMR head amplitudeAmplitud de las cabezas (GMR-head).
231/E7TemperatureTemperatura de la unidad.
240/F0Head flying hoursTiempo transcurrido en operaciones de posicionamiento.
250/FARead error retry rateN煤mero de errores en operaciones de lectura.

En un Synology puedes consultar los valores SMART de cada disco en el Administrador de Almacenamiento / Administraci贸n de Disco Duro / S.M.A.R.T:



Es importante vigilar siempre los valores S.M.A.R.T. de nuestros discos duros sean internos de un ordenador o trabajen en un NAS, puesto que nos ayudar谩 a hacernos una idea de cuando un disco deja de ser fiable o cuando puede ser posible que falle.

2 comentarios:

Para una mejor informacion haria falta explicar mas los valores.
Yo aun no entiendo su significado en los casos concretos.

como se ve que no sabes nada, lo nombres de los valores smart los sabe todo el mundo, el tema es saber interpretarlo que se ve que no sabes

Publicar un comentario

Share

Twitter Delicious Facebook Digg Stumbleupon Favorites More