viernes, 30 de agosto de 2013

Entendiendo los valores S.M.A.R.T. de los discos duros

En varias ocasiones ya he mencionado la tecnología S.M.A.R.T. (Self Monitoring Analysis and Reporting Technology) de los discos duros y que quizás ya conozcas, en caso contrario es más que recomendable que le dediques unos minutos para leer esta entrada y entender qué es y cómo funciona, y de paso cómo puede salvarte de la catástrofe de perder un disco duro y los datos que en él residan..


S.M.A.R.T. es una tecnología que monitoriza el funcionamiento del disco y va recopilando valores que superada una tasa de errores en ciertas acciones nos da a entender la próxima falla del disco duro. Para poder acceder a esta información se requiere que el disco duro lo admita (los discos actuales lo soportan), debe ser compatible con los sistemas BIOS/Open Firmware/EFI y además estar activado, lógicamente.

Mientras S.M.A.R.T. está en funcionamiento (no repercute en el rendimiento del disco) se van registrando valores como velocidad de los platos internos, errores de calibración y CRC, sectores defectuosos que se van generando, temperatura del disco y un largo etc. Toda esta información se registra en una escala comprendida entre 1 y 253, generalmente a mayor valor mejor estado del disco, y se ofrece en los siguientes valores:

  • Value (Valor): Valor de un atributo determinado
  • Threshold / Warning (Umbral): Es valor el límite que puede alcanzar el atributo, si el registro de Value es menor a este valor se considera que se están recogiendo un número de errores más alto de lo normal y que predicen un próximo fallo físico del disco.
  • Worst (Peor): Es el peor valor recogido por el atributo durante su funcionamiento


ID/HexAtributoDescripción
1/01Raw Read Error RateFrecuencia de errores en una lectura RAW desde disco.
2/02Throughput performanceEficiencia media del disco duro.
3/03Spin up timeTiempo necesario para girar.
4/04Start/Stop countNúmero de inicios y paradas del eje del disco.
5/05Reallocated sector countCantidad de sectores remapeados por defectos.
6/06Read channel marginReserva de canales en operaciones de lectura.
7/07Seek error rateFrecuencia de errores en posicionamiento.
8/08Seek timer performanceEficiencia media de operaciones de posicionamiento.
9/09Power-on hours countNúmero de horas transcurridas en funcionamiento.
10/0ASpin retry countNúmero de intentos de giro.
11/0BCalibration retry countNúmero de intentos de calibración del dispositivo.
12/0CPower cycle countNúmero de eventos de encendido.
13/0DSoft read error rateFrecuencia de errores de lectura vía software.
191/BFG-sense error rateFrecuencia de errores como resultado de impactos internos.
192/C0Power-off retract countNúmero de eventos de apagado.
193/C1Load/Unload cycle countNúmero de ciclos Load/Unload.
194/C2HDA temperaturaInformativo. Muestra la temperatura del disco.
195/C3Hardware ECC recoveredNúmero de errores recuperados on-the-fly (En discos MAXTOR).
196/C4Reallocation countNúmero de operaciones de remapeado.
197/C5Current pending sector countNúmero de sectores inestables (esperando por remapeado).
198/C6Offline scan uncorrectable countNúmero de errores sin corregir.
199/C7UDMA CRC error rateNúmero de errores de CRC durante modo UltraDMA.
200/C8Write error rateFrecuencia de errores en operaciones de escritura.
201/C9Soft read error rateNúmero de errores al intentar acceder a la pista siguiente.
202/CAData Address Mark errorsNúmero de errores de Marca de datos (DAM).
203/CBRun out cancelNúmero de errores de detección de memoria.
204/CCSoft ECC correctionNúmero de errores corregidos por un software de detección de errores.
205/CDThermal asperity rate (TAR)Número de errores de temperatura.
206/CEFlying heightAltura de las cabezas sobre la superficie del disco.
207/CFSpin high currentCantidad más alta actual para girar el dispositivo.
208/D0Spin buzzNúmero de rutinas para girar el dispositivo.
209/D1Offline seek performanceRendimiento de búsqueda durante operaciones de apagado.
220/DCDisk shiftCambio de disco.
221/DDG-sense error rateNúmero de errores como resultado de impactos detectados.
222/DELoaded hoursNúmero de horas en estado operacional.
223/DFLoad/unload retry countCarga causada por operaciones de recurrencia (lectura, grabación, posicionamiento, …).
224/E0Load frictionCarga causada por la fricción mecánica.
225/E1Load/Unload cycle countNúmero total de ciclos de carga.
226/E2Load-in timeTiempo de carga en disco.
227/E3Torque amplification countCantidad de rotaciones.
228/E4Power-off retract countNúmero de eventos de apagado.
230/E6GMR head amplitudeAmplitud de las cabezas (GMR-head).
231/E7TemperatureTemperatura de la unidad.
240/F0Head flying hoursTiempo transcurrido en operaciones de posicionamiento.
250/FARead error retry rateNúmero de errores en operaciones de lectura.

En un Synology puedes consultar los valores SMART de cada disco en el Administrador de Almacenamiento / Administración de Disco Duro / S.M.A.R.T:



Es importante vigilar siempre los valores S.M.A.R.T. de nuestros discos duros sean internos de un ordenador o trabajen en un NAS, puesto que nos ayudará a hacernos una idea de cuando un disco deja de ser fiable o cuando puede ser posible que falle.

1 comentarios:

Para una mejor informacion haria falta explicar mas los valores.
Yo aun no entiendo su significado en los casos concretos.

Publicar un comentario

Share

Twitter Delicious Facebook Digg Stumbleupon Favorites More