È un film già visto troppe volte, un brutto film. Un film dell’orrore. Si rimanda il backup dei dati un giorno dopo l’altro: “tanto non succederà proprio oggi”, “devo finire il lavoro in tempo, non posso aspettare tre ore per il backup…” Poi succede. L’hard disk si rompe e ci crolla il mondo addosso. Cerchiamo disperati una ditta di recupero dati che giustamente ci spara un cifrone e mettiamo mano al portafogli, ben sapendo che non è assolutamente garantito che si riesca a recuperare qualcosa.
Tra un passaggio e l’altro di questa triste storia il solito intercalare: “l’avessi saputo prima…”.
La verità è che sì, avremmo potuto saperlo prima. Nei prossimi paragrafi parleremo proprio di questo, della possibilità di accorgerci per tempo che un hard disk o un ssd ci stanno per lasciare.
La tecnologia S.M.A.R.T.
I guasti degli Hard Disk meccanici sono prevedibili nel 60% dei casi a patto che il loro funzionamento sia costantemente monitorato. La tecnologia S.M.A.R.T., acronimo per Self-Monitoring, Analysis and Reporting Technology, si prefigge proprio questo obiettivo: monitorare costantemente il funzionamento delle unità di memorizzazione attraverso l’uso di sensori collocati nell’hardware ed elaborare queste informazioni in tempo reale allo scopo di riconoscere condizioni di criticità indicative di una prossima rottura del device.
Ad effettuare il monitoraggio costante è il firmware del controller del dispositivo che, in maniera completamente indipendente dal sistema operativo, che dei dati elaborati è un semplice fruitore, memorizza le informazioni provenienti dai sensori su un’area riservata del disco.
Attraverso utility disco è possibile sapere se il disco rigido sta funzionando regolarmente o è in sofferenza.
Per accedere a questa informazione bisogna lanciare Utility disco e scegliere dal menu Vista “Mostra tutti i dispositivi”. A questo punto, nella parte sinistra della schermata, bisognerà selezionare il disco da controllare, avendo cura di scegliere il disco fisico che ci interessa e non i contenitori ed i volumi o le partizioni che questo comprende. Si potrà quindi leggere, in corrispondenza della voce “Stato S.M.A.R.T.:” un laconico “Verificato”, che secondo il linguaggio Apple, a volte un po’ troppo sterile, significa che va tutto bene. Ogni altra voce che non sia “verificato”, “Non supportato” o i loro equivalenti in lingua inglese dovrebbero mettervi in allarme e spingervi a fare immediatamente un backup.
Coloro che, giustamente, volessero accedere ad ulteriori particolari circa la salute del disco non devono fare altro che cercare un programma per MacOS o per Windows che legga i valori dal controller e li presenti all’utente in una tabella. Esistono diverse utility che fanno questo, prima di presentarvele, però, è bene cercare di fornirvi gli strumenti necessari ad interpretarne i vari valori.
I Valori S.M.A.R.T: per gli Hard Disk Meccanici
Su wikipedia è presente una pagina che spiega in maniera esaustiva il significato dei tantissimi valori elaborati dal controller S.M.A.R.T. Non tutti questi valori sono rilevanti per capire se il disco rigido del nostro computer ci sta lasciando per strada, ci concentreremo, quindi sugli indicatori di malfunzionamento principali e, tra questi, è essenziale concentrarsi su quelli critici.
Legenda | ||
---|---|---|
ALTO |
È meglio avere un valore alto
|
|
BASSO
|
È meglio avere un valore basso
|
|
Critico
|
Potenziale indicatore di un imminente guasto elettromeccanico |
Se stai leggendo questo articolo da smartphone, ti consigliamo di leggere la tabella seguente in modalità landscape.
ID | Hex | Nome attributo | Meglio se | Descrizione | |
---|---|---|---|---|---|
01 | 01 | Read Error Rate
Critico
|
BASSO |
Indica il numero delle volte in cui è capitato un errore di lettura hardware avvenuto leggendo un dato dalla superficie del disco. Un valore diverso da zero indica un problema della superficie del disco o delle testine di lettura/scrittura. Da notare che gli hard-disk Seagate spesso riportano un valore raw, che non indica problemi e può riportare alti valori anche su dischi appena comprati.
|
|
02 | 02 | Throughput Performance | ALTO |
Ampiezza di banda del disco. Se il valore di questo attributo cala c’è un’alta probabilità che il disco abbia un problema.
|
|
03 | 03 | Spin-Up Time |
BASSO
|
Tempo medio che impiega il rotore ad accendersi (da zero RPM alla piena funzionalità [millisecondi]). | |
04 | 04 | Start/Stop Count | BASSO | Numero dei cicli di start/stop compiuti dal disco. | |
05 | 05 | Reallocated Sectors Count Critico
|
BASSO
|
Numero di settori riallocati. Quando il disco trova un errore di lettura/scrittura/verifica, marca il settore come “riallocato” e trasferisce i dati in una speciale area riservata (spare area). Questo processo è anche conosciuto come “rimappatura” e i settori “riallocati” sono chiamati “remaps”. Questo è il motivo del fatto che, nei moderni hard-disk, i settori danneggiati non possono essere trovati testando la superficie infatti tutti i settori danneggiati sono nascosti in settori riallocati. Tuttavia più settori vengono riallocati, più la velocità di lettura/scrittura diminuirà. | |
06 | 06 | Read Channel Margin | Margine di un canale mentre è in atto una lettura. La funzione di questo attributo non è specificata. | ||
07 | 07 | Seek Error Rate | BASSO | Numero degli errori di posizionamento delle testine magnetiche. Se sono presenti problemi nel sistema di posizionamento meccanico, danneggiamenti del rotore o un aumento della temperatura, il numero di errori di posizionamento aumenterà. Un elevato numero di errori di posizionamento indica un peggioramento delle condizioni della superficie del disco e del suo sistema meccanico. | |
08 | 08 | Seek Time Performance | ALTO |
Tempo medio per il posizionamento delle testine magnetiche. Se questo attributo cala, indica un problema nel sistema meccanico.
|
|
09 | 09 | Power-On Hours (POH) | BASSO |
Conteggio delle ore in cui il disco è rimasto acceso. Il valore RAW di questo attributo mostra il totale di ore (o minuti, o secondi, dipende dal costruttore) di attività del disco.
|
|
10 | 0A | Spin Retry Count
Critico
|
BASSO |
Indica i tentativi di avviamento del disco. Questo attributo registra il numero totale di tentativi di avviamento affinché il disco diventi completamente operativo (a condizione che il primo tentativo non vada a buon fine). Un aumento di questo attributo indica problemi nel sistema meccanico del disco.
|
|
11 | 0B | Recalibration Retries |
BASSO
|
Questo attributo indica il numero di volte in cui è stata richiesta la ricalibrazione (a condizione che il primo tentativo non abbia avuto successo). Un aumento di questo attributo indica problema nel sistema meccanico. | |
12 | 0C | Device Power Cycle Count | BASSO | Questo attributo indica il numero totale dei cicli di accensione/spegnimento del disco. | |
13 | 0D | Soft Read Error Rate |
BASSO
|
Errori di lettura, non correggibili, segnalati dal sistema operativo. Se questo valore è diverso da zero si consigli di fare un backup. | |
190 | BE | Airflow Temperature (WDC) | BASSO |
Valore di temperatura dell’aria presente sui dischi Western Digital (Uguale alla temperatura (C2), ma il valore indica 50 gradi in meno su alcuni modelli. Segnato come obsoleto.)
|
|
190 | BE | Temperature Difference from 100 | ALTO | Il valore è uguale a (100 – temp °C), permette ai produttori di impostare un soglia minima corrispondente alla massima temperatura. | |
191 | BF | G-sense error rate |
BASSO
|
Frequenza di errori risultanti da fattori esterni. | |
192 | C0 | Power-off Retract Count | BASSO |
Numero delle volte in cui le testine vengono spostate dalla superficie del disco. Le testine possono essere spostate senza la necessità di spegnere il disco (Emergency Retract Cycle count nei dischi Fujitsu).
|
|
193 | C1 | Load/Unload Cycle |
BASSO
|
Conteggio dei cicli di posizionamento/uscita della “parking area” (zona di posizionamento a riposo delle testine). | |
194 | C2 | Temperature |
BASSO
|
Indica la temperatura corrente interna. | |
195 | C3 | Hardware ECC Recovered | ALTO |
Indica il tempo intercorso tra la correzione di errori ECC.
|
|
196 | C4 | Reallocation Event Count
Critico
|
BASSO |
Numero delle operazioni di rimappatura. Il valore RAW di questo attributo mostra il numero totale di tentativi di trasferire i dati dai settori danneggiati all’area di spare”. Vengono contati sia i tentavi riusciti che quelli non andati a buon fine.
|
|
197 | C5 | Current Pending Sector Count
Critico
|
BASSO |
Numero di settori “instabili” (in attesa di essere rimappati). Se il settore instabile è successivamente letto o scritto con successo, il valore di questo attributo diminuirà e il settore sarà rimappato. Un errore di lettura sul settore non porterà alla sua rimappatura, questo avverrà solo nel caso di un tentativo fallito di scrittura. Questo può portare a dei problemi perché il settore non viene rimappato se le scritture derivano dalla cache, ma solo se derivano da scritture di I/O dirette.
|
|
198 | C6 | Offline Uncorrectable Sector Count | BASSO |
Numero totale di errori, non correggibili, durante la lettura/scrittura di un settore. Un aumento del valore di questo attributo indica difetti della superficie del disco e/o problemi del sistema meccanico.
|
|
199 | C7 | UltraDMA CRC Error Count | BASSO | Il numero di errori, durante il trasferimento dati via cavo, determinati dall’ICRC (Interface Cyclic Redundancy Check). | |
200 | C8 | Write Error Rate / Multi-Zone Error Rate | BASSO | Il numero totali di errori avvenuti durante la scrittura di un settore. | |
201 | C9 | Soft Read Error Rate
Critico
|
BASSO | Numero di errori off-track. Se il valore è diverso da zero si consiglia di fare un backup. | |
202 | CA | Data Address Mark errors | |||
203 | CB | Run Out Cancel | BASSO |
Numero di errori ECC.
|
|
204 | CC | Soft ECC Correction | BASSO |
Numero di errori corretti dal software ECC.
|
|
205 | CD | Thermal Asperity Rare (TAR) | BASSO |
Numero di errori dovuto a problemi termici. |
|
220 | DC | Disk Shift
Critico
|
BASSO | Spostamento del disco dal “perno” centrale, solitamente dovuto a un colpo esterno. L’unità di misura è sconosciuta. | |
221 | DD | G-Sense Error Rate | BASSO |
Numero di errori risultanti da fattori esterni come colpi o vibrazioni.
|
|
224 | E0 | Load Friction |
BASSO
|
Resistenza causata dall’attrito sulle parti meccaniche, mentre queste ultime sono in movimento. | |
225 | E1 | Load/Unload Cycle Count | BASSO |
Numero totale di cicli di caricamento.
|
|
227 | E3 | Torque Amplification Count | BASSO | Numero di tentativi di compensazione dovuti alla variazione di velocità dei dischi. | |
228 | E4 | Power-Off Retract Cycle | BASSO |
Numero di volte in cui il braccio è stato riposizionato in automatico a causa di una caduta di tensione.
|
|
231 | E7 | Temperature | BASSO | Temperatura del disco. | |
250 | FA | Read Error Retry Rate | BASSO | Numero di errori durante la lettura del disco. |
La tecnologia S.M.A.R.T. e gli SSD
La tecnologia S.M.A.R.T., come si evince da una lettura nemmeno molto attenta della tabella, è adatta agli hard disk meccanici anche se molti controller di dischi SSD nel formato da 2,5″ con interfaccia SATA, soprattutto per una questione di compatibilità, la supportano raccogliendo dati comunque interessanti sul numero di ore di funzionamento, il numero di volte in cui l’unità è stata alimentata e il “Wear Leveling Count”, contraddistinto dal parametro con ID 177, che fornisce una stima indicativa dello stato di consumo dell’SSD: varia tra 100 e 1, dove 100 vuol dire che l’SSD è praticamente nuovo mentre quando tale indicatore giunge a 1, il numero stimato di cicli di scrittura per ogni cella per cui il device è stato progettato è stato probabilmente effettuato. Ciò non vuol dire che l’SSD morirà al raggiungimento di tale soglia, potrebbe funzionare ancora per molto, ma sicuramente il rischio di malfunzionamento a breve c’è ed è bene procedere con il backup e la sostituzione dell’unità. Altri parametri indicativi del buon funzionamento dell’unità sono il 190 Airflow temperature Celsius che è bene non superi i 50 gradi, il 235 POR Recovery Count che è indicativo del numero di perdite di tensione improvvise, il 241 Total LBAs written che è indicativo del numero di blocchi scritti sul disco. Moltiplicando questo valore per la dimensione di un settore, solitamente 512 Byte, si ottiene un valore che può essere confrontato col parametro TBW (Total Bytes Written) fornito dal costruttore che indica per quante scritture di un singolo Byte l’SSD è garantito.
La tecnologia S.M.A.R.T. e gli SSD montati da Apple nei nuovi Mac
Apple non supporta più la tecnologia S.M.A.R.T. dal 2016. Le motivazioni sono chiare, si tratta di una tecnologia nata per gli hard disk meccanici, non adatta ai nuovissimi SSD di tipo NVMe. Ci sono comunque utility di terze parti come DriveDX in grado di fornire informazioni che ci aiutino a capire in che condizioni versa L’Unità.
Alcune Utility per visualizzare lo stato S.M.A.R.T. su MacOS e Windows.
Oltre al già citato DriveDX vale la pena di nominare SMART Utility,che non solo visualizza i singoli attributi per vedere il loro stato, ma utilizza anche un algoritmo proprietario basato su tali attributi in grado rilevare il guasto delle unità prima che il sistema SMART indichi la prossima rottura.
Sul fronte Windows uno dei programmi gratuiti più semplici da usare è CrystalDiskInfo che offre anche una comodissima versione portable.
Il suo utilizzo è molto semplice, subito dopo il lancio viene proposta una schermata che nella parte superiore riporta subito lo stato del disco con una percentuale che ne indica lo stato di usura.
Sempre per Windows va assolutamente citato HDSentinel un programma molto ben fatto a pagamento nella sua versione completa. Le informazioni sullo stato di salute dell’hard disk sono moltissime e sono presenti dei commenti e dei consigli tecnici molto chiari, che facilitano la comprensione dei dati riportati.
Conclusioni
Il sistema S.M.A.R.T., le utility che vi abbiamo presentato e le altre che potete trovare in rete, ci offrono molte possibilità per capire se i nostri dati sono in pericolo. Come abbiamo detto all’inizio, però, la previsione di un guasto imminente è possibile solo nel 60% dei casi. Conviene allora organizzare un sistema di backup basato su architettura raid come quelle proposte da Qnap o sul cloud avendo cura, in questo caso, di scegliere servizi seri ed affidabili come può essere iCloud della Apple che con una piccola cifra mensile permette di fare stare serena tutta la famiglia.
ApplePhilosophy original content – riproduzione consentita citando la fonte.
SUPPORTA Apple Philosophy
Ti sarai reso conto di quanto siano particolari gli articoli pubblicati su ApplePhilosophy. Non sono le scopiazzature da 9to5mac.com che spesso si trovano su altri siti. Sono il frutto di un lavoro serio di approfondimento che richiede tempo, impegno e passione. Se stai per fare un acquisto su Amazon e desideri supportare Applephilosophy, clicca sul banner qui sotto. Per ogni acquisto il blog riceverà una piccolissima percentuale. Ovviamente NON spenderai un centesimo di più di quanto avresti speso per gli stessi acquisti andando direttamente su Amazon.