Glossario • F

FAULT-TOLERANCE


Fault Tolerance (tolleranza ai guasti) è la capacità che un sistema a fornire il servizio per il quale è stato predisposto anche in presenza di situazione di errore. Questo può essere realizzato tramite la duplicazione di parti o dell'intero sistema. Questi accorgimenti tecnologici riguardano specialmente le memorie di massa nei server in rete e riguardano sistemi di medie e grandi dimensioni. La tolleranza ai guasti è uno degli aspetti che costituiscono l'affidabilità ed è importante considerare che non viene garantita l'immunità da qualsiasi tipo di errore. L'aumento del fault tolerance diminuisce il livello delle altre prestazioni, per cui bisogna ottimizzare il grado di progettazione. Il fault tolerance varia per tipologia a seconda dell'aspetto al quale viene applicata e può avere tipi di implementazione molto differenti fra loro. Esistono 3 tipi di livelli per realizzarlo:

  1. Il metodo più semplice si chiama mirroring e consente di avere nelle unità di memoria di massa due copie identiche dello stesso disco ( oppure solo di alcuni archivi particolarmente importanti e preselezionati ); quando un' operazione di I/O riscontra un errore, l'elaborazione non viene interrotta potendo essa usare la copia alternativa.
  2. Un secondo livello di tolleranza del guasto viene realizzato con la tecnica del duplexing, che consiste nella duplicazione dell'unità di controllo dei dischi ( controller ) oltre che dei dischi . L'utente può continuare ad elaborare anche nel caso di un guasto al controller o al disco, e diminuiscono i dischi di interruzione.
  3. Il terzo livello riguarda la duplicazione dell'intero sistema, del server nel caso di reti locali e del mainframe nel caso di un sistema di grandi dimensioni.

Esistono tuttavia anche altre tecniche che consistono nel distribuire i dati su un gruppo di dischi, in modo che sia possibile ricostruire per via matematica tutti i dati eventualmente persi da uno dei dischi - tecnica RAID (Redundant Array Of Inexpensive Disk).