( enpassant | 2020. 01. 16., cs – 08:15 )

Láttam big datás rendszereket, épp ezért tudom, hogy ott az adat jósága mást jelent, mint helyi szinten.

Helyi szinten azt jelenti, hogy:

  • amit ki akarunk írni adat, tényleg az kerüljön tárolásra,
  • amit beolvasunk adat, az tényleg az az adat legyen, amit a tároló tartalmaz.

Elosztott rendszereknél meg azt jelenti, hogy bejön egyszerre két helyre ugyanarra vonatkozó adat és el kell dönteni, hogy melyiket fogadjuk el. Fizikailag nincs gond egyik adattal sem, csak logikailag.

Ha helyi szinten nem azt tárolod el, ami a jó adat vagy nem azt olvasod vissza, ami a jó adat, akkor nincs semmi értelme a tárolásnak. Erre való a CRC. Ezért van komolyabb gépekben a memóriák esetén is, bár ott nagyon ritkán történik hibázás, de mégis történik. HDD, SSD-nél már sokkal gyakrabban történik, tehát ott még jobban indokolt.
Mivel ott sűrűn előfordul, ezért ott szükség van a hibajavításra is. Azért, hogy egy-két byte-os hiba miatt ne kelljen azonnal kukázni a gépet, ezért a duplikált adatból könnyen helyreállítható a hibás. Erre is való a RAID.