A Proxmox alatt egy ZFS van, ami RAID0-be van (kísérleti cuccnak jó és kell a hely).
Az egész sztori a múlt héten kezdődött, amikor volt egy linux frissítés. Másnap ez a mail fogadott a szervertől:
The number of I/O errors associated with a ZFS device exceeded
acceptable levels. ZFS has marked the device as faulted.
impact: Fault tolerance of the pool may be compromised.
eid: 21
class: statechange
state: FAULTED
host: pve
time: 2020-02-07 16:18:12+0100
vpath: /dev/sdc1
vphys: pci-0000:00:1f.2-ata-4
vguid: 0x51FA9E4D76A3E72E
devid: ata-WDC_WD20EARX-00PASB0_WD-WCAZAC153095-part1
pool: 0xC8E728B9CD2A9090
A merevlemez eltűnt a linux alól, még a blkid se látta. restart után ismét megjelent, és egy resilver után, minden ment tovább, minden hiba és adatvesztés nélkül.
ZFS has finished a resilver:
eid: 11
class: resilver_finish
host: pve
time: 2020-02-07 17:10:56+0100
pool: omv_data
state: ONLINE
scan: resilvered 16.4G in 0 days 00:05:21 with 0 errors on Fri Feb 7 17:10:56 2020
config:
NAME STATE READ WRITE CKSUM
omv_data ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
sdc ONLINE 0 0 0
sdb ONLINE 0 0 0
errors: No known data errors
A S.M.A.R.T. semmilyen hibát nem talál, látszólag minden rendben.
Ma délelőtt ismét eltűnt a merevlemez. A múlt héthez képest annyi a különbség, hogy most kicseréltem az adatkábelt, majd ismét resilver és minden megy tovább.
Mivel a Raid 0 nem hibatűrő, viszont az adatok, a mentések szerint intaktak, továbbá a S.M.A.R.T. nem dob hibát, én úgy gondolom, nem a merevlemez a ludas, de érdekelne, kinek, mi a véleménye!
Nem éles, kísérleti/home rendszer, tehát némi, max. 1 napos kiesés simán elfogadható, ennyi idő alatt a mentésből pótolhatóak az adatok, ezért marad a RAID 0, továbbá a gép se bír el több merevlemezt. Amíg a Proxmox alatti tűzfal megy, senki se panaszkodik.