Sziasztok,
1. Adott egy ZFS egy 2TB-s SSD-n, amire sajnos a SMART azt irja, hogy hibas blokkok keletkeztek. A ZFS epp ezert irja, hogy bizonyos fajlok elerhetetlenek es az egesz disk DEGRADED allapotba kerult. Ennek kapcsan vegiggondoltam, hogy valojaban mire is van szuksegem: egyreszt szeretnem, hogy RAID-el noveljem a rendelkezesre allast, masreszt mindig legyen backup egy levalasztott kulso adattartolon. Ezzel kapcsolatban kernem a hozzaertok segitseget, hogy jol iranyba gondolkodom illetve milyen konkret lepeseket kell tenni.
2. A SMART jelenleg igy nez ki:
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 42 Celsius
Available Spare: 95%
Available Spare Threshold: 10%
Percentage Used: 4%
Data Units Read: 140.108.472 [71,7 TB]
Data Units Written: 272.305.604 [139 TB]
Host Read Commands: 5.119.874.183
Host Write Commands: 7.313.948.105
Controller Busy Time: 14.012
Power Cycles: 617
Power On Hours: 4.3465
Unsafe Shutdowns: 355
Media and Data Integrity Errors: 4.888
Error Information Log Entries: 4.888
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Temperature Sensor 1: 44 Celsius
Temperature Sensor 2: 57 Celsius
Thermal Temp. 1 Transition Count: 2
Thermal Temp. 1 Total Time: 62
Jol gondolom, hogy a "Media and Data Integrity Errors" jelzi a rossz blokkokat? Van esetleg valamilyen Samsung SSD specifikus tool amivel bovebb info nyerheto ki es fut linuxon? (vagy Windows virtualis gep alol). Samsung magician regebbei verziojat probaltam, az nem ismerte fel az SSD-t. Amit meg nem ertek itt, hogy amikor eszlelte hogy problema van adott blokkokkal akkor mar at is allokalt a rossz blokkokrol a jo blokkokra? Tehat ugyan elveszett az eredeti adat a rossz blokkokban, de ha ujra oda tarolna a rendszer valamit, akkor mar ujra jo lenne?
3. a ZFS pool status:
pool: rpool
state: DEGRADED
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: https://openzfs.github.io/openzfs-docs/msg/ZFS-8000-8A
scan: scrub repaired 0B in 00:20:02 with 109 errors on Sun Sep 11 00:44:04 2022
config:
NAME STATE READ WRITE CKSUM
ssdpool DEGRADED 0 0 0
internal-ssd DEGRADED 0 0 0 too many errors
errors: Permanent errors have been detected in the following files:
<0x8025>:<0x4dadc6>
<0x8025>:<0x5156d6>
<0x8025>:<0x4cebe0>
ssdpool/ROOT/ubuntu_be65hc/var/lib/docker/c6d1d0cc3fb9e09a9afd9758d6e8b1cab4ee02b26eba23808452dc436cc6a2d0@75126264:/usr/share/lxc
ssdpool/USERDATA/user_be65hc@backup-20220105151646:/Desktop/TrY-yKe5qRE.mp4
Ezek lennenek a hibas fajlok. Elozoleg az elso harmat is ugy irta ki, mint az utolso kettot (tehat teljes eleresi uttal), de proba jelleggel letoroltem oket, mivel annyira nem voltak fontosak es arra szamitottam, hogy akkor eltunik a listabol (es azokat a szektorokat a ZFS se hasznalja tobbet), ehelyett atvaltott erre a hexa kijelzeses modra. Scrubbal vagy barmi massal tudok ilyenkor probalkozni? Hogyan lehet megertetni a ZFS-el, hogy felejtse el az elveszett adatokat es tesztelje ujra az adott blokkokat, hogy jol mukodnek es ha igen, ujra tegyen oda adatot?
4. Az SSD meg garancia idos, viszont a garanciaztatas kb 1 honapot is igenybe vehet. Arra gondoltam, hogy veszek egy ugyanilyen SSD-t, RAID mirrort alakitok ki, particionalom, beteszem az uj meghajtot a poolba, megvarom, hogy a ZFS mindent atmasoljon, majd a hibas meghajtot elviszem gariztatni es addig a rendszert a masik SSD-rol hasznalom. Ha az uj meghajto visszakerult, azt is particionalom, beteszem a poolba es akkor van egy tejles RAID mirror rendszerem. Mire erdemes figyelni? Gondolok itt pl arra, hogy particionalaskor gondolom bytera ugyanakkor meretu particiokat kell letrehozni es mindent ugyanugy elrendezni mint az eredeti meghajton, kulonben a mirror nem fog mukodni a meretkulonbseg miatt?! A gariztatando SSD-t eltavolitom, a ZFS a maradek 1 SSD-vel gond nelkul fog mukodni tovabb vagy van valami teendo?
5. Milyen modon erdemes egy 2TB-s mirrorba tett SSD tombrol backupot kesziteni? Arra gondoltam, hogy egy kulso HDD-re zfs autobackuppal es zfs send-el csinalok idonkent snapshotokat (ez ugye kb 2TB helyet igenyel, plusz amennyi a snapshotokhoz meg szukseges). Ezen kivul nagyobb rendszer upgradekkor esetleg diszk image szinten is lementem az egeszet, hogy konnyen vissza lehessen allitani. Tehat osszessegeben min 6, de inkabb 8-10TB meretu HDD kell nekem. Jol latom? Konkret jotanacsok esetleg tipussal kapcsolatban?
6. ZFS online backupjara ha van valakinek bevalt modszere/szolgaltatoja, szinten erdekes lehet.
Elore is koszonom a segitseget!