Ma reggel ezt találtam:
NAME STATE READ WRITE CKSUM
data DEGRADED 1.38K 0 0
raidz1-0 DEGRADED 1.38K 0 0
ad10 ONLINE 1.38K 0 0
ad12 ONLINE 0 0 0
ad14 ONLINE 0 0 0
ad16 REMOVED 0 0 0
Gyorsan leszedtem az ad16-on levő vinyót, tettem rá egy másikat. Ezután - szerencsétlen módon - kiadtam a következő parancsot:
zpool add data ad16
Ennek az lett a következménye, hogy az ad16 megjelent a pool-ban, a következő módon:
NAME STATE READ WRITE CKSUM
data DEGRADED 0 0 0
raidz1-0 DEGRADED 0 0 0
ad10 ONLINE 0 0 0
ad12 ONLINE 0 0 0
ad14 ONLINE 0 0 0
ad16 FAULTED 0 0 0 corrupted data
ad16 ONLINE 0 0 0
Az ad16 egyrészt egy "nem felhasznált online eszköz", ami nem része egyik volume-nek sem. Másrészt egy FAULTED eszköz ami része a raidz1-0 volume-nek. Azonos a nevük! Sajnos ezek után az ad16 replace nem működik:
gw# zpool replace -f data ad16 ad16
invalid vdev specification
the following errors must be manually repaired:
/dev/ad16 is part of active pool 'data'
Úgy gondolom, hogy a hozzáadott ONLINE ad16-ot el kellene távolítanom a data-ból mielőtt replace-elni tudnám a FAULTED ad16-ot. Viszont ez nem megy, mert se offline-ba nem tudom tenni, se eltávolítani nem tudom:
gw# zpool offline data ad16
gw# zpool status
pool: data
state: DEGRADED
status: One or more devices has been taken offline by the administrator.
Sufficient replicas exist for the pool to continue functioning in a
degraded state.
action: Online the device using 'zpool online' or replace the device with
'zpool replace'.
scan: scrub in progress since Thu Apr 18 03:23:06 2013
26.1G scanned out of 3.13T at 50.7M/s, 17h52m to go
0 repaired, 0.81% done
config:
NAME STATE READ WRITE CKSUM
data DEGRADED 0 0 0
raidz1-0 DEGRADED 0 0 0
ad10 ONLINE 0 0 0
ad12 ONLINE 0 0 0
ad14 ONLINE 0 0 0
ad16 OFFLINE 0 0 0
ad16 ONLINE 0 0 0
errors: No known data errors
gw# zpool remove data ad16
cannot remove ad16: only inactive hot spares, cache, top-level, or log devices can be removed
Feltételezem az a baj, hogy az "offline ad16" parancs arra az ad16 device-re vonatkozik ami FAULTED. Én a másikat szeretném offline-ba tenni és eltávolítani, de ezt nem tudom megtenni, mert azonos a nevük.
Vagy az is lehet hogy valamit nagyon összekevertem? Szerencsére nem túl gyakran megy tönkre ez a rendszer, nagyon stabil. De amikor tönkremegy akkor mindig ott tartok, hogy egy éve nem használtam ezeket a parancsokat, és nem tudom hogy javítsam meg. :-( Köszönöm!