FreePBX - Asterisk szerverben elhalálozott RAID - Köszönöm a válaszokat!

Fórumok

Sziasztok!

Van egy FreePBX-Asterisk telefonszerver, amiben 2 db 240G-ás HDD van szoftveres RAID1-ben. A RAID-et az Asterisk telepítője hozta létre.

Most azt írja a GUI, hogy a RAID halott (sda2 OK; sdb(F) FAULT). Bosszantó, mert egy kevesebb, mint 2 éves gépről van szó...
Netes segítséggel lekérdeztem néhány adatot a RAID-ről:
 

cat mdadm kimenete: https://www.dropbox.com/scl/fi/u1ygrjvng934450ly8di1/cat_mdadm.png?rlkey=hxtmyni5f4udae9fxbuhj97nb&dl=0

cat mdstat kimenete: https://www.dropbox.com/scl/fi/2tg7n5fswvuygchbu546i/cat_mdstat.png?rlkey=2vyrcrb0nzd4utl49q7tjjsj1&dl=0

mdadm --query - md0 és mdadm --detail md0 kimenete: https://www.dropbox.com/scl/fi/qsamfqcyibe3wgevzhxel/mdadm_detail_md0.png?rlkey=stj253wvpbv7j39ztpq1nz4rn&dl=0

mdadm --query md1 és mdadm --detail md1 kimenete: https://www.dropbox.com/scl/fi/ol5d7wax1u3oh7xvej31f/mdadm_detail_md1.png?rlkey=orrfupckt42y2jw0ckt0u3hoi&dl=0

Két kérdésben kellene a segítségetek:

1. Ez alapján hogyan tudom eldönteni, melyik HDD halott? (Ne a jót vegyem ki a gépből)

2. Ha kicseréltetem és belekerül a szűz eszköz, hogyan tudom úgy beletenni a jelenlegi RAID-be, hogy az utána működőképes legyen és ne kelljen újratelepítenem a rendszert?

Gábor

 

Szerk.: Köszönöm mindenkinek a hathatós segítséget, jelentkezem a következő fázisnál.

 

Szerk. 2: Elnézést, rosszul írtam, nem 2T-ás, hanem 2 * 240G-ás SSD volt a gépben. Nem is tudom, miért írtam félre....

Hozzászólások

Szerkesztve: 2023. 11. 09., cs – 09:26

kicsit nehéz igy a vakvilágba megmondani hogyan keresd meg a disket, elég sok dolog van ami beleszól.

mivel az sdb halott (vagy annak tetteti magát) egy

sudo smartctl -a /dev/sda

megmondja az sda seriaszámát (ha le tudja kérdezni a smartctl), igy a másik disk lesz az amit cserélni kell.

vagy megnézed melyik disk melyi SATA csatira van csatlakoztatva, a nagyobbik számmal rendlekezö jó eséllyel az sdb.

ha van HBA, az SFF-8088 to 4 SATA kábelen is számzova szokott lenni hányadik SATA, ha a HBA támogatja (manual) akkor itt is megy a smartctl csak nem úgy mint fentebb.

ha keretben van akkor rá kell jönni hogyan van a sorrend.

esetleg megnézni hogy a GUI-ban nem írja-e a jó disknek a széria számát.

A /proc/mdstat kimenete alapján a diszkek sorrendje: sda, sdb, majd pedig U_ azaz az első used, a második meg eltűnt.

smartctl -a /dev/sda --> listázza az sda paramétereit, köztük a diszk szériaszámát is. Na ezt a szériaszámot hagyd meg a gépben, a másikat cseréld. (Nem tudom, az sdb mennyire halott, ha nem válaszol, akkor szerériaszám se lesz)

Csere után megparticionálod, ahogy az sda particionált, majd mdadm manage és hozzá adodo a megfelelő partíciókat a megfelelő raid kötetekhez.

Értem. Ha majd ott tartok, biztos szükségem lesz ennél bővebb segítségre a beállításban. Ott kezdődik majd a dolog, hogy azt sem tudom, milyen partíció szerkezet van a lemezen, Az Asterisk telepítője teljesen automatán csinálta meg a telepítést a partícionálással, raid építéssel együtt.

fdisk -l /dev/sda

itt kiirja milyen particiók vannak,

felírod az sda2 éz az sda3 méretét és létrehozod ezekkel a méretekkel az sdb1 és sdb2 particiókat (!!!az md1-ben sda3 és sdb2 van párosítva, az md0-ban meg sda2 sdb1 !!!)

gondolom csak az sda-n van boot partició (sda1)

ezért szoktam a másik disken is megcsinálni ugyanazokat a particiókat hogy ezzel ne kelljen szívni és menjen az amit _ventura_ irt. az sdb1 ilyenkor üres marad, vagy ha igazán jó fej vagyok átmásolom oda is a tartalmat, így ha az sda burul meg akkor sem lesek mint Jenö a moziban, persze frissítéskor mindíg figyelni kell rá. ha még ennél is jobb fej vagyok akkor még bootolhatóvá is teszem, és felveszem a boot menübe is.

sfdisk -d /dev/sda > /tmp/part_table
grep -v ^label-id /tmp/part_table | sed -e 's/, *uuid=[0-9A-F-]*//' | sfdisk /dev/sdb

vagy ha nincs sfdisk (gpt esetén lehet nem lesz annyira jó):

dd if=/dev/sda of=partitiontable.bin bs=1 skip=446 count=64 # backup
dd if=partitiontable.bin of=/dev/sdb bs=1 seek=446 count=64 # restore

gpt esetén sem a dd, sem az sfdisk nem jó, arra ott van az sgdisk.

szerk:

az sfdisk restore-t átírtam, hogy az uuid ne ugyanaz legyen a 2 disk-en

forrás

disk csere elött kiadnám ezt (bár már faulty, de akkor is, a remove meg kiveszi a raidböl):

sudo mdadm --fail /dev/sdb1 --remove /dev/sdb1
sudo mdadm --fail /dev/sdb2 --remove /dev/sdb2

lehet akkor is ha már benn van az új disk, csak lehet hogy a bootnál nem tetszik majd neki.

utána, ha megvannak a particiók:

sudo mdadm --add /dev/md0 /dev/sdb1
sudo mdadm --add /dev/md1 /dev/sdb2

mivel megadod hogy melyiket vegye ki, csak azt veszi ki, ha kiveszed a jót (mert elgépeled) akkor az nem lesz benne.

ha kiveszed a rossz disket/particiót, attól még degraded módban elindul a tükör, amíg a jó disk meg nem hal.

ha beteszed az új particiókat, akkor elindul a resync, lesegetni igy tudod:

cat /proc/mdstat

Sziasztok!

Most jutottam el addig, hogy kivegyem a winyót a gépből.

Betettem egy gépbe, amin WIn7 volt (épp ilyen volt kéznél).

Közölte, hogy a lemezt inicializálni kell. Ez jogos, hisz RAID-ben volt előtte.

Inicializálásnál megkérdezte, hogy MBR vagy GPT. MBR választásakor CRC hibát adott, de GPT-vel minden gond nélkül megcsinálta.

Ezek után meg tudta csinálni rajta az elsődleges partíciót, amit tudtam írni és olvasni is hiba nélkül.

Szóval előfordulhat az, hogy csak szoftveresen esett ki a RAID-ből?

Gábor

Elöfordulhat, nekem volt egy Adaptec káryám (Adaptec RAID 6805E), a diskek JBOD-ként voltak beállítva, a raid a linuxon volt összerakva, egy disk folyamatosan kiesett a raid 5-böl.

Kábelcsere sem segített, hónapokkal késöbb szétesett az ext4 rajta (nem tudta írni a journalt, merevre fagyott a gép), mivel volt backup, nem estem 2 shake-be, úgyis be akartam üzemelni a microszerverem, vettem bele egy P222 kontrollert, átraktam a diskeket, megcsináltam a raidet, de most nem a linuxon, köszöni szépen azóta is megy az összes disk (WD Red).

nem tudom mi volt a baja, lehet táp (nem v-né és tsa), lehet hogy a desktop alaplap, vagy akár más, majd egyszer kipróbálom, a microszerverre váltás amúgy is tervben volt, csak nem volt meg a kellö motiváció.

Nálad az eredeti gép nem is látta a HDD-t, egy kábelcsere nem drága dolog.

Frissítés:

Sikerült az SSD beüzemelése, tökéletesen összeállít a leírások alapján a RAID, köszönöm mindenkinek a hozzászólásokat! A legjobb segítség Tom hozzászólása volt.

Egyébként, mint kiderült, nem az SSD volt a gubancos, úgy tűnik a SATA csatlakozó lehet hibás, IPon-tól visszajött az SSD azzal, hogy a tesztek alapján semmi baja. Ezután visszaraktam a gépbe, de másik portba és láss csodát, tökéletesen működik. Az alaplappal kapcsolatban pedig futok majd egy kort a céggel...

Gábor

Ui: Tom hozzászólásában olt a következő utasítás, ami elvileg a hibás disket kiveszi a raid-ből:

sudo mdadm --fail /dev/sdb1 --remove /dev/sdb1

Ezt nem így kellett volna kidni?

sudo mdadm --fail /dev/md0 --remove /dev/sdb1

Számomra legalábbis ez volna logikus....
 

Nem, man mdadm:

-r--remove
remove listed devices. They must not be active. i.e. they should be failed or spare devices. As well as the name of a device file (e.g. /dev/sda1) the words failed and detached can be given to --remove. The first causes all failed device to be removed. The second causes any device which is no longer connected to the system (i.e an 'open' returns ENXIO) to be removed. This will only succeed for devices that are spares or have already been marked as failed.
-f--fail
mark listed devices as faulty. As well as the name of a device file, the word detached can be given. This will cause any device that has been detached from the system to be marked as failed. It can then be removed.