Sziasztok!
Van egy FreePBX-Asterisk telefonszerver, amiben 2 db 240G-ás HDD van szoftveres RAID1-ben. A RAID-et az Asterisk telepítője hozta létre.
Most azt írja a GUI, hogy a RAID halott (sda2 OK; sdb(F) FAULT). Bosszantó, mert egy kevesebb, mint 2 éves gépről van szó...
Netes segítséggel lekérdeztem néhány adatot a RAID-ről:
cat mdadm kimenete: https://www.dropbox.com/scl/fi/u1ygrjvng934450ly8di1/cat_mdadm.png?rlkey=hxtmyni5f4udae9fxbuhj97nb&dl=0
cat mdstat kimenete: https://www.dropbox.com/scl/fi/2tg7n5fswvuygchbu546i/cat_mdstat.png?rlkey=2vyrcrb0nzd4utl49q7tjjsj1&dl=0
mdadm --query - md0 és mdadm --detail md0 kimenete: https://www.dropbox.com/scl/fi/qsamfqcyibe3wgevzhxel/mdadm_detail_md0.png?rlkey=stj253wvpbv7j39ztpq1nz4rn&dl=0
mdadm --query md1 és mdadm --detail md1 kimenete: https://www.dropbox.com/scl/fi/ol5d7wax1u3oh7xvej31f/mdadm_detail_md1.png?rlkey=orrfupckt42y2jw0ckt0u3hoi&dl=0
Két kérdésben kellene a segítségetek:
1. Ez alapján hogyan tudom eldönteni, melyik HDD halott? (Ne a jót vegyem ki a gépből)
2. Ha kicseréltetem és belekerül a szűz eszköz, hogyan tudom úgy beletenni a jelenlegi RAID-be, hogy az utána működőképes legyen és ne kelljen újratelepítenem a rendszert?
Gábor
Szerk.: Köszönöm mindenkinek a hathatós segítséget, jelentkezem a következő fázisnál.
Szerk. 2: Elnézést, rosszul írtam, nem 2T-ás, hanem 2 * 240G-ás SSD volt a gépben. Nem is tudom, miért írtam félre....
- 639 megtekintés
Hozzászólások
kicsit nehéz igy a vakvilágba megmondani hogyan keresd meg a disket, elég sok dolog van ami beleszól.
mivel az sdb halott (vagy annak tetteti magát) egy
sudo smartctl -a /dev/sda
megmondja az sda seriaszámát (ha le tudja kérdezni a smartctl), igy a másik disk lesz az amit cserélni kell.
vagy megnézed melyik disk melyi SATA csatira van csatlakoztatva, a nagyobbik számmal rendlekezö jó eséllyel az sdb.
ha van HBA, az SFF-8088 to 4 SATA kábelen is számzova szokott lenni hányadik SATA, ha a HBA támogatja (manual) akkor itt is megy a smartctl csak nem úgy mint fentebb.
ha keretben van akkor rá kell jönni hogyan van a sorrend.
esetleg megnézni hogy a GUI-ban nem írja-e a jó disknek a széria számát.
- A hozzászóláshoz be kell jelentkezni
smartctl: command not found.
CentOS az oprendszer (Asterisk ezzel jön), mit kellene tennem, hogy legyen ilyenem?
Válasz magamnak: yum install smartmontools
- A hozzászóláshoz be kell jelentkezni
a smartmontools csomag része
yum install smartmontools
újabb centosokon dnf is megy.
- A hozzászóláshoz be kell jelentkezni
smartctl -a /dev/sdb válasza:
Short INQUIRY response, skip product id
A mandatory SMART command failde; exiting.
Szóval az sdb teljesen halott.
- A hozzászóláshoz be kell jelentkezni
A /proc/mdstat kimenete alapján a diszkek sorrendje: sda, sdb, majd pedig U_ azaz az első used, a második meg eltűnt.
smartctl -a /dev/sda --> listázza az sda paramétereit, köztük a diszk szériaszámát is. Na ezt a szériaszámot hagyd meg a gépben, a másikat cseréld. (Nem tudom, az sdb mennyire halott, ha nem válaszol, akkor szerériaszám se lesz)
Csere után megparticionálod, ahogy az sda particionált, majd mdadm manage és hozzá adodo a megfelelő partíciókat a megfelelő raid kötetekhez.
- A hozzászóláshoz be kell jelentkezni
Értem. Ha majd ott tartok, biztos szükségem lesz ennél bővebb segítségre a beállításban. Ott kezdődik majd a dolog, hogy azt sem tudom, milyen partíció szerkezet van a lemezen, Az Asterisk telepítője teljesen automatán csinálta meg a telepítést a partícionálással, raid építéssel együtt.
- A hozzászóláshoz be kell jelentkezni
Nem is kell tudnod, klónozod (sfdisk vagy sgdisk particionalas tipusától függően ) a partíciós táblát sda ról és kész. mdadm -el meg összerakod újra (mdadm --add )
Fedora 41, Thinkpad x280
- A hozzászóláshoz be kell jelentkezni
fdisk -l /dev/sda
itt kiirja milyen particiók vannak,
felírod az sda2 éz az sda3 méretét és létrehozod ezekkel a méretekkel az sdb1 és sdb2 particiókat (!!!az md1-ben sda3 és sdb2 van párosítva, az md0-ban meg sda2 sdb1 !!!)
gondolom csak az sda-n van boot partició (sda1)
ezért szoktam a másik disken is megcsinálni ugyanazokat a particiókat hogy ezzel ne kelljen szívni és menjen az amit _ventura_ irt. az sdb1 ilyenkor üres marad, vagy ha igazán jó fej vagyok átmásolom oda is a tartalmat, így ha az sda burul meg akkor sem lesek mint Jenö a moziban, persze frissítéskor mindíg figyelni kell rá. ha még ennél is jobb fej vagyok akkor még bootolhatóvá is teszem, és felveszem a boot menübe is.
sfdisk -d /dev/sda > /tmp/part_table
grep -v ^label-id /tmp/part_table | sed -e 's/, *uuid=[0-9A-F-]*//' | sfdisk /dev/sdb
vagy ha nincs sfdisk (gpt esetén lehet nem lesz annyira jó):
dd if=/dev/sda of=partitiontable.bin bs=1 skip=446 count=64 # backup
dd if=partitiontable.bin of=/dev/sdb bs=1 seek=446 count=64 # restore
gpt esetén sem a dd, sem az sfdisk nem jó, arra ott van az sgdisk.
szerk:
az sfdisk restore-t átírtam, hogy az uuid ne ugyanaz legyen a 2 disk-en
- A hozzászóláshoz be kell jelentkezni
disk csere elött kiadnám ezt (bár már faulty, de akkor is, a remove meg kiveszi a raidböl):
sudo mdadm --fail /dev/sdb1 --remove /dev/sdb1
sudo mdadm --fail /dev/sdb2 --remove /dev/sdb2
lehet akkor is ha már benn van az új disk, csak lehet hogy a bootnál nem tetszik majd neki.
utána, ha megvannak a particiók:
sudo mdadm --add /dev/md0 /dev/sdb1
sudo mdadm --add /dev/md1 /dev/sdb2
- A hozzászóláshoz be kell jelentkezni
Ha a --remove-al kiveszem a tükör RAID-ből, nem tűnik el a jó disk is belőle?
- A hozzászóláshoz be kell jelentkezni
mivel megadod hogy melyiket vegye ki, csak azt veszi ki, ha kiveszed a jót (mert elgépeled) akkor az nem lesz benne.
ha kiveszed a rossz disket/particiót, attól még degraded módban elindul a tükör, amíg a jó disk meg nem hal.
ha beteszed az új particiókat, akkor elindul a resync, lesegetni igy tudod:
cat /proc/mdstat
- A hozzászóláshoz be kell jelentkezni
Elég sok diszken rajta van a szériaszám valahol, fizikailag.
- A hozzászóláshoz be kell jelentkezni
Sziasztok!
Most jutottam el addig, hogy kivegyem a winyót a gépből.
Betettem egy gépbe, amin WIn7 volt (épp ilyen volt kéznél).
Közölte, hogy a lemezt inicializálni kell. Ez jogos, hisz RAID-ben volt előtte.
Inicializálásnál megkérdezte, hogy MBR vagy GPT. MBR választásakor CRC hibát adott, de GPT-vel minden gond nélkül megcsinálta.
Ezek után meg tudta csinálni rajta az elsődleges partíciót, amit tudtam írni és olvasni is hiba nélkül.
Szóval előfordulhat az, hogy csak szoftveresen esett ki a RAID-ből?
Gábor
- A hozzászóláshoz be kell jelentkezni
Elöfordulhat, nekem volt egy Adaptec káryám (Adaptec RAID 6805E), a diskek JBOD-ként voltak beállítva, a raid a linuxon volt összerakva, egy disk folyamatosan kiesett a raid 5-böl.
Kábelcsere sem segített, hónapokkal késöbb szétesett az ext4 rajta (nem tudta írni a journalt, merevre fagyott a gép), mivel volt backup, nem estem 2 shake-be, úgyis be akartam üzemelni a microszerverem, vettem bele egy P222 kontrollert, átraktam a diskeket, megcsináltam a raidet, de most nem a linuxon, köszöni szépen azóta is megy az összes disk (WD Red).
nem tudom mi volt a baja, lehet táp (nem v-né és tsa), lehet hogy a desktop alaplap, vagy akár más, majd egyszer kipróbálom, a microszerverre váltás amúgy is tervben volt, csak nem volt meg a kellö motiváció.
Nálad az eredeti gép nem is látta a HDD-t, egy kábelcsere nem drága dolog.
- A hozzászóláshoz be kell jelentkezni
T-ás? G-ás?
Helyesír-ás?
- A hozzászóláshoz be kell jelentkezni
Köszönöm szépen a válaszod!
Igen, ez volt a hiba! Hogy eddig nem jöttem rá?
- A hozzászóláshoz be kell jelentkezni
Frissítés:
Sikerült az SSD beüzemelése, tökéletesen összeállít a leírások alapján a RAID, köszönöm mindenkinek a hozzászólásokat! A legjobb segítség Tom hozzászólása volt.
Egyébként, mint kiderült, nem az SSD volt a gubancos, úgy tűnik a SATA csatlakozó lehet hibás, IPon-tól visszajött az SSD azzal, hogy a tesztek alapján semmi baja. Ezután visszaraktam a gépbe, de másik portba és láss csodát, tökéletesen működik. Az alaplappal kapcsolatban pedig futok majd egy kort a céggel...
Gábor
Ui: Tom hozzászólásában olt a következő utasítás, ami elvileg a hibás disket kiveszi a raid-ből:
sudo mdadm --fail /dev/sdb1 --remove /dev/sdb1
Ezt nem így kellett volna kidni?
sudo mdadm --fail /dev/md0 --remove /dev/sdb1
Számomra legalábbis ez volna logikus....
- A hozzászóláshoz be kell jelentkezni
Nem, man mdadm:
- -r, --remove
- remove listed devices. They must not be active. i.e. they should be failed or spare devices. As well as the name of a device file (e.g. /dev/sda1) the words failed and detached can be given to --remove. The first causes all failed device to be removed. The second causes any device which is no longer connected to the system (i.e an 'open' returns ENXIO) to be removed. This will only succeed for devices that are spares or have already been marked as failed.
- -f, --fail
- mark listed devices as faulty. As well as the name of a device file, the word detached can be given. This will cause any device that has been detached from the system to be marked as failed. It can then be removed.
- A hozzászóláshoz be kell jelentkezni
Azon csúszol el, hogy itt egy parancssorban két utasítás van kiadva. Ha szétbontod, érthetőbb
sudo mdadm --fail /dev/sdb1 - megjelöli az sdb1-et, hogy az fault,
sudo mdadm --remove /dev/sdb1 - a korábban már hibásnak jelölt sdb1-et el is távolítja a tömbből
- A hozzászóláshoz be kell jelentkezni
Köszönöm, mindig tanulok valamit!
- A hozzászóláshoz be kell jelentkezni