[Megoldva] Lucid server + softRAID = gave up waiting for root device

Fórumok

Sziasztok!
Ide is megírnám a problémám, hátha itt hamarabb találok megoldást (az eredeti fórumtéma itt)

10.04 x64 telepítésével próbálkozok (de a 10.10-et is próbáltam már) a következő konfigra:
Intel S3210SH server board
Xeon 2,33GHz
4gb ECC RAM
Intel Matrix Storage félhardveres RAID vezérlő (szerintem ez lesz a probléma oka)
2xSamsung 500GB, 2xWD Raptor 74GB

Először a RAID vezérlővel próbáltam a tömböket összehozni, de miután nem sikerült (meg azt olvastam, hogy a szoftveres se rosszabb, sőt!), inkább sw raidet szeretnék összehozni.
Valahogy így nézne ki:
md0(raid1) -> / -> sda1, sdb1 (50 gb)
md1(raid0) -> /home -> sda2, sdb2 (900gb)
md2(raid0) -> swap -> sdc1, sdd1 (8gb)
md3(raid0) -> (sehova, majd squid cache lesz) -> sdc2, sd2 (140 gb)

ennek így elvileg működnie kellene, virtuális gépben kipróbáltam.

A telepítő elvileg gond nélkül lefut, de újrainduláskor csak az initramfs-ig jut, azt írja, hogy a root device nem érhető el.
ls /dev/md* szertint tényleg CSAK az az egy nem megy, md1, md2, md3 igen.
ls /dev/sd* szerint az összes winyó létezik.
cat /proc/modules -ben benne van az összes raid meg az ahci is.
grub benne van sda és sdb MBR-jében is, a konfigja is elvileg jó (uuid alapján keresi a root device-t, ami elvileg stimmelne, de induláskor ezt nem találja)

A telepítő helyreállító módjából chrootolva működik a rendszer (pl grub-install -t sikerült lefuttatni innen is)

A sata vezérlő előszőr raid módban futott, majd átállítottam ahci-ra, reinsall, de az se segített. holnap még kipróbálom ide módban, de nem hiszem, hogy az megoldaná.
BIOS (pontosabban EFI) frissítést csináltam, holnap még a raid vezérlőhöz nézek firmware-t.

Ma még ezzel próbálkoztam

Mi is szívtunk ezzel, aztán a végén egy 10.04 desktop alternate telepítésekor megcsináltuk az SW raidet, majd 10.04 szerver telepítőt gyakorlatilag rátelepítettük a desktop által kreált raid tömbökre. Szerintem hibás a szervertelepítő, mert teljesen ugyanaz a hibajelenség!

Nem jött össze, pedig biztató volt a kezdés.
RIP linux-szal ezt mutatta (még újratelepítés előtt) a /cat/mdstat

Personalities : [linear] [raid0] [raid1] [raid10] [raid6] [raid5] [raid4] [multipath]
md124 : active raid0 sda2[0] sdb[1]
927944576 blocks 64k chunks

md125 : active raid1 sda1[0]
48827328 blocks [2/1] [U_]

md126 : active raid0 sdc1[0] sdd1[1]
7810944 blocks 64k chunks

md127 : active raid0 sdc2[0] sdd2[1]
137412480 blocks 64k chunks

Miután partícionáltam, mdstat azt írta, hogy szinkronizálja a raid tükröt. Miután ezt befejezte, folytattam a telepítést, de semmi.

BusyBoxból /cat/mdstat szerint
az md2 és md3 ugyanolyan, mint normál esetben (a megfelelő partíciókat tartalmazza, raid0)
viszont azt írja, hogy md1 a teljes sda-t és sdb-t tartalmazza, raid0-ban, és hogy md0 nem létezik.

BusyBox-ban ha kézzel újra létrehoztam a tömböt
mdadm --stop /dev/md1 (ebben sda és sdb volt csak partíciók nélkül)
mdadm --create /dev/md0 --level=mirror --raid-devices=2 /dev/sda1 /dev/sdb1
mdadm --create /dev/md1 --level=0 --raid-devices=2 /dev/sda2 /dev/sdb2
exit

akkor a rendszer indul, gond nélkül működik, még a sebessége is jó.
Viszont reboot után ismét nem találja a root device-t, és most md1 helyett md_d1 néven hozott létre egy raid 0 tömböt, benne az sda és sdb teljes lemezekkel.

Miközben futtattam a fenti parancsokat, mindegyik kiadása után kiírta, hogy
mdadm:CREATE user root not found
mdadm:CREATE group disk not found

Ez baj? Közelebb visz a megoldáshoz?
Ja és ilyenkor persze újraszinkronizálja a md0 tömböt szóval nem lenne szerencsés minden rebootot így kezdeni...

Remélem, látott már ilyet valaki, és közelebb tud segíteni a megoldáshoz!
A válaszokat előre is köszönöm!

Hozzászólások

A telelpito konzoljan:

mdadm --zero-superblock /dev/sd[ab]
mdadm --zero-superblock /dev/sd[ab]1
mdadm --zero-superblock /dev/sd[ab]2
mdadm --zero-superblock /dev/sd[ab]...

mdadm -C a yes /dev/md0 -l1 -n2 /dev/sd[ab]1
mdadm -C a yes /dev/md1 -l1 -n2 /dev/sd[ab]2
.....

Igy probald meg.

tompos

Köszönöm a választ, de sajnos nem oldotta meg a problémát.
Ugyanúgy busybox, hiányzik neki a root device, md0 és md1 helyett md_d1 van, ami persze nem valami jó.
Gondolom, egyébként arra gondoltál, hogy
mdadm -C -a ...
nameg a md1-nél -l0,
de értettem a lényeget.
Ja.. nem telepítőből, hanem BusyBox-ból csináltam. Az számít?
Más ötlet?

Sikerült megoldani a problémát, de végül is nem tudom, mi volt a hiba.
Egy megoldás, ami nem vált be, de probléma lehetett:
A /etc/mdadm/mdadm.conf -ban a tömbök UUID-je nem egyezett meg azzal, ami valójában a lemezeken, a szuperblokkokban volt (mdadm -Es).
Beleírtam az mdadm.conf-ba a helyes uuid-ket, aztán update-initramfs -sel új initrd-t hoztam lérte.
Sajna ez nem oldotta meg a problémámat, de hátha másnak segít.

Ami végül valahogy megoldotta:
RIPlinux-szal boot, tömbök lebontása, zero superblock, fdisk partíciók törlése, újra létrehozása, tömbök újra létrehozása, fájlrendszerek létrehozása (mdadm, fdisk, mkfs.ext3).
Ekkor felment rá az ubuntu, de nem tudta valamiért a grubot telepíteni.
Ubuntu cdről helyreállító módban boot, a fenti procedúrát újra eljátszottam (manuálisan tömblebontás, zero superblock, stb), aztán innen folytattam a telepítést.
Most bootol, apt-get dist-upgrade már új kernelt is tett alá, az is működik.

Konklúzió: szerintem az ubuntu telepítőben a partícionáló vagy a sw raid létrehozó vagy a fájlrendszer létrehozó rész valami hibát követ el, ezért manuálisan kell megcsinálni, tök üres lemezekkel (maradék superblockok se legyenek)