Alaplap: Intel S5520HC
Raid: 3Ware 9690SA-8I - LSI
OS: Ubuntu 12.04 LTS (3.11.0-15)
A raid kártya már elég régi, a HDD-ket jumperrel le kellett korlátozni 3Gbit/s-re, különben random "device error" üzenet jelent meg egyes lemezek mellett tw-cli /c4 show -ban. A HDD-k sima desktop HDD-k. Így működött évekig hiba nélkül, ugyanezzel az alaplappal, HDD-kel, csak az ubuntu volt régebbi rajta.
Most újra lett telepítve, belekerült egy hotswap keret (Chembro 84H211210-005) + 2 hotspare HDD.
5-12 napig minden rendben működik (0-24), majd egyszer csak a raid kártya nem válaszol, a fájlrendszereket újracsatolja az OS csak olvashatóként. Reset után minden működik tovább újabb 5-12 napig.
Ilyenkor a tw-cli csak ennyi mond az eszközről: "Bus error"
Lehalás előtt a tw-cli /c4 show semmi hibát nem mutatott. Lehalás alatt dmesg.
tw-cli /c4 show
tw-cli /c4 show diag
tw-cli /c4 show alarms nem mutat semmi érdekeset, csak egy esedékes battery testet.
A géphez jelenleg nincs fizikai hozzáférésem. Ha lesz, én a hotswap keretet venném ki belőle először (az az egyetlen új hw ami korábban nem volt benne). A nagyker firmware frissítéseket javasolt (hotswap keret, raid kártya, alaplap bios), és a HDD-k enterprise verzióra cserélését. A hotswap kerethez nem találtam semmi firmware-t, a többit frissíteni fogom. HDD-k enterprise verzióra cserélését nem én döntöm el, nem valószínű hogy cserélni fogják, "desktop hdd-vel évekig működött, és több szerverünk is így működik raid10-ben" alapon.
Egyéb tipp?