HP Proliant ML150 G6 halódik

Fórumok

Van egy ilyen 10 éves vasam. Az életének 99%-át kikapcsolva töltötte, pár havonta kapcsoltam be 1-1 alkalomra valamit letesztelni. 1 cpu, 24gb ram 6x4gb modullal van benne. Trükkös ram install sorrendje van, melyik slotokat kell feltölteni ha nem mind a 6-ot használná az ember.

Januárban még működött. A napokban bekapcsoltam, és a memóriát hibásan detektálta, csak 16gb-ot írt ki. Összes modul ki, majd egyesével bepakolva és elindítva 20Gb-ig jutottam. Az utolsót bepakolva a sorrend alapján, na ekkor lát 24 helyett csak 16-ot. Azzal még nem játszottam, hogy a hibásnak tűnő modult rakom hamarabbra, h. a modul vs. slot hibát kiderítsem.

Viszont a másik új hülyesége, hogy minden power on után megáll a POST az IDE eszközök + usb diszkek detektálása után, nem lép tovább a raid kártya biosára. Elvileg nem fagy meg, mert usb billentyűzet led-ek reagálnak, ill. a ctrl-alt-del-re is újraindul. Ilyenkor tovább is lép gond nélkül a raid kártyára, és el is indul a boot.

Tapasztalt már ilyet bárki hasonló géppel?

Update 2021.07.01 úgy tűnik tényleg a ram modul fáradt el. 2 új másik modul is működik hibátlanul abban a slotban. A POST megakadást nem sikerült megfejteni, minden power gombos indításnál is megakad továbbra is, billentyűzetről crtl-alt-delete, és 2. próbálkozásnál mindig ugrik tovább a raid bios-ra. 

Update 2021.07.08 került bele 2x Xeon E5540, és telenyomtam a 2. cpu-hoz való 6 RAM slotot is 4GB modulokkal. Így most van benne összesen 48GB RAM. Állítólag belemegy a DDR3 8GB registered is, így fel lehetne tornázni 96GB-ra is, de egyelőre nincs szükség ilyen sok memóriára. Így is zabálja az áramot  Ez az 5500-as Nehalem xeon mindenféle energiatakarékoság mellett: intel enhanced speedstep, és C-states (C6 biztosan, és talán van még C7 is) mellett is, BIOS-ban power profile: "custom" és windows-ban beállított balanced power profile esetén is megzabálja a gép idle-ben a 135W-ot (1x E5540 CPU). 

A Xeon 5600-as (Westmere) szériát elvileg szintén támogatja az alaplapi 5500 chipset. Az állítólag a csíkszélesség csökkentés miatt jóval barátságosabb fogyasztású lett, azaz jobb a perf/watt aránya. A nagyobbik tesó Proliant ML350 G6-ban 5520-as chipsetet rakott a HP, de nem ezen múlik az 5600-as CPU support. Hanem hogy az ML150-hez 2011-es az utolsó BIOS, holott 2014-15ig volt gyártói support erre a gépre. Az ML350-hez meg adtak ki BIOS-t még 2018-ban is. A 2011-12es időszakban kijött egy tucat BIOS update az ML350-hez, amiben a Xeon 5600-as mikrokódot updételgették havonta, így utána elvileg már használható állapotba került az a processzor ebben a modellben. Az ML150-et meg simán hagyta leszarva a HP, így elvileg nem működik ebben a modellben xeon 5600 széria.

Jó teszt lenne a firmware BIOS fájlból kidumpolni, hogy vajon az 5600-as processzorok kezeléséhez van-e benne mikrokód, és ha igen az milyen reviziójú.

Ugyanitt keresek ML150 g6-hoz való elülső front system 1 fan, system 2 redundant fan modulokat:

régi part number 513927-B21 / új part number: 519737-001

Hozzászólások

Éve cseréltem benne cmos elemet. Akkor látványos volt a hülyéskedés, mert a beállított paramétereket pl. dátum/idő restart után elfelejtette. De bootolni akkor is tudott gond nélkül, a raid kártya is feljött POST során. 

Szerkesztve: 2022. 06. 22., sze – 21:02

Trükkös ram install sorrendje van

Jah, követni kell az úgynevezett ABC-t. Fel van szitázva a NYÁK-ra is, meg matricázva a gépház fedelére is.

Tapasztalt már ilyet bárki hasonló géppel?

Mármint, elakadó boot folyamatot, vagy elromló alaplapot? Talán két napja láttam utoljára. A system health LED nem világít pirosan?

Egyébként, mi a cél? A G6-os ProLiant szériát 2009.04. és 2011.04. között árusították, a terméktámogatása 2016.04. hóban (6+ éve) szűnt meg. Múzeális értéke szerintem nincs, entry level kommersz szar.

Tanulós gép volt, saját zsebből vettem, mikor melóhelyen annó laborozni kellett volna de a "labormenedzser"-rel nem lehetett zöld ágra vergődni. Nem vagyok hülye, pontosan tudom mekkora a teljesítménye 2022-ben, illetve hány generációval van elmaradva az aktuális csúcstól.

Nyilván ha ügyfél pénzén kéne nekem is cserélgetnem 3 évente a lejárt szapportos vasakat, én is dobálnám ki az ablakon. Így viszont továbbra is tervezném még használni.

System health led amber kikapcsolva, bekapcsolva pedig zöld. Mikor a tápja szart be 6 éve, akkor piros volt.

Ezekhez a 100-as sorozatú entry szerverekhez nem értek... a 300-as sorozatú szerverek esetében:

  • A boot folyamat során egyfolytában kiírnak egy 4 számjegyű POST kódot, amiből lehet tudni, hogy éppen mit csinálnak. Ez nem ír ki ilyet?
  • Az Integrated Management Log és az Active Health Log eléggé bőbeszédű szokott lenni. Itt ugye nincs iLO, de van-e LO 100, és az tud-e ilyeneket mondani?

Sajna nincs rajta semmilyen POSTkód kiíró izé (mármint ha valami alaplapi komponensre gondolsz). Ha a GUI-s ILO képernyőn megjelenő 4számjegyű kódra gondolsz, ez az LO100 nem ír ki ilyeneket, sima AWARD BIOS-szerű képernyője van, ha a HP splashscreen-t eltüntetem.

De ahogy első blikkre néztem, még diagnosztikai led is talán csak valami 1 bit-es (jó/nemjó). De előtúrom a doksiját holnap, hátha találok benne valamit.

Az LO-100 szintén használhatatlan ilyen hibakeresésre. Sikeres POST-nak le kell mennie ahhoz, hogy elérhető legyen, addig nem éled fel. No comment. Visszanézve 1 sikeres POST után a system log-ot, számomra nem evidens bejegyzések voltak benne, látványos hibát nem tudtam a bináris formátumú kódokból kiszedni. Szintén valami dokumentációt kellene találnom ha létezik ilyen ami ezeket a POST kódokat részletezné (kevés bizalmam van benne).

Bár nekem régi Dell szerverrel volt hasonló fura halódás, hogy randomra a ramok fele eltűnt meg néha kikapcsolt, ott konkrétan kiderült, hogy mivel pincében volt tartva, egyik hiányzó takarólemez helyén belemászott egy egér és az egyik cpu tápkörét telibe lepisálta, ami nem látszott elsőre.
Esetleg nézz körbe te is, hogy akár csak szemlére nem látsz-e valami fizikai eltérést az alaplapon, ami gyanús lehet.

Pince itt is stimmel. De nem teljesen a padlóra volt lerakva, hanem kb. 10 centi magas műanyag cuccon állt. Macska hugyozta oldalba az alját az előlap környékén párszor ahogy észrevettem. De rajta volt minden takarólemez minden oldalról paszentosan, ebbe nem mászhatott bele poloskánál / póknál nagyobb jószág.

Ez az a gép?
https://www.youtube.com/watch?v=mQRNHGlDn3s

Ha így álló helyzetben volt tárolva, akkor könnyen lehet, hogy a macska pecse behordott a tápegységbe. A macska pes meg kib...t büdös és agresszív anyag. Meg általában felfelé hugyoznak.

Megnézném a tápot belülről. 

Nálunk egy fém asztalon volt kb 60 centi magasan, de a kábeleken egész egyszerűen felmászott. Télen tetszett a kis dögnek, hogy ott meleg van. Egyébként poloskát is láttam tápegységben elfüstölni, szóval gyakorlatilag bármi ilyesmi nyom után érdemes nézelődni, hogy hátha ilyesmi eredetű. 

ram modul csatlakozóin oxid réteg? -> gyerektől radírt beszerez, megtisztít -> örül ha működik

hibásnak tűnő slot lehet a proci lábait érintő szennyeződés is

Minden csatlakozót megmozgatnék, szemrevételeznék. 

memória modulokat szed ki és radírozd meg a csatlakozókat mindkét oldalon, majd próba

Szerkesztve: 2022. 09. 26., h – 22:06

Ugyanitt a SmartArray P410 RAID kártyához Advanced Pack SAAP licensz kulcsot is elfogadnék, ha van vkinek ilyenje....

Update: körbekérdeztem egy tucat embert akinél van/volt még ilyen P410: senkinek nincs advanced license kulcsa.

Update: BIOS-ban bekapcsolva a Quick boot-ot megoldódott a POST során történő megakadás. Érti ezt bárki, mi az ok-okozat, mert én nem?

Csak ugye az a szopó, hogy nem ír ki semmit melyik tesztesetnél fail-el. Egyszerűen csak megáll ott, és nyomhatom neki a 3gombost. Gagyi LightsOut100-asban egy kanyi sor nincs az eventlogban. Erre írtam h. a 20 éves athlon xp alaplapomhoz adott diagnostic LED-sor többet volt képes elárulni, mint ez a belépőszintű enterprise-szar 10 évvel később.

Szerkesztve: 2022. 09. 27., k – 11:23

Csekkold, hogy nincs-e bekapcsolva a memória beállításoknál Sparing, LockStep vagy Mirroring. A három csatorna helyett ezekben az esetekben lehet, hogy csak kettőt lát/használ és a harmadikat vagy talonban tartja, vagy nem is használja...

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Memória beállításokban MINTHA láttam volna ilyeneket h. Lockstep v. Interleave (most nem emlékszem pontosan, meg kell néznem). De ez milyen szempontból is érintene engem? Elvileg az OS látja a teljes RAM kapacitást (12x4GB = 48 GB)

 

Ezt már írtam régen a nyitóban:

Update 2021.07.01 úgy tűnik tényleg a ram modul fáradt el. 2 új másik modul is működik hibátlanul abban a slotban.