Rejtély - de nem biztos, hogy alaplap (update)

Fórumok

Sziasztok!

 

Ötletem sincs, mi okozhatja a gondot.

Van egy asztali gépem, ami atomstabilan ment évek óta. Viszont egy borzasztó ergya házban volt. Egy jó bő éve úgy "asztali", hogy egy szerverszobában van (a folyosó túlsó végén, nem messze)

Van jó tápja (fél moduláris 750-es bronz FSP (ha jól dereng, de márkás) - az eredeti kb 2 éve halt meg), van benne 6 db hdd, 4 ssd, Asus X79 alaplap, 8x8 GB DDDR3 Ram (1db 4x8-as, és 2db 2x8-as kit), egy Intel ES v2-es 10 magos Xeon (eBay-ről). Egy LSI SAS vezérlő, IT-re flashelve, meg egy nVidia Ti750.

Nem mai gép, de szépen tette a dolgát, legutóbb majdnem egy évig, meg VGA váltás után még vagy 3 hónapig folyamatosan ment.

Az ősszel hozzá jutottam egy selejtezésre váró, ősrégi Opteront tartalmaző Fujitsu-Siemens házhoz, amiből mindent kidobálva, szépen át is szereltem mindent. A ház szerencsére teljesen ATX-es, szóval minden a helyére került. Mindent ugyanúgy dugtam vissza, minden csatlakozó az eredeti helyén.

 

Nos, azóta naponta, de van, hogy 2-3 naponta újraindul a gép.

Szétszedtem, össze raktam, CPU-t újra kentem (Thermaltake hűtő), RAM-okat ki-vissza (az eredeti szerelésnél ki sem vettem őket), csatlakozók átnézve, megmozgatva, újra dugdosva...

Amikor újra indul, terhelés nincs (de amióta észre vettem, hogy mi van, amúgy se hajkurászom), és a Windows is csak annyit ír, hogy a tápellátás hirtelen megszűnt, az újraindulás váratlan volt.
Az egyetlen dolog, ami változott, az az, hogy ebben a házban volt/van egy nagy, 120-as venti. Nos, délelőtt kicseréltem, hátha... de azóta csak ma már háromszor volt restart.

A tápot - másik hiányában - nem tudom (legalábbis egyelőre) kipróbálni, hogy az-e a baj.

De mi történhetett, ami ilyen rendszertelenül előforduló, fura hibát okoz? Valamelyik nap futtattam rajta cinebench-et meg se kottyant neki. Azóta nincs terhelés, nyugi van, és mégis volt már több restart is. Már ott tartok, hogy vissza rakom az eredeti (leharcolt, ótvar... :D ) dobozába...

 

Hátha valakinek lenne ötlete...

Köszi,

a

update: Elkezdtem a ramok tesztelését másik gépben.
Ha Memtest 5.01-gyel tesztelem multi thread módban, akkor dugig hibákkal. De szó szerint százezrével...
Ha letiltom a multi core-t, akkor eddig a 3 pár ramból (kettesével tesztelem, hogy haladjon), 3 hibátlan. Gyanús, hogy nem döglik meg 3 ram egy gépben egyszerre (de szóljatok, ha tévedek; bár el tudom képzelni, hogy az alaplap ha annyira gatya, esetleg tönkre teszi őket...?), szóval egyre gyanúsabb, hogy alaplap lesz...

Hozzászólások

Nem a doboz az oka, hanem a leállás. Öreg hardver nem szokta szeretni a leállás/szerelés kombót.

Sajnos, csak azt tudom javasolni, hogy próbatáppal nézd meg, első körben!

A kellően fejlett technológia, megkülönböztethetetlen a varázslattól.
Arthur C. Clark

Kapcsolja vissza a mikrofont!
Winston Churcill

Igen, ezt kellene, csak valahonnan kéne szerezni egy hasonló tápot... Próbából elég izé egy ilyet venni (vetetni)... Amúgy nekem is gyanús, hogy ez lesz.

A RAM-on is filóztam, hogy esetleg az, a hétvégére lehet, hogy ráeresztek egy memtest-et.

<-------
You can't grep on dead trees.

Tulajdonképpen ez egy félig saját gép (a sztori hosszú, ne menjünk bele), amit bent használok. 

Szóval ezért izé, mert az egyetemen keresztül verni két hónap. Így értve az. És hasonló tápok nem nagyon vannak körülöttünk. De nem lesz más választásom, ma futok pár kört.

<-------
You can't grep on dead trees.

Nincs ebben semmi rejtély, a Windows világosan írja, hogy a táp. Ha jól értem, átszerelted egy olyan új házba, ami a saját tápjával jött. Ennek ellenére a venti miatt a hőfokokra is ránéznék.

“I didn’t start using Linux so I could have friends.” (Luke Smith, 2019) 🐧

A ház saját tápját kidobtam, az eredeti táppal megy. Még - ahogy írtam - a csatlakozók is ugyanazok. Ettől még lehet ez a gond.

A hőmérsékletek rendben, a hdd-k is 35 fok körül vannak a hdsentinel szerint, a cpu (az összes átlaga) meg olyan 40 körül egy VM futása mellett. Az alaplap is 35 C körülit ír.

Még az jutott eszembe, hogy az alaplap kezd döglődni... :/

<-------
You can't grep on dead trees.

Igen, az alaplap is halódhat. Megérheti újrakondizni, hátha segít. Esetleg próbából, átmenetileg 1-2 meghajtót lehúzni róla, csak pár napra.

“I didn’t start using Linux so I could have friends.” (Luke Smith, 2019) 🐧

Szerkesztve: 2021. 02. 19., p – 07:27

tipp: Bizonytalan kapcsoló, vagy resetgomb az új házban. Próbáld  ezeket lehúzni az alaplapról és úgy járatni.

tápkábel :) Ne nevess, próbáld ki! :)

Üdv!

a Windows is csak annyit ír, hogy a tápellátás hirtelen megszűnt, az újraindulás váratlan volt.

Ez csak annyit jelent, hogy újraindult. Tapasztalatom szerint kb. bármilyen hiba okozta újraindulás után bedobja az eventek közé.

Nem tudom segít e, de nekem is volt hasonló pár éve, heteken keresztül futott a MemTestX86 meg hasonló diagnosztikai cuccok nulla hibával és kb. ugyan ilyen értetlenül álltam a dologhoz, amíg elvittem egy ismerőshöz, hogy ő is nézzen rá.

Na nála semmi hiba nem volt.

Nem értettük, egészen addig, amíg ki nem derült, hogy ahol ő tesztelte a gépet, ott volt klíma és kb. 22-23 fok volt, ahol meg én használtam ott nem és így kb. 27-28...emiatt a hőmérsékletkülönbség miatt nem jött elő a hiba nála és előjött nálam. Elöregedtek az alaplapon a forrasztások. Azt írtad, átkerült a gép egy szerver szobába. Ezért gondoltam, hogy segít, ha leírom az én régebbi esetemet. Ezen kívül nem zárnám ki a táphibát sem, de ehhez már ki kellene próbálni ugye egy másik táppal akár.

Buta kérdés. Mikor újra pasztáztad a cpu -t kivetted? Ha nem tedd meg és nézd meg milyen állapotban vannak a foglalat érintkezői.

Mint villamosmérnök átnéznék minden csatlakozót, beleértve a RAM -ot is, érdemes lehet megtisztítani egy kis alkohollal. (Ha jól értettem valami szerver szoba félében működött, így a por nem játszik)

Ritka de előfordul "hibás" forrasztás a cpu táplálás környékén. Az elektrolit kondenzátorok is okozhatnak hazárdot (de ha nincs tapasztalatod akkor keress valami segítséget 5-8 rétegű NYÁK még rutinos szakikon is kifoghat).

* Én egy indián vagyok. Minden indián hazudik.

Szerkesztve: 2021. 02. 19., p – 16:02

Nézd át, hogy egészen biztosan nem maradt-e benne egy fém távtartó az alaplap alatt a régiből. Számold meg hátulról a távtartókat és előlről a csavarokat. Egyszer küzdöttem egy ilyennel egy "kevés" ideig....

És hiába tűnik hülyeségnek volt már nekem is gondom tápkábellel, ami előtte nem nagyon volt mozgatva.

Ez biztos nem, mert a távtartók a házba vannak szerelve. Illetve a héten szétkaptam megint (éppen ilyesmi okokból), és nem is volt semmi alatta, és most már egészen biztosan nincs semmi alatta :) - és még mindig újraindulgat. Ram lesz, vagy alaplap...

<-------
You can't grep on dead trees.

Az is fontos, hogy az alaplap a rögzítőcsavaroknál rendesen érintkezzen a fém távtartókkal és a rögzítő csavarral. Ne rakj alátétet. Hasonló okból nem szerencsés műanyag távtartókkal sem helyettesíteni a fém távtartókat. Jártam úgy, hogy instabilitást okozott - az alaplapok a rögzítő lyukak környékén számítanak a földelésre.

"Jegyezze fel a vádhoz - utasította Metcalf őrnagy a tizedest, aki tudott gyorsírni. - Tiszteletlenül beszélt a feljebbvalójával, amikor nem pofázott közbe."

Nem, nincs alátét. A háznak meg jóféle saját csavarozható távtartói vannak, pont annyi, és pont ott, ahol kell. Szerintem ez rendben van.
De köszi a tippet, a földelés dolgot nem tudtam! Műanyag távtartót amúgy csak akkor használtam egyet-egyet, ha valamiért nagyon nem tudtam másképp megoldani. De  most egy sincs! :)

<-------
You can't grep on dead trees.

Megreccsenhetett az alaplap nyák a rögzítő csavaroknál, mikor átszerelted egyik házból a másikba. Én is jártam már így, volt olyan gépem ami emiatt csak ház nélkül volt hajlandó menni.

"Everything fails, all the time."

Uh... :D

Lehetne, de talán nem. Viszont anno, mikor az sd-ddr váltás volt, sikerült egy ramot valahogy úgy (fordítva) bele tennem egy alaplapba, hogy kijött belőle a füst... hiába, erős voltam... :D
Na, azóta rettentően figyelek az ilyesmire.

<-------
You can't grep on dead trees.

Szerkesztve: 2021. 02. 19., p – 17:08

- véletlen egybeesés és valójában elöregedő kondik vagy más hasonló dolog miatt instabil

- valami az új házban hozzáért valamihez vagy bármi elektromos vezető dolog máshogy van (föld a csavarozásoknál hiányzik, vagy a házon át olyan helyeyn is folyik áram, ahol nem kéne - nzxt h1 felgyulladó pcie riser esete például). Esetleg olyan helyen is van csavar hely, ami az alaplapon nincs és zárlatol. De akár fizikailag is lehet hogy valami görbe, ferde.. kihúz kártyát a slotból.

- de akár egy windows update is tud furákat. A thinkpadeknél mostanában volt, hogy az utolsó előtti win10 kiadás + legfrisebb power management driver kombináció random alkalmakkor dobál olyat, hogy lemerült az akku és hibernál. Bedugott táp mellett. Régebbi win10 + régebbi driver ok, új win + új driver ok. Csak pont van olyan kombó amikor bugzik.

Bármi.. páralecsapódás, döglött csótány, denevér...

Szóval... vagy a ram, vagy az alaplap lesz a ludas.

A héten a ramokat is kiszedtem egyesével, letakarítottam az érintkezőiket, és úgy raktam őket vissza.

Délután elindítottam egy memtest-et, és kb 10 perc múlva elkezdtek gyűlni a hibák, de rengeteg... és ami a legjobb: olyan 300 hiba körül egyszer csak volt egy szép, kövér restart. Aztán goldmemory is futott egy darabig, ott is volt nagyon sok hiba.

Hogy valóban a ram-e a ludas, nem tudom, de gyanús, hogy ennyire csak nem volt gatya egyik modul sem. Szóval tartok attól, hogy az alaplap öregedik.

A jövő héten le tudom majd tesztelni, találtam egy kb azonos generációs i3-as gépet, amiben van két memória foglalat, és így a 8 db modulon szépen egyesével (vagy kettesével, és ha van hiba, akkor külön tesztelem őket) végig tudok menni.

Ha ott rendben vannak, nézhetek alaplapot. Ha mégis a ram, akkor hurrá, legfeljebb kevesebb lesz a gépben. Nem baj, ha több van, de sokáig kevesebb volt benne, és úgy is jó volt :)

<-------
You can't grep on dead trees.

Nekem is gyanús, hogy kondi lesz. Nézni nem néztem, ennyi időm már délután nem volt. Meg lehet, hogy szemre nem is látszana, vagy nem szúrnám ki.

A jövő héten okosabb leszek, másik gépben tesztelem majd a ramokat. A ram hőmérsékletét sose néztem, de az AIDA valamelyik nap ment, és a "sensors" listában (fejből passz a pontos neve) nem láttam kiugró értéket.

CPU, hdd-k, alaplap 24-40 fok között (melyik hogy, de inkább 30 körül), a ramot nem néztem külön (ha írja), de kiugró hőmérsékleti értékre nem emlékszek, hogy láttam volna.

<-------
You can't grep on dead trees.

Sajnos az elko hiba nem mindig annyira egyszerű, hogy ránézek, púpos, csere.
Ha nekiveselkedsz cserélj mindent ami a "kis" kapcsoló üzemű tápok közelében találsz.

Mivel nem tudom van e az elko cserébe tapasztalatod, még a legjobb módszer ha "kitéped" úgy a kondit, hogy a láb maradékok a NYÁK -ban maradnak és arra forrasztod az újat. (Így sajnos nem tudsz ESR -t mérni és akár egy tucat kondit ki kellhet cserélni úgy, hogy az eredmény nem garantált)

* Én egy indián vagyok. Minden indián hazudik.

Neeem... ha ez a gond (a ramok a másik gépben rendben lesznek), akkor megpróbálok másik lapot lőni. Ha nem... akkor majd látom.

Biológus vagyok, és szerelgetek, össze rakom, letesztelem - de az elektronikához, a forrasztáshoz teljesen hü... nem értek hozzá, na! :)

<-------
You can't grep on dead trees.

Rammal kapcsolatos kondinál ideiglenesen segíthet, ha alacsonyabb órajelre állítod őket. Ha ettől javul a stabilitás, akkor jó eséllyel a szűrőkondikkal van gond.
Az ilyen érintkező tisztogatós, fél lábon teliholdkor berakva jó típusú tüneteknél a kondik szoktak lenni általában.

nem megoldás, csak workaround :D

Egy idő után valószínűleg megint instabillá válhat, ha a kondik kezdik feladni. Anno volt, hogy egy tucat régi szutyok gépből álló termet kellett üzemben tartanom és onnan jön ez a tapasztalat. Meg volt más, iparibb eszköz is, ami "elfáradt" és kondicserével nyert második életet. 

Szóval fontos dolgot nem tárolnék rajta ebben az állapotában, mert ha megint hibázgat a ram, akkor sérülhet bármilyen adat a gépen. Lényegében minden háttértárra írt adat is megfordul a memóriában és nem túl egészséges, ha átfordulnak benne itt-ott bájtok.

Memtest update-re: Látom az alaplap Asus X79, bőven UEFIs. Ha a BIOS-os (kék hátterű) memtest-et próbáltad, felejtsd el, utóbbi 10 évben kiadott gépekre bőven false-positive teli a multi-threaded mode. A Passmark-nak van UEFI-s változata, azzal próbáld ki.

Kösz az infót! Azt már nem egyszer tapasztaltam, hogy az un. "unsafe" üzemmódban dobálja a hibákat, akár ki is akad (systemrescue image utoljára 7.01). Aztán safe módban akár napokig.

OFF(?): Elég komolyan melegszik a CPU futáskor.

* Én egy indián vagyok. Minden indián hazudik.

Én is köszönöm a tippet!

 

Bár - ld fentebb - tegnap magamtól rájöttem, hogy valami nincs rendben. És lásd, a tesztek hibátlanul lefutottak - a másik gépben. Azaz a ramok rendben vannak.

Most az eredeti gépbe raktam őket vissza, és single threaded módban fut. Most kb a 64GB felénél jár, és még nincs hiba. Egy trükköt bevetettem, amit fentebb azbest írt: vissza vettem a RAM-ok órajelét. Az eredeti órajelen is kaptam pár hibát (DDR3-1600), most 1333-on eddig nyugi van.

Nézegettem: az X79-es lapok... hát, nem olcsók. (jó, nem is annyira drágák :) ), és ha így még egy darabig stabilan megy, akkor jó. Ha nem... akkor robbantok, és eladom alkatrészenként. Van már másik gép, ez megszolgálta az árát :)

<-------
You can't grep on dead trees.

Ez ilyen, ezek a lapok mostanra ~10 évesek, el tudnak fáradni. Úgy értem, hogy a memóriavezérlő a prociban van, de a lapon is múlik, VRM, kondik, foglalat, stb.. Valóban nem annyira drágák, csak a modern lapokhoz képest nem mindig éri meg. Vannak olcsóbbak is, ilyen újrahasznosított kínai dzsunka X79-es lapok, de azok nagyon sok apró korláttal rendelkeznek, csomó minden nem működik rajtuk.

“I didn’t start using Linux so I could have friends.” (Luke Smith, 2019) 🐧

Ránéztem a "dzsunkákra". Számomra szokatlan az elrendezés, de lehet bene ráció. Egyébként sok használt van fenn belőlük (eBay) de nem tudom itt szabad e ilyesmit venni.

Az alaplapok élettartamában a 10 év nagyon nagy idő, ugyan a Moore törvény megdőlni látszik, de bőven van még hova fejlődni.
(A 2000 évek elején, egy 2-3 éves gép már reménytelenül elavult volt)

* Én egy indián vagyok. Minden indián hazudik.