Új linux szerver stress teszt: memória és CPU izzasztó alkalmazások - erotika nélkül

Fórumok

Sziasztok!

Egy új szervert ti milyen módon ellenőriztek le, hogy megbízható-e?
Itt arra gondolok, ha alapvetően működik, de komoly terhelést még nem kapott.

Leírom, én hogy csinálom és kérlek egészítsétek ki vagy kössetek bele... ;-)

Ha mondtok alkalmazást, és nem triviális, honnan lehet beszerezni, kérlek mondjatok csomagnevet vagy honlapot.
Továbbá várnám azt is, hogy szerintetek mennyi idő után kellene, hogy kijöjjön a hardver hiba, ha nem bírja a gép a terhelést, vagy másik oldalról: mennyi idő zárható ki, hogy nem bírja a terhelést.
Ha van boot CD/boot USB változatban is, mint például a Stresslinux, az úgy még jobb.

Ösztönzés ON: Erről csinálni fogok egy blog bejegyzést, szóval ha mondasz valami hasznosat, híres leszel! :-) Ösztönzés OFF.

Köszönöm.

Kezdeni a BIOS-ban lévő tesztekkel szoktam, ha vannak.

HDD, bár ez nem stressz teszt de hasznos:
HD Sentinel DOS verzióval boot CD-ről megnézem a HDD-k állapotát, hőfokát, SMART-ot. Erre jó lenne valami Linux oldali alternatíva. Nem szoktam már mostanában surface test-et futtatni, csak új hdd esetén sima formázást futtatni, nem gyorsat. De ha RAID-be kerül, ott elvileg ki kellene jönni a hibának. Ez elégséges így?

Memória:
Indítok MemTest86-ot főként boot CD-ről, hogy párszor végigmenjen.
Meglepő infó, hogy egy memória hibát a MemTest86 nem hozott ki, hibátlanul futott órákig a teljes memórián, míg a Windows 7 telepítőben lévő memóriateszt kihozta perceken belül. Az okát nem értem, de tényleg hibás volt az egyik memória modul, cserélve, vagy az nélkül stabil volt a gép, de azzal a modullal egy idő után random fagyások voltak.

Memória és processzor:
Jön az mprime, vagy Windows-on a prime95 annyi szálon ahány CPU mag van, sok memórián, ezt futtatom legalább 4-6 óráig, vagy másnap reggelig. Ha ezt kibírja, akkor nekem már jónak tűnik a szerver. Ilyenkor az is kiderül, hogy meddig melegedtek fel az alkatrészek és hogy jó-e a gép hűtése, mi a CPU hőfokának a maximuma.
Windows-ra van az Everest nevű program, az szépen mutatja ikonként a különböző alkatrészek hőmérsékletét. Erre mi a legjobb free alternatíva, parancssorba?

Főként parancssorból futtatható teszteket várok.

Hozzászólások

Hali!

Dobj fel rá egy klienst a distributed.net oldalról... az kihajtja 100%-ra a procit a háttérben akármilyen alkalmazás mellett is... közben lehet nézegetni a cpu hőfokot. Csak ne feledd később levenni :-D

Üdv:
Feri

A SystemRescueCD-n van pár benchmark program


app-benchmarks bonnie++-1.96
app-benchmarks cpuburn-1.4a
app-benchmarks iozone-3.397
app-benchmarks stress-1.0.4
app-benchmarks systester-1.1.0

Ezen listából a stress nevű progit javaslom, amivel DISK-et, memóriát, és CPU-t is tudsz tesztelni, általad megadott mennyiségű szálon. Figyelj arra, hogy ha nincs swap, ne foglaltass le vele több memóriát, mint amennyi a gépben van, mert akkor eldobja magát az OS!

Meglepő infó, hogy egy memória hibát a MemTest86 nem hozott ki, hibátlanul futott órákig a teljes memórián, míg a Windows 7 telepítőben lévő memóriateszt kihozta perceken belül. Az okát nem értem, de tényleg hibás volt az egyik memória modul, cserélve, vagy az nélkül stabil volt a gép, de azzal a modullal egy idő után random fagyások voltak.

1. Melyik MEmTest86 verzióról van szó? Volt itt egy topik, ahol kiderült, hogy a MemTest86+ nem talált meg bizonyos hibákat, a sima MEmtest86 igen. --> UPDATE: a megoldás végül elod kollégától jött. A sima memtest86+ helyett memtest86 4.0a multithreaded változat kellett, hogy kifogjon egy memóriahibát. A hiba címének utolsó 12 bitje egyezett a diszken talált hibák utolsó 12 bitjével (ami jogos, ha az adat többnyire egész page-enként másolodik a memóriábol). Erre lényegében csak ECC-s memória jelent korrekt megoldást, más integritás-ellenörző módszer legfeljebb véltelen foghatta volna meg.
2. Vannak olyan memóriahibák, amiket a MemTest sem tud 100%-osan kihozni, ezért érdemes legalább 1 éjszakán át futtatni. De még akkor is csak bizonyos valószínűséggel tudja megállapítani a memória minőségét.

"There are two good options. One is Memtest86+ and the other is "memtester" by Charles Cazabon. Memtest86+ requires a reboot and then takes over the machine, while memtester runs from a root-shell. Both use different testing methods and I have found problems fast with each one that the other needed long to find."

https://code.google.com/p/cryptsetup/wiki/FrequentlyAskedQuestions

------------------------------------------------------------------------------
www.woodmann.com/searchlores/welcome.htm

Erre most jól feliratkozom!

--
Fontos! Ha berágok, nem feltétlen személyed ellen szól...
openSUSE 13.1 x86_64

Itt arra gondolok, ha alapvetően működik, de komoly terhelést még nem kapott.

vs

Kezdeni a BIOS-ban lévő tesztekkel szoktam, ha vannak.

csak az a gond, hogy a BIOS tesztek komoly terhelest nem okoznak, legfeljebb 0. koros tesztre alkalmasak

---
Egy jól megállapított probléma félig megoldott probléma.
- Charles Kettering

Biza. A BIOS teszteket én elfelejteném. Egyáltalán nem megbízhatóak.
Ha komoly tesztelés kell, először memteszt 4a többszál (mint ahogy fentebb írták) vagy én még az memteszt+ 5x -et szoktam használni. Induláskor asszem F2-őt kell nyomni és akkor többszálas az is. Na ezekből legalább 5 kört (hogy bemelegedjen a memcsi/alaplap/memvezérlő). De inkább 10-et. Ha ez kész, rescuecd, és stressteszt ahogy fentebb írták. A man sokat segít itt is.
A smartra meg ott lesz tesztelés közben a "smartctl -a /dev/xxx". Ezzel egyébként bekapcsolhatók a különböző smart funkciók is. (merthogy gyárilag nem mindig vannak bekapcsolva)

---------------------------------------------------------------
Ritkán szólok hozzá dolgokhoz. Így ne várj tőlem interakciót.

A HD Sentinel for DOS az az ördög játékszere.
Ha már alapvetően linuxot futtatsz, akkor a linuxosat javaslom pl. innen

cd /usr/src/linux
make

Amit ez nem hoz elő, az a hiba nem létezik.

Én ezt szoktam használni, -j után ahány CPU magod van. Ez fusson 24 órát, ha nem lép ki, akkor én megbízhatónak ítélem.
Tölts le hozzá egy akármilyen kernelforrást, ha nincs fent.


cd /usr/src/linux
while [ "1" = "1" ]
do
  make clean
  make -j8
  if [ $? -ne 0 ]
  then
    echo "OUCH!!!!"
    exit 1
  fi
done

Disk stress testhez, fájlrendszert felcsatolod pl. /mnt/TEST alá, csinász egy stresstest.fio nevü fájlt az alábbi tartalommal:

 
[iometer-file-access-server]
directory=/mnt/TEST
bssplit=512/10:1k/5:2k/5:4k/60:8k/2:16k/4:32k/4:64k/10
rw=randrw
rwmixread=70
direct=1
size=64G
ioengine=libaio
iodepth=256
numjobs=8

A size értéke legyen kétszerese a fizikai memóriának, a numjobs meg a CPU szálak száma.
Ezután mehet a:
fio ./stresstest.fio

Kernelforditas vegtelen ciklusban.

Volt mar olyan asztali gepunk, amin neha-neha befagytak az ablakok, tobbszor is visszakuldtuk garanciaba, de nem csereltek ki, a szerviz szerint jo volt. Feltettem egy alap Debiant a gepre, bootolas utan egybol elindult rajta a kernelforditas. Egy ora utan megbizhatoan kiakadt (pirossal kiirta, hogy hiba, es elkezdett szirenazni :-)) Megint elkuldtuk szervizbe, mondtuk, hogy ha nem hiszik, hogy hibas, tegyek at a vinyot egy ugyanolyan gepbe, abban nem fog megallni. Kicsereltek a gepet :-D

A legtöbb gépnek elég nagy stressz, ha elé ülök. :) Ha véletlen nem jönne ki a hibája, pár óra használat után simán kidob a francba, hogy elege van belőlem.

Viccet félretéve, egy Gentoo fordításal X-el, Qt keretrendszerrel és LibreOffice-al, mindezt ramdisk-ben olyan, mint a gyömbér: mindent kihoz. :)