Ha nagy teljesítmény kell

Fórumok

Ha nagy teljesítmény kell

Hozzászólások

Sziasztok!

Először is a tények:

Szerverünk a következő adatokkal rendelkezik:

- Dual 2.4 Xeon (+HT), 2 GByte RAM
- Debian Linux, 2.4.22-es kernel
- Csúcsidőben 5000 egyidejű HTTP kapcsolat, kb 1.2 MByte/s forgalom, kb. 1500 különböző gépről
- kb. 600 HTTP kérés / másodperc
- kb. 40 GByte / Nap forgalom

Azt gondolom, hogy az ilyen nagy terhelésű szerver elég ritka.
Ennek megfelelően ez egy elég érzékeny gépezet. Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken. Legutóbb pl. az volt a probléma, hogy az exim rosszul volt beállítva, és a MyDoom vírusnak köszönhetően a /var/spool/exim/input könyvtár 25000 fájlt tartalmazott már. Amikor elindult egy exim folyamat, akkor a szerver teljesítménye 600 rq/s-ról 200-ra esett vissza.
A problémám ezzel következő: láttuk, hogy időnként lelassul a kiszolgálás, de sokáig fogalmunk sem volt, hogy mi okozza, és csak véletlenül jöttem rá, hogy az levelezőrendszer a bűnös.

A következők lennének a kérdéseim:

- Hogyan lehet azt látni, hogy a szerver erőteljesen lemezezik-e vagy sem
- Hogyan lehet detektálni azt a process-t amelyik erőteljes lemezezést okoz
- Hogyan lehet megfigyelni a gép teljesítményét (2/4 processzor !) - a top nem ad valós képet

vitya

Hali!

Próbálkozz pl. a sysstat-al (sar, iostat,...)
Grafikus megjelenites pedig az isag-al...

Zsiráf

[quote:962621432e="nvitya"]Sziasztok!

Először is a tények:

Szerverünk a következő adatokkal rendelkezik:

- Dual 2.4 Xeon (+HT), 2 GByte RAM
- Debian Linux, 2.4.22-es kernel
- Csúcsidőben 5000 egyidejű HTTP kapcsolat, kb 1.2 MByte/s forgalom, kb. 1500 különböző gépről
- kb. 600 HTTP kérés / másodperc
- kb. 40 GByte / Nap forgalom

Azt gondolom, hogy az ilyen nagy terhelésű szerver elég ritka.
Ennek megfelelően ez egy elég érzékeny gépezet. Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken. Legutóbb pl. az volt a probléma, hogy az exim rosszul volt beállítva, és a MyDoom vírusnak köszönhetően a /var/spool/exim/input könyvtár 25000 fájlt tartalmazott már. Amikor elindult egy exim folyamat, akkor a szerver teljesítménye 600 rq/s-ról 200-ra esett vissza.
A problémám ezzel következő: láttuk, hogy időnként lelassul a kiszolgálás, de sokáig fogalmunk sem volt, hogy mi okozza, és csak véletlenül jöttem rá, hogy az levelezőrendszer a bűnös.

A következők lennének a kérdéseim:

- Hogyan lehet azt látni, hogy a szerver erőteljesen lemezezik-e vagy sem
- Hogyan lehet detektálni azt a process-t amelyik erőteljes lemezezést okoz
- Hogyan lehet megfigyelni a gép teljesítményét (2/4 processzor !) - a top nem ad valós képet

vitya

Itt inkabb a szuk keresztmetszetet kellene kinyomozni. Milyen diszk alrendszer van a gep alatt? Az ilyen gepen nagysagrendekkel jobban teljesit a 2.6-os kernel. Meg kellen fontolni egy load balancingot, azaz oldalra skalazni a gepet? Szetvalasztani a mail es web funkciokat? Ebben az esetben ket kisebb geppel valoszinuleg jobb teljesitmenyt lehetne elerni.

[quote:dd2a1e22fe="trey"]
Itt inkabb a szuk keresztmetszetet kellene kinyomozni. Milyen diszk alrendszer van a gep alatt? Az ilyen gepen nagysagrendekkel jobban teljesit a 2.6-os kernel. Meg kellen fontolni egy load balancingot, azaz oldalra skalazni a gepet? Szetvalasztani a mail es web funkciokat? Ebben az esetben ket kisebb geppel valoszinuleg jobb teljesitmenyt lehetne elerni.

2.6-os kernelről:
ma kipróbáltam egy elégge alulméretezett gépben (kevés memória volt benne, így swappelni kellett de nagyon).
Használhatatlan, elviselhetetlenül lassú.
Lehet, hogy rengeteget fejlődött a Linux ütemezője, meg egyéb részei, de ugyanebben a tesztben akkor is a FreeBSD a nyerő még mindig :)

[quote:8b58904122="bra"][quote:8b58904122="trey"]
Itt inkabb a szuk keresztmetszetet kellene kinyomozni. Milyen diszk alrendszer van a gep alatt? Az ilyen gepen nagysagrendekkel jobban teljesit a 2.6-os kernel. Meg kellen fontolni egy load balancingot, azaz oldalra skalazni a gepet? Szetvalasztani a mail es web funkciokat? Ebben az esetben ket kisebb geppel valoszinuleg jobb teljesitmenyt lehetne elerni.

2.6-os kernelről:
ma kipróbáltam egy elégge alulméretezett gépben (kevés memória volt benne, így swappelni kellett de nagyon).
Használhatatlan, elviselhetetlenül lassú.
Lehet, hogy rengeteget fejlődött a Linux ütemezője, meg egyéb részei, de ugyanebben a tesztben akkor is a FreeBSD a nyerő még mindig :)

Passz. Nekem egy pIII 700-as gepen 384MB RAM-mal uzemel egy elegge terhelt FTP szerver (egy idoben 10-20 gepet is imagelnek rola) 2.6-os kernellel, es jobban mukodik mint a 2.4-gyel. Lehet, hogy FreeBSD-vel meg jobb lenne, de ez a Linux topic :-)

[quote:247e0f5a3c="nvitya"]Sziasztok!

Először is a tények:

Szerverünk a következő adatokkal rendelkezik:

- Dual 2.4 Xeon (+HT), 2 GByte RAM
- Debian Linux, 2.4.22-es kernel
- Csúcsidőben 5000 egyidejű HTTP kapcsolat, kb 1.2 MByte/s forgalom, kb. 1500 különböző gépről
- kb. 600 HTTP kérés / másodperc
- kb. 40 GByte / Nap forgalom

Azt gondolom, hogy az ilyen nagy terhelésű szerver elég ritka.
Ennek megfelelően ez egy elég érzékeny gépezet. Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken. Legutóbb pl. az volt a probléma, hogy az exim rosszul volt beállítva, és a MyDoom vírusnak köszönhetően a /var/spool/exim/input könyvtár 25000 fájlt tartalmazott már. Amikor elindult egy exim folyamat, akkor a szerver teljesítménye 600 rq/s-ról 200-ra esett vissza.
A problémám ezzel következő: láttuk, hogy időnként lelassul a kiszolgálás, de sokáig fogalmunk sem volt, hogy mi okozza, és csak véletlenül jöttem rá, hogy az levelezőrendszer a bűnös.

A következők lennének a kérdéseim:

- Hogyan lehet azt látni, hogy a szerver erőteljesen lemezezik-e vagy sem
- Hogyan lehet detektálni azt a process-t amelyik erőteljes lemezezést okoz
- Hogyan lehet megfigyelni a gép teljesítményét (2/4 processzor !) - a top nem ad valós képet

vitya

Nem irtad ezenkivul milyen filerendszeren van az exim queue-ja es a userek mailboxa/maildirje, es hogy a userek milyen formaban taroljak a leveleiket (mailbox vagy maildir).

Mindkettore (exim queue es user mail storage) ReiserFS-t ajanlanek es Maildir hasznalatat a usereknek. Valamint exim helyett is megfontolnam a qmail vagy a postfix hasznalatat.

Ja es persze, hogy a particio az magaban all, vagy sw RAID-en vagy hw RAID-en (es ha igen, milyen kontroller) van...

Először is megköszönöm mindenkinek a segítséget!

szaszg!

Köszi, pont erre gondoltam, majd tanulmányozom a paraméterezését. Elsőre nekem úgy tűnik, hogy ez is egy külön tudományág - persze a feladat is bonyolult.

trey!

Pont azt kérdeztem, hogy hogyan lehet a szűk keresztmetszetet kinyomozni.

A 2.6-os kernellel nem kisérletezek ilyen fontos szervernél. Én még inkább várok a 2.6-os kernellel.

Jelenleg a szerver vígan működik, és lazán viszi a csúcsterhelést.

Finrod!

A mail használat elég alacsony. Ahogy ezt a problémát megoldottam a mail elhanyagolható tényezővé vált. Egyébként ReiserFS van a gépen, és nincs RAID.

---

A gépen egyébként egy általam fejlesztett bináris alkalmazás fut. Van egy belső CPU terhelés mérés benne, ami pontosan azt méri, hogy az idejének hány százalékát tölti futással, és hány százalékát a select() utasításban várakozva.

Most néztem meg a szerver állapotát:
A belső mutató 12 %-ot mutat, 220 rq/s mellett, a top szerint a process 85%-on van.
Csúcsidőben kb. 40%-ot mutat a belső mérés, 600 rq/s mellett, a top ilyenkor is 85-95%-ot mutat.

Hol az igazság?

Annyit még elmondok hogy amikor a belső mutató magas, akkor tényleg lassú a kiszolgálás, egyébként nem.

ket dolgot ragadnek ki az egeszbol:

"Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken."

"Egyébként ReiserFS van a gépen, és nincs RAID. "

Lehe figyelmetlen voltan de minhta még mindig nem irtad volna le hogy milyen vinyo ATA, SCSI ?
Szerinte ilyen szerverbe alap a SCSI (meg a RAID is), de pl ATA vinyonál okozhat ilyet hibás beállítás is (tapasztaltam :) ).

Igen, SCSI winyó van benne. (Compaq/HP ML 330 G3-as szerver)
Igazából a lemezkezelésével semmi bajom.
Azt is bőven megértem hogy egy 25000 fájlt tartalmazó könyvtárat már kissé nehézkes és erőforrásigényes kezelni.
A szervernek egy nem normális állapota az intenzív lemezkezelés.
A lemez alrendszer RAID-el való gyorsítása csak tüneti kezelés lett volna.

A problémám az, hogy szeretném jobban megfigyelni a belső állapotát, hogy tudjam melyik process okozza a zavart, és úgy tűnik, hogy erre a top nem igazán alkalmas.

Még valami.
Elhangzott a FreeBSD. Nos, mérlegeltem a FreeBSD használatát, mivel jókat olvastam róla, főleg teljesítmény vonatkozásában.
Viszont ez a rendszer MySQL-t használ és SMP. Erről meg azt olvastam, hogy a Linux lényegesen jobb, és csak az 5-ös, instabil FreeBSD versenyképes vele. Persze lehet, hogy nem igaz...

[quote:9b9138cdf7="trey"]ket dolgot ragadnek ki az egeszbol:

"Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken."

"Egyébként ReiserFS van a gépen, és nincs RAID. "

Trey: akkor most legy szives fejtsd ki, miert emelted ki azt a reszt, hogy ReiserFS van a gepen (a nincs RAID-et azt nagyjabol sejtem (nem annyira biztonsagos mint lehetne)). Netan valami bajod van a ReiserFS-el, vagy csak belekerult a copy-paste-be az azonos mondat miatt?

[quote:fe28c49e5a="Finrod"][quote:fe28c49e5a="trey"]ket dolgot ragadnek ki az egeszbol:

"Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken."

"Egyébként ReiserFS van a gépen, és nincs RAID. "

Trey: akkor most legy szives fejtsd ki, miert emelted ki azt a reszt, hogy ReiserFS van a gepen (a nincs RAID-et azt nagyjabol sejtem (nem annyira biztonsagos mint lehetne)). Netan valami bajod van a ReiserFS-el, vagy csak belekerult a copy-paste-be az azonos mondat miatt?

A ReiserFS-sel semmi bajom, az osszes gepemen ReiserFS van es nagy ReiserFS partolonak szamitok (mar evekkel ezelott ResierFS-t hasznaltam, akkor amikor meg sokan kopkodtek). Abbol a mondatbol a "nincs RAID" a lenyeg, csak nem akartam fel mondatot idezni. Ez a tamado hangnem mostanaban divat lett?

[quote:9cc70d52a8="trey"][quote:9cc70d52a8="Finrod"][quote:9cc70d52a8="trey"]ket dolgot ragadnek ki az egeszbol:

"Ha pl. valamilyen folyamat el kezd intenzíven lemezezni, akkor az egész kiszolgálás teljesítménye drasztikusan csökken."

"Egyébként ReiserFS van a gépen, és nincs RAID. "

Trey: akkor most legy szives fejtsd ki, miert emelted ki azt a reszt, hogy ReiserFS van a gepen (a nincs RAID-et azt nagyjabol sejtem (nem annyira biztonsagos mint lehetne)). Netan valami bajod van a ReiserFS-el, vagy csak belekerult a copy-paste-be az azonos mondat miatt?

A ReiserFS-sel semmi bajom, az osszes gepemen ReiserFS van es nagy ReiserFS partolonak szamitok (mar evekkel ezelott ResierFS-t hasznaltam, akkor amikor meg sokan kopkodtek). Abbol a mondatbol a "nincs RAID" a lenyeg, csak nem akartam fel mondatot idezni. Ez a tamado hangnem mostanaban divat lett?

Bocs, nem tamadasnak szantam, csak megijedtem, hogy esetleg van valami gond a ReiserFS-el. Akkor eszerint semmi gond, es jol ertelmeztem a dolgot (a RAID hiany volt a lenyeges a post-odban).