Vasat gyűjt a Sztaki szótár

 ( trey | 2002. december 5., csütörtök - 18:46 )

Egyik kedvenc lapom a Sztaki online szótára. A látogatottsági adatok alapján úgy tűnik, hogy nem csak én használom. Ma egy kérésre lettem figyelmes a nevezett oldalon, miszerint a vas amelyen a szótár fut 7 éves lesz. Kissé elhasználódott, és nem bírja a jelenlegi forgalmat, amely napi átlag 120.000 lekérést és 20.000 látogatót jelent. Az oldalt egy Sun Enterprise 450, 2 db 400 MHz-es 64 bites UltraSPARC-II processzorral szerelt gép futtatja, rajta Solaris 8 operációs rendszer fut (ennyi köze van az Unixhoz ;-))

Szóval az oldal üzemeltetői segítséget kérnek, amit én is közzéteszek, hátha olvassa olyan valaki ezt az oldalt, akinek módjában áll segíteni:

"A DSD vasat gyűjt

A SZTAKI szótár 2003-ban lesz 7 éves. Az induláskor, 1996-ban hetente alig 3500-an kerestek angol vagy magyar szavakat a szótárban. 2002 őszén a keresések száma a méréseink szerint átlépte a heti 1 milliós határt (auditált mérés szerint ez napi átlag 120.000 lekérést és 20.000 látogatót jelent), ami számunkra igen megtisztelő, és ezúton szeretnénk megköszönni az Önök kitüntető és hálás figyelmét; reméljük haszonnal kattintgatnak nálunk.

Üröm az örömben, hogy a szótár alatti vasat ugyanakkor nem sikerült a 28571%- ra növelni teljesítményileg. 1996-ban egy 25 Mhz-ez NextStation szolgáltatta a SZTAKIwebet, ma pedig egy Sun Enterprise 450, 2 db 400 MHz-es 64 bites UltraSPARC-II processzorral. De úgy tűnik, hogy ez már kevés, s a további fejlesztésekhez, pl. hangos szótár megvalósításához pedig egyre kevesebb. Napközben időnként már ma is akadozik a szótár elérése, s a forgalom növekedésével ez nem valószínű, hogy javulni fog. Szeretnénk a szótárat lehetőség szerint még sokáig a mostanihoz hasonlóan non profit módon, de képességeink szerint profin üzemeltetni, mert szeretjük, és igen szórakoztató szabadidős tevékenységet jelent a fejlesztgetése és az Önökkel való kapcsolattartás, ezért próbálkozunk első körben ezzel a felhívással. Ha ez nem sikerül, akkor a következő alternatívák lehetségesek:

a) a SZTAKI szótár befejezi működését, a helyét felszántjuk, sóval behintjük, és kitesszük a "Tilos az Á" táblát, egyben elismerjük, hogy a marketinghez tényleg lehet érteni, mi viszont nem.

b) a SZTAKI szótárat eladjuk és a pénzből veszünk magunknak saját banánköztársaságot beépített diktátorral.

c) a SZTAKI szótár látogatottságát reklámhelyként eladjuk, banner lesz minden oldalon, és popupokban szólítanak fel a hírdetők a garantáltan működő, pénisznagyobbító eljárások vásárlására.

Egyik rosszabb, mint a másik. Éppen ezért mi egy negyedikutas megoldást választunk, és most vasat gyűjtünk, csókolom, oda tetszik adni a Margit néninek az öntöttvas kályháját? Mert, tetszik tudni, a második bések szereztek valahonnan egy használaton kívüli acélkohót, tetszik tudni, és így megint ők fogják nyerni az iskolai "be a hassal, ki a vassal" reciklista versenyt, ha a Margit néninek nem tetszik tudni segíteni nekünk, tetszik tudni.

De komolyra fordítva.

Várjuk olyan cégek vagy magánszemélyek jelentkezését, akik egy kölcsönösen előnyös konstrukcióban tudnának biztosítani a szótár számára egy szervert, amiért mi köszönetképpen a szótári keresések eredményében tudatnánk a kedves szótárazókkal, hogy a keresés az illető márkájú gépen, vagy az adott cég által adományozott szerveren futott le. Kérdésekkel és az együttműködésre vonatkozó észrevételekkel ide (szotar @ dsd . sztaki . hu) várjuk leveleiket, köszönettel.

Ha a kedves olvasó nincs abban a pozícióban, hogy egy szervergéppel szponzorálja a szótárprojektet, de ismer olyan céget vagy magánszemélyt, vagy még magasabb pozícióban levőt, aki esetleg lát fantáziát egy ilyen együttműködésben, akkor köszönettel vennénk, ha a fenti sorokat vagy az alábbi levelet továbbítaná az illetőnek."

Bővebb információ a project honlapján itt.

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Háth... Azért elég erősnek hangzik az az állítás, hogy egy sun Enterprise 450-es 2 DB 400-as procival ne bírjon ekkora terhelést!
Nálunk az egyetemi SZK legerősebb gépe van ilyenből, és annak magyarország (mostmár csak) második legnagyobb halgatószámú egyetemének halgatóit kell kiszolgálnia.
Imho, a szótárazó program a gagyi. Már amennyiben jól sejtem.
Tudom javasolni a quick english dictionary perl-ben írt forráskódjában való gyönyörködést. Még egy P75-ön is a másodperc törtrésze alatt kidobja az ember konzoljára a fordítást, úgy hogy közben még szótövet, esetleg az utoljára lekért szóval való szókapcsolatot, meg anyámkinját, meg miegymást is keres a szótárban.
Az egésznek annyi a tanulsága, hogy nem csak egy bazi nagy szövegfájl kell, ami maga a szótár, hanem bizony, azt nem árt leindexelni se.

Lehet, hogy én gondolom rosszul, de ez kissé többet jelent, mint egy bazi nagy szövegfájl... És a hangos szótárhoz tényleg kevés ez a vas... másrészt pedig, ha megnézed, láthatod nem csak sima angol-magyar szótár van benne, és az sem átlagos, rövidítések kezelése, elírások felismerése, stb... :)
Szal, remélem sikerrel járnak... szeretem ezt az oldalt... :)

hat igen, egy terheleseloszto okossag sokat segithetne, mert eleg lenne egy Round Robin DNS, hatulra egy adatbazisszerver, elore par frontend. Lenyegesen kisebb lenne a terheles az egyes frontendeken. A szuk keresztmetszet a hatso adatbazis szerver lenne, oda kellene valami gyors diszkrendszer, sok ram stb. Elore meg sima atlagos PC-k.

A Sun szerverrel kapcsolatban, egy hasonlo konfig anno 12 millaba kerult, abbol bizony sokkal gazdasagosabban es eszszerubben lehetne valamit epiteni.

Óriásiak ezek a dumák, itt fetrengtem rajta percekig. :D Ebben vajon benne van kissg keze? Neki van néha hasonlóan üdítő stílusa. :)

Mindjárt megnézem a honlapjukat, szerintem ha alkatrészt esetleg lehet adni, akkor akár magánszemélyes is tudnának apránként segíteni.

Sziasztok!

Szolt egy kedves ember, hogy itt foglalkozva van velunk, amit szeretnek ezuton is megkoszonni, s reagalni a felmerult kerdesekre.

1. Igen, az teljesseggel elkepzelheto, hogy a szotar szoftvere szar es ezert lassu az egesz.

2. De szerintem nem. :-) Leirom, hogy bovebben milyen a jelenlegi helyzetunk, s megtisztelnetek, ha elmondanatok, hogy szerintetek milyen modon lehetne segiteni a helyzeten, ha nem egy uj, dedikalt gep beuzemelesevel.

Adott a "DSD vasat gyujt" kialtvanyban leirt Sun szerver, ami az intezeti generalis szerver. Ez szolgaltatja tobbek kozott a levelezest, a DNS-t (ez egy eleg nagy es sokak altal hasznalt DNS szerver), nehany web siteot es napi ugy 50 egyideju interaktiv felhasznalot (osszesen ugy 400-at, akik matematikai elemzo jobokat vagy Netscapet egyarant futtatnak rajta). Mindehhez tarsul a szotar az o Apache+PHP-jevel, egy MySQL-lel, illetve egy sajat fejlesztesu dictd nevu szerverrel a szotar kiszolgalasara. A jelenlegi konfiguracioban 70 HTTP kapcsolatot engedunk egyszerre. Ezek memoria fogyasztasa:
- HTTP proceszenkent 12 MB
- MySQL 50 MB
- dictd 10 MB
Ez igy osszessegeben kozel 900 MB-os folyamatos memoriafoglaltsagot jelent, mikozben a gepnek osszesen 1GB-ja van (a 6GB swapbol pedig atlag 4GB foglalt, ma eppen mar 5.5). Ha tobb klienst akarnank kiszolgalni, akkor megnovekedne a swap felhasznalas, ami tobb diszkmuveletet jelentene, ezaltal lassulna (kiprobaltuk: lassul) a kiszolgalas, tehat a jelenlegi helyzetben minel tobb klienst probalnunk kiszolgalni, annal kevesebbet tudnunk kiszolgalni. :-)

Ezen a helyzeten szeretnenk valtoztatni egy dedikalt gep uzembehelyezesevel.

A kenyelmes es fenntarthato novekedest biztosito mukodeshez (vagyis, hogy a szotar teljesitmenyben es szolgaltatasaiban fejlodni tudjon) mi azt feltetelezzuk, hogy egy legalabb 2 processzoros, legalabb 2 GB-os memoriaju, gyors lemezkezelovel (pl. SCSI) ellatott unix (solaris, linux, macosx) szerverre lenne szukseg, illetve megoldas lehet meg load balancinggal tobb (mondjuk 2) kisebb szerveren elosztani a forgalmat (akar keresenkent, akar a kiszolgalo szoftverek elosztasaval, pl. SQL szerver es dictd az egyik gepen, apache es tarsai a masikon). Azt gondolom, hogy ez nagyon durvan is 2 millabol ki kell, hogy jojjon es akkor evekig jok vagyunk es fejlesztunk ra, mint singer a varrogepet.

3. Nyelverzekem szerint a "szotart" es "szotarat" forma egyarant helyes, en inkabb csak stilisztikai kulonbseget erzek. Meg sokszor tevedek ilyen kerdesekben.

4. kissg [bitman] keze nincs benne, vagy ha igen letorom. :-) Egyebkent szeretjuk ot, a nyogeteit mint ajandekot szoktuk kuldozgetni a szavakat beirok visszaigazolo leveleiben.

Meg egyszer koszi a velunk valo torodest es varom barmilyen javaslatotokat, kritikatokat, pamela anderson foto-gyujtemenyeteket.
---
balazs

Aha... Mondhatni: így már mindjárt más a leányzó fekvése :-)
Ezt esetleg érdemes lenne a kiáltványban is egyértelműsíteni, hogy dedikált gép kellene, és nem azt írni benne, hogy ekkora bazi nagy vas van, és kihagyni belőle, hogy közben ezt használja az egésztaki...

PS.: A kapott képeket cc/fwd nekem is, nem baj, ha nem pont P.A. :-)

igazabol itt szerintem senki nem gondolt arra, hogy kotekedjen a sztaki munkatarsakkal, csak a szel lebegteti a pofajukat ;>

Szasztok!

En ugy latom, hogy mind memoria mind diszk problemak vannak. Rendszergazdai forrasok szerint igen brutal sok I/O muvelet vegzodik a gepben, de nem tudjak, hogy mitol, illetve ki csinalja ezt. Az en rendszergazdailag fejletlen agyam azt hozta ki, hogy valoszinuleg a sok swapolas lehet a sok I/O oka, hacsak valaki nem direkt szkreccselteti a diszket, mely esetben bezaratom ezt az illegalis diszkot es az osszes budos kolok kikopi azt a rohadt extasyt!! Meg vagyunk ertve?! :-)

Ugy latom, hogy egy PC alapu eros, linuxos gep siman elvinne a szotart, sot meg maradni is eroforras a tovabbfejlodesre.

MySQL vs. Postgres engem is erdekelne.
---
balazs