Precise vs. Trusty mint gateway

A mult heten rebootolgatott a meglevo linux gw. Penteken melo utan kicsereltem, a HDD-ket beraktam egy uj gepbe, ami korabban hostingban stabilan mukodott frankon.

Hetfon reggel ulok, erre jon kollega, h szar a net (mint kesobb kiderult, a max. letoltesi sebesseg 400Kbit/s kornyeken mozgott az internetrol, az intranet rendben volt).
Mondom nalam rendben van, majd mindjart megnezem. Aztan jott meg par kollega, na szep hetfo reggel.

Aztan szep lassan kiderult, h csak windows kliensek szivnak. Sok sikertelen szenvedes utan kinomban frissitettem Trusty-ra a gepet es egycsapasra rendbejott.

Adok egy csokit, aki megmondja wtf.

Hatterinformacio: nagyon alap iptables szabalyok (nehany MASQ, nehany DNAT). Osszesen 4 subnet, mindegyik produkalta. Windows-on linux VM is produkalta a hibat, es Linux-on windows VM is. W2K8, W8, W7 biztosan erintett volt. TC vagy ilyesmi nincs.
A penteken betett gepet egy masikra cserelve nem valtozott semmi, a halokartyak is kulonbozek.

Hozzászólások

Az a baj, hogy egy ekkora upgrade annyi mindent valtoztat, hogy innen mar nehez megmondani, hogy mi valtozhatott. Le kellett volna trackelni a problemat, es csak utana frissiteni.
--

Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant. 

"400Kbit/s kornyeken mozgott az internetrol, az intranet rendben volt"
"szep lassan kiderult, h csak windows kliensek szivnak."

Ennyibol nagyon nehez megmondani, mi lehetett a baj.
1) Eleve nem tudni, milyen iranyokat akartak nezni, ha olyanokat, amiknek van IPv6-os cime, akkor lehet, hogy az MS IPv6 megoldasa szarakodott.
2) DNS cache urites sok hasonlo problemat oldott mar meg, artani sose art
3) szolgaltatoi hiba kizarasa adott iranyokra
4) kozos pont keresese a problemas gepeken az oprendszeren kivul (peldaul egy linuxos laptop bedugasa az erintett gep helyere)

Legalabb 6-7 fele modon el lehet indulni korbejarni a problemat. En altalaban eleg verziobuzi vagyok, de ha egy eles rendszeren problemat tapasztalok, eszembe nem jut az upgrade-t mint megoldast adni addig, amig nincs mellette egy eros erv, hogy peldaul a Trusty kerneleben javitottak a 456321 szamu kernelhibat, ami ilyet okozhat. Tenyleg no offense, de egy upgrade annyi mindent megvaltoztat a rendszerben, foleg egy dist upgrade, hogy nem tudhatod, mit old meg, es mennyi problemat fog okozni. En meg a security update-ket is atnezem, hogy tutira kompatibilisek-e, mert szaladtam mar ra dolgokra.
--

Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant. 

> Eleve nem tudni, milyen iranyokat akartak nezni, ha olyanokat, amiknek van IPv6-os cime, akkor lehet, hogy az MS IPv6 megoldasa szarakodott.

Minden lehet:)

> DNS cache urites sok hasonlo problemat oldott mar meg, artani sose art

Fel tudnal vazolni egy kepzeletbeli, de realis esetet?

> szolgaltatoi hiba kizarasa adott iranyokra

Ezt hogy? Betelefonaljak az op-nak, h a windows kliensek 400-zal toltenek? Szenne rohogi magat.
Egyebkent berelt vonalrol van szo, amennyire tudom, nem allitottak at semmit.

> kozos pont keresese a problemas gepeken az oprendszeren kivul (peldaul egy linuxos laptop bedugasa az erintett gep helyere)

Termeszetesen megprobaltam a hasonlo eseteket, vhogy csak el kellett jutni a konkluzioig...

> Tenyleg no offense

Egy kicsit azert megis annak veszem, mivel a hianyos informaciok ellenere tudod, mit kellene csinalni, eszedbe sem jut feltetelezni, h nem a tokomet vakartam kozben:)

> egy upgrade annyi mindent megvaltoztat a rendszerben

Pl. a nem mukodobol mukodo rendszert csinalhat, mint jelen esetben.
De ez a resze amugy lenyegtelen, sokkal erdekesebb, hogy ilyen (latszolag megmagyarazhatatlan) eset megtortenhet. Ez egy blog, csak ezert irtam le, tanulsagkeppen.

Azert azt megneznem, amikor egy iroda a tokodon ugral es te meg nagy nyugisan uldogelsz, h kuss, most trackelek, majd utana rendbe teszem. Lehet, nem fogunk egyutt dolgozni, felenk mashogy mukodik:)

Nezd, ha nem mondod, hogy mi volt a megoldas, csak azt, hogy "frissitettem, megoldotta", akkor megis mibol kellene gondolnom, hogy mi volt a problema, vagy egyaltalan az, hogy elgondolkodtal a probleman? En egy ilyen problemamegoldas dokumentalasakor (akar a sajat blogomba is) vagy leirom, hogy mi volt a problema es arra mi a megoldas, vagy le se irom, ugyanis egy ilyenbol meg en se tudok a kesobbiekben tanulni, nem hogy mas.

A nyitoban vazolt tortenetnek vagy az a tanulsaga, hogy ha lassu az internet, frissitsd a Linuxodat, vagy nincs tanulsaga. Az, hogy te kozben csendben tudod mi volt a problema, az kifele masnak nem jelent erteket.

Ami a szolgaltatoi hibat illeti, nem veletlenul kerdeztem ra a "mit akartak elern a kliensek" temara, siman van olyan a magyar szolgaltatoknal, hogy bizonyos iranyokba szar a kapcsolatuk, meg ha errol ok nem is tudnak vagy nem is valljak be. Volt mar olyan, hogy napokig nem tudtam normalisan tolteni egy kulfoldi, nem terhelt, tamadas alatt nem allo szerverrol, aztan hirtelen csak beroffent a dolog, mindezt azert, mert valahol feluton szarakodott valamelyik koztes szolgaltato halozati eszkoze. Olyan is van, hogy a "lassu az internet" cimu panasznak az az oka, hogy megbolondulnak a windowsok, es egyszerre akarnak valami frissitest leszedni (nem feltetlen Windows Update, hanem Adobe, virusirto, vagy mas frissitest), es egy 2 MBit/s -el megaldott ceg eseteben ez botranyosan szar internetet general.

Hidd el, hogy amikor vegigveszek egy ilyen listat, arrol az ugyfel is tud, valamint azt is tudja, hogy nem azert veszem ezt a listat vegig, mert ki akarok tolni vele, hanem azert, hogy azonositsam a problemat es realis megoldast tudjak ra adni. Mert attol nem lesz hamarabb internete ugyanannak az irodanak, ha elkezdek kulonfele megoldasokkal vagdalkozni esz nelkul csak azert, hogy szalljanak mar le rolam. Raadasul ez utobbi kicsit sem hajaz professzionalis megoldasi modszerre.

Es megegyszer, no offense, de az alapjan, amit leirtal, ami itt all betukben, nem tudtam ertelmes konzekvenciakat levonni. Az, hogy te mellesleg mit tudsz a fejedben, az szamomra irrelevans, mert _nekem_ azok az infok nincsenek meg a fejemben. Szamomra az eredeti iras konzekvenciaja az volt, hogy ha lassunak talalnam az internetemet, surgossen nezzek utana, van-e frissites a Linuxos gatewayemhez vagy nincsen.
--

Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant. 

> A nyitoban vazolt tortenetnek vagy az a tanulsaga, hogy ha lassu az internet, frissitsd a Linuxodat, vagy nincs tanulsaga. Az, hogy te kozben csendben tudod mi volt a problema, az kifele masnak nem jelent erteket.

Vmit felreertettel.
A megoldas a frissites volt, a hibajelenseg is adott, de az ok-okozati osszefugges nincs meg, legalabbis altalam nem ismert.
Ha ugy erthetobb, irhattam volna akar azt is betyarosan, hogy kinomban frissitettem Trusty-ra es bejott.

> bizonyos iranyokba szar a kapcsolatuk

Minden iranyba szar volt a kapcsolat (btw. nemmagyar isp-kkel is elofordul).

> Raadasul ez utobbi kicsit sem hajaz professzionalis megoldasi modszerre

Eltekintve attol, hogy amit csinaltam az volt vagy nem, az szamit, hogy vegeredmenyben mukodik vagy nem.

> _nekem_ azok az infok nincsenek meg a fejemben

Ez nem verseny, a fent emlitett csoki is full virtualis, nem all rendelkezesre...:)

A tanulsag reszemrol annyi volt ebbol az esetbol a kovetkezok voltak:

1.
Termeszetesen a penteken kicserelt szerverben kerestem eloszor a hibat, kezenfekvo volt, hiszen az valtozott azota, semmi mas. Jo idot eltoltottem akorul, mint kesobb kiderul, mint kesobb kiderult feleslegesen, total vakvagany volt (mikozben az eszem melyen sejtettem, h a HW-hez keves koze lehet egy ilyen hibanak).

2.
Vannak heelyzetek, amikor drasztikus, kvazi sokkszeru valtoztatas erdemben segithet (ez mar tobbszor bejott): ha bejon, akkor valojaban "megkeruli" a hibat, de adott helyzetben a legjobb dontes lehet, a problemat pontosan felderiteni okosabb az arra megfelelo alkalommal.

3.
A fenti, drasztikus valtoztatas csak akkor johet szoba, ha egyebkent biztos benne az ember, hogy rosszabb nem lesz (bocs, de egy szimpla linux gw-t ujabban mar ide sorolok...:)

4.
Nehanyan mindent megtesznek egy kepzeletbeli csokiert:)

Persze sorolhatnam meg, hogy nem teljesen a $RANDOM alapjan tortent a hibakezeles, meg a frissites sem csak heccbol jott, de a lenyeg ez (lehet hivni az elore menekules strategiajanak is).

t

Na, ha ennek a kommentnek csak a fele lett volna benne a nyito postban, nem szoltam volna.

Ami a sokkszeru valtoztatast illeti, nekem vannak ketelyeim. En ugy vagyok a dist-upgradekkel, hogy amig nem tudom, milyen hibakat fogok bevezetni, addig a jelenlegi hibat - hacsak nincs mellette egy nagyon eros erv - eszembe se jut azzal megoldani. Inkabb keresek uj kernel verziot vagy uj IPTablest, de egy disztrofrissites altalaban behoz valamit amivel aztan orakat lehet szivni.

Raadasul nalam meg nem igazan volt olyan ceg, aki a linuxos gatewayt csak gatewaynek hasznalta volna, mert ahova csak egy gateway kellett, oda vettek SOHO/MikroTik routert, az ugyanis - meglepo modon - olcsobb. A legtobb ilyen linuxos "gateway" altalaban web- fajl- level- es tudjisten milyen kiszolgalo is. Es egy dist upgrade ezeket a szolgaltatasokat is egeszen melyen erinti. Nekem elobb kap agyhugykovet az ugyfelem, ha napokig nem megy a levelezes es/vagy a fajlszerver, mert a disztrofrissites elbokte, mint ha par orat egyaltalan nincs internetuk.

Csak kivancsisagbol: nalad miert nem egy tisztesseges halozati eszkoz vegzi a gateway funkciokat? Egy jokepessegu MikroTiket mar husz-huszonot kHUF korul utanadvagnak eloredobozolva.
--

Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant. 

> SOHO/MikroTik routert, az ugyanis - meglepo modon - olcsobb

Egy soho cegnel biztosan ez szamit, de nem soho cegrol beszelunk.
A mikrotikot meg nem szeretem.

> tisztesseges halozati eszkoz vegzi a gateway funkciokat?

Biztos voltam, h elobb utobb elo fog kerulni ez is.
Reszemrol egy linux szamitogep tisztesseges halozati eszkoz, alkalmasabb a feladatra, mint akarmelyik cisco v. mikrotik.

t

> A mikrotikot meg nem szeretem.

Ezt ki tudod fejteni? Nekem van egy mikrotik eszkozom otthon, meg a cegnel is mikrotik van, ha van valami szo"r vele, azt jo lenne tudni...

Ami a linux halozati tudasat illeti, ezzel tudnek vitatkozni. Raadasul ma mar szoknak figyelni a fogyasztasra is, amiben egyertelmuen a Mikrotik a jobb.
--

Ki oda vagyik, hol szall a galamb, elszalasztja a kincset itt alant. 

Amíg 400Kbps sebességgel megy a hálózat kifelé, addig olyan óriási gáz nincs, csak kicsit lassabban jönnek le a képek és akadozik a youtube. ;)
Kell egy jó főnök, aki közéd és a reklamálók közé áll, míg te hibaelhárítasz. :))

Viszont arról egy hangot sem írtál, ha jól láttam, hogy mi volt, amit ellenőriztél és nem segített. Én azt sem tartom elképzelhetetlennek ennyi infó alapján, hogy valami a bootoláskor elkefélődött a szervereden és egy reboot simán helyretette. (igen, linuxon is láttam már ilyet - igaz, nem lett volna feltétlenül szükség rebootra, csak egyszerűbb volt :) )

De ettől függetlenül: egy ilyen hiba miatt hirtelen upgrade-elni egyet, elég nagy merészségre vall... :)