"Hajnal óta áll a Windows Azure"

"Hibás tanúsítvány miatt állt le a Microsoft Windows Azure platformszolgáltatás jelentős része, a kimaradás kiterjedéséről egyelőre nincs információ. Meg nem erősített információk szerint az Azure világszerte leállt, a probléma láthatóan az összes adatközpontot egyszerre érintette. Annak ellenére, hogy a Microsoft már a reggeli órákban ígérte a javítást, a rendszer továbbra is áll."

A teljes cikk itt.

Hozzászólások

Ez jót tesz a felhőkbe vetett bizalomnak?

akkor most "Éljen sokáig, lehetőleg örökké a KÜRT Zrt" az új trendi jelszó?!:D

csak ott van a hiba ezzel a antiCloud gondolatmenettel, hogy a konkurens cloud szolgáltatóknál, akikhez szeretne a Microsoft is felzárkózni nincsenek ilyen súlyos hibák.
nem ez az első kínos incidens, ami Microsoft felhőszolgáltatásokkal kapcsolatos. az Azure szolgáltatást használó ügyfelek csak remélhetik, hogy nem egy sokkal súlyosabb hibát próbálnak leplezni a Microsoftnál, és nem adatvesztés lesz a vége a történetnek.
már akkor megingott a bizalom a Microsoft felhőszolgáltatásainak a minőségét illetően, és a bizalomvesztés érintette az akkor még tesztfázisban levő Azuret is.
akkor azzal védekezett a Microsoft, hogy a Danger infrastruktúrája mondta fel a szolgálatot, ami még nem lett updatelve Microsoft technológiára. most ezt a magyarázatot nemigen lehet majd elővenni.

Nem szívesen lennék annak az arcnak a helyében, aki ezt most elszúrta...

Azt, hogy senki nem hasznal Azure-t onnan lehet tudni, hogy ez csak a HUP cimlapjan van, a CNN-en es az indexen nincs.

Gondoljuk meg ha a Google halt volna igy le, vagy az EC2...

Arra akartam a kérdésem rávezetni, hogy nem történt ilyen, azaz nem állt le minden. Hanem részlegesen valamelyik régió, ami ettől még hiba, de mint kis cég is megtehetem nagy cégként pedig kötelező, hogy nem hagyatkozok egy régió elérhetőségére, bármit is ígérjen az amazon.
Azok akik álltak is ilyen tervezési csapdában voltak. Most az azure teljesen állt, még nagyobb gáz, hogy fingjuk nem volt mi a hiba.

"Bill Laing, a Microsoft szerverekért és felhős rendszerekért felelős alelnöke ma rövid blogposztban részletezte a leállás körülményeit. Eszerint az üzemeltető részleg tegnap (magyarországi idő szerint) éjfél után vette észre, hogy több régióban problémák keletkeztek az Azure működésében. A csapat gyorsan felmérte a problémát, amelyet egy szoftverhiba okozott. A gyorsjavítás hamar elkészült, ennek tesztelése azonban reggelig húzódott, fokozatos telepítése pedig további hosszú órákat vett igénybe. A poszt szerint a hiba felmérésétől a javítás széleskörű telepítéséig több mint 21 óra telt el, a rendszer egyes részei pedig továbbra sem működnek, ami továbbra is elérhetetlen alkalmazásokat jelent egyes felhasználóknak."

Ezt a hwsw írta, nekem egyáltalán nem úgy tűnik, hogy "fingjuk nem volt mi a hiba". Az lenne a furcsa, ha egy ilyen hiba csak bizonyos régiókra korlátozódna, az pedig nem teljesen igaz, hogy minden állt.

Csak hasonló forrásból (szintén hwsw, csak épp még nem a magyarázás időszakában):
"A közzétett értesítések szerint az első problémákat a szolgáltatás menedzsmentfelülete produkálta, a tárolókkal, illetve a futó alkalmazásokkal nem volt gond. A reggel 5 órakor publikált értesítés szerint a hibát sikerült azonosítani, egy hibás tanúsítvány okozott fennakadást a rendszerben. Az első gyorsjavítás hét órára készült el, erre az időpontra már a szolgáltatások egy része problémákkal szembesült. A javítás tesztelése reggel 10 óráig tartott, 10:30-tól pedig fokozatosan elkezdték azt telepíteni, ezzel párhuzamosan pedig a rendszerek visszaállítását ígérte a Microsoft."

valóban ez a ez a "információk szerint egy hibás tanúsítvány a Service Management funkciót ütötte ki, az pedig magával ragadta a rendszer többi elemét is" magyarázat nagyon hihetetlen. pláne, hogy globálisan leállt minden. és ha igaz, az szánalmas szoftvertervezést sejtet a háttérben, ami szintén igen rossz fényt vet a Cloud világban megkapaszkodni igyekvő Microsoftra.

"We have identified the root cause of this incident. It has been traced back to a cert issue triggered on 2/29/2012 GMT,"
"The service management system first began to have problems at 1.45am GMT"

Ezek szerint az Azure szerverek mindenhol UTC idozonaval futnak. Kulonben a tavol keleten mar sokkal hamarabb le kellett volna halnia. Es akkor az impact is kisebb lehetett volna.

Kollégám: nem fúj a szél megállt a felhő. :)

az diplomás indiai programozók kb egy magyar info szakközepes szintjén állnak szakmailag. ilyen erővel fel lehet venni 100x annyi magyar középiskolást is egy munkára. évek óta megy már ez az indiai programozók szöveg, de évek óta nem tapasztaltam érdemi fejlődést náluk színvonalban.
attól még, hogy egy nő 9 hónap alatt ki tud hordani egy gyereket, 9 nő nem fog tudni 1 hónap alatt kihordani egy gyereket. és 900 indiai férfi sem tud kihordani egyetlen gyereket sem, hiába hajlandóak bármit elvállalni:)

Nem akarom minősíteni az indiai munkaerőt, de 5 évvel ezelőtt volt szerencsém egy évig együtt dolgozni egy műszaki IT diplomás indiai sráccal, itt Magyarországon, ide küldték. Nem akarok rosszat mondani róla, nagyon jófej volt, pl. itt látott először havat :) Viszont annyira másképp gondolkodnak, hogy nagyon nehéz volt megoldani velük a legkisebb szakmai problémát is, egyáltalán az hogy megértsék, algoritmizálják a feladatot időre, az is nehézségekbe ütközött. Ami egy hazai kolégának pillanatok alatt ment, illetve kézenfekvő volt, az volt hogy napokat vett igénybe velük. Nem kicsi cég volt, sokan dolgoztak azidő tájt a MS Vista-n is attól a cégtől. Szóval India egy másvilág, más gondolkodással, prioritással, személetmóddal. Jófej emberek, olcsón dolgoznak de más előnyük nincs és ma sincs.

Amikor ennel a cikknel meglatom a "Probald ki a Cloud VPS -t" szovegu hirdetest, eszembe jut, hogy soha nem fogom kiprobalni. Kicsit rosszul sikerult az adsense targetalas...:)

'jó' kis reklám a microsoftnak :) googlenek még fizetni sem kellett érte :D

"dalolni kezdtem ekkor az azúrnak,
annak, kiről nem tudja senki, hol van,"

(Kosztolányi Dezső: Hajnali részegség)

A valódi android, a régiek igazi androidja olyan titok volt, ami minden tekintet előtt elrejteztetett. (ALC)

http://blogs.msdn.com/b/windowsazure/archive/2012/03/01/windows-azure-s…

"Yesterday, February 28th, 2012 at 5:45 PM PST Windows Azure operations became aware of an issue impacting the compute service in a number of regions. The issue was quickly triaged and it was determined to be caused by a software bug. While final root cause analysis is in progress, this issue appears to be due to a time calculation that was incorrect for the leap year. Once we discovered the issue we immediately took steps to protect customer services that were already up and running, and began creating a fix for the issue. The fix was successfully deployed to most of the Windows Azure sub-regions and we restored Windows Azure service availability to the majority of our customers and services by 2:57AM PST, Feb 29th."

A zsorzs iróniája, hogy épp most cinkelték a gugli-t...

"Always up. Always on."

Ebbe belefér az, hogy legalabb fel napig KO volt a rendszer? Atirhatnak, hogy "Usually up. Usually on."

Ez a cloud is csak egy ujabb valami, amivel penzt akarnak kiszedni valaki zsebebol es barmit megigernek, csak fizess, aztan meg nem is mukodik olyan megbizhatoan ahogy azt mindenfele igergetik. Vagyis semmi se valtozik, minden meghibasodhat, lehet hosszu leallas is, csak epp extra penzt keresett vele valaki, egy ujabb parasztvakitassal.

"A Windows Azure az év 365 napján megbízhatóan működik!"

Epic fail

-------------------------
Trust is a weakness...