Mágikus PDNS névszerverhalál

Fórumok

Egy ügyfelünk névszervere - nem nálunk van - ma reggel megadta magát. 3 névszervere volt a domainnek, mindegyik connection timeout-tal visszadobta a domain feloldásának kérelmeit. Pár óra múlva az üzemeltető helyreállította a névszerverek működését.

Mjad nemsokára a mi PowerDNS szerverünk is leállt. Mindenféle konkrét hibaüzenet nélkül. Csak annyi volt a logban, hogy FAILURE. Újraindítani nem lehet. Ha sikerült is, másodpercek múlva ismét leállt. Kb egy óra múlva azonban minden módosítás nélkül helyreállt, és azóta is rendben fut.

Volt már ilyen problémánk a PowerDNS-sel, de akkor kiderült, hogy egy másik ügyfelünk domainjét, és így annak névszervereit is "etikus" hackerek tesztelték, akik a névszerver leállásának ellenére is folytatták a tesztet. Miután abbahagyták, a névszerver újra rendben működött, és megy azóta is.

Ebből arra gondolok, hogy kívülről lehet úgy kérelmeket intézni a PowerDNS szerverhez, hogy az teljesen összeomoljon, és talán ma több névszerver is kaphatott az áldásból.

A Ti névszervereitek rendben működnek? Tapasztalatok valami furát a mai napon? Netán valaki konkrétabban tudja is, mi történhetett?

Hozzászólások

én annyit látok a grafikonon, hogy reggel ~7 óta kb duplázódott a cache-hit-ek száma.

Szerkesztve: 2023. 03. 23., cs – 15:32

Óriási ddos forgalommal bénították meg, vagy kis forgalmú, de cseles lekérésekkel?

A 0day v. peccselés nélküli security lyukakkal amúgy pont ez a helyzet amit írtál: ha egy ilyen hibára megjelent működő proof of concept kód, akkor kb. script kiddie-k is lehalaszthatják a sérülékeny szervereket az egész világon.

Mármint anno az "etikus"? Nem kaptunk róla információt, de innen nézve ddos szerű volt. Önmagában azonban a ddos-tól nem kellene leállnia a pdns szolgáltatásnak a szerveren - szerintem. Itt pedig exitált a PowerDNS is mindkét esetben. A logban erről csak a systemd tájékoztatott a következő informatív üzenettel:

systemd[1]: pdns.service: Main process exited, code=exited, status=1/FAILURE
systemd[1]: pdns.service: Unit entered failed state.
systemd[1]: pdns.service: Failed with result 'exit-code'.
systemd[1]: pdns.service: Service hold-off time over, scheduling restar

Ezen kívül sem error, sem failure sehol.