Érthetetlen hálózati hiba

Az alábbi hibával 2 hete küzdök és mára teljesen kifogytam az ötletekből.

Hardverek: több darab HP V1910 switch. Van köztük 48 és 8 portos is.
Topológia egy részlete:

| A | ------ | B | ------- | C,D,E,F |

A C,D,E,F switcheket nem rajzoltam külön, ők egyesével vannak rákötve B-re.
A hálózatban az A switch végez routolást a VLAN-ok között - ő a default gateway minden VLAN-ban. A többi switch csak L2 funkciókat lát el. Gépek vannak kötve a B-F switchekre. A DHCP szervert az A switchre kötött egyik gép adja. Minden gép mindig kap DHCP-n keresztül beállításokat.

A gond: Időnként előfordul, hogy 1-1 gépnél az adott gép minden hálózati beállítást megkap, de a def. gw-t (A switch) nem látja, pingetni se tudja. Akár úgy is, hogy ugyanazon switch másik portjára kötött gép meg rendben működik, látja a def. gw-t, eléri a többi IP alhálózatot is.

Néztem a switch logokat, de semmit nem találtam benne. A hiba DHCP és statikus IP esetén is eljön. Ráadásul a hiba vándorol a gépek között, switcheken keresztül is. Van, hogy 1 gépet érint a hálózatban, másik nap 4-t, majd 3 napig senkit, majd megint előjön 2 gépen stb.
Próbáltam nézni az A switch ARP tábláját, de nem lettem okosabb. A táblában max. 60-70 cím szokott előfordulni. A durva, hogy az A switch MAC táblájában viszont szerepel a hibás gép címe.

Van valakinek ötlete, hogy mit tehetnék, monitorozhatnék?

Kiegészítés 1:
Kicsit keresgélve találtam hasonló hibaleírást, de ott Dell switchről van szó. Link: http://serverfault.com/questions/224146/no-answer-on-arp-requests

Hozzászólások

Nincs véletlenül egy wifi router lan portja bedugva valahol a hálózatba, ami maga is oszt címeket és beállításokat? Kollégiumban okozott vicces helyzetet amikor switchnek használtak routereket, amelyeken viszont futottak a szokásos szolgáltatások továbbra is és néhány terület az ő válaszukat kapta meg hamarabb a dhcp kéréskor.

Az is kedves, ha valami a ugyanazt a címet használja mint a gw. Bár az gondolom látványosabb hibákat okozna, több gépet is érinthetne.

Ha pingre több válasz is jön az gyanús :)
Nameg, ha akkro is válaszol a pigre, amikor nincs is a hálózaton.
Bár lehet egy wireshark figyelés is segítene neked.

Igen, egy vlanban vannak. Ráadásul a hiba csak az egyik meghatározott vlanban jelentkezik.
A furcsa, hogy az egy vlan-ban lévő gépek mindig elérik egymást. Csak a def. gw-re nézve jön elő, hogy egyik gép eléri, másik nem. Majd a hiba egyszer csak megszűnik, majd megint előjön akár ugyanott, akár másik gépen.

Nincs 802.1x, nincs MAC szűrés még sajnos.

ARP Inspection es vagy HSRP-t hasznalsz?

Ha a PC2-n wiresharkkal nézem a forgalmat, akkor szépen mennek az ARP kérések, válaszok.
Kitol jonnek a valaszok? Kinek mennek a keresek?

Kovetkezoket gyujtsd ossze tablazatba.

Eszkoz;mac
GW,00:00:e1:fd:...

Eszkozrol;nezet eszkoz neve;Nezet mac
PC1,GW,00:00:e1:fd:...
PC2,GW,11:12:e1:fd:...

ARP inspection szerintem nem lesz benne, de DHCP snooping ingen. Én is arra tippelnék, hogy van egy elszabadult DHCP szerver a hálózaton esetleg egy loop...
Ill. nem vagyok róla meggyőződve, hogy mennyire jó ötlet routerként használni ezeket a switcheket? Oké, hogy támogatja, de akkor is...
"elég nagy forgalom mellett"
Bővebben?

Véletlenül nincs kiosztva ugyanaz az IP cím dinamikusan és statikusan is?

Ezt úgy derítetted ki, hogy a gépeken statikusan állítottad be a címeket és kész?
Csak mert ettől még valami szórhat DHCP-t, és ha ugyanazt szórja amit statikusan
beállítottál, akkor a hiba adott a statikus beállításnál is.

Amikor statikus IP címeket használsz, próbálj meg egy gépre dinamikus IP
címet kérni. Ha szerinted nincs DHCP a hálózaton és mégis kap IP-t, akkor meg van a baj,
mert valami mégiscsak szórja a DHCP-t.

Ha ez triviális, és erre is gondoltál, akkor "szori", csak próbálkozom.

Egyrészről a DHCP snoopingot bekonfiguráltam a switcheken. Másrészt a hiba előjött olyan helyen is, ahol statikus, de olyan helyen is, ahol dinamikus IP volt konfigurálva. Harmadrészt végigmentem a gépeken az adott VLAN-ban és egyesével ellenőriztem az IP címeket.

Az ötlet amúgy jó. Hétfőn mindenképp megnézem mégegyszer ezt a részt is.

Jelenleg összesen 9 switchből áll a hálózat + 2 db bladeben. Sajnos a felfűzést nem lehet megszüntetni a végpontok száma és elhelyezkedése miatt.
Hát igen, a nagy forgalom relatív. Az A jelű switchen aggregáltan 10000-150000 packet/s körül mozog a forgalom, sávszélességben 200 Mb/s - 2 Gb/s között. Este vannak nyugisabb órák, akkor tudok érdemi wireshark mérést is csinálni.

Cserebe a Zabbix eleg bonyolult egy kezdonek. Az Observium gyakorlatilag erintes nelkul felscannel es belo neked mindent, a Cacti pedig ennel csak eggyel bonyolultabb. A Zabbix ellenben - amennyire neztem a tutorialokat rola - elegge melos, bar teny, hogy nagyon testreszabhato, cserebe kevesbe felhasznalobarat a kaktusznal.
--
Blog | @hron84
Üzemeltető macik