( nvik | 2016. 03. 16., sze – 00:49 )

"a szálat indító eset is azért születhetett meg, mert nem a "kéne jobb esetben" felállás a valóság."

Kozben kiderult hogy a szalat indito eset azert szulethetett meg mert egy tetves linux fut benne celeron processzoron es mindent softwarebol csinal, es az IBM szervizmernok szerint neha elofordul hogy ezekben fejreall a linux.
(Magyarra forditva: -cenzuraztam magam-)

"szerint a failover nem úgy történik, hogy a másik vezérlő IP címén lesz elérhető a LUN, hanem az "preferred" vezérlő IP címe és iSCSI identitása megy át a másik vezérlőre. Ebből implicit következik, hogy a "host"-ok irányából minden LUN-hoz mindössze két aktív útvonal van.
Ezen két útvonal nyilván lehet aktív-aktív, de ez önmagában semmit nem old meg, mert mindkettő ugyanazon a hálókártyán keresztül él. Ha ez két útvonal elhal a hálókártya hibája miatt, akkor az ESXi számára nincs lehetőség másik kapcsolatra. Kérdés, hogy ezt a tároló érzékeli-e (beleértve olyan sunyi hibát is, hogy az interfész látszólag "up", csak éppen adatforgalmazás nincs), ha igen, akkor tud-e rá reagálni?"

Itt egy kis zavart erzek az okfejtesedben. Odaig rendben van, hogy az iSCSI iqn megy at a masik vezerlore, de igazabol erre sem lenne szukseg, mivel multipath iscsi-rol van szo, ezert az esxi ketto path -on eri el a lun-t, es az egyik path bedoglese eseten atall egybol a masikra.
Ugye fizikailag ez ugy nez ki, hogy van ketto canister a storageban, mindketton ketto-ketto 10Gbit port. Es ketto (igazabol 4 ha jol emlekszem) 10Gbit port az esxi hoston. Mindketto canister egy-egy 10Gbit portja be van dugva a host egy-egy portjaba. Kulon ip cimek, ugy emlekszem kulon iqn (node1. es node2 .valami.iqn)
Es az ESXi ISCSI targetban mindketto iqn fel van veve (erdekesseg, hogy ha a storwize-hoz ip cim alapjan akarsz iSCSI-n csatlakozni, akkor nem tudsz, kizarolag az iqn -nel(!)). Tehat a target discovery -nél nem ip cimet adsz meg, hanem kulon-kulon mindketto IQN-t, amiken keresztul latja ugyan azt a LUN-t ketto, fuggetlen path-on, aktiv-aktiv modban.
Ha nem latja aLUN-t, azonnal atall a masik path-ra es megy tovabb minden. Fontos nyilvan, es ezert hivjak aktiv-aktiv storage-nak, hogy a ketto canister memoriaja es allapota ugyan az legyen mindig.
Az olyan sunyi hibk eseteben, hogy latszolag "up" a link de adat nem megy at rajta, lejar a par masodperc az ISCSI initiator-ban (nem kap SCSI parancsra valaszt), es failed -nek minositi a path-ot, es atvalt a masik path -ra.

"VMware multipath driver fully supports SAN Volume Controller/Storwize V7000 ALUA preferred path algorithms."
Storwize V3700 -rol beszelunk.