Linux - RH 7.4 - XFS - Pending IO

Fórumok

Sziasztok!

Előre jelzem, hogy egy kicsit nehéz esethez kérnék segítséget.

Adott a Red Hat 7.4 ami kijött a 3.10.0-693.el7.x86_64 kernel családdal. Jó szokás szerint a 3rd party fejlesztők szívnak a változások miatt. Mi is. Annyira, hogy még mindig nem sikerult a Red Hat segítségével sem (kicsit túlzás de eltököltek 3 hetet azzal, hogy eldöntsék mi vagyunk-e a hunyok majd lezárták a ticketünk azzal, hogy valószínűleg mi ... nem voltak biztosak benne)

Alapvetően a következőt csináljuk:
A block device write strategy routinjaba hookoljuk a sajat syscallunk.
A bejovo BIO attol fuggoen egybol visszakerul a rendes utvonalra vagy elobb atmegy rajtunk, hogy kell-e vele dolgoznunk.
Ha kell vele foglalkoznunk akkor a "generic_make_request" syscallnak adjuk vissza a BIO-t

Ez remekül működött és részben működik is (ha a BIO a DM után érkezik hozzánk nincs gond) de egy olyan eset van, hogy HA XFS fájlrendszer van a block device felett akkor hiába adjuk vissza a BIO-t, hiába történik meg az írás a SCSI layerben (végigléptettem gdb-ben... utálatos nap volt) a bi_cnt továbbra is 1 marad a completion routinba visszaérve és utánna is.

Mivel hozzáférést nem tudok/szoftver sem/ adni ezért nagyon hálás lennék esetleg tippekért, hogy miképp tudhatom meg, hogz miért pending az IO és mit kellene csinálnunk, hogy műküdjön ?

A maximum amit privátban ki tudok adni a vmcore sysrq dump után ...

Természetesen kérdésekre tudok választ adni ... teszt VM van amit bármikor tönkre tudok tenni ...

Üdv.: Árpád