Sziasztok,
Dell ME5 storage + Proxmox VE környezetben futó iSCSI alapú storage rendszerünknél komoly I/O wait és teljesítmény-anomáliák jelentkeznek (időszakos extrém IO-wait, VM-ek megfagynak, ME5 GUI lefagy, olvasási teljesítmény szélsőségesen változó).
Firmware frissek, multipath konfig Dell ajánlás szerint, RAID10 + SSD read-cache kipróbálva, PBS mentés optimalizálva, PVE friss telepítéssel is tesztelve. A jelenség változó, de vissza-térően tapasztalható, és szeretnénk helyben szakértővel kielemezni.
Keresek olyan szakembert, aki jártas:
- Dell ME5 / ME-sorozatú storage-ban
- iSCSI konfigurációban (ALUA, multipath, tuning)
- Proxmox VE storage integrációban
- teljesítményproblémák diagnosztikájában (I/O, latency, fio, multipath-d)
Helyszín: Székesfehérvár
Olyan valakit keresek, aki személyesen, helyben is tud foglalkozni vele (nem csak távoli) és lehetőleg számlaképes.
Köszönöm!
- 355 megtekintés
Hozzászólások
A diszk konfigurációt leírod? Csak arra gondoltam ha HDD-k vannak RAID10-ben és előtte read-cache SSD, akkor letörhet a teljesítmény ami nincs cacheben és HDD-ről kell olvasni. A szélsőségesen változó olvasási teljesítmény is erre utal, amikor nem cacheből jön az adat.
- A hozzászóláshoz be kell jelentkezni
- A hozzászóláshoz be kell jelentkezni
Switchen és direkt kapcsolaton is ugyanaz a helyzet?
- A hozzászóláshoz be kell jelentkezni
Ha írnál kicsit bővebben az architektúráról, akkor szerintem itt mi is segítenénk.
Pár apró kérdés részemről:
- Pontosan mi a ME5 storage konfigurációja? Modell, lemezek mérete és száma, SSD mérete stb.
- Van-e storage replikáció?
- Hogy áll a tiering? Mit mutat az ottani statisztika?
- Az SSD az RI vagy Mixed Use?
- Hogy néz ki a storage és host közötti hálózat?
- Mit lehet tudni a hostról? Hány VM fut rajta? Mekkora az overcommit rate?
- Használtok-e thin LUN-okat?
- Csak egy pár adott VM-nél jelentkezik a hiba vagy bármelyiknél?
- Mit mutat a storage statisztika az írott / olvasott adatok arányára nézve?
- A hozzászóláshoz be kell jelentkezni
Sziasztok
Köszönöm a választ megpróbálom összefoglalni jobban, de már őszintén nem hiszem hogy én meg tudom oldani....
A storage egy Dell ME5012, 10×4 TB SAS HDD RAID10-ben (512 k chunk), és van mellette egy 1,9 TB SSD read cache (RI típus). Cache policy: write-back + adaptive read-ahead. Nincs tiering vagy replikáció, csak egy pool és volume. A firmware a legfrissebb.
iSCSI-n keresztül csatlakozik, 2×25 Gbit/s round-robin ALUA multipath (Dell multipath.conf ajánlás alapján), jumbo frame aktív.
Direkt Dell dac kábelkapcsolattal (switch nélkül)
Host oldalon Proxmox VE 9 (kernel 6.14), LUN thin, kb. 15 VM fut rajta, 60–70 % overcommit mellett. A gond leginkább Proxmox Backup mentés közben jön elő, amikor az I/O wait kilő és a VM-ek megállnak. Írás 600–1000 MB/s, de olvasás néha beesik 200 MB/s alá (fio-val 13–15 MB/s is előfordult). SSD cache-szel a GUI lefagy, nélküle stabilabb, de időnként továbbra is vannak I/O delay.
- A hozzászóláshoz be kell jelentkezni
Szerintem erdemes korulnezni a TCP Delayed Ack es az iSCSI Queue Depth beallitasok korul.
- A hozzászóláshoz be kell jelentkezni