Néhány üzemeltetési tapasztalat:
1.
XenServer 6.5->XCP-ng 7.6 váltás (+ elérő host CPU) közös XCP-ng -s xencenterből megoldható, live-migrationnal is. Hatás: pár óra-2nap után a VM csontra fagy. Force reboot segít.
XCP-ng 7.6->XCP-ng 8.0 ugyanazon típusú host cpu-val a 2 node-on, live migration esetén szintén előfordult.
Mindkettőre a megoldás: live-migraton után VM reboot.
2.
XCP-ng 8 alatt ősidők (XenServer 5.6) óta problémamentes futó monitoring VM csontra fagy. Force reboot után nem tudja használni a virtuális diszket. Backupból történő visszaimportttal megoldottam. A problémás vm diszket mai napig nem tudom törölni, fogja a rendszer: "Control domain on host .."
Semmiféle vbd és hasonló parancsokkal nem megy az unplug, destroy, delete. Azóta már host újraindítás is volt, beragadt.
3.
XCP-ng 8-on a szokásos xenserveren is használt backup script nem tudott lefutni: snapshot készítés, vm-be konvertálás, vm export, vm diszkek törlése, vm törlése és ezzel átmegy a teljes hoston.
Nem tudott snapshtotot készíteni. nem tudtam lekérdezni az sr-listtel a local storage-ben lévő vm diszkeket. Timeoutra futott. Ha leállítottam egy VM-et, nem tudtam elindítani, mert nem tudott hozzáférni a local storage lvm-hez rendesen. A meglévő VM-ek gond nélkül mentek.
Host reboot után minden rendben.
4.
XCP-ng 8 alatt az egyik nagyforgalmú VM csontra fagyott. A 10GB-s renszer diszkje reboot után nem látható. Beraktam egy "service VM" alá, ahol már van indíuló rendszer diszk, xvdb-nek próbálta volna felismerni, de eldobta, hogy nem tudja olvasni. Az a VM diszk úgy tűnt kuka, holott a többi 150GB-s vm diszkje meg jó volt. Választás: több száz GB-s VM import backupból, system diszk felhasználása vagy teljes host restart. Hátha alapon. És a host restart megoldotta. Mintha mi sem történt volna, a problémás VM bebootolt, az FS nem volt corrupt. Na ez a baz+ kategória nálam. Utánakerestem, és XenServer 7-ből hozták ezt az 3-4 bugot. Reportolom az XCP-ng felé, de ha hozott anyagból dolgoznak, akkor szerintem ez ennyi.
Nálam pedig az utolsó 2 nagyon csúnya, váló ok gyanús.
Az mondjuk még érdekes lehet, hogy shared storage-nél is jelentkezik vagy csak local storage-nél, mert én az utóbbit használom. Ámbár XenServer 5.6 óta használom ezt a technológiát, soha nem volt ilyen gondom.
hibaüzenetek:
XCP-ng hoston dmesg: Buffer I/O error on dev dm-44, logical block 2628577, async page read
"service VM" -en dmesg, ahol attacholtam a problémás diszket:
kernel: [ 5.825837] Buffer I/O error on dev xvdb, logical block 0, async page read
kernel: [ 5.825869] Dev xvdb: unable to read RDB block 0
kernel: [ 5.825920] print_req_error: I/O error, dev xvdb, sector 0