Van egy 1 node-s Kubernetes clusterem, amin semmi nem fut(na), csak egy gitlab, aminek hostpathon vannak a cuccai. 1.22-ről jöttem fel 1.31-re, már ott tartok, h nulláról húzom újra, és 2 perc futás után minden ok nélkül lekapcsol a cluster.
Átmegy ready-be, minden faszának tűnik majd szétrohad a picsába. A kubelet logja gyakorlatilag olvashatatlan, nem tudom mit keressek benne, a kube-system alatti cuccokban nincs érdemi hiba, minden error kezdetű dolgot meggoogleztam, de semmi.
Nem tudok mire keresni, a kubelet logjában ugyan van egy csomó error, de tapasztalatból tudom, hogy ez normális, idő mire elindulnak a dolgok, de közben force probál minden mindenhez csatlakozni. 5 órája szopok vele, és kicsit tele van a hócipőm ezen a ponton.
A kubeadm reset / kubeadm init után van ez, nem fut még semmi, még a calicot sem tettem fel, mert odáig sem jutunk el. A containerd jó, abban sem látok hibát. Már csináltam egy default cni konfigot is ez alapján, de az se segít. El sem tudom képzelni már, mit rontok el, semmi extra nincsen a konfigban.
A kubeadm-et így futtatom:
kubeadm reset -f
kubeadm init --pod-network-cidr=10.88.0.0/16
Kínomban már leszedtem az ufw-t is (amúgy disabledben volt), az sem segített. Találtam egy ufw konfigot hozzá, bekonfiguráltam, hogy hátha valami defaultja van, ami beleszól, az se.
A kubelet logja főleg azzal van tele, hogy CrashLoopBackOff -ba került a kube-scheduler meg a kube-apiserver.
A kube-apiserver logja lényegében eseménytelen, a kube-schedulerben látok ilyet:
I0928 22:12:48.463694 1 shared_informer.go:313] Waiting for caches to sync for client-ca::kube-system::extension-apiserver-authentication::client-ca-file
E0928 22:12:48.463762 1 shared_informer.go:316] "Unhandled Error" err="unable to sync caches for client-ca::kube-system::extension-apiserver-authentication::client-ca-file" logger="UnhandledError"
de ezt azt tippelem, azért írja, mert a kube-apiserver épp nem fut olyankor. És mindegyik szervíznél azt látom, hogy valamilyen - számára - külső ok miatt álltak le.
FONTOS:
Nincs érdemi mentendő dolog a clusteren, a gépet nem tudom újra telepíteni, és a gitlab mappái kellenek ofc, de minden más kuka lehet mindaddig, amíg a gép maga még be tud bootolni és SSH-n elérhető lesz.
Felhőbe menni nem opció, külső szolgáltató nem opció (tőlem félig-meddig független okok miatt, erről nem tudok és nem is akarok bővebben beszélni). Szeretnék itt egy egy node-os k8s clustert, mert később kerülnének ide szolgáltatások, de ha ezt holnap délig nem oldom meg, akkor vmi docker alapú rendszer kerül ide (nem ragaszkodok múlhatatlanul a kuberneteshez, Portainerrel vagy valami más Docker konténereket kezelő cuccal is meg tudom oldani a problémáimat).
A fenti két bekezdést figyelembe nem vevő kommentekre nem fogok reagálni. Minden más segítséget megköszönök és igyekszem válaszolni.