ext4-re vált a Google

A Google-ös Michael Rubin egyik levlistán elejtett néhány mondatot arról, hogy a keresőóriás megkezdte a migrációt az eddig használt ext2 fájlrendszerről a körülbelül egy évvel ezelőtt kvázi élesben is használhatóvá nyilvánított ext4 fájlrendszerre.

Rubin elmondása szerint vállalat szakemberei egy rakás időt töltöttek XFS, ext4, JFS fájlrendszereken különböző standard Unix benchmark-ok futtatásával annak érdekében, hogy kiderüljön melyik teljesít a legjobban. Arra jutottak, hogy a Google-nél előforduló terhelések alatt az ext4 és az XFS elég közel vannak egymáshoz teljesítményben. A vállalat azért döntött végül az ext4 mellett, az ext4-re sokkal egyszerűbben tudnak ext2-ről migrálni. Az egyetlen szóba jöhető migráció a Google-nél az online migráció. Rubin utalt arra, hogy később több információt is közzé tehetnek a migrációval kapcsolatban.

Talán az sem vétletlen, hogy Theodore Ts'o, az ext4 fájlrendszer karbantartója nemrég a Google-höz igazolt.

Hozzászólások

a journaled FS-ek csak a metaadat konzisztenciara figyelnek, tehat ara, hogy maga az FS nem esik szet. Az alkalmazas adatvesztese elkerulesere az alkalmazasnak kell figyelnie, erre valo az fdsync(). picit pontosabban az alkalmazasnak is biztositania kell a minden-pillanatban-konzisztenciat, erre a kernel az fdsync() -cel csak elemi lehetoseget ad. A minden-pillanatban-konzisztens allapotnak csak az egyik (konnyu, gyors) megvalositasa a journal, lehet anelkul is megoldani.

Az alkalmazas adatvesztes elkerulesere egeszen biztos erre kimunkalt infrastruktura van a google-nel, az underlying FS konzisztencia biztositasa (ami ext3-nal, ext4-nel van, ext2-nel nincs) esetleg elhagyhato, ha peldaul nincs erdemi metaadat valtozas (az alkalmazas file-n belul manipulal). Ugy gondolom, hogy nem a journal meglete miatt valtanak ext4-re, hanem egyszeruen azert, mert az gyorsabb. (az ext2 elvileg minden futo helyzetben gyorsabb, mint az ext3, mert a on-disk formatuma megegyezik, es nem kell a journalt kezelnie).

mondjuk ha nincs valodi FS metaadat valtas, akkor az ext3/ext2 kozott sincs valodi teljesitmenykulonbseg. Fene tudja kivulrol megbecsulni a google uzemeltetesi koncepcioit.

"a journaled FS-ek csak a metaadat konzisztenciara figyelnek"

... altalaban, az ext3/4 pont tud full journalt.

"az ext2 elvileg minden futo helyzetben gyorsabb, mint az ext3"

Nem, van olyan workload, ahol journallal gyorsabb (sot, halvanyan emlekszek egy LKML-es levelre, ahol Andrew Morton irt egy tesztrol, amiben az ext3-as data=journal vert mindent).

--
Fontos feladatot soha ne bizz olyan gepre, amit egyedul is fel tudsz emelni!

Akkor ezert tuntek el a leveleim. :>