sokkal erősebb gép (48mag, 64GBram), mégis majdnem 2x lassabb rajta a MongoDB

Sziasztok!

Egy sokkal erősebb gép közel 2x annyi idő alatt végzi el a MongoDB importálást, mint a jóval gyengébb és nem tudunk rájönni, hogy miért.

A teszteléshez ezt használtuk: https://github.com/jsteemann/BulkInsertBenchmark
Lokálisan futtatva: `php run.php`

Ami a stage szerveren 261,1 mp alatt lefut az a production-on csak 466,0 mp.
Vagy ami 9,2 alatt az 14,1 alatt.

A lekért MongoDB configból látszik, hogy a production szerveren a storageEngine {persistent} true-ra van állítva.
Azonban ha ezt módosítani akartuk az /etc/mongod.conf-ban (tudom YAML, tab nem lehet),
akkor 2-es kóddal elszáll a mongod main process, ami "The specified options are in error or are incompatible with other options."

Próbáltuk a loggolást teljesen kikapcsolni meg a diagnosztikai adatok gyűjtését, de az sem hozott eredményt.
Próbáltuk azt is, hogy mmapv1 helyett wiredTiger -re állítjuk a tárolást, de nem segített.

A production gép nem csinál ezen kívűl szinte semmit, mert nincs még publikálva az oldal.
Ha valakinek van bármi ötlete, hogy mit és hogyan próbáljunk ki, akkor kérjük írja meg.

A két gép configja:

1. production (fizikai gép)

CPU 48 mag, bővebben: http://pastebin.com/74SbJnAp
RAM 64GB
Disk HDD
RAID LSI Logic / Symbios Logic MegaRAID SAS 2108 [Liberator] (rev 05), bővebben: http://pastebin.com/9vYAg7jL
Ubuntu 14.04.5 LTS
Linux 4.4.0-57-generic
Mongo version 3.2.11 mmapv1
Mongo config etc http://pastebin.com/nB1zNwZS
Mongo config dump http://pastebin.com/2hDCbrD9

2. stage (virtuális gép, KVM)

CPU 2 mag, bővebben: http://pastebin.com/74DPCQ20
RAM 4 GB
DISK HDD
Ubuntu 14.04.3 LTS
Linux 3.19.0-78-generic
Mongo version 3.2.1 mmapv1
Mongo config etc http://pastebin.com/YdwTRP2h
Mongo config dump http://pastebin.com/v1mP29Pr

4502 megtekintés

"Disk HDD"

Milyen HDD milyen RAID-ban?

----------------------
"ONE OF THESE DAYS I'M GOING TO CUT YOU INTO LITTLE PIECES!!!$E$%#$#%^*^"
--> YouTube csatornám

1 szavazat

A hozzászóláshoz be kell jelentkezni

+1 erre is válaszolhatnál, kedves poszt-toló!

1 szavazat

A hozzászóláshoz be kell jelentkezni

+1 (signup)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Elnézést kérek, sajnos közbejött pár fontos feladat, de amint lesz időm összeírom.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ennyi információ alapján még tippem sincs. Ugyanakkor azért megnézném, hogy a mongo hogyan fut az egyik és a másik gépen (cpu/mem/io használat egyebek) hátha abból látni valamit.
Gondolom meg van ennek is az oka, de miért nem ugyanolyan OS fut a kettőn?

FathoM

0 szavazat

A hozzászóláshoz be kell jelentkezni

A procik tipusa es orajele? A prod gep mast is csinal olyankor? A stage kernelt is 4.4-re updateeljetek.

0 szavazat

A hozzászóláshoz be kell jelentkezni

CPU stage : http://pastebin.com/74DPCQ20
CPU production: http://pastebin.com/74SbJnAp

A gép nem csinál ezen kívül szinte semmit (smtp/imap), mert nincs még publikálva az oldal.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez nem a pontos CPU típus, az órajel mondjuk legalább kiderül. A stage gépen van egy 400MHz-es előny, bár ettől nem kéne kétszer gyorsabbnak lennie. Ami gyanús, hogy az első gépen ha sok NUMA node között ugrál a task ott viszont lehet veszteség.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az a persistent=True az IN-MEMORY storage engint engedelyezi. Valoszinu hogy eleg sok adatot tol a memoriaba es kevesebb a disk I/O. Idovel aztan kiirja de gondolom a 64G-be eleg sok minden belefer es mongo egyebkent is szivesen elterpeszkedik es kihasznalja ami rendelkezesre all - plane ha kered is ra a konfigbol.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Shot in the dark, de amikor legutoljára ilyennel találkoztam (test rendszeren korrekt sebesség, éles rendszeren több nagyságrenddel lassabb, miközben a HW messze elég kellett volna, hogy legyen), egy haveged telepítés oldotta meg; gyakorlatilag állandóan üres volt az entropy pool és arra várt a rendszer.
Egy cat /proc/sys/kernel/random/entropy_avail -t megér.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez pont akarmi lehet. A mongot nem ismerem de nem jo az eltero rendszer a dev es prod kozott de az itt egy update szerencse.

A verziok elterese mellett a numa lehet baj vagy, vagyis minden cpu var a masik altal kezelt memoriaraban levo adatra.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszi az ötletet, észben tartom...

Szerkesztés: közben megneztem sok helyen írják hogy vcpu-bol sok a 16 is egy virtuális gepbe. Ma is tanultam valamit...

0 szavazat

A hozzászóláshoz be kell jelentkezni

miert lenne sok? persze ha a fizikaiban van 4, akkor sok :)

nekunk 28 magosak a legnagyobb VMeink, ez elfer egy numa zonaban (2x14 mag + HT van alul), igy nincs veluk semmi problema. csak a NUMA-t eszben kell tartani.

0 szavazat

A hozzászóláshoz be kell jelentkezni

hdparm -tT ?
Iostat ?
Htop/stop valami piros?
Mekkora a db? Simán befér a kis gép memoriajaba is?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Esetleg ki lehetne próbálni, hogy ha 47 magot letiltasz, akkor gyorsabb lesz-e, vagy lasabb.

0 szavazat

A hozzászóláshoz be kell jelentkezni

elsővilágbéli gondok

0 szavazat

A hozzászóláshoz be kell jelentkezni

:D :D

----------------------
"ONE OF THESE DAYS I'M GOING TO CUT YOU INTO LITTLE PIECES!!!$E$%#$#%^*^"
--> YouTube csatornám

0 szavazat

A hozzászóláshoz be kell jelentkezni

regen wotnal mukodott! :p

--
NetBSD - Simplicity is prerequisite for reliability

0 szavazat

A hozzászóláshoz be kell jelentkezni

A production gépben lehetőleg RAID5-ben vannak a diszkek?

--
Gábriel Ákos
http://ixenit.com

0 szavazat

A hozzászóláshoz be kell jelentkezni

2017ben remelhetoleg SSD-n van minden, es elfelejtjuk mar a szar HDD-ket meg a RAID5-ot

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hah, most mondjam azt, hogy egy atlagos, n3.nhs.uk datacenterben evi 60 GB HDD (!) tarhelyet hozzacsapni egy virtualis gephez 1500 dollar? SSD-bol meg negyszer ennyi?

Tragikomedia.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

az gondolom valami SAN storagerol jon, nem local HDD-rol beszelunk, nem?

0 szavazat

A hozzászóláshoz be kell jelentkezni

De. Ettol fuggetlenul elkepeszto.

----------------------
while (!sleep) sheep++;

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az a nettó 60GiB az datastore-t tekintve nagyjából 70, ha raid1, akkor 140, ha meg replikálva van egy másik DC-be, akkor 280... És a SAN-okba való diszkek nem az olcsóságukról híresek, ráadásul ha jó iops-ot akarsz tengelyes diszkekkel, akkor sok, relative kisebb diszket pakolsz a motyó alá - ami sok fiók (az sem két fillér, bár a betolható diszkek kapacitását és árát tekintve nem vészes - kivéve, ha kevés üf. miatt kell polcokat venni...)
SSD-vel annyiban jobb a helyzet, hogy ott nem elég kevesebb meghajtó, és azt sem muszáj raid1 jelleggel összepakolni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ebbol is latszik, hogy nem csak Magyarorszagon elnek meg sokan es jol a kozbeszerzesekbol :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

actual fuck - the comment

0 szavazat

A hozzászóláshoz be kell jelentkezni

Remelhetoleg nagyon nem :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egyszer elofordult, hogy brand gepen (ugy emlekzsem HP volt) a disk vezerlo ujabb firmware kb tizszeresere lassitotta a dolgokat. Firmware downgrade aztan megoldotta.
Szerintem nezzetek meg a firmwareket is a ketfajta gepen.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egyelőre nekem még az sem világos hogy fizikai vagy virtuális gépről beszélünk :)

1 szavazat

A hozzászóláshoz be kell jelentkezni

+1 én is csak tapogatózom

Szerk: közben megláttam. Régi egy VM, az új egy fizikai vas.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Helyben futtatod a tesztet vagy halozaton keresztul?

--
http://blog.htmm.hu/

0 szavazat

A hozzászóláshoz be kell jelentkezni

mindegy

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezek mégis milyen "gépek" ?! (közben jól értelmezem, ezek 4 socket -es gépek, egyenként 6 maggal) mármint a production gép... mert akkor az nem 48 mag, az csak 48 szál - HT ráadásul ezek eléggé öreg CPU -k

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sokat segitene kideriteni a problema okat, ha futna a sar a gepen egy import soran aztan ideposztolnad a linket

sadf -- -A -p | nc graph.sanxiago.com 443

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mongo kepes bizonyos muveleteknel 1 magot enni, ott szimplan az szamit, hogy 1 magja turbo boosttal mennyit szamol. Ezert van az, hogy nalunk gagyi 4 magos 3.4ghz e3/e5 a leggyorasabb mongo alatt.
Masik, hogy aza "Timing buffered disk reads: 368 MB in 3.01 seconds = 122.19 MB/sec" nagyon keves. Nem derul ki, hogy van-e write cache a kartyan, es engedve van-e, read az biztosan nagyon karcsu, olvasast a 64giga ram biztosan segiti, de ha kartya nincsen 2 giga flash/battery cache, akkor tetu lesz az irasod (olvasasi sebessegbol kiindulva).
Csak egy osszehasonlitasert, nalunk 8x144GB 15K sas vinyo, ami 2009ben vettunk, es hozzatartozo raid kartya, raid10-ben 700-800MB/sec produkal. Tegyel ala par ssd-t, es fenyevekkel gyorsabb lesz.

Teszt pedig insert, ami 1 magot fog terhelni, es irni fog a storage rendszerre. Hiaba van akarhany magod, es akarhany giga ramod.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha igazad van, és valoban egy magot használ, meg ha nekem is igazam van akkor:
a dev server BogoMIPS-je 4788, amig az éles 3989, meg orajelben is van különbség. Tehát egy magra nézve a dev erősebb. de fixme
------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

^^ egy igazi szakerto!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen? ------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

BogoMips semmit nem jelent, meg az órajel se (kivéve ha azonos magok)

0 szavazat

A hozzászóláshoz be kell jelentkezni

bogomips ezen a platformon cpu mhz szamanak duplaja. Ha igazad lenne, akkor 3ghz p4 gyorsabb mint egy mai 6 magos 2.4ghzs i7.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Gyerekedet ha van vagy lesz ne igy neveld :d------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

marmint, hogy ne legyen hulye? bocs, de szerintem ez alap elofeltetel.

0 szavazat

A hozzászóláshoz be kell jelentkezni

marmint, hogy ne legyen hulye? bocs, de szerintem ez alap elofeltetel.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ja meg remek motivacios kartyak. ------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

szemelyes failt szeretnel megosztani velunk?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Van ra igeny? :D------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mellesleg nem feltetelezem hogy sok spec matek kell egy inzerthez ergo marad az orajel.... Meg az io. ------------------------ Jézus reset téged

0 szavazat

A hozzászóláshoz be kell jelentkezni

Journaling paramétereket nézd meg. Az nagyban tudja az insert sebességet befolyásolni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Mindenféle hozzá-nem-értés ellenére az elsö megérzés, hogy kb. nincs többszálú végrehajtásra optimalizálva a kód, így a sok CPU mag gyakorlatilag kihasználatlan.

--
robyboy

0 szavazat

A hozzászóláshoz be kell jelentkezni

Tudni kellene, hogy a stage alatt milyen diszk infrastruktura van. Igy eleg nehez osszevetni a kettot.

Azt is tudni kellene, hogy a "DISK HDD" az mit takar egyik illetve masik esetben. Egy RAID 5 gyorsabb is lehet irasban, egy regi SCSI disk lassabb tud lenni, mint egy SAS diszk, raadasul az se mindegy, hogy a production rendszer alatt nem-e valami write cache-sel megtamogatott RAID megoldas van, mig a virtualis gep alatt esetlegesen csak egy nyers RAID van.

Annyi sok minden lehet, hogy ennyibol eleg nehez tippelni. Merj disk IO-t mind a ket gep esetben, hogy lasd, nem az I/O -d keves-e.
--
Blog | @hron84
Üzemeltető macik

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

Az über elit kaszt az, aki… 2025-11-07T00:49:58+0100
Nem értetted meg. Nem lehet… 2025-11-07T00:28:50+0100
Jobban jarsz ha keresel egy… 2025-11-07T00:09:14+0100
nálam sem ugrál. Világosra… 2025-11-07T00:08:41+0100
Nálam nem, de gyorsnak… 2025-11-07T00:07:41+0100
Ez nem erőviszonyon múlt: ő… 2025-11-06T23:59:41+0100
(Most is ugrál a dark mode?… 2025-11-06T23:36:17+0100
2.0.5:Gyorsult az… 2025-11-06T23:29:56+0100
Nem, én itt az… 2025-11-06T23:20:10+0100
Majd ha sikerül megérteni… 2025-11-06T23:17:51+0100

sokkal erősebb gép (48mag, 64GBram), mégis majdnem 2x lassabb rajta a MongoDB

Hozzászólások