Katie Bouman, Python, fekete lyuk

Mi mást használtak volna a fekete lyuk fényképének elkészítéséhez, mint
azt a sokszor lesajnált pythont:
https://www.reddit.com/r/Python/comments/bbrhr4/they_use_python_to_prod…

Hozzászólások

Mert ehhez volt fejlesztői tudás/kapacitás?

Ha megírták volna C++-ban, akkor vajon mennyi áramot és közvetve CO2-t spóroltak volna meg? És ha kioptmimalizálják a magját ASM-ben - ahogy Hajbi szokta javasolni?

Vicces, hogy valami 200 fős csapat dolgozott a projekten, de kinézték maguknak ezt a lányt, hogy őt fogják sztárolni. Mintha ő lenne a gólkirály, vagy ilyesmi.

Kb ez megy most, mert a háttérhatalmak idén most éppen olyasmiben ügyködnek, amiklhez nőket akarnak láttatni a világgal a kompjúterszakmákban. Majd lecseng ez az eröltetés is. Aztán jön a következő faszság (pl. a hermafrodita transz-apacshelikopterek nyomkodása mindenféle Tech-cégvezetői székekbe).
--

Nekem se fáj, de ha igazak a kritikák, akkor a "lány aki az algoritmust fejlesztette" és a "nő aki a fekete lyukról készült kép mögött van" címlap címek nem kicsit túlzóak, amikor csak a font méretet állítgatta a színsávon és más kódjait commitolgatta fel.

És innentől kezdve felmerülhet a kérdés, hogy nem kettősmérce történik-e azáltal, hogy egy csajt helyeznek ennyire előtérbe, miközben egy srác írta a 900 ezer sornyi kód 95%-át, akiről viszont semmit se lehet tudni, mert csak a statisztikákból derül ki....

Ha igazak. Nagyon szep osszeallitas, de ugyanugy lehet szubjektiv, es kivulrol ezt szerintem mi nem fogjuk tudni kitalalni/eldonteni. De gumicsontnak mindenkeppen tokeletes. :)

A sracrol egyebkent lehet tudni:

https://twitter.com/thisgreyspirit/status/1116518544961830918?ref_src=t…

So apparently some (I hope very few) people online are using the fact that I am the primary developer of the eht-imaging software library (https://github.com/achael/eht-imaging …) to launch awful and sexist attacks on my colleague and friend Katie Bouman. Stop.

Our papers used three independent imaging software libraries (including one developed by my friend @sparse_k). While I wrote much of the code for one of these pipelines, Katie was a huge contributor to the software; it would have never worked without her contributions and the work of many others who wrote code, debugged, and figured out how to use the code on challenging EHT data. With a few others, Katie also developed the imaging framework that rigorously tested all three codes and shaped the entire paper (https://iopscience.iop.org/article/10.3847/2041-8213/ab0e85 …); as a result, this is probably the most vetted image in the history of radio interferometry. I'm thrilled Katie is getting recognition for her work and that she's inspiring people as an example of women's leadership in STEM. I'm also thrilled she's pointing out that this was a team effort including contributions from many junior scientists, including many women junior scientists (https://www.facebook.com/photo.php?fbid=10213326021042929&set=a.1021145… …). Together, we all make each other's work better; the number of commits doesn't tell the full story of who was indispensable.

So while I appreciate the congratulations on a result that I worked hard on for years, if you are congratulating me because you have a sexist vendetta against Katie, please go away and reconsider your priorities in life. Otherwise, stick around -- I hope to start tweeting more about black holes and other subjects I am passionate about -- including space, being a gay astronomer, Ursula K. Le Guin, architecture, and musicals. Thanks for following me, and let me know if you have any questions about the EHT!

Nem tudom, mashol min megy a musor, nem kovetek minden dramat minden kiskanal vizben.

Pl nem tudtam/tudom, hogy a projekt minden resze publikus kod-e (te biztos utanajartal), es hogy a konkret team strukturat es hogy ki mit csinalt, az orrunkra kotik. Mondjuk nekem se kedvem se idom kovetni es kiszamolni hogy hany ember pontosan hanyat kommitolt es hova, de gondolom, ha valakit nagyon erdekel, majd megteszi, hajra, ha nincs jobb dolga.

Valamit a temahoz illetve a linkelt hozzaszolashoz? Ha mar az altalad emlitett emberke irta akirol semmit se tudni?

Ha megnezed a commit-okat, nem csak fontokat allitott azert.
Maga a kod sem 900k, a python kodsorok szama 36667...

Sajnalatos, hogy ennek a kepnek a kapcsan mar tobbeket jobban erdekel a 'felhajtas', mintsem maga az eredmeny.
Az, hogy a kodhoz mekkora mertekben jarult hozza a lany, nezzetek meg codescene-nel, vagy valami massal, ha mar annyira zavar, de meg az sem mutatja meg, hogy maganak a kepnek az elkeszitesehez mekkora mertekben jarult hozza. Tehat ami a kodban van, amogott sokszor van egy whiteboard is, kulonosen mikor kicsit szamolgatosabb problemakra ir az ember kodot. Lehet ott is kivette a maga reszet. Persze az is lehet, az elvegzett munka alapjan mast jobb lett volna kiemelni...
Ezt viszont kivulrol nehez megitelni.
Az, hogy kit mikor miert ki helyez eloterbe, arrol megvan a privat velemenyem, de azert azt objektiven ki lehet jelenteni, hogy akit most kiemelnek, o azert hozzajarult az eredmenyhez es amilyen stilusban -mondjuk ugy- kritizaljak ot, az mindenkepp problemas. A cimlapok meg... nem tartom valoszinunek, hogy o diktalta volna ezeket.

Az meg hogy python... hat ez van. Nem hinnem, hogy szamitana barmit is. Ok ezt valasztottak, elsosorban azert nem fejlesztokrol van szo, hanem fizikusokrol.

Ami viszont jo irany: kint van github-on (nem tudom, ez az egesz-e, stb...).

szerintem feleslegesen fárasztod magad :)

már elkönyvelte, hogy az egész csak ellene van felépítve, és hogy ennek egy nő az 'arca' az csak az ő, és csakis az ő bosszantására van és különben is a fold lapos, az univerzum meg csak egy vászonra festett kép az ég helyen. a többi meg az árnyák világhatalom kreatúrája. sorospénzen persze..

A csaj (meg az egész csapata) pont nem fizikusok, hanem informatikusok. Ez kicsit olyan, mintha a Higgs-bozon megtalálása után elkezdtek volna egy gépészmérnököt sztárolni, mert ő tervezte a csőszakaszokat összefogó csavart. De valami diversity manager jó ötletnek gondolta, a csaj meg valószínűleg pont a háta közepére kívánja, hogy politikai célból mutogatják. Ismertem hasonló helyzetben lévő lányt, ő nagyon utálta, hogy a szakmailag indokoltnál több figyelmet kap, mert ő az egyetlen nő a csapatban, ott is hagyta az egészet. A kódsorok számához meg csak annyit, hogy mindig a junior kapja a piszlicsáré, repetitív feladatokat, amiből sok sornyi commit lesz, itt meg a sorok nagy része eleve adat.

Ami engem egyedül felbaszott a sztoriban az az, hogy sok sjw már azon vitatkozott twitteren, hogy Nobel díj vagy Fields medál jár neki, miközben nem hogy ő, az egész project a közelében sincs annak, hogy Nobelt érjen. Majd biztos ezen is lesz picsogás a hozzáértő laikusok által.

Pythonhoz még annyit, hogy ezeket nem vanila pythonban, hanem külön erre készült library-ket használva írják, a legmélyén BLAS meg LAPACK végzi a számolások nehezét. Lefogadom, hogy az ide írók 99.9%-a 10-szer annyi idő alatt sem közelítené meg a teljesítményét tetszőlegesen választott nyelven.

> az egész project a közelében sincs annak, hogy Nobelt érjen

Igen, rádiótávcsövek eddig is voltak, csak ekkora távolságot (majdnem teljes Föld átmérő) eddig nem sikerült átfogni velük, meg gondolom a vételi pontosságot, a számítási kapacitást, hasonlókat javítottak apró lépésekben. Az egész egy óriási mérnöki teljesítmény, és remekül példázza, hogy óriási nemzetközi összefogásokkal lehet már a méréseinken javítani. Hihetetlen léptékű projekt, rengeteg minőségi emberi munkával benne.

Viszont nincsen benne eredeti tudományos elmélet, vagy áttörés, ami Nobel díjat érne.

> De valami diversity manager jó ötletnek gondolta, a csaj meg valószínűleg pont a háta közepére kívánja, hogy politikai célból mutogatják. Ismertem hasonló helyzetben lévő lányt, ő nagyon utálta, hogy a szakmailag indokoltnál több figyelmet kap, mert ő az egyetlen nő a csapatban, ott is hagyta az egészet.

Hogy mennyire a háta közepére kívánja azt mondjuk nem tudhatjuk és a te ismerősödből nem is lehet ezt levezetni. A Ted Talkon ez a Katie tartotta a témáról pont 2 éve az előadást, tehát beszélni szeret róla nagyobb nyilvánosság előtt és nincs is ezzel semmi baj, mert szükség van a jó kommunikációra. Ő bemutatta, hogy egy nagy csapat dolgozik rajta. Nekem csupán azzal van bajom, hogy az újságírók ennyire leegyszerűsítik és egyoldalúan mutatják be a dolgot a szenzációhajhász szalagcímeken, mintha egyedül dolgozott volna rajta. De nyilván értem azt is, hogy így jobban eladható a story...

Abból a kódból amit a srác írt sem derült ki mi az ami tényleg kód meg mi az ami csak metadata. Ha megnézed vannak ott több megás .txt fájlok is több-tízezer sorral. Ami viszont fix infó, hogy nem Katie Bouman algoritmusa volt az ami a végső képet kigenerálta. Három másik algoritmus kombinációja volt.

inkább az a vicces hogy beállsz a nőgyűlölők táborába, mert valaki képes aktívan levezetni egy ilyen projektet. te meg nem.

vagy nem is vicces..
csak olyan vakkomondoros :))

és azért írták pythonban, hogy legyen mivel lehülyézni őket azoktól akik csak ugatják az egészet, vagy még azt sem:))

Szégyennek elég nagy szégyen, hogy egy világelső egyetem kutatóintézetének csupán trendi scriptnyelvekben való tapicskolásra futotta, ugyanakkor én ezt pont nem érzem égető problémának. Azért nem, mert ez egy belsős használatra összerakott program script, ami jóeséllyel 1x futott le teljes egészében. Sokkal nagyobb gondnak érzem azt, hogy egyre inkább terjed a scriptnyelvekben való komplett felhasználói alkalmazások és rendszerkomponensek írkálása, amit nap mint nap futtat több millió számítógép, gigawattokat pocsékolva el szoftverfejlesztőék kényelmeskedésének köszönhetően. Ideértve nem csak a Red Hat és a Canonical vadfejlesztési habitusait, de a Microsoft bloated PowerShell scriptjeit is, amik számítógépek százmillióin futnak minden frissítéskor.

Nyugodtan kötekedhetsz a számokkal, valamennyire még jogos is, mert kirakták a netre, tehát bárki lefuttathatja. Viszont nem gondolom, hogy annyiszor futtatták le, mint ahányszor lefutnak a bloated csomagkezelő, frissítő stb. scriptek szerte a világban (százmilliós nagyságrend). Azt sem gondolom, hogy több energiát fogyasztott a feketelyuk Python általi kiszámolása ez egy átlagos Windows 10 Creators Update az összes azt megkapó számítógép energiafogyasztására nézve.

Apróság, de szerinted a teljes feldolgozást az utolsó betűig Python csinálta? Én azért kétlem... Már csak amiatt is, mert a tényleges számolgatást bizony ott is C-ben írt függvénykönyvtárak végzik, amiket most épp egy nem előre lefordított kódot produkáló nyelvből használtak.

A Windows 10 Creators Update olyan 2-3GiB méretű, aminek nagyjából kétmilliószorosa volt a feldolgozott adathalmaz, ez az egyik - ezért sem gondolom, hogy csak python-ban ment minden - komplexebb számolgatásra kifejezetten jó, és megfelelően tesztelt, eredetileg C illetve Fortran nyelven írt cuccok vannak, amiket - milyen meglepő - más nyelvekből is lehet használni.
A másik, hogy a frissítések telepítése során értelmes teljesítményű gépen nem minden seteben veszed észre, hogy megy a frissítés - igen, a munkáddal együtt akár 100%-on is pöröghet a magok egy része, vagy egyszer-egyszer mindegyik, és a memória is ki lesz töltve adatokkal, de azért van a cpu is, meg a ram is, hogy hasnzáljuk. És egy korszerű CPU még mindig kevesebbet eszik így, mint az n generációval régebbi villanykályha kategóriás vacak.

A Windows 10 Creators Update olyan 2-3GiB méretű, aminek nagyjából kétmilliószorosa volt a feldolgozott adathalmaz

Tehát minimum kétmillió Windows 10 felhasználó esetén jutunk el oda, hogy az adat mennyisége megegyezzen. Ahová viszonylag hamar eljutunk, hiszen többszázmillióan használnak Windows 10-et. Ami többszázmillió munkaálláomást jelent. Mindegyik fel fogja dolgozni azt a 2-3GB adatot, ha nem is bonyolult matematikai műveleteket végezve el rajta, de annál inkább bloated scriptnyelvből. Egy Windows 10 Creators Update feltelepítése minden egyes Windows 10 felhasználó gépét számításba véve, nagyságrendekkel több erőforrást igényel, mint az MIT idealista feketelyuk projektje.

a frissítések telepítése során értelmes teljesítményű gépen nem minden seteben veszed észre, hogy megy a frissítés

Egy SSD minimum kell ehhez, de ha pl. laptopozol és az akkuidő drasztikusan csökken a 100% PowerShell bloat miatt, akkor elég hamar észreveszed. Az újraindítgatást meg szintén észreveszed.

azért van a cpu is, meg a ram is, hogy hasnzáljuk

Igen. Azért van. És azért véges, hogy beosszuk.

egy korszerű CPU még mindig kevesebbet eszik így, mint az n generációval régebbi villanykályha kategóriás vacak

Asztali gépek processzorainak TDP-jében nincsenek nagy különbségek a Core szériában. Az energia nagy részét az új CPU pedig nem működés közben pazarolja el, hanem annak kibányászása, gyártása, szállítása közben pöfögtetik el. Ezért nem fenntartható folyamatosan új gépet venni. A megspórolt energia önző illúzió csupán. Te nem fizeted ki a villanyszámlában, de a környezetet sokkal jobban tönkretetted.

"Egy SSD minimum kell ehhez, de ha pl. laptopozol és az akkuidő drasztikusan csökken a 100% PowerShell bloat miatt, akkor elég hamar észreveszed. Az újraindítgatást meg szintén észreveszed."

Hint: Nem minden esetben.

"Asztali gépek processzorainak TDP-jében nincsenek nagy különbségek a Core szériában." - Hümmm... Core i3-21xx: 2 mag, 65W, Core i5-2xxx: 4 mag, 95W (bőven nem dupla TDP dupla magszámra), de van belőle egészen 45W-os TDP-ig, de ha az Ivy Bridge szériát nézzük, akkor 77W-os TDP-vel van négy mag, és ez igaz az i7-re is - akol az L3 cache harmadával nagyobb, miközben a fogyasztás ugyanakkora.

Ha a mikroarchitektúrákon lépkedünk felfelé, akkor szépen látszik, hogy 1W TDP-ből egyre nagyobb számítási kapacitást hoznak ki.

"Az energia nagy részét az új CPU pedig nem működés közben pazarolja el, hanem annak kibányászása, gyártása, szállítása közben pöfögtetik el."

Nomostan van egy új cég, új munkahelyekkel, amiket fel kell szerelnie számítógépekkel. Oda akkor is "oda kéne pöfögtetni" a pécéket, ha évekkel korábbi technológiára épülve gyártották volna le azokat, hiszen tök mindegy, hogy a dobozban abakusz van, vagy a legújabb CPU-val szerelt erőgép.

Kb. igen. Ez már olyan szintű izzadtságszagú kierőltetett kula, amitől az intel marketingesei garantált tripla-aranyeret kaptak, mire kitolták. Ennyire nyilvánvaló hazudozást, hogy a ráírt 65W igazából 95W, de lehet még 165W és 215W is attól függően h. épp mi van. Amikor a köcsög usa-megacorp nem képes beismerni h. szemedbehazudott, de rajtakaptad.
--

Nomostan a P_valós*hazugságtényező=P_katalógus mindegy, hogy igaz, vagy sem, a P_katalogus_x értékeket hasonlítottam össze, azaz mindegyik ugyanúgy "hazugsággal terhelt" érték, pontosabban adott mérési módszer szerint számított elméleti adat.
Ha arra vagy kíváncsi, hogy a CPU tápfeszültségének és a táplábakon átfolyó áramnak a szorzata maximálisan mennyi lehet, akkor azt kell mérni és számolni, illetve összehasonlítani, ha meg arra, hogy a TDP definíciója szerinti értékek hogyan alakulnak, akkor azt. Mint az autóknál a fogyasztási adatok, abból is van NEDC ciklus szerint mért és számított adatsor, meg van a tömeges használati adatok alapján készülő statisztikákból kieső adatsor - meg van a saját, ezektől akár lényegesen eltérő teletank módszerrel számolt átlagod. Mindegyik alapján össze lehet hasonlítani az autók fogyasztását, a lényeg az, hogy ha az egyiknél a NEDC alapon kapott adatsort nézed, akkor a másiknál is azt kell előszedned.

Egyébként szabad a pálya: lehet csinálni olyan "mérőkódot", ami n magra/szálra (közel) lineárisan skálázódó számítási teljesítményt igényelve dolgoztatja a CPU valamennyi komponensét (inc. L3 cache), és azt több, előre definiálit inputtal futtatva mérni a CPU áramfelvételét. Mindezt úgy, hogy a CPU teljesítményszabályozását is megtornáztassa rendesen. Aztán ezt elnevezni RPTDP-nek :-) és utána ez alapján összehasonlítani, hogy adott számítási igény elvégzéséhez mennyi időre és energiára volt szükség egyik meg másik CPU-nak.