Metaadat és digitális lábnyom... takarítsd ki feltöltés előtt

Kormányzati doksi akadt a kezem közé, természetesen MSO natív formátumban, úgyhogy belenéztem a metaadatokba, kicsit nézelődtem a fájlban egy 7-Zippel, ill. eleresztettem pár Google keresést. Volt vagy 5 perc...

Ezek alapján majdnem biztos, hogy: a NISZ által menedzselt/telepített Windows 10-es gépen, Office 2010-et (*) használva, egy nevesincs, középfokú tanulmányokat végzett valószínűleg ügyintéző összerakott egy listát, ami érint legalább egy olyan intézményt, amellyel korábban kapcsolatban állt, egy hónappal a lista elkezdése után nyomtatták ki utoljára a doksit, majd a publikálás napján hajnalban még egy államtitkár valamit módosított rajta. A telepített nyomtatóban 4 papírtartó, egy boríték adagoló és egy kézi adagoló van.
Egyébként január óta elégedetten használ egy entry level Logitech vezeték nélküli egeret [off: ami egyébként tényleg jó, sajnos a gombjai gyorsan kopnak :( ], adott rá reviewt az online shopban, ahol megvette.

(*): A verziószámokat és nyomtatóinformációkat az államtitkár gépe is felülcsaphatta.

Hozzászólások

Szerkesztve: 2020. 07. 15., sze – 21:07

Még a nyomtatót megértem, de az, hogy milyen egér ??  Ehhez mi köze van egy dokumentumnak ? Már csak az IP cím OS versio és teljes hardver config hiányzik.

Az egér típusa speciel a webshopból jött, ahol névvel írta a review-t (és ami miatt ha rákeresel az illető nevére, a Google a képtalálatoknál csak Logitech egereket dob ki egy bizonyos webshopból :) ).

A nyomtató típusát meg nem tudom, csak a nyomtatási tulajdonságokat is elmenti a fájlba (innen jön a Windows 10, mert szerepel a Microsoft Print to PDF string az egyik nyomtató bináris tulajdonságai közt), és az a típus épp felsorolja az összes elérhető papírtálcát :)

BlackY

"Gyakran hasznos ugyanis, ha számlálni tudjuk, hányszor futott le már egy végtelenciklus." (haroldking)

+1

Szerintem pont ezt a file-t néztem én is :)

Mert van olyan program ami nem kem ?

Hatso urgyuru tagulasi aranyait is tudja aki akarja, ha csak egyszer latott egy kobor laptop kameraja. Aki maskent velekedik az boldog egyugyusegben el es hagyjatok meg neki. Reg 84 van sot mar lehet 85 is ...

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

Szerkesztve: 2020. 07. 17., p – 14:06

Már 20 éve, Office97 idején is léteztek ilyen dokumentum kitakarító 3rd party utility-k, Office 2007-ben pedig már bőven volt ilyen beépített tool mentéskor, ami "anonimizálta". Az h. nem ez a default, gondolom tudatos döntés a redmondi idióták részéről, h. minden szar visszakövethető legyen egy bármilyen kikerült doksikban.

JPEG Exif adatai dettó: milyen kamerával, milyen fényviszonyok, záridő esetén készült, dátum, idő, és lehet h. még a GPS koordináták is bennevannak.

Az h. nem ez a default, gondolom tudatos döntés a redmondi idióták részéről, h. minden szar visszakövethető legyen egy bármilyen kikerült doksikban.

Igazából valahol ezt is megértem: sokkal gyakrabban küldök doksit ismert címzettnek, mint ahányszor a neten kell publikálnom egy .docx fájlt. Utóbbi halmazt ráadásul minimálisra csökkenti az, hogy erre inkább amúgy is PDF-et használok, ahol csak lehet.

Na ja, de az ECDL-analfabéta user csak a tünet, arra meg nem lehet berendezkednie egy trillió dolláros cégnek, hogy a magyar ugar biorobotjai nem képesek alapvető feature-öket használni, hiába van neki számítógép használati jogosítványa, whatever that is.

2020 van, már ott tartunk, hogy Office fájlokhoz úgy tudsz jogosultságokat beállítani, hogy azt távolról vissza tudod vonni akkor is, ha az illető már pendrive-on hazavitte a másolatot róla, de egyes helyeknek problémát okoz metaadatok nélkül feltölteni valamit a netre? Ne már. :)

Ez biztosan magyar sajatossag? Ha ugyanez a problema elojon Braziliaban meg Indoneziaban is, akkor nem a magyar felhasznalok a hulyek, hanem a program van valahogy rosszul megirva. Mondjuk ha nem nyilvanvalo a feature, vagy nem ugy kenyelmes hasznalni, akkor siman lehet, hogy nem a felhasznalok hulyek.

Ismerve a ribbon kretensegeit, valoszinubb, hogy a MS a ludas.

Itt szamomra az sem vilagos, hogy kinek lett volna a feladata a metaadatok kiirtasa. Mancikae, aki megirta (akkor a fonoke meg bennmaradt volna), vagy a fonokee, aki jovahagyta, de nem biztos, hogy rendelkezik a megfelelo tudassal hozza (nem veletlenul nem o irta, nem o nyomkodja egesz nap a wordot, feltehetoen mashoz ert). Esetleg az online felulete, ahova feltettek (vagy a levelezorendszere, amivel kikuldtek). Egy idoben tul sok netre feltoltott kep tartalmazta a GPS koordinatakat, aztan idovel ezek a kepmegosztok bevezettek azt a feature-t, hogy maguktol kiirtottak belole minden ilyet. Lehet, hogy itt is erre lenne szukseg.

Egyebkent miert kell egy szovegszerkeszto formatumaba belementeni a nyomtato es a hasznalt eger tipusat?

A strange game. The only winning move is not to play. How about a nice game of chess?

akkor nem a magyar felhasznalok a hulyek, hanem a program van valahogy rosszul megirva

Ahogy említettem eggyel fentebb, a user bénázása szerintem csak a tünet. Ez egy program, ami lehetőséget ad elég sok dologra a bénázástól egy olyasmi workflow-ig, amit ugyanabban a hozzászólásban említettem. A két forgatókönyv között az egyik fő különbség a rendszergazda szakértelme. 

Itt szamomra az sem vilagos, hogy kinek lett volna a feladata a metaadatok kiirtasa.

Mondok egy alternatívát. Megírod a doksit. Rákattintasz egy gombra, amikor publikálni akarod. Elmegy a főnöködhöz, vagy más illetékes személyhez, a rendszer ezt magától eldönti. Ő review-zza a doksit. Ha nem talált semmi kivetnivalót, a rendszer legenerálja neked a kiküldhető, metaadatok nélküli, de elektronikusan aláírt fájlt.

Ez egy igaz történet volt a magyar közigazgatásból. SharePoint Online-ban összekattintgatom neked ugyanezt egy délután alatt. :)

Egyebkent miert kell egy szovegszerkeszto formatumaba belementeni a nyomtato es a hasznalt eger tipusat?

Bele kell? :) "Az egér típusa speciel a webshopból jött, ahol névvel írta a review-t (és ami miatt ha rákeresel az illető nevére, a Google a képtalálatoknál csak Logitech egereket dob ki egy bizonyos webshopból :) )."

Először meg akartalak védeni, hogy ez tényleg user error, de mióta megint a még-több-szoftverrel-taknyoljuk-körbe-a-user-ostobaságát (plusz folyamatváltás, ami mamutnál tuggyukhogymegy) előjött, már nem :)

Egyértelműen user error, több szinten is (a középfokú végzettségű ügyintéző, a helyettes államtitkár, a Béla, aki publikálta [nekem is szoktak átmenni a kezemen publikálandó doksik, ki szoktam takarítani őket, mielőtt kiteszem, mert tudom, hogy a user elcseszi], a másik Béla, aki nem rakta bele a portál motorba az automatikus takarítást stb.). És egyébként még automatizálni is... legalábbis problémás, mert nem fekete és fehér, hogy mit kell belőle kiszedni (printer preferences maradhat? lehet olyan helyzet, ahol nem gond, lehet olyan, ahol az; doksi készítésének/módosításának idejei maradhatnak? lehet, ahol kell, lehet, ahol maradhat, és lehet, ahol káros [pl. egy visszadátumozott szerződésnél bukó]).

Volt, hogy double blind review-hoz csináltam online rendszert, a szerkesztők felelőssége volt kitakarítani a doksikból a felismerhető adatokat (mármint a szövegekből is - ez pl. szintén nem triviális, ha egy kutatás valami pályázati lóvéból ment, akkor az elkészült tanulmányba annak az azonosítóját a szerzőnek bele kell írnia; viszont a reviewer nem láthatja, mert abból egyértelmű lehet, ki írta... ezért volt emberre bízva, és a lelkükre kötve, hogy a metaadatokat is töröljék). Egyik szervező csapat ezt szépen abszolválta, a második évben kb. két órát élt meg a rendszer változatlan formában, mert benne hagyták a metaadatokat. Gyors fix: a már anonimizáltaknál minden szerzői/intézmény/kutyafüle mezőt REDACTED-re állítunk, aztán ugyanezt beépítettük a feltöltéskorra, függetlenül a szervező teamtől (így összesen egy reviewer látott olyat, amit nem kellett volna, ezért visszautasította a felkérést).

A rendszer kapott egy hasznos feature-t, igen. De attól az még PEBKAC volt, egyrészt tőlem, hogy megbíztam a szervezőkben, másrészt a szervezőkben (és harmadrészt szerencsére a reviewerektől, akik meg szerintem azt se tudják, hol kell ezt megnézni). És akkor kanyarodjunk vissza a mit írtsunk ki kérdésre: a telepített nyomtatók alapján, ha következetesen vannak telepítve a gépek, intézmény szinten belőhető, hogy melyik tanulmány kitől jött. Egyrészt nem nézem ki a célközönségből, hogy meg tudják nyitni a docx-et egy tömörítőben, másrészt azt, hogy utána a bináris szemétdombban (printer preferences az) turkálnak stringek alapján :)

BlackY

"Gyakran hasznos ugyanis, ha számlálni tudjuk, hányszor futott le már egy végtelenciklus." (haroldking)

Nem egy és nem két auditnál volt szerencsém ilyenhez, hogy weboldalra kirakott/partner(ek)nek/ügyfeleknek/stb. kiküldött doksikupacból csillió+1, részben szenzitív információt lehetett kinyerni a publikáló cég belső IT-infrastruktúrájáról. És nem csak office dokumentumokból, hanem pl. pdf-ekből is...

Na igen, a PDF-eknél is vannak aranyos mezők :) Szerencsére a pdtk dump_data_utf8 / update_info_utf8 nagyon jól használható.

Másik kedvencem, amikor jól átküldöm a webes cuccból a "PDF exportot" (értsd: nyomtatás -> Print to PDF), és benne hagyja a az URL-t... helló, bejelentkezett user session id-ja :)

BlackY

"Gyakran hasznos ugyanis, ha számlálni tudjuk, hányszor futott le már egy végtelenciklus." (haroldking)

Ez az NKI letölthető makrós excel tábláira emlékeztet. :D Ott több hálózati nyomtató is van az (\\srvvm00wsus) gépre telepítve. :D