Akár 7-10-szeres gyorsulást ígér a grep új kiadása

Szerszám

A grep karbantartók nevében Jim Meyering ma bejelentette, hogy elérhető a GNU grep 2.17-es kiadása. Figyelemreméltó változás, hogy a felhasználó akár 7-10-szeres gyorsulást is tapasztalhat az eszköz használata közben. A bejelentés szerint az ilyen mérvű gyorsulás nem nevezhető mindennapinak olyan eszköz esetén mint a grep. A változások közt említhető, hogy régóta nyugdíjba készülő "--mmap" opció végleg eltűnt.

Részletek a bejelentésben.

A hozzászóláshoz be kell jelentkezni
7757 megtekintés

Most mi lesz a BSD greppel: http://hup.hu/cikkek/20100815/vita_a_bsd_grep_korul+ ?

A hozzászóláshoz be kell jelentkezni

rpm -q grep grep-2.17-1.fc20.x86_64
Úgy látom, a linkelt bejegyzésben is 2.17 a verziószám, nem pedig 2.7. Javítsd, kérlek!

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

És ezt vajon hogyan sikerült?

Gondolom nem csak annyi történt, hogy megnyomták az XT elején a turbo gombot :-)

A hozzászóláshoz be kell jelentkezni

volt az xt elején turbó gomb? az enyémen nem :D

A hozzászóláshoz be kell jelentkezni

Volt olyan, amelyiken igen. Persze nem IBM volt. És arra sem emlékszem, hogy csak dekoráció volt-e vagy működött is... :)

A hozzászóláshoz be kell jelentkezni

Ejnye & bejnye!
Figyelmetlenségedet ezennel csúsztatásnak minősítem, max. a bejelentőre háríthatod.
Mintha kimaradt volna a lényeg: in a multibyte locale.
Egy ilyen régi cuccost, mint a grep ilyen mértékben gyorsítani számomra csak annyit tesz, hogy eddig rosszul volt megírva.

(Töprengés: Mi a rossebnek kell gigabájtokat multibájtosan greppelni?)

A hozzászóláshoz be kell jelentkezni

Valszeg a japán és hasonló (gondolom kínai, kóreai, stb.) nyelven keresőknek ez egy viszonylag általános kívánalom, hogy japánul (...) tudjon greppelni :)

A hozzászóláshoz be kell jelentkezni

Azért ez általános kívánalom lehet a magyarul vagy bármely szláv, afrikai, ázsiai nyelven beszélőnek is, nem csak a japánnak, kínainak, koreainak. Elvégre az UTF-8ban a nemzeti karakterek erősen több-bájtosak.

A hozzászóláshoz be kell jelentkezni

Biztosan nem ismered az "akár" szó jelentését. Kérlek nézz utána az értelmezőszótárban.

--
trey @ gépház

A hozzászóláshoz be kell jelentkezni

Jajjdehogyisnem! A nyelv változik. Az "akár" manapság leggyakrabban a reklámokban fordul elő. Reklám == törvényes hazugság. A kör bezárult!

Magyarázat. A grep nem multibyte feldolgozásra készült. Aztán belerakták. Most, hogy belenéztem a commit szövegébe, a (fejlesztőkre) vonatkozó megjegyzésem megerősítést nyert.

Megoldottak egy profilozási problémát és feltalálták a karakterkonverziót. Királyság. Így rosszindulatúan (?) az "akár 7-10-szeres gyorsulást" olvassuk már úgy, hogy "nem mindig olyan lassú". És még CPU függő is. :(

A hozzászóláshoz be kell jelentkezni

Úgy gondolom, hogy neked továbbra is értelmezési problémád van. Ha nem és valóban technikai, akkor írd meg a GNU grep listára.

A "lassú" ranthoz érdemes lenne egy elérhető grep implementációkat összehasonlító teszted készítened, mert az állításaid így csak lógnak a levegőben. Én egy ilyen teszttel felszerelve írnék a helyedben a fejlesztőknek.

--
trey @ gépház

A hozzászóláshoz be kell jelentkezni

Vesd össze: szempillaspirál, _akár_ 75%-kal dúsabb hatás, összehasonlító teszt, levél a fejlesztőknek ..., ugyanez megy mosóporra, egészségügyi papírra, bármire, úgy látszik szoftverre is. Szerintem kiválóan értette.
--
ulysses.co.hu

A hozzászóláshoz be kell jelentkezni

Azért nem ártana, ha kifejtenéd. Pl. "Szerintem te ÍGY érted, de ÚGY kellene értelmezn!" Hátha akkor érteném én is mire gondolsz.

Beszélgessünk!
- Lassú a Trabantod! A helyedben nem hencegnék vele.
- Dehogy lassú! Mutasd a Ferrarid!
Ebből a szövegből
- Nem következik, hogy gyors a Trabantod.
- Igazam van, mert tényleg lassú.
- Nincs Ferrarim, de akkor is lassú.
- Nem kell Ferrarit vennem, hogy igazam legyen.
- Ferrari nélkül is el tudom dönteni, hogy a Trabant lassú.

Egyik topicban állítottam, hogy big endian processzoron sokkal gyorsabb karakteres feldolgozásokat lehet írni. Ott és akkor én voltam a hülye és nem értettem semmihez. Itt viszont egy NAGY GREP FEJLESZTŐ írja, hogy 3-7x gyorsabb a CPU függvényében. Hogy is van ez?

That allows the matcher to search in buffer mode, rather than having to extract/case-convert/search each line separately. - Ezt a technikát úgy 15 évvel ezelőtt "találtam fel". (Először a világon, egyedül, elengedett kézzel! :))) A feldolgozási idő 1/24 arányban csökkent. Aprócska különbség, hogy a feledat megoldásához nem volt elég az "akár", mert véges idő állt rendelkezésre. Pontosabban az addig 100k rekordot 2 óra alatt feldolgozó programot kellett átalakítani 1,2M rekord feldolgozására úgy, hogy akár 4-5 futás is beleférjen a 24 órába.

Szóval hidd el, tudom miről beszélek, annak ellenére, hogy nem ötletelek a grep levlistán! És nem is tenném, mert nem grep-et szoktam írni, hanem jóval komplexebb feldolgozásokat.

A hozzászóláshoz be kell jelentkezni

Az ilyen képzett kritikusoknak itt biztosan hasznát tudnák venni. A "lassú"-ra reagálva. A többi hasfájásod - hogy más topikban milyen trauma ért - annyira engem nem érdekel. Az autós hasonlatok sem.

--
trey @ gépház

A hozzászóláshoz be kell jelentkezni

Pedig passzolt ide :)
--
♙♘♗♖♕♔

A hozzászóláshoz be kell jelentkezni

Ez egy igazan kulturalt hozzaszolas volt ismet!
Neha azon gongonkodom hogy mi a f@sznak jovok a hup-ra, mert tisztan latszik hogy meg az uzemeltetoknek is komoly mentalis problemajuk van otthon!

Ha teged nem erdekel hogy O mit gondol, akkor ot miert kellene hogy erdekelje hogy te mit gondolsz???
Komolyan mondom ez nem is igaz.

Blikk/Borsonline == hup!

A hozzászóláshoz be kell jelentkezni

+1
Nem is szorul magyarázatra.

A hozzászóláshoz be kell jelentkezni

Mer olyan az input?

Az egész IT egyik legnagyobb rákfenéje, hogy egy olyan nép volt az úttörője, akinek kb a világ legrövidebb abcje van :)

A hozzászóláshoz be kell jelentkezni

Közülük is legördögibb Morze Sámuel, aki képes volt KÉT BITEN leírni a világot! :)

A hozzászóláshoz be kell jelentkezni

És a szünet? Jó, tudom, az meg a NULL érték :-P

A hozzászóláshoz be kell jelentkezni

Ezt már én is el akartam sütni, csak kicsit megkavarodott a telefon billentyűzete és a végén hagytam a fenébe. :))

A hozzászóláshoz be kell jelentkezni

Jópofi vagy, csak morzézni nem tudsz. :)
bit 0: van jel - nincs jel
bit 1: rövid - hosszú
00 = rövid szünet (két jel között)
01 = rövid jel (pont)
10 = hosszú szünet (két betű között)
11 = hosszú jel(vonás)
SOS=01 00 01 00 01 10 11 00 11 00 11 10 01 00 01 00 01
NULL érték nincs, mert nem storage, hanem stream ;)

A hozzászóláshoz be kell jelentkezni

"Egy ilyen régi cuccost, mint a grep ilyen mértékben gyorsítani számomra csak annyit tesz, hogy eddig rosszul volt megírva."

... meglehet, hogy az egyik fejlesztőnek február elején a tyúkszemére esett egy "Algoritmusok és adatszerkezetek" című könyv :D

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

A hozzászóláshoz be kell jelentkezni

mb az a utf8, nem?

--
NetBSD - Simplicity is prerequisite for reliability

A hozzászóláshoz be kell jelentkezni

Az utf8 az részhalmaza a multibyte kódolásoknak. Másfajta multibyte is létezik.

A hozzászóláshoz be kell jelentkezni

Nemcsak.
A "standard" dolgokat meglátod az oldal alján.

A hozzászóláshoz be kell jelentkezni

"...ilyen mértékben gyorsítani számomra csak annyit tesz, hogy eddig rosszul volt megírva."

Ugyanez volt az első gondolatom, csak én nem mertem leírni. :-)

---
Science for fun...

A hozzászóláshoz be kell jelentkezni

locale | grep -i utf

A hozzászóláshoz be kell jelentkezni

"(Töprengés: Mi a rossebnek kell gigabájtokat multibájtosan greppelni?)"

Me' a juniksz teksztben erős! (Állítólag).

----------------
Lvl86 Troll, "hobbifejlesztő" - Think Wishfully™

A hozzászóláshoz be kell jelentkezni

Állításod bölcs és igaz. Ha kicsit utánaolvasnál rögtön kiderülne, hogy ennek a tulajdonságnak nem a grep a fő okozója.
A grep/fgrep komolyabb adatmennyiség feldolgozására teljesen alkalmatlan. Eddig ezt tapasztaltam, hát ezért a töprengés.

A hozzászóláshoz be kell jelentkezni

Egy nagy büdös francokat erős. Van egy halom jól-rosszul használható izé, ami többé-kevésbé használható módon megpróbálja elmaszatolni az alapproblémát, mégpedig azt, hogy legyen valami jól definiált interface az egyes rendszerek között és ezzel egy 40 éves agysérülést okozva az IT-nak. Aztán ezt azzal próbálják bemagyarázni, hogy "de a juniksz teksztben erős!!!4444"

Aki dolgozott már különféle nyelvterületekről származó adatokat, az érti ezt a problémát. A beszűkültebb meg elrendezi annyival, hogy a hülye gyökér miért nem ezt vagy azt a formátumot használta.

Juniksz teksztben erős? Aham, próbálj meg mondjuk egy TSV-t egy dátumot tartalmazó oszlop alapján rendezni.

----------------
Lvl86 Troll, "hobbifejlesztő" - Think Wishfully™

A hozzászóláshoz be kell jelentkezni

Ha a dátum mező normális formátumú, akkor nem nehéz a feladat - át kell forgatni %Y%m%d formára, aztán mehet a numerikus sort - az más kérdés, hogy a legtöbb nyelvi környezetben valami idióta okból nem a nagy - kisebb - még kisebb egység a normál sorrend a dátumnál...

A hozzászóláshoz be kell jelentkezni

Szerencsére a modern IT régóta megtalálta erre a megoldást! Az egészet betöltöd egy jól hordozható formátumba. Javaslom a COleDateTime VARIANT ojjektumot. Ezt OLEDB és java segítségével áttöltheted egy egy Oracle adatbázisba. Utána már csak egy select.

Alternatív megoldás lehet, hogy tisztában vagy a dátum, az nls, a bájt mibenlétével, és - csakis az előbbiek után - ha még mindig valami nem világos, akkor man sort.

Igaz, egy amerikai nő azért perelt, mert a mikrójának a használati utasítása nem említette, hogy macskát nem szabad szárítani benne. Nos, man sort sem írja le, hogy a vegyes kínai és magyar szavakat miként tudod ciril abc szerint rendezni. Szerintem, ha már rájöttél erre a hiányosságra - pereljél!

Juniksz teksztben erős? Aham, próbálj meg mondjuk egy TSV-t egy dátumot tartalmazó oszlop alapján rendezni.
Nem fogom "megpróbálni"! Több mint 20 éve csinálom, sok-sok millió adattsorral. Nekem működik.

A hozzászóláshoz be kell jelentkezni

Én kifejezetten örülök az ilyesmiknek (nem).

A hozzászóláshoz be kell jelentkezni

:)
Ez nem karakteres feldolgozás. A való világban ezt szinoníma és egyéb szótárakkal oldják meg. Ilyenről a grep esetén szó sincs.
Pl. a "magyar" karakterkészletben szerepel az ä, Ä és a ß. Az első összehasonlítás (rendezés) szempontjából megfelel a magyar nyelvtan szerinti a-á egyezésnek. A második pedig ss kettős karakterré írandó át, mivel a németek már régen "betiltották". Rendezés szempontjából megfelel az s karakternek. Ugyanakkor az 1 byte hosszú kódkészletnél símán át kell írni s karakterré. Ez a kényszer.
Viszont a több karakterből álló hangok esetén sok esetben szótárakat kell használni - így az inkább nyelvészkedés.

A hozzászóláshoz be kell jelentkezni

Mit tiltottak be a németek?
A ß használatát? Mert akkor elfelejtették tájékoztatni a google-t, hogy a Straße helytelen. :)

A hozzászóláshoz be kell jelentkezni

Szerintem a google-t. :D
Azért írtam idézőjelbe, mert a pontos jogi és akadémiai kontextust nem ismerem. A forrás a wiki helyett apám, aki anyanyelvi szint felett beszéli a németet(is).
Valójában a tudathasadáshoz elegendő a http://www.fussball.de/ oldalra ellátogatni. Kis papírkávál 2 oszlopba: fussball jobbra vonás, fußball balra vonás, osztán a statisztika győz. :)

A hozzászóláshoz be kell jelentkezni

Ha valakit érdekel, a két commitban egész emberi nyelven le van írva mit változtattak, és az mikor hasznos:
http://git.savannah.gnu.org/gitweb/?p=grep.git;a=commit;h=97318f5e59a1e…
http://git.savannah.gnu.org/gitweb/?p=grep.git;a=commit;h=b75ce6f7c611c…

"...handing C++ to the average programmer seems roughly comparable to handing a loaded .45 to a chimpanzee." -- Ted Ts'o

A hozzászóláshoz be kell jelentkezni

Köszi, hasznos volt olvasni.

Régi, hasonló tartalmú bug szál:
https://bugzilla.redhat.com/show_bug.cgi?id=194471

Külön gyöngyszem benne mindenki kedvenc Drepperének szokásosan bunkó hozzászólása :)

A hozzászóláshoz be kell jelentkezni

Mondjuk most éppen igaza volt. :)

A hozzászóláshoz be kell jelentkezni

Öööö... miért is? Az egyetlen negatív, lekezelő stílusú hozzászólás. Azt indokolja, hogy miért nem lehet/érdemes megcsinálni valamit, ami pár sor kód, és jelentős gyorsuláshoz vezet. Remélem ezentúl a mostani gyorsító patch-eket is visszacsinálod a magad által fordított grep-ben hogy újra lassabb legyen! :)

A hozzászóláshoz be kell jelentkezni

OK, akkor árnyaljuk a képet. Az ott vitatott nagy gyorsítás azokra az esetekre vonatkozik, amikor a grep nem reguláris kifejezést keres, hanem egy fix string-et. Ezekre az esetekre meg ott van az fgrep.

Szóval adott kettő, már létező tool, az egyik a grep ami reguláris kifejezéseket keres, és a másik az fgrep ami fix sztringeket. Most pedig azt mondják az emberek abban a szálban, hogy optimalizáljuk a grep-et azokra az esetekre amikor fix sztringeket keresünk, méghozzá úgy hogy a fix sztringet árírjuk egy olyan reguláris kifejezésre amin a grep gyorsabb. Van ennek értelme? Miért nem hívjuk meg az fgrep-et akkor már? A legtöbb grep implementációban úgyis közös a bináris.

Valamint ez egy kicsit szembemegy az eredeti filozófiával miszerint az grep és az fgrep különböző dolgokat csinálnak.

Egyedül akkor van haszna, ha a mintát nem lehet előre tudni, és lehet fix sztring is, vagy reguláris kifejezés, de még ekkor is inkább ellenőrizni kellene, hogy mi a minta és aztán grep-et vagy fgrep-et hívni, ha már optimalizálunk.

A hozzászóláshoz be kell jelentkezni

> Most pedig azt mondják az emberek abban a szálban, hogy optimalizáljuk a grep-et azokra az esetekre amikor fix sztringeket keresünk, méghozzá úgy hogy a fix sztringet árírjuk egy olyan reguláris kifejezésre amin a grep gyorsabb. Van ennek értelme? Miért nem hívjuk meg az fgrep-et akkor már?

Emlékeim szerint épp arról szól a thread, hogy akkor az fgrep-et hívjuk meg, vagyis használjuk a már létező gyorsabb algoritmust.

Tök mindegy, hogy a sima grep mellett milyen más progik is vannak. Ha a grep azt ígéri, hogy valamit megtesz, és azt meg is teszi, és pár sor plusz kód segítségével azt sokkal gyorsabban tudja megtenni (rájön hogy hoppá a már létező fgrep algoritmus is jó), akkor tegye már meg!

> Egyedül akkor van haszna, ha a mintát nem lehet előre tudni, és lehet fix sztring is

Előfordulhat szkriptben is, hogy nem tudni előre, a minta tartalmaz-e speciális karaktereket. De szerintem legalább ennyire jogos érv az is, hogy ha én kézzel gépelek be egy parancsot, akkor ne nekem kézzel kelljen azt az f betűt is odabiggyesztenem (esetleg a parancs végiggépelése után, mert akkor jut eszembe hogy sima szóra kerestem rá), ne az én felelősségem legyen hogy megmondjam a gépnek hogy sokkal gyorsabb legyen, hanem legyen ő magától sokkal gyorsabb.

A hozzászóláshoz be kell jelentkezni

Emlékeim szerint épp arról szól a thread, hogy akkor az fgrep-et hívjuk meg, vagyis használjuk a már létező gyorsabb algoritmust.

Nem arról szól. Az eredeti patch sem arról szól egyébként, nem arról, hogy a 'fix' mintát átírja arra, hogy '[fF][iI][xX]' ha a user használja a -i kapcsolót. Ezt egyébként nem is minden locale-ben lehet megtenni.
http://git.savannah.gnu.org/gitweb/?p=grep.git;a=commit;h=97318f5e59a1e…

Drepper azt mondja, hogy ehelyett a hekkelés helyett használjuk az fgrep-et. Ízlés dolga, én nem engedtem volna be ezt a kommitot, mert szerintem hekkelés, és minden ilyen speciális eset csak elbonyolítja a kódot. De nem én tartom karban a grepet persze.

Egyébként szerintem bikeshed az egész, kb. kurvára mindegy.

ne az én felelősségem legyen hogy megmondjam a gépnek hogy sokkal gyorsabb legyen,

Igen, mert te a felhasználó szempontjából nézed a dolgot. Drepper meg a fejlesztő szempontjából, vagyis nem akarja szétcseszni a kódot csak azért, mert egy ritka use-case, amire van is megoldás (fgrep), gyorsabb lesz.

A hozzászóláshoz be kell jelentkezni

ket kulonbozo utasitas, melyek minden esetben ugyanazt csinaljak, csak az egyik gyorsabban?

A hozzászóláshoz be kell jelentkezni

man grep

fgrep is quicker than both grep and egrep, but can only handle fixed patterns (i.e. it does not interpret regular expressions).

A hozzászóláshoz be kell jelentkezni

A grep -F nem ugyanez?

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

http://unix.stackexchange.com/questions/17949/what-is-the-difference-be…

A hozzászóláshoz be kell jelentkezni

Aha, tehát az fgrep egy visszafelé kompatibilitás miatt meghagyott szörnyűség, s illenék grep -F parancsot használni. Amúgy épp ezt szoktam tenni. Lehet, korábban olvastam ezt a manualban, ezt csináltam, csak már elfelejtettem, hogy miért. :)

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

Szerintem másról beszélünk. Te a '[fF][iI][xX]' kapcsán a két új patch egyikéről. Én egy régi bugról, ahol nincs is patch, és a 2. komment leírja hogy már van speciális mágia - ha van, akkor ugyan miért lenne elítélendő ha a sima grep is mágiázna és fgrep-re váltana? -, valamint a 4. komment vége javasolja is hogy ezt kéne csinálni. Pár plusz kódsor és hirtelen egy bizonyos use-case sokkal gyorsabb lenne. Mire Drepper bácsi azt mondja hogy LFS.

> Igen, mert te a felhasználó szempontjából nézed a dolgot. Drepper meg a fejlesztő szempontjából, vagyis nem akarja szétcseszni a kódot csak azért, mert egy ritka use-case, amire van is megoldás (fgrep), gyorsabb lesz.

Nem hinném, hogy ritka use-case (sőt, szerintem kifejezetten nem), a kódot nem szétcseszni kéne hanem egy jól elkülönített, átlátható, dokumentált, egyszerű kódrészlet kezelné a speciális esetet (valszeg már eleve rakat speciális eset van, nem ez lenne az első speckó "hackelés").

Teljesen igazad van abban, hogy én fejlesztőként is a felhasználó szempontjából nézem a dolgokat, köszönöm, jól esett hogy észrevetted :), ez valóban így van, büszke vagyok rá, és szerintem minden fejlesztőnek el kellene jutnia idáig, sőt ha valamit, akkor ezt kellene nagyon erősen hangsúlyozni mindenféle programozó suliban/könyvben.

A hozzászóláshoz be kell jelentkezni

Szerintem másról beszélünk

Lehet.

A felhasználó általában nem tudja, hogy az amit akar az milyen következményekkel jár a távolabbi jövőre nézni, ami a kód karbantarthatóságát illeti. A fejlesztő felelőssége nem szétcseszni a kódot.

A hozzászóláshoz be kell jelentkezni

Ne tegyünk egyenlőségjelet egy plusz optimalizáció, és a kód szétcseszése közé.

A hozzászóláshoz be kell jelentkezni

Ne tegyünk. A kód szétcseszése elég relatív fogalom, másnak mást jelent. Abban szerintem egyetérthetünk, hogy általánosságban optimalizációkkal simán szét lehet cseszni a kódot, sőt, azokkal lehet csak igazán.

A hozzászóláshoz be kell jelentkezni

> Abban szerintem egyetérthetünk, hogy általánosságban optimalizációkkal simán szét lehet cseszni a kódot, sőt, azokkal lehet csak igazán.

Ez egy túl általános megfogalmazás ahhoz, hogy egyet tudjak érteni vele. Gány kódolással lehet szétcseszni a kódot, és lehet optimalizálni elegánsan, tisztán, áttekinthetően. Nem a kód szépségéért írunk kódot, hanem a megoldandó problémának alárendelve.

A hozzászóláshoz be kell jelentkezni

Ebben a konkrét esetben én úgy látom azért, hogy a helyzet a következő. Van egy nagy kódbázis, aki egyébként kifele kb mindenhol azt mutogatja magáról, hogy konzisztens. Legalábbis nekem az, hogy van grep -F, grep -E, meg egrep és fgrep, amik ugyanarra a grep binárisra mutatnak, bizony azt kommunikálja, hogy kb tökmindegy, hogyan használom, mert ugyanaz a progi. Láttam már párszor a manját, talán rémlik is valami magyarázkodás, de hogy én spec. tuti betudtam annak, hogy ja, 75ben még biztos ez volt sysv5-ön, backward compatibility haleluja. Namost ha ebben a kódban, ami belül egyébként is kénytelen támaszkodni arra, hogy algoritmusok között válogasson belül (a fenti kezelése miatt minimum, de mint a fentebbi beszélgetés mutatja, vannak még ilyen esetek), és nincs egy olyan, jól elhatárolható kódrészlet, ami ezeket a válogatásokat tartja egy helyen, akkor azt a kódot egy ilyennel már nem lehet szétcseszni, mert már szét van cseszve :) És lehet, hogy amikor a régi izéket egyesítették, akkor illett volna refaktorálni, nem mutogatni a buta userre most :)

A hozzászóláshoz be kell jelentkezni

Szerintem a fix sztring szűrése grep-pel (és nem fgrep-pel!) egyáltalán nem ritka use-case. Szerintem ez a tipikus parancssoros használat, simán 50% felett. De a figyelmetlen rendszergazdák (a többség) simán script-ben is ezt hívja még biztosan fix szűrő-sztring esetén is. A kód elbonyolítása azért elég vicces kifogás.

if ( is_regexp_fix(regex) )
{
algo = FIX_FILTER;
}
else
{
algo = REGEX_FILTER;
}

Woááá, nagyon bonyolult és átláthatatlan... Az igaz, hogy lehet átláthatatlanul is megírni, mint ezt a Hello world!-öt.

A hozzászóláshoz be kell jelentkezni

ROTFL - bár a vezérigazvatós erősen kérdőjeles, mivel számomra az is kérdéses, hogy egy vez.ig. képes megtalálni a billentyűzetet. :)

A hozzászóláshoz be kell jelentkezni

Nekem már a manageres is kérdéses. Terminál, command line vezérigazgató, manager előtt? Oda valamit be kell írni, nem lehet a meglévő kínálatból választani!

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

Managert már láttam unix prompt előtt ülni. :)

A hozzászóláshoz be kell jelentkezni

Az kevés. Tudott is vele valamit kezdeni? :)

Bár, gondolom, úgy lett manager, hogy végigjárta a szamárlétrát, szóval Unix expert is volt az illető egyben.

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

Persze. Rendszergazdaként kezdett ;)

A hozzászóláshoz be kell jelentkezni

Lehet te vagy a vezérigazgatója ;)

A hozzászóláshoz be kell jelentkezni

Ezt a poént én 96 körül láttam először, akkor még más volt a világ, rosszabb volt a grafikája :D Ez az oldal is, ahol most rátaláltam, atom: http://mm.iit.uni-miskolc.hu/hints/ Unix alól Netscape 2.0, Win 3.1 alól IE. Nyehehe :)

A hozzászóláshoz be kell jelentkezni

Megnéztem, mert rémlett valami, és bejött :) Nem mostanság készült a site, az egyszer biztos...

A hozzászóláshoz be kell jelentkezni

Szerintem a fix sztring szűrése grep-pel (és nem fgrep-pel!) egyáltalán nem ritka use-case

Még az is kell, hogy legyen -i kapcsoló, meg le kell ellenőrizni, hogy milyen locale-ben vagy. És nem két külön algoritmust kell meghívni, hanem újra kell írni a mintát. Megnézted te azt a patchet?

http://git.savannah.gnu.org/gitweb/?p=grep.git;a=commit;h=97318f5e59a1e…

Woááá, nagyon bonyolult és átláthatatlan.

Ja, tényleg. Nem is tudtam, hogy ilyen egyszerű a grep forráskódja.

A hozzászóláshoz be kell jelentkezni

Nem néztem meg. Szép forráskódot írni lehetséges. Láttam már olyanokat, akik ilyet tudnak. Nem sokat, de láttam. Nem állítom, hogy a patch egyszerű. De azt igen, hogy meg lehet úgy írni ezt a funkciót, hogy a forrás átlátható marad. Még akkor is, ha a locale-t és a -i kapcsolót is le kell ellenőrizni. Én is fejlesztek szoftvert, és nem fogadom el egyik kollégámtól se, hogy azért legyen rossz a felhasználónak (figyeljen oda ilyen -F kapcsolókra), hogy a fejlesztőnek jó legyen. Nem tudom, hogy mennyire fogalmazzak erősen, ezért ide írom kétféleképpen:
1) Nem szerencsés hozzáállás a fejlesztő részéről, ha elvárja a felhasználótól, hogy az optimális felhasználás érdekében olvasson kézikönyv oldalakat és figyeljen a használatnál, ha ő is megcsinálhatja a szoftverben ennek a megoldását.
2) Az ilyen fejlesztő lusta, tohonya disznó és menjen inkább céllövöldésnek. Az ilyeneket fogja először falhoz állítani a forradalom.

A fejlesztők vannak a felhasználókért. Szerintem.

A hozzászóláshoz be kell jelentkezni

A hozzászóláshoz be kell jelentkezni

Csináltam egy kávét és közben jól felidegesítettem magam ezen a hozzáálláson. A grep fejlesztői évente 50x látják ezt a kódrészletet. A felhasználók naponta világ szinten 10^8 alkalommal használják rosszul (-F nélkül). Ez _nagyon_ gáz.

A barátaimnak és a kollégáimnak rendszeresen mondom: Azért, hogy a fejlesztőnek jobb legyen, a gyakran használt programoknak nem kellene sokkal több energiát elfogyasztani, mint ami indokolt. Belegondoltatok már, hogy ha egy lusta fejlesztő ír egy rossz algoritmust, indokolatlanul használ egy újabb absztrakciós szintet, nem oldja meg, hogy a lusta, buta felhasználók helyett a program gondolkodjon (mint itt), akkor egy általánosan használt programnál (mint itt) ez napi szinten irdatlan mennyiségű elektromos áramot használ el világszinten! Egy-egy tehetségtele vagy lusta fejlesztő és fák százezrei halnak meg hiába, több gramm urán ég ki feleslegesen! Nem viccelek. Szeretem az optimalizálást. Írjunk jó programokat!

A hozzászóláshoz be kell jelentkezni

A világ nem fehér és fekete. Nem lehet mindent lefejleszteni, amit a felhasználó akar, legalábbis nem egy szabad szoftver projektben. Egyszerűen nincs rá idő. Azt fejleszti az ember ami szerinte hasznos, és ami érdekes(!). És nem azért mert lusta.

A hozzászóláshoz be kell jelentkezni

De azért van picike különbség a "jó ötlet, bocsi, sajnos nincs időm lekódolni, patch-et szívesen veszek" és az "ez baromság, nincs mit tenni, add meg kézzel a megfelelő kapcsolót" hozzáállás között.

A hozzászóláshoz be kell jelentkezni

De nem is a stílusról volt szó eddig. Na mindegy, részemről ez lezárva, mert bikeshed, és túllihegtük.

A hozzászóláshoz be kell jelentkezni

> De nem is a stílusról volt szó eddig.

Az első hozzászólásomban, amire reagáltál, a stílusról is szó volt.

A hozzászóláshoz be kell jelentkezni

Azt hittem a .sig-emet linkeled a Hello world okan :-)


#!/bin/ksh
Z='21N16I25C25E30, 40M30E33E25T15U!';IFS=' ABCDEFGHIJKLMNOPQRSTUVWXYZ ';
set -- $Z;for i;{ [[ $i = ? ]]&&print $i&&break;[[ $i = ??? ]]&&j=$i&&i=${i%?};
typeset -i40 i=8#$i;print -n ${i#???};[[ "$j" = ??? ]]&&print -n "${j#??} "&&j=;
typeset +i i;};IFS=' 0123456789 ';set -- $Z;for i;{ [[ $i = , ]]&&i=2;
[[ $i = ?? ]]||typeset -l i;j="$j $i";typeset +l i;};print "$j"

Az olvashatosag okan tordelve, amugy az egesz egy (illetve a she-bangen kivul egy) sor.

A hozzászóláshoz be kell jelentkezni

> Szóval adott kettő, már létező tool, az egyik a grep ami reguláris kifejezéseket keres, és a másik az fgrep ami fix sztringeket.

> A legtöbb grep implementációban úgyis közös a bináris.


$ ls -l /bin/fgrep
lrwxrwxrwx 1 root root 4 Dec  7  2010 /bin/fgrep -> grep
$ lsb_release -d
Description:    CentOS release 5.10 (Final)

A hozzászóláshoz be kell jelentkezni

A hozzászóláshoz be kell jelentkezni

Azt mondja, hogy CentOS 5-ön az fgrep egy symlink a grep-re.

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

Tudomásom szerint én is ezt mondtam, még idézte is felette.....

A hozzászóláshoz be kell jelentkezni

Bocs, nem néztem meg, mire írta, így a kérdőjeledet próbáltam felkiáltójellé vasalni, mint kiderült, feleslegesen.

Még egyszer elnézést a figyelmetlenségemért!

tr '[:lower:]' '[:upper:]' <<<locsemege

LOCSEMEGE

A hozzászóláshoz be kell jelentkezni

Èn mindig örülök annak, ha nem új feature-ökröl szól a hír, hanem optimalizációról.

--
robyboy