Anno itt a hup-on is téma volt Pék Dani parancssorból használható online Sztaki szótár scriptje:
http://code.google.com/p/pysztaki/
Egyszer már kihúzta ugyan alóla a talajt a Sztaki, de mivel megmaradt a régi weboldal is, a cím átírásával továbbra is működött - vagy két héttel ezelőttig. Akkor ugyanis megszűnt a régi weboldal elérhetősége.
Pék Daninak semmi kifogása ellene, hogy valaki átpofozza a scriptet a mai viszonyokra. Én egychipes hw közeli programozást csinálok, nem értek eléggé a Pythonhoz. Átgyúrná ezt a nagyon kellemesen használható scriptet egy hozzáértő jótét lélek...?
Hozzászólások
Először forkoltam, de az átírás túl hosszadalmasnak tűnt, így végül újraírtam Python3-ban:
https://github.com/oroszgy/pysztaki/
Akkor ezt vehetem úgy, hogy ne akarjak programozóként elhelyezkedni.
Ennyi idő alatt akkor sem végeztem volna vele, ha komolyan elkezdem.
Apropo: unittest? Az argparse első paraméterében direkt maradt ott a 2?
Véletlen. Volt.
Nem állítom, hogy nagyon robusztus, de Uhum kollegának jól jöhet. Amúgy meg forkolni ér.
Én a teljes újraíráson gondolkodtam két okból:
1. Te 3-as pythont használsz, a rendszerek többségén még 2-es a default
2. Mindketten (?) használtatok olyan külső modult, amit külső forrásból kell telepíteni a megszokott repok helyett, ha igaz.
(én inkább valamelyik "szabványos" XML parsert szedtem volna elő helyette - már feltéve, hogy jól értem annak a B betűs modulnak a funkcióját ;) )
upd: BeautifulSoup az a B betűs :)
2. "tag soup" vs XML
Szerk: azt nem tudom, hogy sztakis kontextusban ennek van-e jelentosege...
----------------------
"ONE OF THESE DAYS I'M GOING TO CUT YOU INTO LITTLE PIECES!!!$E$%#$#%^*^"
--> YouTube csatornám
Miről van szó? A "tag soup" számomra nem igazán ismerős. Illetve most rákerestem, hogy mit jelent.
A sztakis fejlesztőkről feltételeztem, hogy tisztességes kódot írnak. Hát a w3c.org validatorával ellenőrizve, már kezdem érteni az említett modul használatát. :(
Tévedtem. Linuxmint alatt van 2-es és 3-as pythonhoz is előre csomagolt BeautifulSoup.
1 észrevétel + 1 kérdés
+
Először is köszönjük.
észrevétel:
-h kapcsoló és a README.md nem ugyanazt tartalmazza a használatra.
kérdés:
csak nekem nem működik a magyarról, ha ékezetes, vagy nem is kellene?
Ha nem UTF8-as karakterkészleted van, akkor úgy látom, nem működik normálisan. (nem próbáltam, csak a forrás alapján)
hááát a Karakterkódolás beállításánál Unicode (UTF-8) -at mutat.
Az urllib nem szerette az Unicode dolgokat: javtottam a readmevel együtt.
Köszi az észrevételt!
És neked működik? Mert nálam valami ritka ocsmány hibával elhasalt.
Az elejére kellett még egy
from urllib.parse import quote
És oda, ahol a _word-re hivatkozol, a köv. paraméterbe word helyett quote(word)
Persze ez gányolás részemről, meg kellene nézni pontosabban. (meg az sem kizárt, hogy a gittel kavartam el valamit és azért nem működött nálam)
+1: "hiba", hogy az URL-be a SZTAKI-sok kérésére a régi verzióban volt egy in_pysztaki=1 a paraméterek közt, amit a te verziódban nem találok (lásd "git log" kimenetében!)
upd: jól látom, hogy ugyanezt megcsináltad te is? Mert akkor az első, gittel lerántott (clone) verzió még nem tartalmazta, a javításod után meg már nem volt hajlandó a fetch átírni azt, amibe belepiszkáltam...
Én is pontosan ugyanezt csináltam.
... az in_pysztaki=1 is bekerült...
Lassan mehetne egy 0.2-es release a pypi-re.
--
♙♘♗♖♕♔
Köszönöm a köz nevében.
Gondoltam, felteszem a kér(d)ést, aztán pár nap múlva ránézek, hátha átdolgozza valaki. Most meg jól meglepődtem, milyen gyors voltál. Köszi még egyszer!
Megjegyzem, nálam működik a régi szótár oldal is (http://regiszotar.sztaki.hu/index.hu.jhtml)
A régi olykor-olykor nem megy.
:)
A bs4 import miatt a Beautiful Soup 4 kell neki?
# apt-cache policy python-beautifulsoup
python-beautifulsoup:
Installed: (none)
Candidate: 3.2.1-1
Version table:
3.2.1-1 0
900 http://http.debian.net/debian/ wheezy/main amd64 Packages
-10 http://http.debian.net/debian/ jessie/main amd64 Packages
-10 http://http.debian.net/debian/ sid/main amd64 Packages
------------------------------------------------------------------------------
www.woodmann.com/searchlores/welcome.htm