Feladom, hogyan lehet keresni a fájlok tartalmában??? (Win10)

Szóval az van, hogy letöltöttem egy komplett blogot (http://maji-de.reblog.hu/) mert nem tudtam benne keresni. Na mondom, majd helyben.

A leülni szóra keresek, de akárhogy írom be, van 83 találat, és az első kb. 6-7 hamis pozitív találat után úgy érezem hogy valami nem pompás. Beírtam idézőjellel is, "leülni", újraépítem az indexet is, ami még tart, de máris megint tele van hibás találatokkal. Kerestem az oldal forrásában is, természetesen.

Mi a búbánatot tudok így benézni?

http://kepkuldes.com/images/50318cefeb08cb4b943073d4da49ab01.png

Hozzászólások

Áh, ami még kavarhat, hogy angol windows, de magyar dátum- meg billentyűzetbeállítással, emiatt(?) nem nagyon találja el az abc-t, de gondolom ez csak nem lehet akkora baj...

Már linuxon is greppeltem, csekély eredménnyel. Nem kizárt hogy nem is ezen és hogy nem is magyar blogon volt. Leginkább az motivál, hogy valamit vagy nagyon rosszul csinálok, vagy valami nagyon rosszul működik, mert ennek azért nem kéne hogy probléma legyen, és ez bosszant.

Nem tudom, van e a Windows -nak elég esze, hogy használja az encoding type -ot, már ha van ilyen a html fájlokban.
Ha ehhez van esze akkor kérdéses, hogy az & oacute; jellegű dolgokat automatikusan felismerje, azaz érti e a kereső a html -t.

A letöltött fájlok karakterkódolása vs. a Win10 kódolása milyen viszonyban áll egymással?

Oké, lehet hogy rosszul fogalmaztam, de az van, hogy megtalálja a szót a kereső, de nincs benne. Se a leülni se a le&uuacute;lni. Legalábbis se a firefoxszal, se a notepaddal nem lelem.

Nem, arról, hogy a japánok imádnak egymás mellé ülni, szépen sorba, még akkor is, ha amúgy millió hely van mindenfelé. És úgy látszik hogy eddig nem kattogtam, hamarabb meguntam. És csak remélem hogy tényleg ebben a blogban volt.

Az is lehetne a kérdés, hogy a http://maji-de.reblog.hu/az-elso-butoh-tancos oldalon/oldalban hol van a "leülni". Vagy valamit, amit annak néz, de tulajdonképpen nem ez érdekel.

Az enyémnek meg az, hogy a http://maji-de.reblog.hu/az-elso-butoh-tancos oldalon is megtalálja (http://kepkuldes.com/images/50318cefeb08cb4b943073d4da49ab01.png) de hol?! Feltöltöttem a letöltött html-t pastebinre: https://pastebin.com/aneyS1YG (nagyon remélem hogy ebből nem lesz copyright probléma). Pontosan ez van nálam, ebben találja meg (vagy valamit annak néz). De én nem találom.

Elkezdtem visszafelé olvasni a blogot, ha találkozok erről szóló bejegyzéssel, akkor szólok. Feltéve, hogy addig nem találod meg. :)

Most tartok a 6/18 oldalnál, eddig egy hasonló bejegyzés volt csak, de az nem az egymás mellé ülésről szólt, hanem a lépcsőzésről: A lépcső kétfelé van osztva, egyikre kiírva, hogy "lefelé", a másikra "felfelé" és a japánok akkor is szeretnek beállni a sorba, ha egyébként a lépcső másik fele tök üres, szóval simán fel tudnának menni ott a tömeg mellett, csak ugye az elválasztóvonal átlépése egy nagy dilemma számukra, amit nem igazán vállalnak be.

Hát. Végig olvastam a blogot, de nem volt benne szó ilyenről. Lehet, hogy tényleg törölve lett az a bejegyzés, ahogy fentebb is írták vagy valahol máshol láthattad esetleg (facebook oldalán?). Sajnálom, hogy nem tudtam segíteni! :(

Egyébként nem volt benne semmi áldozat, ironcat blogjából találtam rá és mivel érdekel Japán, ezért elkezdtem módszeresen kiolvasni. :D

ó, ha a win10-ben lenne grep... mondjuk, kéne, hogy legyen, mert valamikor az MSDOS 6.22 korszakban használtam... vagy mondjuk a DOS-Navigator is tudott olyat, hogy kijelölt mappák fájljaiban keresett adott szóra.
Esetleg FAR-Commander, Total Commander?

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba

Lényegében van, én munkához is használom a munkahelyi Windows 10-emen - minő bánat - a WSL-t. A bánat arra vonatkozik, hogy alapvetően azért Windows van azon a gépen.

https://docs.microsoft.com/en-us/windows/wsl/install-win10

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Egyetértek, Total Commander vagy Double Commander segítségével lehet a fájlokban keresni, de talán tényleg a FAR is tudja. Hamis találatot nem fognak adni, az tuti. Arra kell figyelni, amit már írtak, hogy a szóban forgó blogon az ü &uuml; (u-umlaut) HTML entity-vel van helyettesítve, és nem szabvány UTF-8-as kódolásban van a szöveg.

Az meg már köztudott, hogy a Win beépített szutykai nem sok mindenre jók, nem kell meglepődni, ha keresni sem tud normálisan.

„Pár marék nerd-et leszámítva kutyát se érdekel már 2016-ban a Linux. Persze, a Schönherz koliban biztos lehet villogni vele, de el kéne fogadni, ez már egy teljesen halott platform. Hagyjuk meg szervergépnek…” Aron1988@PH Fórum

Először is minden html-ből kiszedném a szöveget sima txt-be, hogy lehessen bennük keresni.

https://www.google.ch/search?q=leülni+site%3Amaji-de.reblog.hu”

Nekem ez három találatot ad vissza. Mindegyik ugyanahhoz a bejegyzéshez vezet. Ebben a bejegyzésben kétszer szerepel a leülni szó. (http://maji-de.reblog.hu/egy-nap-elso-fele)

Ez miért nem jó találat? Mit néztem el? Mi az igazi feladat?

Egyébként az oldal forrásában a vonatkozó bekezdés:

Felszáll két egyetemista lány, fogják a tankönyveiket, csacsognak, nézik, hova tudnának leülni. Az újságába elmerülő szararimentől jobbra és balra eső két hely üres, de szemmel láthatóan nem akarnak a két oldalára leülni. A fickó észreveszi a helyzetet és odébb csúszik eggyel. Hajlongás a két lány részéről, biccentés a férfi részéről. Nem nagyon tudok visszaemlékezni olyan alkalomra az elmúlt évekből, amikor hasonló esetben ne ugyanez történt volna. 

https://hup.hu/node/158186?comments_per_page=9999#comment-2204174

A "leülni" nem is tuti, ezért kerestem volna olyan szavakra, amik a homályosan felrémlő történethez illenek. Alapvető probléma volt, hogy - szerintem - a google túl kevés találatot adott, a Windows keresőizéje meg indokolatlanul sokat. Mára már tulajdonképpen az a kérdés, hogy miért ad fals találatokat, az eredeti problémát részemről lezártam azzal, hogy a fene tudja hogy melyik és milyen nyelvű blogban olvastam - már ha nem hallucináltam.

A Windows fals találatai ügyében nem nyilatkozom. Azonban nekem úgy tűnik, hogy egyes bejegyezések (régebbiek?) törölve lettek. Például a 14. oldalon (http://maji-de.reblog.hu/oldal/14), kb. a harmadánál van egy link (http://maji-de.reblog.hu/thaifold-es-metal), ami már nem él.

A legelső bejegyzés 2015. október 28-ai dátumú, és elolvasva, nem úgy tűnik, hogy tényleg ez volt az első bekezdés. Mert akkor valami olyasmiről szólna, hogy lesz majd itt ez a blog, amiben erről, meg arról írok. Az „Öt éve Japánban.” szlogen is arra utal, hogy korábban kezdődött a blog. Tehát irány az archive.org, ha tényleg meg akarod keresni a korábbi cikket.

Most hogy így mondod... valóban. Szóval ez úgy volt valahogy, hogy Marton さん írogatta szépen a blogot, majd egyszercsak hazajött. Na, utána pár bejegyzésen kalapált valamit(*), amit annak tudtam be, hogy a könyvéhez rendezgeti az anyagot, és amiben javítani valót talált, azt átírta. Lehet hogy ekkor bejegyzéseket is törölt valamiért.

Annyira meg nem érdekes hogy az archive.org-ot is letöltsem :) Pláne ha az, amire emlékszem törölve lett, akkor nyilván oka volt rá.

*) Nemrég megint előbukkant az RSS olvasóban, én meg nem nagyon foglalkoztam vele.

Valami eszembe jutott, de legszívesebben halványszürkével írnám, annyira valószínűtlen.
Hajdan a midnight és talán még a norton commander is azzal az érthetetlen felfogással létezett, hogy a standard NULL (0x00) karakter minden keresett sztringre illeszkedik.

Egyrészt nem hinném, hogy akár a weboldalon lévő anyagban volna nulla, akár a letöltő program ékelt volna bele, azt meg pláne, hogy a keresési funkció ilyen orbitális baromságot tartalmazzon manapság... csak azért említem, mert télidőben az ablakunk mellett vonulnak reggel-este a varjak, és olykor karóra is telepszenek közben, amit én látok.

findstr

szerk: akkor kicsit hosszabban:

findstr /S /C:leülni *.*

p00t

A vicc az, hogy jó eséllyel ez lenne a legjobb megoldás, mert elég egyszerű, nem okoskodik a különféle szóalakokkal, és viszonylag könnyen tudok más-más szavakra, kifejezésekre keresni. Remélve, hogy nincs közben whitespace vagy valami. Meg variálva az ü és &uuml; alakot. De egyre inkább hajlok arra, hogy a google (a google sem) azért nem találta amit kerestem, mert nem ebben a blogban van, a windows meg azért dobott egy csomó fals találatot, mert nagyon okos.

Ehhez minek kellett letölteni?
Nyitod a google-t, beírod a keresőbe:
leülni site:http://maji-de.reblog.hu/

Én fájlkereséshez feladtam a Windows kereső használatát, még azt a fájlt se találja ami kint van a keresés gyökérkönyvtárában.
DoubleCommander-t használok, TC klón, tök ingyenes és müxik a keresője.

PS: eddig nem volt igényem spéci kódolás keresésére, de most nézem, hogy engedi,lehet választani formátumot.

Ha lehet adott keresőben jocker karaktert használni, akkor lehetne pl arra is keresni, hogy le*lni vagy le?lni