arkhein blogja

Szöveg darabolása – RAG adatelőkészítés

Folytattam a blogon a Keresésalapú Szöveggenerálásnál (RAG) témát. Ezúttal a szövegek darabolásáról írtam. Az előző írásomban kifejtettem, miért érdemes a szövegeket kisebb részletekre vágni. Bemutattam a „tű a szénakazalban” tesztet, valamint azt is, hogy a hosszabb szövegek feldolgozása nagyobb erőforrásokat igényel. A mostani bejegyzés inkább gyakorlati megközelítést kínál, és különböző darabolási eljárásokat ismertet.

Konvolúciós Neurális Hálózat 2. rész

A blogomon folytatom a Konvolúciós Neurális Hálózat tárgyalását. Az előző részben megnéztük, a Konvolúciós Neurális Hálózat (KNN) legjellemzőbb rétegét a Konvolúciós réteget. A mai részben megismerkedünk a Szűrő fogalmával, a Összevonó réteggel, a lapítással és a Lépésközzel. Részletek.

PDF, EPUB és egy szebben formázott HTML verzió szintén elérhető itt.

Markdown editor + irodalmi hívatkozások

Kb. egy éve elkezdtem egy online Markdown szerkesztőn dolgozni a bloghoz amit írok. Szükségem volt néhány olyan funkcióra ami a WordPress-ben nem volt elérhető: lábjegyzet, táblázatok, real-time collaborative szerkesztés és normális (tudományos) hivatkozás rendszerre. Ma végre sikerült kipipálni az utolsó elemet is: Happy days. 
Akit érdekel a kód: Itt
Ha valaki ki szeretné próbálni: Itt.