[megoldva] Központozás utáni regex csere

Fórumok

Adott egy csupa kisbetűs szöveg (pl. gépi diktálás nyomán). A központozás beírása után szeretném elkerülni azt a lépést, hogy én alakítom nagybetűssé a .!? utáni szóköz utáni betűt. Milyen cserével lehetne ezt megoldani? LibreOffice vagy Google Document jön szóba szövegszerkesztőként, főként itteni keresés/csere érdekelne. (Illetve plain text-ként is meg tudom oldani, ha valami miatt egy perl csere egyszerűbb, csak az interaktív változat egy fokkal vonzóbb, mert hátha valahol kihagynám a cserét.)

Tehát pl.:

itt egy mondat meg egy másik -ba, ha bekerül egy felkiáltójel:

itt egy mondat! meg egy másik, akkor ezt manuális beavatkozás nélkül szeretném ilyenné alakítani:

itt egy mondat! Meg egy másik

Hozzászólások

Libreoffice: Szöveg kijelölése - Shift+F3 tetszés szerint többször lenyomva :)

Végül aztán egy ilyen sajátos perl cseresorozattal oldottam meg a teendőt, más apróságokat is beletéve (pl. többszörös szóközök stb.) :

perl -p -w -e '
s/\t/ /g;
s/ +/ /g;
s/ \,/\, /g;

s/ \./\. /g;
s/ \!/\! /g;
s/ \?/\? /g;

s/\. (.)/\. \U$1/g;
s/\! (.)/\! \U$1/g;
s/\? (.)/\? \U$1/g;
s/\. á/\. Á/g;
s/\. é/\. É/g;
s/\. í/\. Í/g;
s/\. ö/\. Ö/g;
s/\. ü/\. Ü/g;
s/\. ő/\. Ő/g;
s/\. ű/\. Ű/g;
s/\. ó/\. Ó/g;
s/\. ú/\. Ú/g;
s/\! á/\! Á/g;
s/\! é/\! É/g;
s/\! í/\! Í/g;
s/\! ö/\! Ö/g;
s/\! ü/\! Ü/g;
s/\! ő/\! Ő/g;
s/\! ű/\! Ű/g;
s/\! ó/\! Ó/g;
s/\! ú/\! Ú/g;
s/\? á/\? Á/g;
s/\? é/\? É/g;
s/\? í/\? Í/g;
s/\? ö/\? Ö/g;
s/\? ü/\? Ü/g;
s/\? ő/\? Ő/g;
s/\? ű/\? Ű/g;
s/\? ó/\? Ó/g;
s/\? ú/\? Ú/g;

s/^(.)/\U$1/g;
s/^á/Á/g;
s/^é/É/g;
s/^í/Í/g;
s/^ö/Ö/g;
s/^ü/Ü/g;
s/^ő/Ő/g;
s/^ű/Ű/g;
s/^ó/Ó/g;
s/^ú/Ú/g;

' z1 > z2

Minden világos, kivéve, hogy miért egyértelmű, hogy ha sor elején van az ékezetes betű, akkor nagybetűsnek kell lennie? És ha az ékezetes betű esetén ez igaz, akkor miért nem igaz az ékezettelen magánhangzókra, vagy akár a mássalhangzókra? (Azaz az utolsó blokkot nem értem.)

Opsz, most jövök rá, hogy a blokk első szabálya szerint pint azt csinálod amit kérdezek.

Akkor sztornó az egész.

Kelleni nem kell, de egy lehetőség, és viszonylag kényelmes és áttekinthető.

(Még a sorvégi szóközöket kifelejtettem; az is megnyugtatólag hat, ha eltüntethetem őket.)

Először (ahogy írtam is föntebb) a szövegszerkesztőben akartam helyrerázni a gépi diktálásból keletkezett csupa-kisbetűs-központozatlan (majd központozással ellátott) szöveget, de aztán egyéb ötleteim is jöttek.