ChatGPT jól fordít?

Kicsit társalgósnak is szánom a topikot, de egy konkrét kérésem lenne. Nem beszélek angolul sajnos. Magyarul írtam pár html fájlt, amit lefordíttattam a műaggyal. Megkérnék szépen egy angol anyanyelvi szinten beszélő fórumtársat, hogy lektorálja, ha van pár perce rá. https://www.esp8266.org/download/dev/help.zip

Hozzászólások

"Pár perc" arra volt elegendő, hogy 3 helyen belenézzek. Hangsúlyozottan _ebben_ összesen talán két olyan mondat volt, amiben én más szórendet használtam volna, de így is érthető.

Azt senki nem fogja neked megtenni, hogy töviről hegyire összenézi az angolt a magyarral, már csak azért se, mert ez nagyobb munka, mint lefordítani.

Megfigyeléseim szerint az automata fordítókat elsősorban az összetett magyar mondatok zavarják, mivel nem "értik" a mondatrészek közötti összefüggést. Lehetnek tehát benne értelemzavaró hibák, pont úgy, mint a YouTube-on az automatikusan generált feliratokban.

A személyes kedvencem ebben a témakörben az a mondat volt, amiben Szerző - a felirat szerint - közölte, hogy most telepíteni fogja a 64 bites Nácizmust. (A Netwide Assemblerből ez jött ki az AI-nek hallás után.)

Hát ugye az eleve gyorskötöző (itt jön képbe, hogy különírva merőben mást jelent), de tény, hogy azt se ismeri így, csak úgy. Az ilyesmiken viszont az "AI" hamar túllendül, mert nem érti hogy mi olvas, csak azt látja, hogy mindenki így írja: 'A "gyors kötöző" angolul "cable tie" vagy "zip tie".'

Ilyenkor - őszintén szólva - sírni lenne kedvem.

Bé lehetőség: én vagyok az őskövület fasz, aki nem érti magyarul.

Én nem néztem bele a zipbe, de ha a magyar nyelv helyes mondatszerkezetét használod, akkor a GPT is jó angol fordítást fog eredményezni. Ha egy magyar szöveg fordítását szeretnéd kérni, akkor azt érdemes specifikálni a GPT-nek. Pl.:

--------------------

Kérlek, ellenőrizd a következő magyar szöveg helyes mondatszerkezetét, javítsd ki, ha szükséges, majd fordítsd le angolra. Elsőként a helyes magyar szöveget jelenítsd meg, majd a javítási pontokat sorold fel, végül az angol fordítást.

Szöveg: Én nem néztem bele a zip-be, de ha a magyar nyelv helyes mondatszerkezetét helyesen használod, akkor a GPT is jó angol fordítást fog eredményezni.

:-) gondoltam, nekem is tetszett, ezért írtam bele.

Itt dokumentumról van szó, ebből a nézőpontból a nyelvtan fontos (lehet). Helyesen használni az alany, állítmány... Ez a fordításnál, legyen bármelyik fordító intelligencia, előnyös.

Ez alól kivétel a kotnyeles írói vénát erőltető indiai aki angolul ír. Azt még a GPT is nehezen értelmezi.

Nem teljesen világos, hogy min is vitatkoztok, de adnék egy támpontot, hogy te is képben legyél (ha eddig nem voltál). :-)

A témához: a "szabad" szórend, és minden olyan szituáció, amikor a hangsúlyok hordoznak kiegészítő jelentést, nyilván zavarni fogja a mesterséges intelligenciát. A fordítás nem, vagy csak véletlenül fogja visszaadni a teljes jelentést.

Egy MI szinte biztosan képtelen új szóvicceket csinálni, már csak azért is, mert a humor jellegzetesen az értelemhez kapcsolódó dolog és az emberiségen belül is igen nagy a változatossága annak, hogy kinek mi a vicces. Ha megkéred, hogy mondjon szóvicceket, bizonyára csak annyit csinál, hogy a "szóvicc" kifejezést keresi és ami utána van, azt odaadja neked, akkor is, ha az történetesen a Kommunista Kiáltvány.

Hasonlóan ha egy fordító MI olyan mondattal találkozik, aminél a szórendben van elrejtve valami apró utalás, azt nem fogja tudni visszaadni.

Mindazonáltal egy műszaki dokumentációnál ez a probléma szinte soha nem fog fölmerülni.

Tessék egy példamondat: -„A legkorszerűbb elvek alapján készült, én azt gondolom, talán ma a kontinensen nincs is, csak Angliában, ilyen szintű vitrin.” ... 

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Amennyiben a mondatoddal at akarsz adni valami infot  akkor az a helyes mondatszerkezet, amivel statisztikailag a legtobb olvaso azt olvassa ki a mondatodbol, amire te is gondoltal.

A legjobb szerkezet eseten is lesz olyan hulye, aki nem erti. Es a legrosszabb szerkezet eseten is lesz olyan, aki rajon, mire gondolt a kolto. Ugyhogy nincs egzakt valasz, hasonloan ahhoz, ahogy a jo ido fogalma is relativ es szubjektiv, peldaul ebben a csillagaszati kiskutyaban jol esne egy tokig elaztato eso. :-)

Off: A legjobb közhely az, amelyik olyan, mintha mondana valami bölcsességet, de igazából nem mond semmi nemtriviálisat. (Példa: Hogy kire hallgassunk, ha sok a vita, és nehezek a problémák? Én mindig ahhoz tartottam magam, hogy arra hallgatok, akinek igaza van.)

On: Valódi mondatszerkesztési szabály például az, hogy a 'minden bogár rovar'-szerű mondatokban nem lehet megváltoztatni a két főnév sorrendjét, mivel az jelentést hordoz.

Eredetileg onnan indultunk, hogy van 'helyes magyar mondatszerkezet', erről akartam volna konkrétumokat hallani, de eddig csak tautológiák hangzottak el. (Vö: "a hideg a meleg hiánya, a meleg pedig a hideg hiánya" -- nagy bölcsességnek hangzik, de igazából nem tudunk meg belőle semmit.)

A "helyes magyar mondatszerkezet" kifejezéssel arra utaltam, hogy a magyar nyelvben a mondatoknak van egy szabályos, logikus felépítése. Így a mondatok a dokumentációban egységesek, ami biztosítja az érthetőséget és a helyes nyelvtani szerkezetet. Ezt a GPT könnyebben fogja fordítani, és a fordításban is egységes marad.

> a magyar nyelvben a mondatoknak van egy szabályos, logikus felépítése

Erre kérdeztem rá kb. ötször, hogy hol lehet erről tájékozódni.

Off: egyébként részeredmények tényleg vannak, például, hogy az ige előtt van a fókusz, ide kerül a leghangsúlyosabb szó, pl. a tagadószó vagy az igekötő. (Nádasdy Ádám írásait lehetne például olvasgatni, Modern Talking címmel.)

Előre is elnézést, ránéztem a profilodra. Kizárólag arra voltam kíváncsi mikor regisztráltál, hogy a korod megközelítőleg megállapítsam. Elnézést érte. Utálom ha az emberek kutakodnak.

Erre kérdeztem rá kb. ötször, hogy hol lehet erről tájékozódni.

Te is könyvekből kezdtél tanulni. Kezdheted a könyvtárban. :-)

Terelésnek jó ,-)

Az én (eddig explicite ki nem mondott) álláspontom az, hogy ez nagyrészt blöff: nincs olyan autentikus forrás ami a 'helyes magyar mondatszerkezetet' definiálná (vagy leírná), szóval nagyjából ott tartunk, hogy "írjunk úgy, ahogy jónak érezzük!"

Pont ugyanezt írták többen is, hogy a szabályrendszer nem túl merev, bizonyos dolgokat úgy írsz ahogy szeretnél, maximum árnyalatnyi változást fogsz vele okozni, mindaddig amíg szándékosan hibás dolgot nem írsz. Az élő nyelv nem program nyelv, hogy egy vesszővel szintax errort okozz, sőt, az életed múlhat egy megfelelően hibás mondat létrehozásán, például a királynőt megölni nem kell félnetek jó lesz... :-)

"a magyar nyelvben a mondatoknak van egy szabályos, logikus felépítése"

Háátőőőő... vagy nem értem mire gondolsz, vagy nincs, vagy sok is van (persze mindegyik mást jelent, de szabályosnak, logikusnak... nekem az, de aki nem ezzel a nyelvvel született, az eret vág):

Én el mentem a vásárba.
Én a vásárba mentem el.
Én mentem el a vásárba.
A vásárba én mentem el.
Elmentem én a vásárba.

Ha szűkítjük a kört a műszaki dokumentációkra, az egy másik történet, ott ha egy adott dolgot akar kifejezni az ember, akkor:

  • ki kell választani azt a konkrét szerkezetet
  • azt a konkrét szerkezetet kell kiválasztani

...ami a legkevesebb esélyt adja a félreértésre. Na, szóval amikor ide írok, akkor nagyon sokszor át kell fogalmaznom mindent is, hogy aki egybites (értem ez alatt, hogy számára igen/nem, fekete/fehér minden, nem azt hogy ostoba) se tudja félreérteni.

Fordiccsuk ángolra:

szert
szeret
szeretet
szert tett
szeretett
szerettet
szeretetet
szert tetetett
szeretettet
szerettetett
szerettetettet
szeretetet tetet
szeretetet tettetett
 

Egy angol nyelvész videójából értettem meg, miért nehéz a magyar nyelv egy külföldinek. A fenti egy enyhe ízelítő.

Én mindig azt szoktam példának hozni, hogy tegyük egymás mellé az Országh-féle angol-magyar és a magyar-angol szótárt. Mérjük le a vastagságukat. 1/3 : 2/3 :D

Ha az angolban ismered a get és a put igét, mindent ki tudsz fejezni.

"a hideg a meleg hiánya, a meleg pedig a hideg hiánya" -- nagy bölcsességnek hangzik, de igazából nem tudunk meg belőle semmit.

Dehogynem. Ebből kiderül, hogy ez a két fogalom kötődik egymáshoz, hogy többnyire egymáshoz mérten van jelentésük, ergo kölcsönösen függenek egymástól. És ez helyes, hiszen sem a meleg, sem a hideg nem egzakt, elvégre az abszolút nulla felett 1 fokkal melegebb dolog még mindig rettenetesen hideg.

"a legtobb olvaso azt olvassa ki a mondatodbol, amire te is gondoltal" - ez oké, de amikor azt látom, hogy nekik a belépőkártya az belépő kártya(*), me' há a telefon! kijaviccsa! - akkor tényleg vagy elkap az ideg, vagy csak lekucorodok a sarokba zokogni. Igen, ez egybeírás - különírás, de így reggel, kávé nélkül ennyire telik.

 

*) Mármint konkrétan azt értik alatta, annyira fogják fel a különbséget, mint egy vakond.

hablatyolóprogram dönti el?

Egyelőre azt a részt hagyjuk ami az önálló gondolkodást és beszédet taglalja.

Bárhogyan nézem, ez a hablatyolóprogram, a GPT-3.5-öt 2 éves és 4 hónapos. A GPT-4 16 hónapos. A GPT-4o meg még cicizik. Miben különbözik a humanoid hablagyológyerek a hablatyolóGPTtől?

Egy gyerek ugyan úgy megtanulja a szavak sorrendjét, szülői intelligenciától és tájszólástól függően beszél valahogy. Ezt az iskolában vagy továbbfejleszti vagy nem. De minden esetben bizonyos szórendet használ és hablatyol ha kérdezik. Ezt a GPT is tudja.

És ha itt visszatérünk az önálló gondolkodásra, már napok óta hablatyolnak az újságírók arról, hogy talán lesz gondolkodó és cselekvő GPT is. Amihez nem kellett, hogy elolvassam a cikkeket, mert már korábban is biztos voltam benne, hogy hamarabb itt lesz, mint bárki gondolná.

Átfutottam, hülyeség nincs benne. 1-2 helyen én máshogy írtam volna, de ahogy a GPT fordította, úgy sem rossz, csak kicsit mesterkélt. Az is igaz, hogy egyszerű, rövid szövegek, mondatok, talán az is segített.

Mindenesetre erre az AI tényleg jó, jobban fordít, mint a korábbi hagyományos elemzős megoldások. Viszont így sem tökéletes. Ha fontos a projekt, dolgozz össze olyannal, akinek jó az angolja, vagy ha opensource a kód, akkor felteheted nyilvános git tárolóba, és akkor lehet lesznek önkéntesek, akik lokalizálgatnak neked ingyen, segítségképpen. Esetleg ha valami komoly céges projekt, ami finanszírozva is van, akkor meg költsenek fordításra.

The world runs on Excel spreadsheets. (Dylan Beattie)

Köszönöm, hogy megnézted. Így marad, nyelvtudás hiányában mást úgy se tudok vele kezdeni. GitHub megtanulása rajta van a bakancslistán, szándékozok kiadni a forráskódot, de a kód minősége miatt visszatart a szégyenérzet. Mentségemre azt fel tudom hozni, hogy soha nem tanultam programozni.

de a kód minősége miatt visszatart a szégyenérzet

A Földön töltött életünk, az ~30000 nap túl kevés ahhoz, hogy szégyenérzetünk legyen bármilyen is a forráskód. Elég sok ember van itt, akitől segítséget kérhetsz, ha úgy döntesz, hogy publikussá teszed a forráskódot. Lesznek, akik segítőkészek és lesznek, akik napokig képesek egy cikluson vitatkozni, hogy hány sorba kell írni. De pull request-et nem fognak küldeni, mert ahhoz a saját szégyenérzetüket kellene legyőzniük. Hamarabb fogsz máshonnan segítséget kapni.