Fordítás AI-val, de nem a szokásos módon, hogyan melyikkel?

 

Előszó:

Van egy 6 kötetes könyvsorozat. Ebből 4 már rendelkezik fordítással az utolsó kettő nincs tervben mert nem fogyott. Ugorjunk. Eddig meg vannak epub-ban de Calibre txt-be is átalakítja, ha arról van szó, hogy az AI nem tudja mi az.

Az elképzelés:

0. Könyvek feltöltése txt-ben. Prompt megírása. Már amennyire meg tudom írni és nem marad ki semmi.

A Prompt:

1. Analizálás - tanulmányozza a meglévő fordítást és az eredeti szöveget, készítsen szótárat, erre nem vagyok kíváncsi, tartsa magában mert kelleni fog.

2. Kimaradt részek pótlása - vagyis a le nem fordított mondatokat illessze be a meglévő szövegkörnyezetbe.

2a) Vannak kikötéseim szavakat és személyneveket ill. Vannak tulajdonnevek, amelyeket a korábbi fordító is lefordított és folytatni kellene, mert ez egy jó húzás, de itt nem sorolnám feleslegesen.

3. Helyesírási hibák javítása - itt az elütésekre gondolok

4. Stílus - használjon markdownt - maradjon a meglévő magyar stílus használatánál a párbeszédeknél, monológoknál, megszólalásoknál DE! Ha hiányzik komplett ilyen mondat, akkkr a magyar — gondolajjellel vagy mivel kezdődő stílust (ehhez további utasítások is kellhetnek szóval majd felütök valami szabályzatot, hogy ezt hogyan kell, előzetesen keresésemben ehhez is találtam leírást a neten) használja az angol "" idézőjeles helyett. Továbbá a dőlt és/vagy félkövér kiemeléseket nyugodtan hozhatja az angol szerint, mint ahogyan az eredeti műfordító is így tett. Az angol 3pontot ... helyettesítse az egy karakteres …-al. Bekezdések első sora egy tabulátorral beljebb húzva, az időbeli ugrások a belső szövegben mehet az angol *** csillaga szerint.

5. Kérem a 4 magyar fordítást javított és bővített verzióban - sima txt de benne legyen a markdown.

6. Az utolsó két könyvhöz használja a saját szótárát, amit a négy könyv fordításából hozott létre, amivel nem boldogul jelezze és megbeszéljük, hogy mi lehet a mondat.

7. Kérem az utolsó két könyv fordítását txt-ben markdownnal

A valóság:

Melyik AI tudja ezt? A chatgpt plus elvérzik rajta ... vagy én vagyok szerencsétlen hozzá már nem tudom mert kiidegelt. Az első fejezet felénél tovább bármennyire is unszolom nem jut. És írja hogy tessék a teljes első fejezet. -Hát ez papám 30-adjára mondom NEM az! -Valóban nem az. Készítsem el a teljes első fejezetet? -Igen! -Tessék a teljes első fejezet javított bővített változata. -Most hülyének nézel? -Valóban nem a teljes első fejezet. kéred az... -ANY.D! Nna ekkor elmondom neki hogy ettől a sortól eddig a sorig. Menni fog? -Igen így már értem. Tess... VESSZÉL MEG! -Megértem hogy frusztrált vagy...

Hozzászólások

Kifutsz a context window-ból. Vagy nagyobb ablakkal rendelkező modellt használj, vagy kis darabokban add neki a feladatot úgy, hogy beleférjen egy plusz dokumentum, amiben a fenti szabályhalmazt mindig hozzácsapod. Ráadásul ne chat felületen próbáld, mert ott próbálja követni az eddigi történéseket is, de akkor pláne kifutsz a keretből.

Vagy használj direkt fordító szolgáltatást, az erre van kitalálva.

De nem tudom melyik van éppen erre kitalálva. :(

Nem sokat, vagy 2-3-at kipróbáltam, de kampó mindig. A DeepL lenne a legjobb, de azzal nem tudok beszélni. Lehet hogy a legjobb fordító, de most ha csak feltöltöm neki a könyveket a forma és stílus még elfogadható lenne, ha nem szállna el és kezdené el a személyneveket fordítani, meg false szavakat használni. Jó lenne beszélni hozzá. Vagy lehet csak nem vettem eddig észre hogy hol kell.

hat ezt nem hinnem hogy barmelyik tudja igy ebben a formaban. deepl valo forditasra, a chat-ok nem.

en fognek (persze, ha lenne szabadon elerheto) egy forditasra valo modelt (egyaltalan milyen nyelvek?) es finetuningolnam a mar leforditott konyvekkel, es utana engednem ra a maradekra. a markdownt szerintem felejtsd el...

Van egy kis gond a magyar fordítással, még pedig az, hogy nem teljes. Hiányoznak komplett mondatok, amiket a chatgpt-nek sikerült megoldania, és úgy faragott rajta hogy illeszkedjen a szövegbe.

Amit megcsinált a ChatGPT az zseniálisan (tényleg le a kalappal előtte) szépen markdown formázott szöveg volt, néhány kérést még belefűztem hogy az érzékelők nem mutatnak hanem jeleznek, és a monitorok megjelenítenek. Csak akkor fordítsa a show szót mutatnak, ha emberi cselekvésről van szó, pl valaki mutatja a térképen. Utána már nem tudtam belekötni. Tudja a markdownt nem volt vele gondja.

Angol nyelvű markdown formázott txt az alapanyag a meglévő 4 magyar szintén.

Arra van promptolva hogy, ha nem megszólalás, párbeszéd, monológ, akkor használja nyugodtan az angol dőlt betűsen formázott szöveget, ha jól láttam ez lesz a belső monológ. De nem akartam bonyolítani. Ellenben amikor megszólalás, párbeszéd, monológ történik arra külön promptban van a szabály.

A probléma csak annyi hogy nem jut tovább.

Milyen sorozat ez, csak nem Jack Campbell: Az elveszett flotta? Elvileg nem olyan nehéz a nyelvezete, egyszer befejezem angolul.

Miért mehet? Sajnos a könyvkiadás nem jótékonysági alapon megy, hiába volt egy kicsi, de elszánt rajongótábora, nem vették meg elegen, a negyedik részt is kisebb csoda, hogy legalább e-bookban kiadták. Veszteséget pedig csak ideig-óráig finanszíroznak sikeresebb könyvekből.

Nem hiszem hogy sokan örülnek annak, hogy félbemaradt a sorozat. Így még kevesebben veszik meg szvsz. Nálam itt a 3 könyv a polcon, ebookban a negyedik. Ha most meg akarod venni a könyvet max ebookban tudod mert semelyik boltban nincs kitéve külön rendelésre sincs. Az új könyvek meg már 6-7000 ft-ok és semmilyen utalvány nem váltható be rájuk egy évig. Mégis mindig az van hogy nincs pénz, meg minden veszteséges. És gondoltam ingyen befejezem, ugyanakkor nem ez volt a kérdésem.

Ez az igazi 22-es csapdája, ami havonta többször előkerül könyves oldalakon. Az olvasó nem veszi meg, csak ha a teljes sorozat kijött, a kiadó viszont nem adja ki végig, mert nem jók a fogyások. Van ilyen példa a közelmúltból is, az Agave kiadó leállította a Vámpírakadémia sorozat újra kiadását, mert a második rész után a harmadik rész fogyása beleállt a földbe.

Ha elég sokan megvették volna, nem maradt volna félbe. A könyvesboltok meg nem tartanak pár évnél régebbi könyveket, az első rész pedig már a kiadónál sincs.

Ne keverjünk össze most több dolgot, mert akkor nagyon mélyen elmerülünk a nyúlüregben, de maradjunk annyiban, hogy ha azt akarod, hogy egy sorozat végig megjelenjen, akkor közvetlenül a kiadótól vedd meg, lehetőleg 1-2 éven belül a megjelenés után, különben azt mutatja nekik a matek, hogy nem érdekli az embereket.

Itt van egy nagyon jó összefoglaló a könyvkiadás anyagi oldaláról, mindenkinek ajánlom: https://spekulativzona.substack.com/p/konyvkiadas-minek-van

Egy ilyen fordításhoz nem elég a jó angol nyelvtudás, mert olyan kifejezéseket kell lefordítani,

amik ritkák/nem szokványosak és/vagy egy adott területhez (pl.: katonai) tartoznak, amit meg kell ismerni.

Komoly munka.

Neki kezdtem az 5. könyvnek, az első oldal után feladtam, mert nehéz munka és sok idő..

 

Lehet  molyosokkal kellene beszélni, hogy lehessen összehozni valahogy azokat akik szeretnének fordítást, mert

ha van X ezer ember aki összedob Y összeget, akkor már azzal lehet kezdeni valamit?

 

Ez bizony el. :( Ráadásul maradt is ki szöveg a könyvekből.

Lassan, de haladok. Az első fejezet vége felé tartok. Így is parkolópályára tesz a chatgpt :( csak a pro előfizetés az unlimited. Az meg szerintem sok. Próbáltam a Geminit ... jujj veszélyes :( szerintem a Google-nek ezt nem kellene erőltetnie. A chatgpt is tud hibákat úgy beállítani, mintha az igaz lenne vagy úgy lenne, de a Gemini-vel vitatkozni se akartam, lefárasztott két perc alatt amikor azt mondta hogy az a szabály a monológnál, párbeszédeknél a magyar stílusban az, hogy idézőjelben van... mondom hagyjuk ez időveszteség. Pedig annak is ott volt a promptjában a szabály rá.

Holnap megnézem mit tud ez:

https://github.com/bookfere/Ebook-Translator-Calibre-Plugin?tab=readme-ov-file

Elvileg most van egy chatgpt plus api-kulcsom. Hátha begyorsítja a folyamatot. De van olyan része is amihez nem kell api-kulcs pl deepl-free, google hátha valaki máson is segít.

Hátha meg lehet gyorsítani a dolyamatot vele.

Hmm, ha már... van egy hobbiprojektem, blogból könyvet. Azaz van - már csak - kb. ötven html fájl, abból kéne "ebook html"-t, vagy eleve epub vagy hasonlót gyártani. Eddig kézzel csináltam, de unalmas favágómunka. Melyik AI-al lenne értelme legyártatni? Figyelembe véve hogy elég háklis vagyok a - szerintem - szép, minimalista kódra.

Szerkesztve: 2024. 12. 26., cs – 08:29

-

Én a chatgpt-vel próbáltam egyszerű filmfeliratot fordítani, azt mondta neki túl sok :) Gondolom könyvet akkor még ennyire sem tud.

Apropó AI, ezen röhögtem a napokban egy nagyot.

Minden hulla a Mount Everesten valamikor egy nagyon motivált ember volt.

Úgy próbáltad hogy feltöltöd neki txt-ben? Én a könyveket úgy kezdtem el fordítani vele, hogy feltöltöttem a 6 angol és 4 magyart meg a 2 primitíven, értsd: deepl-el előfordított könyvet. Egy darabig el is jutott. Szóval tudja mi van benne. Csak nem tudott nekem visszatérni egyszerre mindennel, vagyis egyszerre a komplett első könyvvel. Ma azt vettem észre hogy ha azt mondom neki hogy kis részletekben kezdje visszaadni, vagyis hozzászólásonként írja ki a fordítást (én ugye eddig az egész fájlra koncentráltam - és ez rossz ötlet volt) talán működhet a dolog. Ma úgy álltam hozzá, hogy azt mondtam: folytasd tovább. Mintha így már megszüntek volna a keretei. És apránként commenteli amit megcsinált.

Hátha neked is visszaadja a fordítást ha kommentenként kéred, amennyi épp belefér neki a hsz-be.

Ma jöttem rá arra is hogy ha hosszú a prompt akkor nem fogadja el. De ha azt is feltöltöm txt-be és azt mondom hogy a szabályok.txt-ben vannak az utasítások amelyeket követned kell, akkor elfogadja és használja is.

Nem megy, sima chatgpt-vel próbáltam, pluszra meg nem fogok előfizetni:

You've reached your data analysis limit.

Upgrade to ChatGPT Plus or try again tomorrow after 9:24 AM.

Szerk: ahogy írtad, kis részletekben visszaadja a fordítást (30-40 sor) és rákérdez, hogy folytassa a következő résszel. Az eredményt elnézve a fordításon még lenne csiszolni való elég:

8
00:01:37,401 --> 00:01:39,576
Miért most? Genetikailag módosított étel,

9
00:01:39,577 --> 00:01:42,450

  • vagy egy fegyverként használt vírus?
  • Rendben, csak fókuszáljunk arra,

10
00:01:43,799 --> 00:01:46,148
amit tudunk.

11
00:01:46,149 --> 00:01:49,891
Senki, és úgy értem, senki,

12
00:01:49,892 --> 00:01:52,460
ne legyen holdfénynek kitéve ma éjjel. Ez az első.

13
00:01:54,331 --> 00:01:55,898
A második a félelem.

14
00:01:56,986 --> 00:01:59,206
A félelem rossz döntéseket hoz.

15
00:02:00,685 --> 00:02:02,425
Legyen egy tervetek,

16
00:02:02,426 --> 00:02:03,731
ragaszkodjatok hozzá,

17
00:02:03,732 --> 00:02:05,212
és maradjatok biztonságban.

18
00:02:06,256 --> 00:02:08,214
A harmadik, a harmadik...

19
00:02:08,215 --> 00:02:10,172
Mindenkinek tudnia kell, hogy dolgozunk

20
00:02:10,173 --> 00:02:12,784
éjjel-nappal, hogy megtaláljuk a megoldást.

21
00:02:14,090 --> 00:02:16,265
Túl fogjuk élni ezt.

Minden hulla a Mount Everesten valamikor egy nagyon motivált ember volt.

Lehet hogy neked is kell hozzá vagy 200 sor szabály, hogy megfeleljen egy felirat stílusának, meg lehet hogy néhány szót le kell neki szögezni, mint nekem. Például a hajók neveit le kellett mert egy bekezdésen belül volt minden a Dauntless csak Rendíthetetlen nem. Utána jött az ötlet hogy a meglévő magyar fordítást is feltöltöttem neki, hogy inkább azt használja, csak egészítse ki, ha kimardt valami. Ugyanis valamiért megkérdeztem tőle, hogy az előzetes átvizsgálásod alapján maradtak-e ki olyan szövegek, amelyek nem lettek lefordítva. Már köpte is a példákat, hogy a hangok pl suttogva mondta, vagy hangja mint az acél csendült nem lettek lefordítva. Akarod hogy jobban átnézzem. Hát most már igen. Aztán lökött olyan bekezdést, ami komplett kimaradt a magyar fordításból. Mi legyen velük? Illeszd be úgy a meglévő fordításba, hogy az ne változzon sokat, vagy megfeleljen a környezet stílusának.