Ez szerintem nem Chi specifikus, hanem a dokumentumok még anno CP852 kódolással készültek (vagy 437-tel, ha nem állítottad át). A szöveget magát át kéne konvertálni iconv paranccsal.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
Mostanában én is szívok ilyenekkel, régi DOS-os archívumaimat összeszedtem, és van bennük egy csomó rosszul öregedő formátum (WinZip, Context, korai Word/Excel, Works, stb.), meg mindenféle kódolás (alapértelmezett, amerikai DOS-os kódtábla CP437, közép-európai DOS-os, CP852, korai windowsos CP1250). Főleg ezek a WYSWYG típusú proprietary formátumok öregedtek rosszul, nem véletlen, hogy évek óta kerülöm is ezeket. Az roff, TeX, LaTeX, HTML/CSS, Markdown, PostScript, stb. azért tudott évtizedeken át sikeres maradni, mert nyíltak, és plain text alapúak, emiatt megnyithatók akármilyen text editorral (Windows Notepad, vagy egy SSH konzolban szerveren egy vi vagy nano), nagyon könnyű őket más formátumokba konvertálni, akár csak egy pár soros szkripttel, vagy egy XML, stb. parser libet használó saját CLI programmal, vagy pandoc-kal. Hasonló még a régi időkből a WordPerfect, bár az proprietary, de legalább szintén tag-alapú, így azt még megeszi sok minden, meg a modern Office formátumok is azért járják ezt az utat, xdoc, xlsx, odt, stb., mert ezek meg XML alapúak, csak be vannak csomagolva zip-pel, meg átnevezve.
Ez stratégiai kérdés, az ember beleteszi a munkát a dokumentumaiba, érdemes figyelni, hogy azok jól öregedő formátumban legyenek lehetőleg, évtizedek múlva is megnyithatók. Sok cég is ezért nem tud a vendor lock-in-ből kijönni, bele vannak szorulva régi OS verziókba, meg ősi, gányolt formátumos szoftverekre, mert arra rendezkedtek be, abban van tárolva mindenük. Anno senki nem foglalkozott ezzel a kérdéssel, és most szívnak miatta.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
Egyszerű Ms Word nem alkalmas rá? Elvileg megkérdezi text fájloknál, hogy milyen kódolású a szöveg, és ha a listán van olyan kódlap, akkor azzal beolvassa.
Hozzászólások
Ez segít?
https://ctan.org/tex-archive/support/chi2tex?lang=en
Köszi. Egyszerű szövegek - ez egyelőre ágyúnak tűnik.
http://www.colinandmargaret.co.uk/CW2RTF/CW2RTF.html
akkor ez?:)
Sajnos az ékezetekkel ez sem boldogul :-(
ott a forraskod (pascal :)) mellette, javitsd ki :)
Görögül tud pedig :)
Vagy postscript exportból ps2txt? Esetleg ChatGpt megkérheted, hogy egészítse ki ékezetekkel a szöveget, erre lehet, hogy jó.
Lehet, de magyar szöveget azért távol tartok tőle. Szerintem utána több dolgom lenne vele.
Az se rossz ötlet, de gondoltam: ha van valakinek, akkor kevesebbet kell dolgozni.
(Végül is az egész chi specifikáció megvan :-))
Ez szerintem nem Chi specifikus, hanem a dokumentumok még anno CP852 kódolással készültek (vagy 437-tel, ha nem állítottad át). A szöveget magát át kéne konvertálni iconv paranccsal.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
Köszönöm. Ez eszembe nem jutott volna, de bejött.
Mostanában én is szívok ilyenekkel, régi DOS-os archívumaimat összeszedtem, és van bennük egy csomó rosszul öregedő formátum (WinZip, Context, korai Word/Excel, Works, stb.), meg mindenféle kódolás (alapértelmezett, amerikai DOS-os kódtábla CP437, közép-európai DOS-os, CP852, korai windowsos CP1250). Főleg ezek a WYSWYG típusú proprietary formátumok öregedtek rosszul, nem véletlen, hogy évek óta kerülöm is ezeket. Az roff, TeX, LaTeX, HTML/CSS, Markdown, PostScript, stb. azért tudott évtizedeken át sikeres maradni, mert nyíltak, és plain text alapúak, emiatt megnyithatók akármilyen text editorral (Windows Notepad, vagy egy SSH konzolban szerveren egy vi vagy nano), nagyon könnyű őket más formátumokba konvertálni, akár csak egy pár soros szkripttel, vagy egy XML, stb. parser libet használó saját CLI programmal, vagy pandoc-kal. Hasonló még a régi időkből a WordPerfect, bár az proprietary, de legalább szintén tag-alapú, így azt még megeszi sok minden, meg a modern Office formátumok is azért járják ezt az utat, xdoc, xlsx, odt, stb., mert ezek meg XML alapúak, csak be vannak csomagolva zip-pel, meg átnevezve.
Ez stratégiai kérdés, az ember beleteszi a munkát a dokumentumaiba, érdemes figyelni, hogy azok jól öregedő formátumban legyenek lehetőleg, évtizedek múlva is megnyithatók. Sok cég is ezért nem tud a vendor lock-in-ből kijönni, bele vannak szorulva régi OS verziókba, meg ősi, gányolt formátumos szoftverekre, mert arra rendezkedtek be, abban van tárolva mindenük. Anno senki nem foglalkozott ezzel a kérdéssel, és most szívnak miatta.
“The world runs on Excel spreadsheets.” (Dylan Beattie)
4.0?
https://winworldpc.com/product/chiwriter/4
Horstmann oldaláról próbáltam a 4-et is. Az talán még rosszabb volt.
Ha szó szerint "ASCII-export", akkor érthető, hogy szóközök lettek a 0x7f feletti karakterekből.
:-)))
Egyszerű Ms Word nem alkalmas rá? Elvileg megkérdezi text fájloknál, hogy milyen kódolású a szöveg, és ha a listán van olyan kódlap, akkor azzal beolvassa.
Az előtte konvertálás jó lett.