Testu hutseko fitxategiak - gehienetan .txt
luzapena daukate. - testu-informazioa besterik ez dute gordetzen. Ez dago modu argirik zein hizkuntzatako testua gordetzen duten jakiteko. Asko sinplifikatuz, horrek esan nahi du ordenagailuak erabakitzen duela testua ordenagailuaren hizkuntza berean dagoela.
Errusiarra bazara, seguru asko zure ordenagailuak errusieraz egiten du lan: menuak errusieraz daude, irekitzen dituzun fitxategiak errusierazkoak dira, etab. Kasu gehienetan, ordenagailuak uste zuzena dauka fitxategi gehienen edukiari buruz: errusierazko testuak gordetzen dituzte eta, beraz, pantailan ezin dira errusierazko karaktereak besterik erakutsi.
Haatik, japonieratik errusierara itzultzen duzun itzultzailea bazara, eta testu hutsekoak diren japonierazko fitxategiak jasotzen badituzu, ordenagailuak errusiera daukaten fitxategiak direla uste izango du. Izan ere, fitxategiak berak ez dauka informaziorik barruan gorderik daukan testuaren hizkuntzari buruz.
Japonierazko fitxategiaren edukia ondokoa izan daiteke:
とは、コンピュータを利用した翻訳ツールです。
Baina zure testu-editoreak beste modu honetan erakutsi dezake:
OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≅ВЈБB
Edukiak errusieraz daudela uste duelako... Baina ez da errusiera. Errusieraz erakutsitako japonierazko karaktereak dira.
OmegaT ez da desberdina. OmegaT-k uste du testu hutseko fitxategien edukia automatikoki ordenagailuak lehenetsitako moduan erakutsi daitekeela. Horrek emaitza egokia ematen du ordenagailuak fratsesez lan egiten badu eta ingelesezko fitxategiak jasotzen badituzu, edo ordenagailua alemanezkoa bada eta italierazko fitxategiak jasotzen badituzu.
Zergatik da emaitza ona ingelesa eta frantsesa nahastean eta okerra errusiera eta japoniera nahastean? Ingelesak eta frantsesak karaktere-sorta bera erabiltzen dutelako. Bere izena, Latin-1 edo bere aldaeretako bat. Duela gutxira arte, errusierak eta japonierak ez zuten karaktere-sortarik partekatzen. Errusierazko karaktere-sorta gehienek ez dute japoniera kontuan hartzen, ezta alderantziz ere. Emaitza goian erakutsi dena da.
Bezero japoniarrak japonierazko ordenagailu batekin egiten du lan eta japoniera daukaten testu-fitxategiak sortzen ditu. Bezeroaren ordenagailuak hautatutako karaktere-sorta sistema eragilearen eta beste hainbat ezarpenen araberakoa izango da, baina seguru asko errusierazko ordenagailuak gaizki interpretatuko du jatorrizko ordenagailuaren (japonierazko) karaktere-sorta hautatua.
Karaktere-sorta jakin bat darabilen testu-informazioa nola transmititzen den (alegia, fitxategian nola dagoen idatzita, ordenagailuak interpretatu eta erakutsi ahal dezan), kodeketaren araberakoa da. Ordenagailuak fitxategia irakurtzen duenean, bere kodeketaren arabera "dekodetzen" du eta karaktere-sortaren arabera erakusten du. Oro har, kodeketa bati karaktere-sorta bat dagokio...
OmegaT-k hiru bide dauzka arazo hau konpontzeko. Hiru bideek Aukerak menuko fitxategi-iragazkiak erabiltzea suposatzen dute.
.txt
luzapena duten fitxategien) kodeketa zehaztu..txt
fitxategiari dagokion kodeketara..txt
-tik .jp
-ra japonierako testuetan.*.jp
sorburu-fitxategien eredua eta hautatu sorburu- eta helburu-kodeketetarako parametro egokiak..txt
-tik .utf8
-ra.Egun, OmegaT-k honela ulertzen ditu testu hutseko fitxategiak
.txt
fitxategiek ordenagailuaren kodeketa lehenetsi bera erabiltzen dutela..txt1
fitxategiak ISO-8859-1 dira, hau da, Europa mendebaldeko hizkuntza gehienak barne hartzen dituen kodeketa..txt2
fitxategiak ISO-8859-2 dira, hau da, Europa erdialde eta ekialdeko hizkuntza gehienak barne hartzen dituen kodeketa..utf8
fitxategiek UTF-8 kodeketa (munduko hizkuntza ia guztiak barne hartzen dituena) erabiltzen dutela.Zure kabuz egiaztatu dezakezu hori, Aukerak menuko Fitxategien iragazkiak aukera hautatuz.
OmegaT-k zerrenda labur hau prestatu du testu hutseko zenbait fitxategi errazago kudeatu ahal ditzazun.
Esaterako, txekieraz dagoen testu-fitxategi bat edukiz gero (gehienetan ISO-8859-2 kodeketa erabiliko duena), luzapena aldatu eta .txt
ordez .txt2
idatziz, OmegaT-k modu zuzenean interpretatuko ditu bere edukiak.