Donnerstag, 8. Juli 2010

In a session on Verbatim, Pootle etc yesterday, Matjaz presented a Jetpack add-on, that allows one to use a translation memory (in a TMX form) during the  Verbatim process. The example showed nicely, how one can take an existing TMX file, list the candidates (100% match and some fuzzies as well) and then drop the selection into the target segment.

Verbatim does not use any translation memory mechanism (as far as I know, not even MO, the nonstandard Pootle's version of a translation memory) to propagate the translations which already exist through the material to be translated. Well, fine, but then the JetPack solution by Matjaz will fix it, will it not?

Please note first, the TMX, to be used in the JetPack, comes from outside. It is not an integral part of the Verbatim / Pootle solution. It is a deus ex machina, a translational band-aid - for now at least, if not for some time coming.


Matjaz showed during the demo of his Jetpack solution, how  "Australia" is translated into "Avstralija" with the help of an existing translation memory. Just before this example, however, there was a case of "Argentina" without any suggestion from TMX. Matjaz dropped in the copy of the source and then proceeded  on to the next entry. But hold on a second: where did the target entry for "Argentina" land?  Just in the PO? How adding the new stuff to TMX? After all  it would not hurt to adhere to the Mozilla spirit and expand the TMX with the working being done. I am pretty certain, however, that in the case of Matjaz' add-on TMX get short-changed. 

Here's the situation in a nutshell: external translational sources are tapped to (help Verbatim) help the localizer do the work. The Verbatim per se is not involved,  as it does not as yet have any ways and means to tap into the possibilities, offered by standardized translation memories. On the other hand, the external sources are on receiving end of the stick in the Jetpack proposal, as their initial investment and the use of their assets, as implemented in the Matjaz' proposal, is not  reciprocated by expanding the memory with new translations.

We all have open and free standards for everybody written all over our hearts, flags and banners. Standardized translation memory - free and open-sourced for all - must be among them.

Vito

PS:  one of the listeners, who was evidently new to the subject of translation memories and specifically to the subject of TMX, commented with visible relief "Oh, fine, it's just an XML file". Oh well... XML file is not much, if anything at all, without a corresponding DTD.

To see DTD for TMX files - and implicitely all the work and drive behind it - see
TMX specification by LISA

Jetpack add-on for Verbatim

at Mozilla Summit 2010, 8.july

In a session on Verbatim, Pootle etc yesterday, Matjaz presented a Jetpack add-on, that allows one to use a translation memory (in a TMX form) during the  Verbatim process. The example showed nicely, how one can take an existing TMX file, list the candidates (100% match and some fuzzies as well) and then drop the selection into the target segment.

Verbatim does not use any translation memory mechanism (as far as I know, not even MO, the nonstandard Pootle's version of a translation memory) to propagate the translations which already exist through the material to be translated. Well, fine, but then the JetPack solution by Matjaz will fix it, will it not?

Please note first, the TMX, to be used in the JetPack, comes from outside. It is not an integral part of the Verbatim / Pootle solution. It is a deus ex machina, a translational band-aid - for now at least, if not for some time coming.


Matjaz showed during the demo of his Jetpack solution, how  "Australia" is translated into "Avstralija" with the help of an existing translation memory. Just before this example, however, there was a case of "Argentina" without any suggestion from TMX. Matjaz dropped in the copy of the source and then proceeded  on to the next entry. But hold on a second: where did the target entry for "Argentina" land?  Just in the PO? How adding the new stuff to TMX? After all  it would not hurt to adhere to the Mozilla spirit and expand the TMX with the working being done. I am pretty certain, however, that in the case of Matjaz' add-on TMX get short-changed. 

Here's the situation in a nutshell: external translational sources are tapped to (help Verbatim) help the localizer do the work. The Verbatim per se is not involved,  as it does not as yet have any ways and means to tap into the possibilities, offered by standardized translation memories. On the other hand, the external sources are on receiving end of the stick in the Jetpack proposal, as their initial investment and the use of their assets, as implemented in the Matjaz' proposal, is not  reciprocated by expanding the memory with new translations.

We all have open and free standards for everybody written all over our hearts, flags and banners. Standardized translation memory - free and open-sourced for all - must be among them.

Vito

PS:  one of the listeners, who was evidently new to the subject of translation memories and specifically to the subject of TMX, commented with visible relief "Oh, fine, it's just an XML file". Oh well... XML file is not much, if anything at all, without a corresponding DTD.

To see DTD for TMX files - and implicitely all the work and drive behind it - see
TMX specification by LISA

Freitag, 23. April 2010

lokalizacija = sl.jar

Če si v (zaenkrat shredder imenovani) instalaciji pogledaš podmapo chrome, boš naletel na datoteko sl.jar, ki vsebuje naše dosedanje delo. Lokalizacija ni nič več in nič manj kot vsebina te knjižnice.

Za novo verzijo je treba (samo in nič več kot to) novo verzijo sl.jar.

Francesco( mozilla l10n blog )
You can simply download the latest nightly and work on the chrome/sl.jar of that package: if you're using Windows (but it's probaly possible for other platforms as well), you can use 7zip's File Manager and change files without unpacking/repacking the .jar file.
Da vidimo ... 7Zip. Zap ... Ha!...  dejansko.

Mittwoch, 3. März 2010

Prevodi vključeni v release proceduro

Oglasil se je Simon Paquet z lepo novico, da je prevode vdelal v sistem - gre za stanje, preden je Aleš R poslal zadnji delež. Tu dnevnik dosedanjih dogodkov

Stanje je videti na naslednjih naslovih:sl shipping 3.0 in sl shipping 3.1
Poleg manjkajočih delov je Simon omenil še naslednje: prevajali smo tudi zadeve, za katere je v komentarjih eksplicitno zahtevano, da se jih pusti pri miru. Moja krivda in v bodoče naloga, da skrbim za te primere.

Testbuild naj bi bil po njegovih besedah na razpolago enkrat danes: TB 3.0 oz. TB 3.1




Mercurial, skladišča, pošte ...

Sistem, ki se v Mozilli uporablja za hranjenje in ažuriranje izvorne kode, se imenuje Mercurial.

Kdor je doslej že delal z SVN ipd., se na Mercurial (ali kratko hg) lahko hitro navadi. Glede na to, da gre za prostokodne projekte, je pri Mozilli vse na dlani:

mozilla.org releases repository ... seveda za branje, za pisanje obstaja procedura, kako se do teh pravic pride.

Še en naslov: poštna stran za "lokalizatorje".

Lep pozdrav in upam da lepa novica za vse.



PS: Ali je mogoče komentirati?

Zaenkrat nobenih komentarjev ali prijavljencev na blog, pri čemer ne vem, ali je krivda nezanimiva ali nesporna vsebina, ali pa nastavitev bloga. Lahko kdo poizkusi s komentarjem?

Sonntag, 28. Februar 2010

Izrazoslovje II, Google Docs, FOSDEM

attachment: priponka. Nasvet Aleša K, U.C idr. Izraz uporablja tudi Microsoftov glosar
offline mode: nepovezan način. Gre lepše z jezika in s tipkovnice kot način brez povezave.

Ker glosar vidno raste, sem ga postavil v Google Docs (EN SL (Mozilla) glosar). Tam je najti tudi preglednico s stanjem projekta - gl. privatno pošto s tem v zvezi -.


Kako odgovarjati na ta blog oz. ga komentirati?  Da ne bi prihajalo do anonimk, vandalizma, se je treba prijaviti, potem pa bi moralo iti brez problemov.


Kaj je na sporedu?

Naslednji cilj  je testna verzija, kjer bomo lahko videli, kaj vse je narobe (g).  V tem smislu čakam na sporočilo kolegov pri Mozilli. 

Zanimivo branje: Thunderbird_Localization
od tu se lahko zakrmari do naslednje strani, ki je merodajna: l10n dashboard/


Za konec spominek z letošnjega FOSDEM

The 2010 Fosdem dance

Lep pozdrav

smo

Donnerstag, 25. Februar 2010

Izrazoslovje I

To, From, cc, bcc: Za, Od, Kp, Skp. Nisem prepričan glede Skp

junk mail: neželena pošta. Lepo bi bilo kaj bolj "udarnega".

attachment: priloga. Najti je tudi predlog pripetek, ne vem pa, ali se mu je uspelo udomačiti se.

certificate
: potrdilo - brez digitalno. Glede na dolgoletne izkušnje Slovenije s certifikati je vprašanje, ali ima moj predlog smisel.

tbc

smo

Sonntag, 21. Februar 2010

Slovenski jezikovni viri na mreži

Ena od odgovornosti prevajalca je vsekakor tudi skrb za pravilno izrazoslovje. Tukaj viri, na katere sem se s časom navadil in ki so dovolj skrbni, da se na njih lahko zanesemo.

http://evroterm.gov.si

Doslej še nisem naletel na kako večjo napako ali nedoslednost. Kar se računalništva tiče, je spletišče sicer bolj revno zasedeno.

http://www.islovar.org


Če kdo, je poleg SAZUja slovensko društvo za informatiko tista ustanova, ki ima nalogo in odgovornost za izrazoslovje. Kar moti, so pogostni alternativni predlogi, kjer je prevajalec prepuščen sam sebi, kar se končne izbire tiče.

Microsoft glosar

Gre za obširen, prosto dostopen prevodni spomin, ki vsebuje lokalizacijo vseh pomembnih izdelkov Microsofta (od Access 2003 do Word 2003). Terminologija je konsistentna in sodobna. Čast komur čast...Moja kopija je v zazipani obliki na razpolago pod

http://www.textnart.de/EN SL Microsoft Glossary.zip

Nota bene: ZIP verzija je okoli 8 MB, originalna TMX pa ima 87MB. Za OmegaT to ni noben problem. Največji prevodni spomin, s katerim razpolagam, je EuroLex v obsegu 224MB in tudi s tolikšno količino podatkov nisem doslej imel problema.

http://www.slovarji.info/

Lepo in skrbno delo moje kolegice prof. Tjaše Kürpick. Čeprav so slovarji na razpolago v obliki, ki omogoča samo ogled, vendar njih vsebina zasluži tri zvezdice.

Google Translate

Po eni strani je enostavno privzeti, da Google asociira - t.j. da na primer vzame angleški original Shakespearea in ga "poravna" s prevodom kakega Otona Župančiča. Zadeva je tekom zadnjega leta ali dveh napredovala v obsegu, ki ga ni bilo pričakovati. Za primer slov. original in pa nemški prevod, ki gotovo ne izvira iz kakega skeniranega prevoda:

Velikokrat v svojem življenju sem storil krivico človeku, ki sem ga ljubil.

Viele Male in meinem Leben habe ich falsch gemacht haben Menschen,
die ich liebte.


Nota bene: prevajalnik se je moral spopasti ne samo z enim, ampak z dvema jezikoma!

slovenski OpenOffice.org

Skupina okoli slovenske verzije OpenOffice.org je vsekakor zaslužna za veliko novih (in potrebnih) izrazov. Na žalost zaenkrat ni konsistentnega prevajalnega spomina, s katerim bi si bilo mogoče pomagati.


smo

OmegaT 2.1.3 Trunk podpira DTD

Aktivna pomoč, tako s strani ekipe Mozilla kot s strani razvijalcev OmegaT, je obrodila sadove: OmegaT 2.1.3 (razvojna verzija) podpira tudi DTD. Prvi poizkusi z razvojno verziojo to tudi potrjujejo.

Tako je sedaj z OmegaT mogoče lokalizirati vse, kar je za aplikacije Mozille potrebno, tako datoteke properties kot tudi datoteke DTD.

Kako priti do razvojne verzije OmegaT?

Iz sourceforge naložiti ustrezno verzijo:

http://sourceforge.net/projects/omegat/files/

gl. Development, verzija 2.1.3 z dne 21.2.2010


Poleg ostalih sprememb vsebuje ta verzija sedaj tudi datotečni filter za DTD. Za Mozilla lokalizacije je torej treba aktivirati properties in DTD:



Na ta način je z enim korakom uspelo skrčiti število besed, ki jih je treba v datotekah DTD "prežvečiti", približno za faktor 3, v celoti 10774. Od tega je (pred)prevedeno že okoli 6000, tako da je treba prevesi samo še 4203 besed.

Približno 1000 besed pošiljam danes AR v obdelavo.

Freitag, 19. Februar 2010

Delo z DTD - 20.02

Med čakanjem na preostala prispevka za properties (gl. prejšnji prispevek) sem iskanl in našel rešitev za DTD lokalizacijo. V vsakem primeru je bilo zaželjeno, pri delu uporabljati OmegaT in že prevedene materiale v obliki TM, pri tem pa se izogibati nepotrebnemu delu. Za kaj gre pri tem?

Vzemimo tipičen stavek iz DTD datoteke:

!ENTITY fileMenu.label "File"

S Stališča lokalizacije je vse, razen besede File, šum. V TRADOSu bi preostanek dobil atribut UNTRANSLATABLE, tako da !ENTITY fileMenu.label prevajalcu sploh ne bi prišel pod noge. OmegaT tega ne pozna, tako da bi prevajalec moral med delom ves čas preskakovati te elemente. Dejstvo je, da zaenkrat - v verziji 2.0.5 - OmegaT te oblike datotek ne pozna. Že 2007 je bil prijavljen RFE 1848169

.... In ko grem pogledat za številko, najdem informacijo od včeraj, da je Didier implementiral DTD podporo v Trunk verziji(!!)

Montag, 8. Februar 2010

Stanje lokalizacije 8.2.2010

Material, ki se ga lokalizira, je na razpolago v obliki datotek s pripono properties in datotek s pripono DTD. Z datotekami Properties smo skoraj končali. Od 107 datotek manjkajo samo štiri od Primoža in Mateja. Izraženo v številu besed, ki jih je bilo treba prevesti:


Prevedeno do 3.2 9842 + Aleš R. 5.2. 2037 = 11879 / 73%
Odprto: Primož - 3088 besed in Matej - 1259

OmegaT očitno ni kakšna posebna prepreka za delo, v vsakem primeru upam v pomoč, da gre zadeva hitreje od rok.

Pri datotekah DTD je tudi že del narejen. Odločil sem se, da vse te datoteke, vključno z že prevedenimi, začasno prikrojim na obliko properties, ker s tem vsem sodelavcem, ki uporabljajo OmegaT, prihranim cel kup nepotrebnega dela. !ENTITY ključ etc., ki se jih tako ali tako ne prevaja, ne bo več videti. Tu upam narediti oz. končati ta teden.

Vabim vas vse, da se abonirate na blog in da se tudi oglasite s komentarji in vprašanji.

LP

Vito

Kick-off za LBl10n Blog

Glede na to, da je skupina za lokalizacijo program Thunderbird 3.0 v slovenski jezik zadnjih nekaj tedno zelo hitro narastla, je pametno, da na to temo začnemo komunicirati prek bloga z naslednjimi cilji:
  • objava novic, ki zanimajo celotno skupino
  • skladišče besedil, ki so relevantna za nalogo
  • prikaz trenutnega stanja lokalizacije
Blog je na razpolago vsem, ki se zanimajo za lokalizacijo TB 3.0. Za vsebino prispevkov odgovarja seveda vsak sam. V kolikor se vsi koncentriramo na zastavljeni cilj, bodo kakršnikoli ukrepi upam nepotrebni.


Vito

PS - kick-off:New Orleans Saints win 2010 Super bowl. Pravilno (g).