Vortlisto de Apertium
La formato de la vortlistoj de la Apertium-projekto apertium-eo-en estas ege malsama ol tiu de ekz Vortlisto traduku.net. Jen mi klarigas:
1) Estas fakte TRI vortaroj: A) angla, B) Esperanta kaj C) angla-esperanta
Contents
La angla vortaro
En la angla vortaro estas priskribo pri cxiuj anglaj vortoj, iliaj vortklasoj kaj kiel oni fleksias ilin.
La dosiero nomigxas apertium-eo-en.en.dix (plej aktuala versio - jen sxangxoj faritaj lastatempe).
La formato estas:
- <e lm="nomo de vorto">radiko de vorto<par n="fleksisimala vorto__vortklaso"/></e>.
La vortklasoj estas iom pli fajnaj ol simple substantivo, adjektivo, adverbo, verbo. Jen plena listo: List of symbols#Categories.
Jen kelkaj ekzemploj:
<e lm="characteristic"><i>characteristic</i><par n="house__n"/></e> <e lm="characteristic"><i>characteristic</i><par n="expensive__adj"/></e> <e lm="change"><i>chang</i><par n="liv/e__vblex"/></e> <e lm="change"><i>change</i><par n="house__n"/></e>
- La vorto characteristic povas esti o-vorto/substantivo (angle: noun) kaj fleksias kiel la vorto house (house__n)
- La vorto characteristic povas esti a-vorto/adjektivoo kaj fleksias kiel la vorto expensive (expensive__adj)
- Vorto change povas esti as-vorto/verbo kaj fleksias kiel la vorto live
- Vorto change povas esti substantivo kaj fleksias kiel la vorto house (house__n)
La esperanta vortaro
En la esperanta vortaro estas priskribo pri cxiuj esperantaj vortoj, iliaj vortklasoj kaj kiel oni fleksias ilin (la fleksio estas kompreneble iom triviala).
La dosiero nomigxas apertium-eo-en.eo.dix.xml (plej aktuala versio - jen sxangxoj faritaj lastatempe).
Jen kelkaj ekzemploj:
<e lm="karakterizi"><i>karakteriz</i><par n="verb__vblex"/></e> <e lm="karaktero"><i>karaktero</i><par n="nom__n"/></e>
- La vorto karakterizi estas verbo. Cxar en Esperanto cxiuj verboj fleksias same oni simple nomis tiun manieron (-i -as -is -os) verb__vblex.
- La vorto karaktero povas esti o-vorto kaj fleksias kiel cxiuj aliaj o-vorto (nom__n)
La esperanta-angla vortaro
En apertium-eo-en.eo-en.dix priskribas la ligon inter la lingvoj Esperanto kaj la angla.
La dosiero nomigxas apertium-eo-en.eo-en.dix (plej aktuala versio - jen sxangxoj faritaj lastatempe).
La formato estas:
- '<e>
<l>nomo de esperanta vorto
</e>.</l><r>name</r>
Jen kelkaj ekzemploj:
<e><p><l>nomo<s n="n"/></l><r>name<s n="n"/></r></p></e> <e><p><l>nombro<s n="n"/></l><r>number<s n="n"/></r></p></e> <e><p><l>propono<s n="n"/></l><r>offer<s n="n"/></r></p></e> <e><p><l>malpura<s n="adj"/></l><r>dirty<s n="adj"/><s n="sint"/></r></p></e> <e><p><l>malpura<s n="adj"/></l><r>gross<s n="adj"/><s n="sint"/></r></p></e> <e><p><l>malrapide<s n="adv"/></l><r>slowly<s n="adv"/></r></p></e> <e><p><l>ĉiam<s n="adv"/></l><r>always<s n="adv"/></r></p></e> <e r="RL"><p><l>ĉefe<s n="adv"/></l><r>primarily<s n="adv"/></r></p></e> <e r="RL"><p><l>ĉefe<s n="adv"/></l><r>principally<s n="adv"/></r></p></e> <e><p><l>ĉefe<s n="adv"/></l><r>especially<s n="adv"/></r></p></e> <e><p><l>malriĉa<s n="adj"/><s n="mf"/></l><r>poor<s n="adj"/><s n="sint"/></r></p></e>
- La vorto nomo
(la esperanta substantivo nomo) kongruas kun la angla vorto name(name kiel substantivo). - La vorto malpura
(malpura kiel adjektivo) kongruas kun la angla vorto dirty(dirty kiel adjektivo).
r="RL" kaj r="LR"
La atributo r estas mallongigo de 'restriction'. Tiel ekz. r="RL" signifas 'restricted to go from Right to Left'.
En la bidix tio do signifas:
r="RL": NUR DE ANGLA AL ESPERANTO t.e. r="RL" se multaj anglaj vortoj -> unu esperanta vorto <e r="RL"><p><l>blua<s n="adj"/></l><r>blue<s n="adj"/></r></p></e> r="LR": NUR DE ESPERANTO AL ANGLA t.e. r="LR" se multaj esperanto-vortoj -> unu angla vorto <e r="LR"><p><l>blua<s n="adj"/></l><r>blue<s n="adj"/></r></p></e>
Oni povas ankaux uzi en monodix, por limigi en kiu direkto eblas uzi tiun linion.
Ekzemple jen oni povas certigi ke la malgxusta 'traveler' estas rekonita kiel 'traveller' (sed ke oni neniam generas la surfacan formon 'traveler' de la profunda formi traveller<n>):
<e lm="traveller"> <i>traveller</i><par n="house__n"/></e> <e r="LR"> <p><l>traveler</l> <r>traveller</r></p><par n="house__n"/></e>
Pluraj vortoj
B.v. rigardu Multiwords.