Vortlisto de Apertium

From Apertium
Jump to navigation Jump to search

La formato de la vortlistoj de la Apertium-projekto apertium-eo-en estas ege malsama ol tiu de ekz Vortlisto traduku.net. Jen mi klarigas:

1) Estas fakte TRI vortaroj: A) angla, B) Esperanta kaj C) angla-esperanta

La angla vortaro

En la angla vortaro estas priskribo pri cxiuj anglaj vortoj, iliaj vortklasoj kaj kiel oni fleksias ilin.

La dosiero nomigxas apertium-eo-en.en.dix (plej aktuala versio - jen sxangxoj faritaj lastatempe).

La formato estas:

  • <e lm="nomo de vorto">radiko de vorto<par n="fleksisimala vorto__vortklaso"/></e>.

La vortklasoj estas iom pli fajnaj ol simple substantivo, adjektivo, adverbo, verbo. Jen plena listo: List of symbols#Categories.

Jen kelkaj ekzemploj:

    <e lm="characteristic"><i>characteristic</i><par n="house__n"/></e>
    <e lm="characteristic"><i>characteristic</i><par n="expensive__adj"/></e>
    <e lm="change"><i>chang</i><par n="liv/e__vblex"/></e>
    <e lm="change"><i>change</i><par n="house__n"/></e>
  • La vorto characteristic povas esti o-vorto/substantivo (angle: noun) kaj fleksiatas kiel la vorto house (house__n)
  • La vorto characteristic povas esti a-vorto/adjektivo kaj fleksiatas kiel la vorto expensive (expensive__adj)
  • Vorto change povas esti as-vorto/verbo kaj fleksiatas kiel la vorto live
  • Vorto change povas esti substantivo kaj fleksiatas kiel la vorto house (house__n)

La esperanta vortaro

En la esperanta vortaro estas priskribo pri cxiuj esperantaj vortoj, iliaj vortklasoj kaj kiel oni fleksias ilin (la fleksio estas kompreneble iom triviala).

La dosiero nomigxas apertium-eo-en.eo.dix.xml (plej aktuala versio - jen sxangxoj faritaj lastatempe).


Jen kelkaj ekzemploj:

    <e lm="karakterizi"><i>karakteriz</i><par n="verb__vblex"/></e>
    <e lm="karaktero"><i>karaktero</i><par n="nom__n"/></e>
  • La vorto karakterizi estas verbo. Cxar en Esperanto cxiuj verboj fleksiatas same, oni simple nomis tiun manieron (-i -as -is -os) verb__vblex.
  • La vorto karaktero povas esti o-vorto kaj fleksiatas kiel cxiuj aliaj o-vortoj (nom__n).

La esperanta-angla vortaro

En apertium-eo-en.eo-en.dix priskribas la ligon inter la lingvoj Esperanto kaj la angla.

La dosiero nomigxas apertium-eo-en.eo-en.dix (plej aktuala versio - jen sxangxoj faritaj lastatempe).


La formato estas:

  • '<e>

    <l>nomo de esperanta vorto</l><r>name</r>

    </e>.

Jen kelkaj ekzemploj:

    <e><p><l>nomo<s n="n"/></l><r>name<s n="n"/></r></p></e>

    <e><p><l>nombro<s n="n"/></l><r>number<s n="n"/></r></p></e>

    <e><p><l>propono<s n="n"/></l><r>offer<s n="n"/></r></p></e>


    <e><p><l>malpura<s n="adj"/></l><r>dirty<s n="adj"/><s n="sint"/></r></p></e>
    <e><p><l>malpura<s n="adj"/></l><r>gross<s n="adj"/><s n="sint"/></r></p></e>

    <e><p><l>malrapide<s n="adv"/></l><r>slowly<s n="adv"/></r></p></e>
    <e><p><l>ĉiam<s n="adv"/></l><r>always<s n="adv"/></r></p></e>

    <e r="RL"><p><l>ĉefe<s n="adv"/></l><r>primarily<s n="adv"/></r></p></e>
    <e r="RL"><p><l>ĉefe<s n="adv"/></l><r>principally<s n="adv"/></r></p></e>
    <e><p><l>ĉefe<s n="adv"/></l><r>especially<s n="adv"/></r></p></e>

    <e><p><l>malriĉa<s n="adj"/><s n="mf"/></l><r>poor<s n="adj"/><s n="sint"/></r></p></e>


  • La vorto nomo (la esperanta substantivo nomo) kongruas kun la angla vorto name (name kiel substantivo).
  • La vorto malpura (malpura kiel adjektivo) kongruas kun la angla vorto dirty (dirty kiel adjektivo).


r="RL" kaj r="LR"

La atributo r estas mallongigo de 'restriction'. Tiel ekz. r="RL" signifas 'restricted to go from Right to Left'.

En la bidix tio do signifas:

    r="RL": NUR DE ANGLA AL ESPERANTO
    t.e. r="RL" se multaj anglaj vortoj -> unu esperanta vorto

    <e r="RL"><p><l>blua<s n="adj"/></l><r>blue<s n="adj"/></r></p></e>

    r="LR": NUR DE ESPERANTO AL ANGLA
    t.e. r="LR" se multaj esperanto-vortoj -> unu angla vorto

    <e r="LR"><p><l>blua<s n="adj"/></l><r>blue<s n="adj"/></r></p></e>

Oni povas ankaux uzi en monodix, por limigi en kiu direkto eblas uzi tiun linion.

Ekzemple jen oni povas certigi ke la malgxusta 'traveler' estas rekonita kiel 'traveller' (sed ke oni neniam generas la surfacan formon 'traveler' de la profunda formi traveller<n>):

<e lm="traveller">            <i>traveller</i><par n="house__n"/></e>
<e r="LR">                    <p><l>traveler</l>            <r>traveller</r></p><par n="house__n"/></e>

Pluraj vortoj

B.v. rigardu Multiwords.