Exemple d'utilisation de Crossdics
Comment obtenir la paire de langues Anglais-Galicien[1] (A-C) à partir de Anglais-Espagnol[2] (A-B) et Espagnol-Galicien[3] (B-C).
Contents
Obtenir apertium-crossdics
Téléchargement
$ svn co https://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-dixtools
Vous aurez besoin d'installer Ant et Java Development Kit 6 (JDK6)
$ sudo apt-get install ant sun-java6-jdk
Compilation and installation
$ cd apertium-crossdics $ ant jar $ sudo ant install
Ce qu'il vous faut
Dictionnaires
Pour obtenir une paire de langues Anglais-Galicien (A-C) depuis les paires Anglais-Espagnol (A-B) et Espagnol-Galicien (B-C), vous avez besoin des dictionnaires qui suivent :
- Morphologique A: apertium-en-es.en.dix
- Morphologique C: apertium-es-gl.gl.dix
- Bilingue AB: apertium-en-es.en-es.dix
- Bilingue BC: apertium-es-gl.es-gl.dix
Document de Modèle Croisé
Vous avez aussi besoin d'un :
- Modèle croisé ABC: cross-model-en-es-gl.dix
Un document de modèle croisé doit contenir au moins une pattern-action par défaut. Ici vous avez un exemple très simple de document cross-model-en-es-gl.xml.
<?xml version="1.0" encoding="UTF-8"?> <cross-model> <cross-action id="default" a="ebenimeli"> <description>Default pattern</description> <pattern> <e> <p> <l>$lemmaA<v n="cat"/><t n="tailA"/></l> <r>$lemmaB<v n="cat"/><t/></r>
</e> <e> <p> <l>$lemmaB<v n="cat"/><t/></l> <r>$lemmaC<v n="cat"/><t n="tailC"/></r>
</e> </pattern> <action-set> <action> <e> <p> <l>$lemmaA<v n="cat"/><t n="tailA"/></l> <r>$lemmaC<v n="cat"/><t n="tailC"/></r>
</e> </action> </action-set> </cross-action> </cross-model>
Lire plus dans Comment créer un document de modèle croisé.
Document de Ressources Linguistiques
Finalement, un document avec des références aux ressources linguistiques requises.
Exemple du document en-es-gl-ling-resources.xml :
<?xml version="1.0" encoding="UTF-8"?> <ling-resources> <name>Mes ressources linguistiques</name> <description>Mes ressources linguistiques : dictionnaires morphologique et bilingues, modèles croisés, corpus, etc.</description> <resource-set> <name>Mes ressources linguistiques pour obtenir la paire de langues Anglais-Galicien.</name> <description>Dictionnaires morphologique et bilingues.</description> <!-- modèle croisé en-es-gl --> <resource> <property name="name" value="cross-model-en-es-gl"/> <property name="type" value="cross-model"/> <property name="sl" value="en"/> <property name="tl" value="gl"/> <property name="for-crossing" value="yes"/> <property name="src" value="cross-model-en-es-gl.xml"/> </resource> <!-- modèle croisé gl-es-en --> <resource> <property name="name" value="cross-model-gl-es-en"/> <property name="type" value="cross-model"/> <property name="sl" value="gl"/> <property name="tl" value="en"/> <property name="for-crossing" value="yes"/> <property name="src" value="cross-model-en-es-gl.xml"/> </resource> <!-- Dictionnaire morphologique 'en' --> <resource> <property name="name" value="apertium-en"/> <property name="type" value="mon"/> <property name="sl" value="en"/> <property name="for-crossing" value="yes"/> <property name="src" value="apertium-en-es.en.metadix"/> </resource> <!-- Dictionnaire morphologique 'gl' --> <resource> <property name="name" value="apertium-gl"/> <property name="type" value="mon"/> <property name="sl" value="gl"/> <property name="for-crossing" value="yes"/> <property name="src" value="apertium-es-gl.gl.dix"/> </resource> <!-- 'Dictionnaire bilingue 'en-es' --> <resource> <property name="name" value="apertium-en-es"/> <property name="type" value="bil"/> <property name="sl" value="en"/> <property name="tl" value="es"/> <property name="for-crossing" value="yes"/> <property name="src" value="apertium-en-es.en-es.dix"/> </resource> <!-- 'Dictionnaire bilingue 'es-gl' --> <resource> <property name="name" value="apertium-es-gl"/> <property name="type" value="bil"/> <property name="sl" value="es"/> <property name="tl" value="gl"/> <property name="for-crossing" value="yes"/> <property name="src" value="apertium-es-gl.es-gl.dix"/> </resource> </resource-set> </ling-resources>
Lire plus au sujet de Document de Ressources Linguistiques
Croisement de dictionnaires
Pour utiliser apertium-crossdics :
$ apertium-crossdics -f en-es-gl-ling-resources.xml en-gl
Vous obtiendrez les dictionnaires croisés dans le répertoire dix.
dix/apertium-en-gl.en-gl-crossed.dix dix/apertium-en-gl.en-crossed.dix dix/apertium-en-gl.gl-crossed.dix