Crossdics : génération d'une paire de langue à partir de 2 autres

From Apertium
Jump to navigation Jump to search

In English

Article principal : Fabriquer des dictionnaires

Crossdics (qui fait partie de apertium-dixtools) est un programme qui peut être utilisé pour "croiser" des paires de langues. C'est à dire qu'à partir des paires de langues données, aa-bb et bb-cc il va créer une nouvelle paire de langue pour aa-cc.

Installation[edit]

Voir Apertium-dixtools (français).

Utiliser apertium-crossdics[edit]

$ apertium-dixtools cross

Croisement de dictionnaires[edit]

En utilisant un Document de Ressources Linguistiques[edit]

Vous pouvez définir un Document de Ressources Linguistiques (LRD) et l'utiliser pour indiquer quels dictionnaires seront utilisés pour le croisement :

$ apertium-dixtools cross -f mes-ressources-linguistiques.xml sl-tl

Par conséquent, seulement 2 paramètres sont nécessaires :

  • mes-ressources-linguistiques.xml: un document spécifiant un ensemble de ressources linguistiques (dictionnaires, modèles croisés, corpus, autres fichiers LRD, etc).
  • sl-tl: langue source (sl) and langue cible (tl).

Sans document de ressources linguistiques[edit]

Premièrement, copier les données linguistiques dans le répertoire "dics"

  • Dictionnaire bilingue A-B: apertium-bb-aa.bb-aa.dix
  • Dictionnaire bilingue B-C: apertium-bb-cc.bb-cc.dix
  • Dictionnaire morphologique A: apertium-bb-aa.aa.dix
  • Dictionnaire morphologique C: apertium-bb-cc.cc.dix

Notez que :

  • tous les dictionnaires doivent être de la forme :
    • apertium-xx-yy.xx-yy.dix (dictionnaires bilingues)
    • apertium-xx-yy.xx.dix (dictionnaires morphologiques)
  • La langue commune (B) doit être du coté gauche, c'est à dire les dictionnaires de la forme B-A et B-C
  • utilisez "-r" à la place de "-n" si le dictionnaire doit être retourné (apertium-aa-bb.aa-bb.dix en apertium-bb-aa.bb-aa.dix)

Utilisez le script apertium-dixtools pour croiser les dictionnaires :

$ apertium-dixtools cross-param monA.dix -n bilAB.dix -n bilBC-dix monC.dix

Un exemple de croisement es-ca et es-pt pour obtenir la paire ca-pt.

$ apertium-dixtools cross-param dics/apertium-es-ca.ca.dix -n dics/apertium-es-ca.es-ca.dix -n dics/apertium-es-pt.es-pt.dix dics/apertium-es-pt.pt.dix

Customisation des actions de croisement[edit]

Par défaut, l'outil crossdics utilise un modèle croisé simple qui définit des règles très simples pour le croisement de deux ensembles de dictionnaires. Toutefois, des actions de croisement plus spécifiques peuvent être nécessaires pour croiser certaines paires de langues correctement. La définition d'une nouveau schéma de croisement avec des éléments pattern-action concrets résout ce problème.

Maintenance[edit]

NullPointerException in crossing sections
[9] Crossing sections 'main' and 'main'

Exception in thread "main" java.lang.NullPointerException
        at dictools.cross.DicCross.crossSections(DicCross.java:342)
        at dictools.cross.DicCross.crossDictionaries(DicCross.java:233)

Si vous obtenez cette erreur, essayez de supprimer les sections inutilisées des dictionnaires bilingues jusqu'à ce qu'il ne vous reste que les sections 'principales'.

Voir aussi[edit]