Les fichiers modes
Il y a plusieurs manières d'utiliser les pipelines dans Apertium. L'une d'elle est les fichiers Modes. Les fichiers modes (appelés typiquement modes.xml
) sont des fichiers XML (voir modes.dtd) qui spécifient quels programmes devraient être lancés et dans quel ordre. Normalement chaque paquet linguistique possède un de ces fichiers qui spécifie les diverses manières dont vous pouvez utiliser les données pour faire des traductions.
Voir fichiers modes de es-ca pour un exemple. Les modes qui ne disent pas install="yes"
sont utilisables seulement avec l'option -d d'Apertium, ils sont principalement utilisés pendant le développement (ex: ca-es-anmor qui réalise juste l'analyse morphologique du catalan et rien d'autre).
Modes statistiques[edit]
Afin d'obtenir quelques informations statistiques sur les traductions réalisées en utilisant Apertium, on a détourné le mode de traduction principal, en arrêtant le pipeline juste après la disambiguïsation et en sauvant la sortie dans un fichier temporaire. Après ça, le pipeline est repris avec le fichier temporaire à la place de stdin.
En guise d'exemple, vous pouvez voir le pipeline cassé pour ca-es, installé comme ca-es-estadistiques.mode
/usr/local/bin/lt-proc /usr/local/share/apertium/apertium-es-ca/ca-es.automorf.bin > $LOGSDIR$SEC.tmp; /usr/local/bin/apertium-tagger -g /usr/local/share/apertium/apertium-es-ca/ca-es.prob < $LOGSDIR$SEC.tmp \ |/usr/local/bin/apertium-pretransfer|/usr/local/bin/apertium-transfer /usr/local/share/apertium/apertium-es-ca/apertium-es-ca.trules-ca-es.xml \ /usr/local/share/apertium/apertium-es-ca/trules-ca-es.bin /usr/local/share/apertium/apertium-es-ca/ca-es.autobil.bin \ |/usr/local/bin/lt-proc $1 /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin \ |/usr/local/bin/lt-proc -p /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin
Et un exemple d'appel d'apertium avec ce mode serait comme suit
LOGSDIR=~/logs/apertium/; SEC=`date +%s`; echo "Ara Apertium permet extraure estadístiques" | apertium ca-es-estadistiques
Dans cet exemple, $LOGSDIR est un répertoirer où les logs seront sauvés, et $SEC est un ID unique pour ce log.
Quand la traduction est faite, on peut traiter le log créé afin d'obtenir dest statistiques.