Difference between revisions of "Les fichiers modes"
(moved Les fichiers modes to Modes mixtes: Erreur entre 2 noms de page) |
m (typo) |
||
(2 intermediate revisions by one other user not shown) | |||
Line 1: | Line 1: | ||
[[Modes|In English]] |
|||
Il y a plusieurs manières d'utiliser les pipelines dans Apertium. L'une d'elle est les fichiers '''Modes'''. Les fichiers modes (appelés typiquement <code>modes.xml</code>) sont des fichiers XML (voir [http://apertium.svn.sourceforge.net/viewvc/apertium/trunk/apertium/apertium/modes.dtd modes.dtd]) qui spécifient quels programmes devraient être lancés et dans quel ordre. Normalement chaque paquet linguistique possède un de ces fichiers qui spécifie les diverses manières dont vous pouvez utiliser les données pour faire des traductions. |
|||
Voir [http://apertium.svn.sourceforge.net/viewvc/apertium/trunk/apertium-es-ca/modes.xml fichiers modes de es-ca] pour un exemple. Les modes qui ne disent pas <code>install="yes"</code> sont utilisables seulement avec l'option -d d'Apertium, ils sont principalement utilisés pendant le développement (ex: ca-es-anmor qui réalise juste l'analyse morphologique du catalan et rien d'autre). |
|||
== Modes statistiques == |
|||
Afin d'obtenir quelques informations statistiques sur les traductions réalisées en utilisant Apertium, on a détourné le mode de traduction principal, en arrêtant le pipeline juste après la disambiguïsation et en sauvant la sortie dans un fichier temporaire. Après ça, le pipeline est repris avec le fichier temporaire à la place de stdin. |
|||
En guise d'exemple, vous pouvez voir le pipeline cassé pour ca-es, installé comme <code>ca-es-estadistiques.mode</code> |
|||
<pre> |
|||
/usr/local/bin/lt-proc /usr/local/share/apertium/apertium-es-ca/ca-es.automorf.bin > $LOGSDIR$SEC.tmp; |
|||
/usr/local/bin/apertium-tagger -g /usr/local/share/apertium/apertium-es-ca/ca-es.prob < $LOGSDIR$SEC.tmp \ |
|||
|/usr/local/bin/apertium-pretransfer|/usr/local/bin/apertium-transfer /usr/local/share/apertium/apertium-es-ca/apertium-es-ca.trules-ca-es.xml \ |
|||
/usr/local/share/apertium/apertium-es-ca/trules-ca-es.bin /usr/local/share/apertium/apertium-es-ca/ca-es.autobil.bin \ |
|||
|/usr/local/bin/lt-proc $1 /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin \ |
|||
|/usr/local/bin/lt-proc -p /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin |
|||
</pre> |
|||
Et un exemple d'appel d'apertium avec ce mode serait comme suit |
|||
<pre> |
|||
LOGSDIR=~/logs/apertium/; SEC=`date +%s`; |
|||
echo "Ara Apertium permet extraure estadístiques" | apertium ca-es-estadistiques |
|||
</pre> |
|||
Dans cet exemple, $LOGSDIR est un répertoirer où les logs seront sauvés, et $SEC est un ID unique pour ce log. |
|||
Quand la traduction est faite, on peut traiter le log créé afin d'obtenir dest statistiques. |
|||
== Voir aussi == |
|||
* [[Modes mixtes]] |
|||
[[Category:Documentation]] |
|||
[[Category:Documentation en français]] |
Latest revision as of 12:02, 6 April 2017
Il y a plusieurs manières d'utiliser les pipelines dans Apertium. L'une d'elle est les fichiers Modes. Les fichiers modes (appelés typiquement modes.xml
) sont des fichiers XML (voir modes.dtd) qui spécifient quels programmes devraient être lancés et dans quel ordre. Normalement chaque paquet linguistique possède un de ces fichiers qui spécifie les diverses manières dont vous pouvez utiliser les données pour faire des traductions.
Voir fichiers modes de es-ca pour un exemple. Les modes qui ne disent pas install="yes"
sont utilisables seulement avec l'option -d d'Apertium, ils sont principalement utilisés pendant le développement (ex: ca-es-anmor qui réalise juste l'analyse morphologique du catalan et rien d'autre).
Modes statistiques[edit]
Afin d'obtenir quelques informations statistiques sur les traductions réalisées en utilisant Apertium, on a détourné le mode de traduction principal, en arrêtant le pipeline juste après la disambiguïsation et en sauvant la sortie dans un fichier temporaire. Après ça, le pipeline est repris avec le fichier temporaire à la place de stdin.
En guise d'exemple, vous pouvez voir le pipeline cassé pour ca-es, installé comme ca-es-estadistiques.mode
/usr/local/bin/lt-proc /usr/local/share/apertium/apertium-es-ca/ca-es.automorf.bin > $LOGSDIR$SEC.tmp; /usr/local/bin/apertium-tagger -g /usr/local/share/apertium/apertium-es-ca/ca-es.prob < $LOGSDIR$SEC.tmp \ |/usr/local/bin/apertium-pretransfer|/usr/local/bin/apertium-transfer /usr/local/share/apertium/apertium-es-ca/apertium-es-ca.trules-ca-es.xml \ /usr/local/share/apertium/apertium-es-ca/trules-ca-es.bin /usr/local/share/apertium/apertium-es-ca/ca-es.autobil.bin \ |/usr/local/bin/lt-proc $1 /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin \ |/usr/local/bin/lt-proc -p /usr/local/share/apertium/apertium-es-ca/ca-es.autogen.bin
Et un exemple d'appel d'apertium avec ce mode serait comme suit
LOGSDIR=~/logs/apertium/; SEC=`date +%s`; echo "Ara Apertium permet extraure estadístiques" | apertium ca-es-estadistiques
Dans cet exemple, $LOGSDIR est un répertoirer où les logs seront sauvés, et $SEC est un ID unique pour ce log.
Quand la traduction est faite, on peut traiter le log créé afin d'obtenir dest statistiques.