L'outil Moses
Jump to navigation
Jump to search
Requis
- GIZA++ et mkcls http://giza-pp.googlecode.com/files/giza-pp-v1.0.2.tar.gz
- Moses (
svn co https://mosesdecoder.svn.sourceforge.net/svnroot/mosesdecoder/trunk
) - IRST LM (
svn co https://irstlm.svn.sourceforge.net/svnroot/irstlm
)
Compilation
Voir aussi : Utiliser GIZA++
- GIZA++
tar -xzvf giza-pp-v1.0.2.tar.gz cd giza-pp make cp mkcls-v2/mkcls /path/prefix/bin cp GIZA++-v2/GIZA++ /path/prefix/bin cp GIZA++-v2/plain2snt.out /path/prefix/bin cp GIZA++-v2/snt2cooc.out /path/prefix/bin cp GIZA++-v2/snt2plain.out /path/prefix/bin cp GIZA++-v2/trainGIZA++.sh /path/prefix/bin cd ..
- Moses
cd trunk ./regenerate-makefiles.sh ./configure --prefix=/path/prefix make make install cd scripts/training/symal make cp symal giza2bal.pl /path/prefix/bin cd ../../../ cd scripts/training/phrase-extract make cp extract score /path/prefix/bin cd ../../../Utiliser GIZA++
Maintenant éditez le fichier scripts/training/train-factored-phrase-model.perl
et changez les lignes suivantes :
my $SCRIPTS_ROOTDIR = "/home/fran/source/moses/trunk/scripts/"; ... # the following line is set installation time by 'make release'. BEWARE! # (traduction) la ligne qui suit est initialisée au moment de l'installation par 'make release'. ATTENTION ! my $BINDIR="/path/prefix/bin";
cp scripts/training/train-factored-phrase-model.perl /path/prefix/bin/ cp scripts/training/symal/giza2bal.pl /path/prefix/bin/ cd ..
- IRSTLM
cd irstlm ./install
Maintenant éditez les fichiers dans scripts/build-sublm.pl
et scripts/merge-sublm.pl
et vérifiez l'emplacement de gzip,
my $gzip="/usr/bin/gzip"; my $gunzip="/usr/bin/gunzip";
On les systèmes Debian, gzip
et gunzip
se trouvent dans /bin
, ces deux scripts échoueront en silence si gzip n'est pas trouvé.
cp bin/* /path/prefix/bin/ cp bin/x86_64-pc-linux-gnu/* /path/prefix/bin/ mkdir -p /path/prefix/include cp include/* /path/prefix/include cp lib/x86_64-pc-linux-gnu/libirstlm.a /path/prefix/lib/ cd ..
Construire un modèle de langue
export IRSTLM=/path/prefix build-lm.sh -i cy.crp.txt -o cy.lm.gz -t /tmp