<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=L%27outil_ReTraTos</id>
	<title>L&#039;outil ReTraTos - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=L%27outil_ReTraTos"/>
	<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=L%27outil_ReTraTos&amp;action=history"/>
	<updated>2026-04-18T15:29:20Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.34.1</generator>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=L%27outil_ReTraTos&amp;diff=50325&amp;oldid=prev</id>
		<title>Bech: Lien page anglaise</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=L%27outil_ReTraTos&amp;diff=50325&amp;oldid=prev"/>
		<updated>2014-10-06T09:43:31Z</updated>

		<summary type="html">&lt;p&gt;Lien page anglaise&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;Revision as of 09:43, 6 October 2014&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;[[ReTraTos|In English]]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;&#039;&#039;&#039;ReTraTos&#039;&#039;&#039; est une boite à outils pour construire des ressources linguistiques utiles pour une machine de traduction (MT) : des dictionnaires bilingues et des règles de transfert. Les systèmes d&#039;induction et les données linguistiques libres (ou ouvertes ?) peuvent être utilisés avec la boite à outils [[Apertium]] pour construire des systèmes de traduction libres.&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;&#039;&#039;&#039;ReTraTos&#039;&#039;&#039; est une boite à outils pour construire des ressources linguistiques utiles pour une machine de traduction (MT) : des dictionnaires bilingues et des règles de transfert. Les systèmes d&#039;induction et les données linguistiques libres (ou ouvertes ?) peuvent être utilisés avec la boite à outils [[Apertium]] pour construire des systèmes de traduction libres.&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 116:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 118:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;        Generating target-source dictionary ... OK&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;        Generating target-source dictionary ... OK&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;        Processing bilingual dictionary ... OK&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;        Processing bilingual dictionary ... OK&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;        &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;Generalizing&lt;/del&gt; bilingual dictionary ... OK&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;        &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;Generalising&lt;/ins&gt; bilingual dictionary ... OK&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;        Cleaning equal attributes ... OK&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;        Cleaning equal attributes ... OK&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=L%27outil_ReTraTos&amp;diff=30902&amp;oldid=prev</id>
		<title>Bech: Création page</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=L%27outil_ReTraTos&amp;diff=30902&amp;oldid=prev"/>
		<updated>2011-12-31T18:33:41Z</updated>

		<summary type="html">&lt;p&gt;Création page&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;&amp;#039;&amp;#039;&amp;#039;ReTraTos&amp;#039;&amp;#039;&amp;#039; est une boite à outils pour construire des ressources linguistiques utiles pour une machine de traduction (MT) : des dictionnaires bilingues et des règles de transfert. Les systèmes d&amp;#039;induction et les données linguistiques libres (ou ouvertes ?) peuvent être utilisés avec la boite à outils [[Apertium]] pour construire des systèmes de traduction libres.&lt;br /&gt;
&lt;br /&gt;
== Dictionnaires bilingues ==&lt;br /&gt;
&lt;br /&gt;
Cette section décrit comment utiliser ReTraTos pour créer un dictionnaire bilingue pour votre paire de langues Apertium. Vous aurez besoin :&lt;br /&gt;
&lt;br /&gt;
* d&amp;#039;un [[corpus]] aligné des deux langues. Pour chaque paire de langues européennes, le corpus JRC-Acquis est recommandé.&lt;br /&gt;
* apertium&lt;br /&gt;
* [[Lttoolbox (français)]]&lt;br /&gt;
* ReTraTos&lt;br /&gt;
* [[GIZA++]]&lt;br /&gt;
* beaucoup de patience&lt;br /&gt;
&lt;br /&gt;
=== Préparation du corpus ===&lt;br /&gt;
&lt;br /&gt;
Le corpus devrait être en deux fichiers, chacun avec une phrase par ligne. Par exemple,&lt;br /&gt;
&lt;br /&gt;
;es.txt&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
Reconociendo que , en particular , sería mutuamente beneficioso cooperar&lt;br /&gt;
mediante el establecimiento de un programa común de investigaciones y de desarrollo ;&lt;br /&gt;
Considerando que un acuerdo que establezca una cooperación en el ámbito&lt;br /&gt;
de las utilizaciones pacíficas de la energía atómica iniciaría fructíferos &lt;br /&gt;
intercambios de experiencia &lt;br /&gt;
...&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
;it.txt&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
Riconoscendo in particolare che sarebbe loro reciproco vantaggio cooperare&lt;br /&gt;
con lo stabilire un programma comune di ricerche e di sviluppo ;&lt;br /&gt;
Considerando che un accordo inteso a stabilire una cooperazione nel campo&lt;br /&gt;
degli usi pacifici dell&amp;#039;energia atomica darebbe inizio ad un proficuo &lt;br /&gt;
scambio di esperienze&lt;br /&gt;
...&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Selon que vous vouliez créer ou non des entrées pour noms propres, vous pourriez passe en minuscules tout le corpus. Assurez-vous qu&amp;#039;il y a des espaces autour de chaque caractère de ponctuation, sinon la ponctuation sera comptée comme une partie du mot. &lt;br /&gt;
&lt;br /&gt;
=== Baliser le corpus ===&lt;br /&gt;
&lt;br /&gt;
Balisez les deux fichiers en utilisant apertium-tagger. Donc, par exemple pour l&amp;#039;espagnol :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ cat es.txt | apertium-destxt | lt-proc es-it.automorf.bin | apertium-tagger -g es-it.prob | apertium-retxt &amp;gt; es.tagged.txt &amp;amp;  &lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Après ça, supprimez les symboles &amp;#039;^&amp;#039; et &amp;#039;$&amp;#039; du fichier es-tagged.txt . Ça donnera des lignes qui ressemblent à quelque-chose comme :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
Reconocer&amp;lt;vblex&amp;gt;&amp;lt;ger&amp;gt; que&amp;lt;cnjsub&amp;gt; ,&amp;lt;cm&amp;gt; en&amp;lt;pr&amp;gt; particular&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt;&lt;br /&gt;
,&amp;lt;cm&amp;gt; ser&amp;lt;vbser&amp;gt;&amp;lt;cni&amp;gt;&amp;lt;p3&amp;gt;&amp;lt;sg&amp;gt; mutuamente&amp;lt;adv&amp;gt; beneficioso&amp;lt;adj&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;&lt;br /&gt;
*cooperar mediante&amp;lt;pr&amp;gt; el&amp;lt;det&amp;gt;&amp;lt;def&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt; establecimiento&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;&lt;br /&gt;
de&amp;lt;pr&amp;gt; uno&amp;lt;det&amp;gt;&amp;lt;ind&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt; programa&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt; común&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt; de&amp;lt;pr&amp;gt;&lt;br /&gt;
investigación&amp;lt;n&amp;gt;&amp;lt;f&amp;gt;&amp;lt;pl&amp;gt; y&amp;lt;cnjcoo&amp;gt; de&amp;lt;pr&amp;gt; desarrollo&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt; ;&amp;lt;sent&amp;gt;&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
ReTraTos est très délicat au sujet du formatage, donc avant d&amp;#039;enlever les &amp;#039;^&amp;#039; et &amp;#039;$&amp;#039; vous pourriez vouloir juste enlever quelque-chose qui &amp;#039;&amp;#039;n&amp;#039;est pas&amp;#039;&amp;#039; encadré par &amp;#039;^&amp;#039; et &amp;#039;$&amp;#039;, par exemple quelque-chose comme&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
# ^foo$-^bar$ =&amp;gt; ^foo$ ^bar$     -^foo$ =&amp;gt; ^foo$           ^bar$- =&amp;gt; ^bar$&lt;br /&gt;
sed &amp;#039;s%\$[^^]*\^%\$ \^%g&amp;#039;    | sed  &amp;#039;s%^[^^]*\^%\^%g&amp;#039; | sed &amp;#039;s%\$[^^]*$%\$%g&amp;#039; |\&lt;br /&gt;
# supprimer &amp;#039;^&amp;#039; et &amp;#039;$&amp;#039;&lt;br /&gt;
sed &amp;#039;s%[$^]% %g&amp;#039;&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Ça vous fera gagner beaucoup de temps plus tard... oh, et vous pourriez aussi supprimer toutes les lignes qui ne contiennent pas au moins une séquence &amp;lt;code&amp;gt;^foo&amp;lt;bar&amp;gt;$&amp;lt;/code&amp;gt; (par exemple un simple alignement de &amp;#039;%&amp;#039; à &amp;#039;%&amp;#039;, ou autre).&lt;br /&gt;
&lt;br /&gt;
=== Aligner le corpus ===&lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Utiliser GIZA++]] et [[Comment démarrer avec les outils d&amp;#039;induction]]&lt;br /&gt;
&lt;br /&gt;
Utilisez GIZA++ pour aligner les deux fichiers, les instructions peuvent être trouvées dans la page [[Utiliser GIZA++]]. Une fois que l&amp;#039;alignement a été fait, vous terminerez avec un fichier qui finit par &amp;lt;code&amp;gt;.A3.final&amp;lt;/code&amp;gt;, c&amp;#039;est votre fichier d&amp;#039;alignement. Ensuite, vous aurez besoin de convertir l&amp;#039;alignement au format LIHLA qu&amp;#039;utilise ReTraTos. Le script dans la [[Talk:ReTraTos|page de discussion anglaise]] sert ce propos. Pour la paire Espagnol--Italien, il sera appelé ainsi :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ perl giza_to_lihla.pl es_it.aligned.A3.final ./es/ ./it/&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Cela va écrire deux fichiers dans les répertoires &amp;lt;code&amp;gt;./es/&amp;lt;/code&amp;gt; et &amp;lt;code&amp;gt;./it/&amp;lt;/code&amp;gt; qui correspondent aux lignes en espagnol et italien respectivement. Ces fichiers d&amp;#039;alignement LIHLA se termineront par &amp;lt;code&amp;gt;.al&amp;lt;/code&amp;gt; et ressembleront à ce qui suit :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
&amp;lt;s snum=6&amp;gt;Reconocer&amp;lt;vblex&amp;gt;&amp;lt;ger&amp;gt;:1 que&amp;lt;cnjsub&amp;gt;:0 ,&amp;lt;cm&amp;gt;:0 en&amp;lt;pr&amp;gt;:2&lt;br /&gt;
particular&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt;:3 ,&amp;lt;cm&amp;gt;:0 ser&amp;lt;vbser&amp;gt;&amp;lt;cni&amp;gt;&amp;lt;p3&amp;gt;&amp;lt;sg&amp;gt;:5 mutuamente&amp;lt;adv&amp;gt;:7 &lt;br /&gt;
beneficioso&amp;lt;adj&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:8 *cooperar:9 mediante&amp;lt;pr&amp;gt;:10 el&amp;lt;det&amp;gt;&amp;lt;def&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:11&lt;br /&gt;
establecimiento&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:12 de&amp;lt;pr&amp;gt;:0 uno&amp;lt;det&amp;gt;&amp;lt;ind&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:13 programa&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:14&lt;br /&gt;
común&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt;:15 de&amp;lt;pr&amp;gt;:16 investigación&amp;lt;n&amp;gt;&amp;lt;f&amp;gt;&amp;lt;pl&amp;gt;:17 y&amp;lt;cnjcoo&amp;gt;:18 de&amp;lt;pr&amp;gt;:19&lt;br /&gt;
desarrollo&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:20 ;&amp;lt;sent&amp;gt;:0&amp;lt;/s&amp;gt;&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Afin d&amp;#039;utiliser ReTraTos, les formes de surface de chaque unité lexicale ont besoin d&amp;#039;être rajoutées donc l&amp;#039;exemple ci-dessus ressembleront à ce qui suit :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
&amp;lt;s snum=6&amp;gt;Reconociendo/Reconocer&amp;lt;vblex&amp;gt;&amp;lt;ger&amp;gt;:1 que/que&amp;lt;cnjsub&amp;gt;:0 ,/,&amp;lt;cm&amp;gt;:0 en/en&amp;lt;pr&amp;gt;:2&lt;br /&gt;
particular/particular&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt;:3 ,/,&amp;lt;cm&amp;gt;:0 sería/ser&amp;lt;vbser&amp;gt;&amp;lt;cni&amp;gt;&amp;lt;p3&amp;gt;&amp;lt;sg&amp;gt;:5&lt;br /&gt;
mutuamente/mutuamente&amp;lt;adv&amp;gt;:7 beneficioso/beneficioso&amp;lt;adj&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:8 *cooperar/*cooperar:9&lt;br /&gt;
mediante/mediante&amp;lt;pr&amp;gt;:10 el/el&amp;lt;det&amp;gt;&amp;lt;def&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:11 establecimiento/establecimiento&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:12&lt;br /&gt;
de/de&amp;lt;pr&amp;gt;:0 un/uno&amp;lt;det&amp;gt;&amp;lt;ind&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:13 programa/programa&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:14 común/común&amp;lt;adj&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;sg&amp;gt;:15&lt;br /&gt;
de/de&amp;lt;pr&amp;gt;:16 investigaciones/investigación&amp;lt;n&amp;gt;&amp;lt;f&amp;gt;&amp;lt;pl&amp;gt;:17 y/y&amp;lt;cnjcoo&amp;gt;:18 de/de&amp;lt;pr&amp;gt;:19&lt;br /&gt;
desarollo/desarrollo&amp;lt;n&amp;gt;&amp;lt;m&amp;gt;&amp;lt;sg&amp;gt;:20 ;&amp;lt;sent&amp;gt;:0&amp;lt;/s&amp;gt;&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
=== Exécuter ReTraTos_lex ===&lt;br /&gt;
&lt;br /&gt;
Vous aurez besoin d&amp;#039;avoir l&amp;#039;entête (header) et le bas (footer) d&amp;#039;un dictionnaire bilingue dans deux fichiers séparés, par exemple, &amp;lt;code&amp;gt;dic_header.txt&amp;lt;/code&amp;gt; et &amp;lt;code&amp;gt;dic_footer.txt&amp;lt;/code&amp;gt; (voir les exemples dans le paquet). Ensuite le programme pour générer le dictionnaire (&amp;lt;code&amp;gt;ReTraTos_lex&amp;lt;/code&amp;gt;) peut être appelé comme ceci :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ ReTraTos_lex -s ./es/es_it.aligned.A3.final.al -t ./it/es_it.aligned.A3.final.al -b dic_header.txt -e dic_footer.txt &lt;br /&gt;
&lt;br /&gt;
PRE-PROCESSAMENTO&lt;br /&gt;
&lt;br /&gt;
        Reading the examples ...  100000 examples read&lt;br /&gt;
        Reading the examples ...  100000 examples read&lt;br /&gt;
&lt;br /&gt;
GERANDO LEXICO&lt;br /&gt;
&lt;br /&gt;
        Generating source-target dictionary ... OK&lt;br /&gt;
        Generating target-source dictionary ... OK&lt;br /&gt;
        Processing bilingual dictionary ... OK&lt;br /&gt;
        Generalizing bilingual dictionary ... OK&lt;br /&gt;
        Cleaning equal attributes ... OK&lt;br /&gt;
&lt;br /&gt;
IMPRIMINDO LEXICO&lt;br /&gt;
&lt;br /&gt;
        Printing bilingual dictionary ... OK&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Le fichier de sortie sera le fichier &amp;lt;code&amp;gt;.dix&amp;lt;/code&amp;gt; .&lt;br /&gt;
&lt;br /&gt;
=== Maintenance ===&lt;br /&gt;
&lt;br /&gt;
;Wrongly tagged&lt;br /&gt;
&lt;br /&gt;
Si vous récupérez plusieurs messages comme ça, ou même un seul, ça signifier qu&amp;#039;il y a une erreur dans une de vos fichiers alignement.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
WARNING: (Entrada::le_sentenca): String O&amp;lt;cnjcoo&amp;gt;.&amp;lt;sent&amp;gt;V&amp;lt;num&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;pl&amp;gt; is wrongly tagged&lt;br /&gt;
WARNING: (Entrada::le_sentenca): String )&amp;lt;rpar&amp;gt;.&amp;lt;sent&amp;gt; is wrongly tagged&lt;br /&gt;
WARNING: (Entrada::le_sentenca): String a&amp;lt;pr&amp;gt;)&amp;lt;rpar&amp;gt; is wrongly tagged&lt;br /&gt;
WARNING: (Entrada::le_sentenca): String 1991&amp;lt;num&amp;gt;.&amp;lt;sent&amp;gt; is wrongly tagged&lt;br /&gt;
&lt;br /&gt;
...&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Les alignements dans les fichiers doivent être au format &amp;lt;code&amp;gt;lemme&amp;lt;balises&amp;gt;:&amp;lt;alignement&amp;gt;&amp;lt;/code&amp;gt;, ex : &amp;lt;code&amp;gt;1991&amp;lt;num&amp;gt;:1&amp;lt;/code&amp;gt; ou &amp;lt;code&amp;gt;pero&amp;lt;cnjcoo&amp;gt;:2&amp;lt;/code&amp;gt;. Les alignements avec des chaînes aléatoires entre les balises sont interdits. Ex : &amp;lt;code&amp;gt;O&amp;lt;cnjcoo&amp;gt;.&amp;lt;sent&amp;gt;V&amp;lt;num&amp;gt;&amp;lt;mf&amp;gt;&amp;lt;pl&amp;gt;&amp;lt;/code&amp;gt; est un ensemble de trois paires de lemmes/balises avec le même alignement. Probablement la ponctuation n&amp;#039;a pas été séparée correctement du texte avec des espaces.&lt;br /&gt;
&lt;br /&gt;
Il est possible de corriger ça à la main, en enlevant la ponctuation, ou en insérant des espaces et des alignements nuls (?), mais ça pourrait être mieux s&amp;#039;il y a plusieurs messages d&amp;#039;avertissement de re-traiter le corpus.&lt;br /&gt;
&lt;br /&gt;
== Voir aussi ==&lt;br /&gt;
&lt;br /&gt;
* [[Utiliser GIZA++]]&lt;br /&gt;
* [[Comment démarrer avec les outils d&amp;#039;induction]]&lt;br /&gt;
&lt;br /&gt;
== Liens externes ==&lt;br /&gt;
&lt;br /&gt;
* [http://www.nilc.icmc.usp.br/nilc/projects/retratos.htm ReTraTos: Homepage] &lt;br /&gt;
* [http://retratos.svn.sourceforge.net/viewvc/retratos/ ReTraTos: SVN]&lt;br /&gt;
&lt;br /&gt;
== Lectures complémentaires ==&lt;br /&gt;
&lt;br /&gt;
* Helena M. Caseli, Maria das Graças V. Nunes, Mikel L. Forcada. (2008) &amp;quot;[http://www.dlsi.ua.es/~mlf/docum/caseli08p.pdf From free shallow monolingual resources to machine translation systems: easing the task]&amp;quot;, in &amp;#039;&amp;#039;Mixing Approaches To Machine Translation&amp;#039;&amp;#039;, MATMT2008, proceedings (Donostia, Spain, Feb. 14, 2008), pp. 41--48&lt;br /&gt;
* Helena M. Caseli, Maria das Graças V. Nunes, Mikel L. Forcada. (2008) &amp;quot;Automatic induction of bilingual resources from aligned parallel corpora: application to shallow-transfer machine translation&amp;quot;. &amp;#039;&amp;#039;Machine Translation&amp;#039;&amp;#039; (to appear)&lt;br /&gt;
&lt;br /&gt;
[[Category:Tools]]&lt;br /&gt;
[[Category:Documentation en français]]&lt;/div&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
</feed>