<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses</id>
	<title>Préparation de données pour Moses - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses"/>
	<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;action=history"/>
	<updated>2026-05-07T06:56:40Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.34.1</generator>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=50581&amp;oldid=prev</id>
		<title>Bech: Lien page anglaise</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=50581&amp;oldid=prev"/>
		<updated>2014-10-08T07:52:16Z</updated>

		<summary type="html">&lt;p&gt;Lien page anglaise&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;Revision as of 07:52, 8 October 2014&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;[[Preparing data for Moses factored training using Apertium|In English]]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;Cette page donne une description sur la manière de pré-traiter un corpus en utilisant Apertium afin qu&#039;il puisse être utilisé pour entraîner Moses &quot;factoredly&quot; (???).&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;Cette page donne une description sur la manière de pré-traiter un corpus en utilisant Apertium afin qu&#039;il puisse être utilisé pour entraîner Moses &quot;factoredly&quot; (???).&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=49243&amp;oldid=prev</id>
		<title>Bech: Correction accès svn</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=49243&amp;oldid=prev"/>
		<updated>2014-07-04T21:36:45Z</updated>

		<summary type="html">&lt;p&gt;Correction accès svn&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;Revision as of 21:36, 4 July 2014&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 21:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 21:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;&amp;lt;pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;&amp;lt;pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;$ wget &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;http&lt;/del&gt;://&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;apertium.&lt;/del&gt;svn.&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;sourceforge&lt;/del&gt;.net/&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;svnroot&lt;/del&gt;/apertium/trunk/apertium-sv-da/apertium-sv-da.da.dix&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;$ wget &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;https&lt;/ins&gt;://svn.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;code.sf&lt;/ins&gt;.net/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;p&lt;/ins&gt;/apertium&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;/svn&lt;/ins&gt;/trunk/apertium-sv-da/apertium-sv-da.da.dix&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;$ wget &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;http&lt;/del&gt;://&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;apertium.&lt;/del&gt;svn.&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;sourceforge&lt;/del&gt;.net/&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;svnroot&lt;/del&gt;/apertium/trunk/apertium-sv-da/da-sv.prob&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;$ wget &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;https&lt;/ins&gt;://svn.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;code.sf&lt;/ins&gt;.net/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;p&lt;/ins&gt;/apertium&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;/svn&lt;/ins&gt;/trunk/apertium-sv-da/da-sv.prob&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;$ wget &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;http&lt;/del&gt;://&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;apertium.&lt;/del&gt;svn.&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;sourceforge&lt;/del&gt;.net/&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;svnroot&lt;/del&gt;/apertium/trunk/apertium-is-en/apertium-is-en.en.dix&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;$ wget &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;https&lt;/ins&gt;://svn.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;code.sf&lt;/ins&gt;.net/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;p&lt;/ins&gt;/apertium&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;/svn&lt;/ins&gt;/trunk/apertium-is-en/apertium-is-en.en.dix&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;$ wget &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;http&lt;/del&gt;://&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;apertium.&lt;/del&gt;svn.&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;sourceforge&lt;/del&gt;.net/&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;svnroot&lt;/del&gt;/apertium/trunk/apertium-is-en/en-is.prob&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;$ wget &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;https&lt;/ins&gt;://svn.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;code.sf&lt;/ins&gt;.net/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;p&lt;/ins&gt;/apertium&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;/svn&lt;/ins&gt;/trunk/apertium-is-en/en-is.prob&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;$ lt-comp lr apertium-sv-da.da.dix da-sv.automorf.bin&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;$ lt-comp lr apertium-sv-da.da.dix da-sv.automorf.bin&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 73:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 73:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;&amp;lt;pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;&amp;lt;pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;$ wget &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;http&lt;/del&gt;://&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;apertium.&lt;/del&gt;svn.&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;sourceforge&lt;/del&gt;.net/&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;svnroot&lt;/del&gt;/apertium/trunk/apertium-tools/tagger-to-factored.py&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;$ wget &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;https&lt;/ins&gt;://svn.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;code.sf&lt;/ins&gt;.net/&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;p&lt;/ins&gt;/apertium&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;/svn&lt;/ins&gt;/trunk/apertium-tools/tagger-to-factored.py&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;&amp;lt;/pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;&amp;lt;/pre&amp;gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=37072&amp;oldid=prev</id>
		<title>Bech: Création page</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pr%C3%A9paration_de_donn%C3%A9es_pour_Moses&amp;diff=37072&amp;oldid=prev"/>
		<updated>2012-11-11T00:25:03Z</updated>

		<summary type="html">&lt;p&gt;Création page&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Cette page donne une description sur la manière de pré-traiter un corpus en utilisant Apertium afin qu&amp;#039;il puisse être utilisé pour entraîner Moses &amp;quot;factoredly&amp;quot; (???).&lt;br /&gt;
&lt;br /&gt;
== Exigences ==&lt;br /&gt;
&lt;br /&gt;
* [[Lttoolbox (français)]]&lt;br /&gt;
* [[Apertium (français)]]&lt;br /&gt;
* &amp;lt;code&amp;gt;tagger-to-factored.py&amp;lt;/code&amp;gt; script de [[Utiliser SVN|apertium SVN]]&lt;br /&gt;
&lt;br /&gt;
== Étapes ==&lt;br /&gt;
&lt;br /&gt;
=== Télécharger et compiler les données ===&lt;br /&gt;
&lt;br /&gt;
Pour le corpus parallèle, on va utiliser Europarl, la page [[corpora]] (seulement en anglais) en liste d&amp;#039;autres :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ wget http://www.statmt.org/europarl/v5/da-en.tgz&lt;br /&gt;
$ tar -xzf da-en.tgz&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Et pour l&amp;#039;analyseur morphologique et le tagger, on va utiliser &amp;lt;code&amp;gt;apertium-sv-da&amp;lt;/code&amp;gt; et &amp;lt;code&amp;gt;apertium-is-en&amp;lt;/code&amp;gt;. Vous pouvez en trouver d&amp;#039;autres dans : [[Liste des paires de langues]] et [[list of dictionaries]].&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ wget http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-sv-da/apertium-sv-da.da.dix&lt;br /&gt;
$ wget http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-sv-da/da-sv.prob&lt;br /&gt;
&lt;br /&gt;
$ wget http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-is-en/apertium-is-en.en.dix&lt;br /&gt;
$ wget http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-is-en/en-is.prob&lt;br /&gt;
&lt;br /&gt;
$ lt-comp lr apertium-sv-da.da.dix da-sv.automorf.bin&lt;br /&gt;
final@inconditional 20 105&lt;br /&gt;
main@standard 9121 18055&lt;br /&gt;
unchecked@standard 4411 8130&lt;br /&gt;
&lt;br /&gt;
$ lt-comp lr apertium-is-en.en.dix en-is.automorf.bin&lt;br /&gt;
final@inconditional 97 2809&lt;br /&gt;
main@standard 22284 47423&lt;br /&gt;
&amp;lt;/pre&amp;gt;The&lt;br /&gt;
&lt;br /&gt;
=== Nettoyer et baliser chaque coté du corpus ===&lt;br /&gt;
&lt;br /&gt;
Supprimer chaque ligne qui commence par des balises :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
$ cat da-en/da/*  | grep -v &amp;#039;^&amp;lt;&amp;#039; &amp;gt; europarl.da&lt;br /&gt;
$ cat da-en/en/*  | grep -v &amp;#039;^&amp;lt;&amp;#039; &amp;gt; europarl.en&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Vérifier que les fichiers ont la même longueur.&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ wc -l europarl.*&lt;br /&gt;
  1687533 europarl.da&lt;br /&gt;
  1687533 europarl.en&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Analyser et baliser le corpus :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ cat europarl.da | apertium-destxt | lt-proc -w da-sv.automorf.bin | \&lt;br /&gt;
  apertium-tagger -g -p da-sv.prob | apertium-retxt &amp;gt; tagged.da&lt;br /&gt;
&lt;br /&gt;
$ cat europarl.en | apertium-destxt | lt-proc -w en-is.automorf.bin | \&lt;br /&gt;
  apertium-tagger -g -p en-is.prob | apertium-retxt &amp;gt; tagged.en&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Notez que l&amp;#039;option &amp;lt;code&amp;gt;-w&amp;lt;/code&amp;gt; supporte la mise en minuscules du dictionnaire, c&amp;#039;est à dire, que le lemme est envoyé avec la casse qu&amp;#039;il a dans le dictionnaire, pas celle de la forme de surface.&lt;br /&gt;
&lt;br /&gt;
=== Convertir dans le format &amp;quot;factored&amp;quot; pour Moses ===&lt;br /&gt;
&lt;br /&gt;
Télécharger le tagger pour le script factored (???) :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ wget http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-tools/tagger-to-factored.py&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Alors convertir dans le format &amp;quot;factored&amp;quot; pour Moses :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ cat tagged.da | python tagger-to-factored.py 2 &amp;gt; factored.da&lt;br /&gt;
$ cat tagged.en | python tagger-to-factored.py 2 &amp;gt; factored.en&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Note:&amp;#039;&amp;#039;&amp;#039; Le nombre en option de &amp;lt;code&amp;gt;tagger-to-factored.py&amp;lt;/code&amp;gt; spécifie combien de balises vous voulez envoyer. En mettant &amp;lt;code&amp;gt;0&amp;lt;/code&amp;gt; ça va seulement envoyer la [[forme de surface]] et le lemme. En mettant &amp;lt;code&amp;gt;1&amp;lt;/code&amp;gt; ça va envoyer la forme de surface, le lemme et la première balise (qui est presque toujours la balise POS). Tout ce qui précède sera envoyé comme avant, mais un facteur supplémentaire sera envoyé comme le reste de l&amp;#039;information morphologique.&lt;br /&gt;
&lt;br /&gt;
Par exemple:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ echo &amp;quot;^der/der&amp;lt;adv&amp;gt;$ ^blev/blive&amp;lt;vblex&amp;gt;&amp;lt;past&amp;gt;&amp;lt;actv&amp;gt;$ ^ramt/ramme&amp;lt;vblex&amp;gt;&amp;lt;pp&amp;gt;$^./.&amp;lt;sent&amp;gt;$&amp;quot; | python tagger-to-factored.py 0&lt;br /&gt;
der|der blev|blive ramt|ramme .|. &lt;br /&gt;
&lt;br /&gt;
$ echo &amp;quot;^der/der&amp;lt;adv&amp;gt;$ ^blev/blive&amp;lt;vblex&amp;gt;&amp;lt;past&amp;gt;&amp;lt;actv&amp;gt;$ ^ramt/ramme&amp;lt;vblex&amp;gt;&amp;lt;pp&amp;gt;$^./.&amp;lt;sent&amp;gt;$&amp;quot; | python tagger-to-factored.py 1&lt;br /&gt;
der|der|adv blev|blive|vblex ramt|ramme|vblex .|.|sent &lt;br /&gt;
&lt;br /&gt;
$ echo &amp;quot;^der/der&amp;lt;adv&amp;gt;$ ^blev/blive&amp;lt;vblex&amp;gt;&amp;lt;past&amp;gt;&amp;lt;actv&amp;gt;$ ^ramt/ramme&amp;lt;vblex&amp;gt;&amp;lt;pp&amp;gt;$^./.&amp;lt;sent&amp;gt;$&amp;quot; | python tagger-to-factored.py 2&lt;br /&gt;
der|der|adv|adv blev|blive|vblex|vblex.past ramt|ramme|vblex|vblex.pp .|.|sent|sent &lt;br /&gt;
&lt;br /&gt;
$ echo &amp;quot;^der/der&amp;lt;adv&amp;gt;$ ^blev/blive&amp;lt;vblex&amp;gt;&amp;lt;past&amp;gt;&amp;lt;actv&amp;gt;$ ^ramt/ramme&amp;lt;vblex&amp;gt;&amp;lt;pp&amp;gt;$^./.&amp;lt;sent&amp;gt;$&amp;quot; | python tagger-to-factored.py &lt;br /&gt;
der|der|adv|adv blev|blive|vblex|vblex.past.actv ramt|ramme|vblex|vblex.pp .|.|sent|sent &lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Après ça, vérifiez de nouveau que les fichiers ont la même longueur :&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
$ wc -l factored.*&lt;br /&gt;
&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Entraîner un modèle &amp;quot;factored&amp;quot; basé sur des phrases ==&lt;br /&gt;
&lt;br /&gt;
Maintenant vous avez les données, vous pouvez [http://www.statmt.org/moses/?n=Moses.FactoredTutorial entraîner un modèle &amp;quot;factored&amp;quot; basé sur des phrases] avec Moses !&lt;br /&gt;
&lt;br /&gt;
== Voir aussi ==&lt;br /&gt;
&lt;br /&gt;
* [[List of dictionaries]]&lt;br /&gt;
* [[Liste des paires de langues]]&lt;br /&gt;
* [[Compilation des dictionnaires]]&lt;br /&gt;
* [[Lttoolbox (français)]]&lt;br /&gt;
&lt;br /&gt;
== Liens externes ==&lt;br /&gt;
&lt;br /&gt;
* [http://www.statmt.org/moses/?n=Moses.FactoredTutorial Tutoriel pour utiliser les Modèles Factored]&lt;br /&gt;
&lt;br /&gt;
[[Category:Documentation]]&lt;br /&gt;
[[Category:Documentation en français]]&lt;/div&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
</feed>