<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
	<id>https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=Pourquoi_nous_tronquons</id>
	<title>Pourquoi nous tronquons - Revision history</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.apertium.org/w/index.php?action=history&amp;feed=atom&amp;title=Pourquoi_nous_tronquons"/>
	<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;action=history"/>
	<updated>2026-05-05T19:38:53Z</updated>
	<subtitle>Revision history for this page on the wiki</subtitle>
	<generator>MediaWiki 1.34.1</generator>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=50613&amp;oldid=prev</id>
		<title>Bech: Lien page anglaise</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=50613&amp;oldid=prev"/>
		<updated>2014-10-08T08:43:26Z</updated>

		<summary type="html">&lt;p&gt;Lien page anglaise&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;Revision as of 08:43, 8 October 2014&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 1:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;[[Why we trim|In English]]&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;Dans les paires de langues Apertium, on conserve les dictionnaires unilingues et bilingues &#039;&#039;tronqués&#039;&#039;, ainsi chaque entrée de l&#039;analyseur aura une correspondance dans le dictionnaire bilingue, et toutes les sorties du transfert auront une entrée dans le générateur.&amp;lt;ref&amp;gt;Typiquement ça marche pour les deux directions de traduction, bien qu&#039;une paire de langues seulement validée pour une direction puisse seulement être tronquée dans cette direction.&amp;lt;/ref&amp;gt;&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;Dans les paires de langues Apertium, on conserve les dictionnaires unilingues et bilingues &#039;&#039;tronqués&#039;&#039;, ainsi chaque entrée de l&#039;analyseur aura une correspondance dans le dictionnaire bilingue, et toutes les sorties du transfert auront une entrée dans le générateur.&amp;lt;ref&amp;gt;Typiquement ça marche pour les deux directions de traduction, bien qu&#039;une paire de langues seulement validée pour une direction puisse seulement être tronquée dans cette direction.&amp;lt;/ref&amp;gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=38753&amp;oldid=prev</id>
		<title>Bech: Numérotation parties + ortho</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=38753&amp;oldid=prev"/>
		<updated>2013-01-29T19:51:02Z</updated>

		<summary type="html">&lt;p&gt;Numérotation parties + ortho&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;en&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;← Older revision&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #222; text-align: center;&quot;&gt;Revision as of 19:51, 29 January 2013&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 3:&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;Line 3:&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;Il y a plusieurs raisons pour faire ça :&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;Il y a plusieurs raisons pour faire ça :&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;# Si un mot n&#039;a pas d&#039;entrée dans le dictionnaire bilingue, il sera envoyé en sortie comme un lemme analysé avec un &#039;@&#039; au début, ex : &quot;canaux&quot; sera envoyé en sortie comme &quot;@canal&quot;, et pire : Un multi-mot comme &quot;pomme de terre&quot; sera envoyé en sortie comme &quot;@pomme&quot; (ou, avec les symboles de debug désactivés, &quot;canal&quot; et &quot;pomme&quot;). Cela signifie que lors de la post-édition, le post-éditeur devra constamment regarder le texte de la langue source (alors qu&#039;un mot inconnu sera possible à traduire sur le champ). Et when gisting (???), le lecteur pourrait être trompé par une mauvaise compréhension du contenu, au lieu d&#039;observer qu&#039;il y a un mot inconnu.&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;+&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;# Si un mot n&#039;a pas d&#039;entrée dans le dictionnaire bilingue, il sera envoyé en sortie comme un lemme analysé avec un &#039;@&#039; au début, ex : &quot;canaux&quot; sera envoyé en sortie comme &quot;@canal&quot;, et pire : Un multi-mot comme &quot;pomme de terre&quot; sera envoyé en sortie comme &quot;@pomme&quot; (ou, avec les symboles de debug désactivés, &quot;canal&quot; et &quot;pomme&quot;). Cela signifie que lors de la post-édition, le post-éditeur devra constamment regarder le texte de la langue source (alors qu&#039;un mot inconnu sera possible à traduire sur le champ). Et when gisting (???), le lecteur pourrait être trompé par une mauvaise compréhension du contenu, au lieu d&#039;observer qu&#039;il y a un mot inconnu.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;br/&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-right&quot; title=&quot;Paragraph was moved. Click to jump to old location.&quot; href=&quot;#movedpara_5_0_lhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_2_0_rhs&quot;&gt;&lt;/a&gt;# Les règles de transfert utilisent assez souvent l&#039;information sur la langue cible du dictionnaire bilingue pour remplir des balises etc... Si le transfert d&#039;anglais à espagnol lit un fragment comme &quot;the children&quot; (les enfants), le déterminant (article) espagnol a besoin de récupérer l&#039;information nombre et genre du nom de la &#039;&#039;langue cible&#039;&#039;. Ce n&#039;est pas assez de regarder la sortie de l&#039;analyseur de la langue source, le nombre peut être changé par le dictionnaire bilingue pour certains noms, et le genre n&#039;est même pas présent dans la langue source. La règle de transfert s&#039;attend à avoir cette information; sans elle, non seulement le nom sera écrit comme @lemme, mais le déterminant (article) ne sera pas généré correctement non plus. Cet effet devient même pire avec de plus gros fragments.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;br/&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-right&quot; title=&quot;Paragraph was moved. Click to jump to old location.&quot; href=&quot;#movedpara_8_0_lhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_4_0_rhs&quot;&gt;&lt;/a&gt;#* On pourrait travailler autour de ça en ayant des exceptions dans les règles de transfert pour par exemple deviner le nombre et le &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;genre&lt;/ins&gt; si le dictionnaire bilingue n&#039;en donne aucun, mais ça mène à un énorme accroissement de la complexité du transfert – toutes les balises doivent être présumées inconnues, et le temps du développeur est gaspillé dans la chasse aux bugs et travaux annexes au lieu d&#039;améliorer la qualité de traduction.&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;br/&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-left&quot; title=&quot;Paragraph was moved. Click to jump to new location.&quot; href=&quot;#movedpara_2_0_rhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_5_0_lhs&quot;&gt;&lt;/a&gt;# Les règles de transfert utilisent assez souvent l&#039;information sur la langue cible du dictionnaire bilingue pour remplir des balises etc... Si le transfert d&#039;anglais à espagnol lit un fragment comme &quot;the children&quot; (les enfants), le déterminant (article) espagnol a besoin de récupérer l&#039;information nombre et genre du nom de la &#039;&#039;langue cible&#039;&#039;. Ce n&#039;est pas assez de regarder la sortie de l&#039;analyseur de la langue source, le nombre peut être changé par le dictionnaire bilingue pour certains noms, et le genre n&#039;est même pas présent dans la langue source. La règle de transfert s&#039;attend à avoir cette information; sans elle, non seulement le nom sera écrit comme @lemme, mais le déterminant (article) ne sera pas généré correctement non plus. Cet effet devient même pire avec de plus gros fragments.&lt;/div&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-deleted&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-right&quot; title=&quot;Paragraph was moved. Click to jump to old location.&quot; href=&quot;#movedpara_8_2_lhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-addedline diff-side-added&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_6_0_rhs&quot;&gt;&lt;/a&gt;# Bien qu&#039;il pourrait y avoir une solution technique pour transporter le mot source s&#039;il n&#039;est pas dans le dictionnaire bilingue (&amp;lt;code&amp;gt;lt-proc -o&amp;lt;/code&amp;gt;), ça mène à des problèmes avec les composants et autres multi-mots qui sont découpés en deux unités lexicales avant l&#039;examen du dictionnaire bilingue : Que faites-vous quand une partie d&#039;un multi-mot est inconnue ? Par exemple, si on a ^writes about/write&amp;amp;lt;vblex&amp;amp;gt;+about&amp;amp;lt;pr&amp;amp;gt;$, c&#039;est actuellement découpé avant l&#039;examen du dictionnaire bilingue en deux unités ^write&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;$, sans les lemmes, et si seulement l&#039;un des deux est inconnu avant l&#039;examen du dictionnaire bilingue, l&#039;autre sera toujours traduit : ^write&amp;amp;lt;vblex&amp;amp;gt;/escribir&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;/@about&amp;amp;lt;pr&amp;amp;gt;$. Si, au contraire, on allait garder la forme de surface, on l&#039;aurait aussi gardée comme une unité dans l&#039;examen du dictionnaire bilingue, ainsi si des parties du multi-mot étaient inconnues, tout l&#039;ensemble serait marqué inconnu, donnant quelque-chose comme ^@writes about/write&amp;amp;lt;vblex&amp;amp;gt;+@about&amp;amp;lt;pr&amp;amp;gt;$. &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;br/&amp;gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-left&quot; title=&quot;Paragraph was moved. Click to jump to new location.&quot; href=&quot;#movedpara_4_0_rhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_8_0_lhs&quot;&gt;&lt;/a&gt;#* On pourrait travailler autour de ça en ayant des exceptions dans les règles de transfert pour par exemple deviner le nombre et le &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;gendre&lt;/del&gt; si le dictionnaire bilingue n&#039;en donne aucun, mais ça mène à un énorme accroissement de la complexité du transfert – toutes les balises doivent être présumées inconnues, et le temps du développeur est gaspillé dans la chasse aux bugs et travaux annexes au lieu d&#039;améliorer la qualité de traduction.&lt;/div&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;a class=&quot;mw-diff-movedpara-left&quot; title=&quot;Paragraph was moved. Click to jump to new location.&quot; href=&quot;#movedpara_6_0_rhs&quot;&gt;&amp;#x26AB;&lt;/a&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;div&gt;&lt;a name=&quot;movedpara_8_2_lhs&quot;&gt;&lt;/a&gt;# Bien qu&#039;il pourrait y avoir une solution technique pour transporter le mot source s&#039;il n&#039;est pas dans le dictionnaire bilingue (&amp;lt;code&amp;gt;lt-proc -o&amp;lt;/code&amp;gt;), ça mène à des problèmes avec les composants et autres multi-mots qui sont découpés en deux unités lexicales avant l&#039;examen du dictionnaire bilingue : Que faites-vous quand une partie d&#039;un multi-mot est inconnue ? Par exemple, si on a ^writes about/write&amp;amp;lt;vblex&amp;amp;gt;+about&amp;amp;lt;pr&amp;amp;gt;$, c&#039;est actuellement découpé avant l&#039;examen du dictionnaire bilingue en deux unités ^write&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;$, sans les lemmes, et si seulement l&#039;un des deux est inconnu avant l&#039;examen du dictionnaire bilingue, l&#039;autre sera toujours traduit : ^write&amp;amp;lt;vblex&amp;amp;gt;/escribir&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;/@about&amp;amp;lt;pr&amp;amp;gt;$. Si, au contraire, on allait garder la forme de surface, on l&#039;aurait aussi gardée comme une unité dans l&#039;examen du dictionnaire bilingue, ainsi si des parties du multi-mot étaient inconnues, tout l&#039;ensemble serait marqué inconnu, donnant quelque-chose comme ^@writes about/write&amp;amp;lt;vblex&amp;amp;gt;+@about&amp;amp;lt;pr&amp;amp;gt;$. &lt;/div&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-deletedline diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td colspan=&quot;2&quot; class=&quot;diff-empty diff-side-added&quot;&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;div&gt;#* Ne pouvez-vous pas juste distribuer la forme de surface par delà (?) les deux unités ? ^writes/write&amp;amp;lt;vblex&amp;amp;gt;$ ^about/about&amp;amp;lt;pr&amp;amp;gt;$! Lorsque dans cet exemple construit, le découpage est sur un espace, il pourrait être n&#039;importe où. La forme de surface ne donne pas  d&#039;indication générale sur l&#039;endroit. Nous avons des multi-mots qui se découpent au milieu de contractions (^au/à&amp;amp;lt;pr&amp;amp;gt;+le&amp;amp;lt;det&amp;amp;gt;&amp;amp;lt;def&amp;amp;gt;&amp;amp;lt;m&amp;amp;gt;&amp;amp;lt;sg&amp;amp;gt;$), ou au milieu de composants (^vasskokaren/vatn&amp;amp;lt;n&amp;amp;gt;+kokar&amp;amp;lt;n&amp;amp;gt;$)&lt;/div&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;div&gt;#* Ne pouvez-vous pas juste distribuer la forme de surface par delà (?) les deux unités ? ^writes/write&amp;amp;lt;vblex&amp;amp;gt;$ ^about/about&amp;amp;lt;pr&amp;amp;gt;$! Lorsque dans cet exemple construit, le découpage est sur un espace, il pourrait être n&#039;importe où. La forme de surface ne donne pas  d&#039;indication générale sur l&#039;endroit. Nous avons des multi-mots qui se découpent au milieu de contractions (^au/à&amp;amp;lt;pr&amp;amp;gt;+le&amp;amp;lt;det&amp;amp;gt;&amp;amp;lt;def&amp;amp;gt;&amp;amp;lt;m&amp;amp;gt;&amp;amp;lt;sg&amp;amp;gt;$), ou au milieu de composants (^vasskokaren/vatn&amp;amp;lt;n&amp;amp;gt;+kokar&amp;amp;lt;n&amp;amp;gt;$)&lt;/div&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;tr&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-deleted&quot;&gt;&lt;br /&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;
  &lt;td class=&quot;diff-context diff-side-added&quot;&gt;&lt;br /&gt;&lt;/td&gt;
&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
	<entry>
		<id>https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=37071&amp;oldid=prev</id>
		<title>Bech: Création page</title>
		<link rel="alternate" type="text/html" href="https://wiki.apertium.org/w/index.php?title=Pourquoi_nous_tronquons&amp;diff=37071&amp;oldid=prev"/>
		<updated>2012-11-11T00:24:22Z</updated>

		<summary type="html">&lt;p&gt;Création page&lt;/p&gt;
&lt;p&gt;&lt;b&gt;New page&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Dans les paires de langues Apertium, on conserve les dictionnaires unilingues et bilingues &amp;#039;&amp;#039;tronqués&amp;#039;&amp;#039;, ainsi chaque entrée de l&amp;#039;analyseur aura une correspondance dans le dictionnaire bilingue, et toutes les sorties du transfert auront une entrée dans le générateur.&amp;lt;ref&amp;gt;Typiquement ça marche pour les deux directions de traduction, bien qu&amp;#039;une paire de langues seulement validée pour une direction puisse seulement être tronquée dans cette direction.&amp;lt;/ref&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Il y a plusieurs raisons pour faire ça :&lt;br /&gt;
&lt;br /&gt;
# Si un mot n&amp;#039;a pas d&amp;#039;entrée dans le dictionnaire bilingue, il sera envoyé en sortie comme un lemme analysé avec un &amp;#039;@&amp;#039; au début, ex : &amp;quot;canaux&amp;quot; sera envoyé en sortie comme &amp;quot;@canal&amp;quot;, et pire : Un multi-mot comme &amp;quot;pomme de terre&amp;quot; sera envoyé en sortie comme &amp;quot;@pomme&amp;quot; (ou, avec les symboles de debug désactivés, &amp;quot;canal&amp;quot; et &amp;quot;pomme&amp;quot;). Cela signifie que lors de la post-édition, le post-éditeur devra constamment regarder le texte de la langue source (alors qu&amp;#039;un mot inconnu sera possible à traduire sur le champ). Et when gisting (???), le lecteur pourrait être trompé par une mauvaise compréhension du contenu, au lieu d&amp;#039;observer qu&amp;#039;il y a un mot inconnu.&lt;br /&gt;
&lt;br /&gt;
# Les règles de transfert utilisent assez souvent l&amp;#039;information sur la langue cible du dictionnaire bilingue pour remplir des balises etc... Si le transfert d&amp;#039;anglais à espagnol lit un fragment comme &amp;quot;the children&amp;quot; (les enfants), le déterminant (article) espagnol a besoin de récupérer l&amp;#039;information nombre et genre du nom de la &amp;#039;&amp;#039;langue cible&amp;#039;&amp;#039;. Ce n&amp;#039;est pas assez de regarder la sortie de l&amp;#039;analyseur de la langue source, le nombre peut être changé par le dictionnaire bilingue pour certains noms, et le genre n&amp;#039;est même pas présent dans la langue source. La règle de transfert s&amp;#039;attend à avoir cette information; sans elle, non seulement le nom sera écrit comme @lemme, mais le déterminant (article) ne sera pas généré correctement non plus. Cet effet devient même pire avec de plus gros fragments.&lt;br /&gt;
&lt;br /&gt;
#* On pourrait travailler autour de ça en ayant des exceptions dans les règles de transfert pour par exemple deviner le nombre et le gendre si le dictionnaire bilingue n&amp;#039;en donne aucun, mais ça mène à un énorme accroissement de la complexité du transfert – toutes les balises doivent être présumées inconnues, et le temps du développeur est gaspillé dans la chasse aux bugs et travaux annexes au lieu d&amp;#039;améliorer la qualité de traduction.&lt;br /&gt;
&lt;br /&gt;
# Bien qu&amp;#039;il pourrait y avoir une solution technique pour transporter le mot source s&amp;#039;il n&amp;#039;est pas dans le dictionnaire bilingue (&amp;lt;code&amp;gt;lt-proc -o&amp;lt;/code&amp;gt;), ça mène à des problèmes avec les composants et autres multi-mots qui sont découpés en deux unités lexicales avant l&amp;#039;examen du dictionnaire bilingue : Que faites-vous quand une partie d&amp;#039;un multi-mot est inconnue ? Par exemple, si on a ^writes about/write&amp;amp;lt;vblex&amp;amp;gt;+about&amp;amp;lt;pr&amp;amp;gt;$, c&amp;#039;est actuellement découpé avant l&amp;#039;examen du dictionnaire bilingue en deux unités ^write&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;$, sans les lemmes, et si seulement l&amp;#039;un des deux est inconnu avant l&amp;#039;examen du dictionnaire bilingue, l&amp;#039;autre sera toujours traduit : ^write&amp;amp;lt;vblex&amp;amp;gt;/escribir&amp;amp;lt;vblex&amp;amp;gt;$ ^about&amp;amp;lt;pr&amp;amp;gt;/@about&amp;amp;lt;pr&amp;amp;gt;$. Si, au contraire, on allait garder la forme de surface, on l&amp;#039;aurait aussi gardée comme une unité dans l&amp;#039;examen du dictionnaire bilingue, ainsi si des parties du multi-mot étaient inconnues, tout l&amp;#039;ensemble serait marqué inconnu, donnant quelque-chose comme ^@writes about/write&amp;amp;lt;vblex&amp;amp;gt;+@about&amp;amp;lt;pr&amp;amp;gt;$. &lt;br /&gt;
&lt;br /&gt;
#* Ne pouvez-vous pas juste distribuer la forme de surface par delà (?) les deux unités ? ^writes/write&amp;amp;lt;vblex&amp;amp;gt;$ ^about/about&amp;amp;lt;pr&amp;amp;gt;$! Lorsque dans cet exemple construit, le découpage est sur un espace, il pourrait être n&amp;#039;importe où. La forme de surface ne donne pas  d&amp;#039;indication générale sur l&amp;#039;endroit. Nous avons des multi-mots qui se découpent au milieu de contractions (^au/à&amp;amp;lt;pr&amp;amp;gt;+le&amp;amp;lt;det&amp;amp;gt;&amp;amp;lt;def&amp;amp;gt;&amp;amp;lt;m&amp;amp;gt;&amp;amp;lt;sg&amp;amp;gt;$), ou au milieu de composants (^vasskokaren/vatn&amp;amp;lt;n&amp;amp;gt;+kokar&amp;amp;lt;n&amp;amp;gt;$)&lt;br /&gt;
&lt;br /&gt;
Il y a maintenant plusieurs manières de [[tronquer automatiquement un dictionnaire morphologique]], donc il est parfaitement possible de garder un dictionnaire morphologique principal complet, utilisé par plusieurs paires de langues, qui pour chaque paire de langues individuelle est compilé comme dictionnaire morphologique tronqué pour l&amp;#039;analyse.&lt;br /&gt;
&lt;br /&gt;
== Notes de bas de page ==&lt;br /&gt;
&lt;br /&gt;
&amp;lt;references/&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Voir aussi==&lt;br /&gt;
&lt;br /&gt;
* [[Tronquer automatiquement un dictionnaire morphologique]]&lt;br /&gt;
* [[Test de vocabulaire]]&lt;br /&gt;
* [http://wiki.apertium.eu/index.php/Session_7 Session 7: Consistance des données et qualité] sur wiki.apertium.eu&lt;br /&gt;
&lt;br /&gt;
[[Category:Quality control]]&lt;br /&gt;
[[Category:Development]]&lt;br /&gt;
[[Category:Documentation en français]]&lt;/div&gt;</summary>
		<author><name>Bech</name></author>
		
	</entry>
</feed>