Difference between revisions of "Apertium-pretransfer (français)"
Jump to navigation
Jump to search
(Création page) |
(Lien page anglaise) |
||
Line 1: | Line 1: | ||
[[Apertium-pretransfer|In English]] |
|||
<code>apertium-pretransfer</code> (installé en tant qu'élément du paquet <code>apertium</code>) fait certaines opérations sur les unités [[multi-mots]] avant l'examen par le [[Bidix (français)|dictionnaire bilingue]]. L'entrée est supposée être désambiguïsée, et n'avoir aucune [[forme de surface]] (juste des analyses). |
<code>apertium-pretransfer</code> (installé en tant qu'élément du paquet <code>apertium</code>) fait certaines opérations sur les unités [[multi-mots]] avant l'examen par le [[Bidix (français)|dictionnaire bilingue]]. L'entrée est supposée être désambiguïsée, et n'avoir aucune [[forme de surface]] (juste des analyses). |
||
Latest revision as of 14:51, 7 October 2014
apertium-pretransfer
(installé en tant qu'élément du paquet apertium
) fait certaines opérations sur les unités multi-mots avant l'examen par le dictionnaire bilingue. L'entrée est supposée être désambiguïsée, et n'avoir aucune forme de surface (juste des analyses).
Les multi-mots composés (ex: une contraction dans les langues romanes, avec <j/> dans le dictionnaire unilingue, un composé nominal dans les langues nord germaniques) sont coupés en deux au signe + :
$ echo '^de<pr>+el<det><def><m><sg>$' | apertium-pretransfer ^de<pr>$ ^el<det><def><m><sg>$ $ echo '^arbeidsmiljø<n><nt><sg><ind><ep-Ø>+lov<n><m><sg><def>$' | apertium-pretransfer ^arbeidsmiljø<n><nt><sg><ind><ep-Ø>$ ^lov<n><m><sg><def>$
- Remarque : Il y a eu des discussions pour changer le symbole + pour les composants en ~, puisque généralement nous ne voulons pas un espace à cet endroit.
Les multi-mots avec inflexion intérieure (en utilisant le <g/> dans le dictionnaire unilingue) ont leur partie non infléchie, le truc après le signe #, déplacée (derrière les étiquettes) sur le lemme :
$ echo '^poner<vblex><inf># a prueba$' | apertium-pretransfer ^poner# a prueba<vblex><inf>$
- Remarque : Le déplacement de l'arrière du multi-mot (la partie après #) est également effectué par
cg-proc