Difference between revisions of "Créer une nouvelle paire de langues"

From Apertium
Jump to navigation Jump to search
(New page: Apertium est un logiciel de traduction automatique, développé par l'université d'Alicante et financé par le gouvernement. Le code est diffusé sous licence GNU GPL. Apertium est l'u...)
 
Line 77: Line 77:
   
 
*http://apertium.sourceforge.net/ Le site officiel d'Apertium
 
*http://apertium.sourceforge.net/ Le site officiel d'Apertium
*[[:w:fr:Apertium]]
 
 
*http://ilazki.thinkgeek.co.uk/apertium/graph.svg
 
*http://ilazki.thinkgeek.co.uk/apertium/graph.svg
 
*http://xixona.dlsi.ua.es/wiki/index.php/Main_Page
 
*http://xixona.dlsi.ua.es/wiki/index.php/Main_Page

Revision as of 15:36, 19 May 2007

Apertium est un logiciel de traduction automatique, développé par l'université d'Alicante et financé par le gouvernement. Le code est diffusé sous licence GNU GPL.


Apertium est l'un des deux projets d'OpenTrad. Au départ, le logiciel était conçu pour traduire des textes dans des langues très proches. Aujourd'hui, le logiciel traite des paires langues qui diffèrent davantage, comme par exemple la paire anglais-catalan.

Le logiciel consiste en

  • un moteur de traduction automatique qui ne repose sur aucune langue (humaine) ;
  • d'outils destinés à gérer les données linguistiques nécessaires pour concevoir, pour une paire de langue donnée, un système de traduction automatique ;
  • de données linguistiques pour un nombre toujours croissant de paires de langues.

Installation

Apertium est notamment disponible pour Ubuntu, et pour Ubuntu (Feisty-Universe)

Pour Ubuntu, une version ancienne existe sur http://packages.ubuntu.com/feisty/libs/apertium.

Si l'on veut profiter des dernières versions, il vaut mieux installer par svn. Installer d'abord svn puis taper :

svn co https://apertium.svn.sourceforge.net/svnroot/apertium

Créer une nouvelle paire de langues

Pour créer une nouvelle paire de langues, il faut créer cinq nouveaux fichiers :

  • deux dictionaires monolingues ;
  • un dictionaire bilingue ;
  • deux fichiers de règles de transfert ;

Soient A et B les langues pour lesquelles vous désirez créer une paire. Vous pouvez dans certain cas récupérer un dictionaire monolingue si une paire A-X ou B-X existe déjà (X est une langue quelconque).

Nous allons prendre comme exemple la création de la paire français-néerlandais. Nous utiliserons comme abréviation fr pour le français et nl pour le néerlandais. Donc, si vous avez bien suivi, il faudra créer

  • un dictionnaire monolingue nl
  • un dictionnaire bilingue fr-nl
  • un fichier de règles de transfer fr-->nl
  • un fichier de règles de transfer nl-->fr

Nous devons pas créer le dictionaire monloingue fr, car fr-es

Commençons par créer le dictionnaire monolingue nl

Dictionnaire monolingue nl

Le dictionnaire est un fichier xml.

Nous devons utiliser l'encodage "ISO-8859-1". Pour l'instant (avril 2007) l'UTF-8 qui permet d'utiliser davantage de langues, ne fonctionne pas encore avec Apertium.

Créons un fichier texte avec votreéditeur de texte préféré (notepad, gedit, kedit, etc) Taper le text

<?xml version="1.0" encoding="ISO-8859-1"?>
<dictionary>
<alphabet>ÀÁÂÄÇÈÉÊËÌÍÎÏÑÒÓÔÖÙÚÛÜàáâäçèéêëìíîïñòóôöùúûüABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz</alphabet>
</dictionary>

Sauver le texte sous le nom de « apertium-fr-nl.nl.dix »

Le contenu de la balise alphabet est néecessaire car Apertium ne reconnaît pas encore l'UTF-8.

Il convient ensuite de remplir l'espace entre

<sdefs> </sdefs>

Pour cela tapons

<sdefs>

</sdefs>

Abréviations utilisées

  • dix : dictionary (dictionnaire)
  • fr : français
  • nl : néerlandais

Liens externes

Sources