Difference between revisions of "Document de ressources linguistiques"

From Apertium
Jump to navigation Jump to search
m
Line 248: Line 248:
 
== Voir aussi ==
 
== Voir aussi ==
   
* [[Crossdics : Génération d'une paire de langue à partir de 2 autres#En utilisant un Document de Ressources Linguistiques|Utilisation d'un Document de Ressources Linguistiques avec apertium-crossdics]]
+
* [[Crossdics : génération d'une paire de langue à partir de 2 autres#En utilisant un Document de ressources linguistiques|Utilisation d'un Document de ressources linguistiques avec apertium-crossdics]]
* [http://apertium.svn.sourceforge.net/viewvc/*checkout*/apertium/trunk/apertium-crossdics/resources/ling-resources.xml Télécharger un exemple de Document de Ressources Linguistiques]
+
* [http://apertium.svn.sourceforge.net/viewvc/*checkout*/apertium/trunk/apertium-crossdics/resources/ling-resources.xml Télécharger un exemple de Document de ressources linguistiques]
   
 
[[Category:Dixtools]]
 
[[Category:Dixtools]]

Revision as of 16:22, 19 February 2013

Un Document de ressources linguistiques (LRD) est un document XML consistant en un ensemble de ressources linguistiques (dictionnaires, modèles croisés, corpus, liens vers d'autres LRD, etc.).

Ce document peut être utilisé, par exemple, avec apertium-crossdics pour indiquer quelles ressources (dictionnaires et modèles croisés) peuvent être croisés.

Structure du document

Aperçu

<?xml version="1.0" encoding="UTF-8"?>

<ling-resources>
   <name>...</name>
   <description>...</description>
   
   <resource>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      ...
   </resource>

   <resource-set>
      <name>...</name>
      <description>...</description>

      <resource>
         <property name="..." value="..."/>
         ...
      </resource>
      <resource>
         <property name="..." value="..."/>
         ...
      </resource>
      ...
   </resource-set>  

   <resource>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      ...
   </resource>
   ...  
</ling-resources>

Ressource

Une ressource est définie avec un ensemble de propriétés.

<resource>
   <property name="name" value="apertium-es"/>
   <property name="type" value="mon"/>
   <property name="sl" value="es"/>
   <property name="for-crossing" value="yes"/>
   <property name="src" value="apertium-es-ca.es.dix"/>
   <property name="version" value="stable"/>
</resource>

Les valeurs possibles pour les ressources sont :

  • name: le nom de la ressource.
  • type: le type de ressource. Les valeurs possibles sont :
    • mon: dictionnaire morphologique.
    • bil: dictionnaire bilingue.
    • crp: corpus.
    • lrd: lien vers un document de ressources linguistiques.
    • cross-model: document de modèle croisé.
  • sl: langue source (par exemple, dans les dictionnaires morphologiques et bilingues)
  • tl: langue cible (par exemple, dans les dictionnaires bilingues)
  • src: source (URL ou chemin d'accès)
  • version: version de la ressource (par exemple, pour les dictionnaires: stable, unstable, pre-alpha, etc).
  • plus ?

Ensemble de ressources

Il est possible de grouper un certain nombre de ressources avec la balise resource-set, comme suit :

<resource-set>
   <name></name>
   <description></description>
   <resource>
      <property name="" value=""/>
      ...
   </resource>
   <resource>
      <property name="" value=""/>
      ...
   </resource>
   ...
</resource-set>

Cette organisation peut être utile pour grouper les données linguistiques de certaines paires de langues.

Types de ressources

Certaines des ressources peuvent être définies.

Dictionnaire morphologique

<resource>
   <property name="name" value="apertium-es"/>
   <property name="type" value="mon"/>
   <property name="sl" value="es"/>
   <property name="src" value="apertium-es-ca.es.dix"/>
   <property name="version" value="stable"/>
</resource>

Dictionnaire bilingue

<resource>
   <property name="name" value="apertium-es-ca"/>
   <property name="type" value="bil"/>
   <property name="sl" value="es"/>
   <property name="tl" value="ca"/>
   <property name="src" value="apertium-es-ca.es-ca.dix"/>
   <property name="version" value="stable"/>
</resource>

Modèle croisé

<resource>
   <property name="name" value="cm-es-ca-en"/>
   <property name="type" value="cross-model"/>
   <property name="sl" value="es"/>
   <property name="tl" value="en"/>
   <property name="src" value="cross-model-es-ca-en.xml"/>
</resource>

Corpus

<resource>
   <property name="name" value="corpus-es"/>
   <property name="type" value="crp"/>
   <property name="sl" value="es"/>
   <property name="src" value="es-corpus.crp"/>
</resource>

Document de ressources linguistiques

<resource>
   <property name="name" value="other-ling-resources"/>
   <property name="type" value="lrd"/>
   <property name="src" value="other-ling-resources.xml"/>
</resource>

Exemple de document de ressources linguistiques

<?xml version="1.0" encoding="UTF-8"?>

<!-- Ressources linguistiques-->
<ling-resources>
   <name>Mes ressources linguistiques</name>
    <description>Mes ressources linguistiques : dictionnaires morphologique et bilingues, modèles croisés, corpus, etc.</description>
   
    <resource-set>
      <name>Mes ressources linguistiques pour obtenir la paire de langues Anglais-Espagnol.</name>
      <description>Une description de cet ensemble de ressources</description>

      <!-- modèle croisé en-ca-es -->
      <resource>
         <property name="name" value="cross-model-en-ca-es"/>
         <property name="type" value="cross-model"/>
         <property name="sl" value="en"/>
         <property name="tl" value="es"/>      
         <property name="for-crossing" value="yes"/>
         <property name="src" value="cross-model-es-ca-en.xml"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- modèle croisé es-ca-en -->
      <resource>
         <property name="name" value="cross-model-es-ca-en"/>
         <property name="type" value="cross-model"/>
         <property name="sl" value="es"/>
         <property name="tl" value="en"/>      
         <property name="for-crossing" value="yes"/>
         <property name="src" value="cross-model-es-ca-en.xml"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire morphologique 'es' -->
      <resource>
         <property name="name" value="apertium-es"/>
         <property name="type" value="mon"/>
         <property name="sl" value="es"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-es-ca.es.dix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire morphologique 'en' -->
      <resource>
         <property name="name" value="apertium-en"/>
         <property name="type" value="mon"/>
         <property name="sl" value="en"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-en-ca.en.metadix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire bilingue 'en-ca' -->   
      <resource>
         <property name="name" value="apertium-en-ca"/>
         <property name="type" value="bil"/>
         <property name="sl" value="en"/>
         <property name="tl" value="ca"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-en-ca.en-ca.dix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire bilingue 'es-ca' -->
      <resource>
         <property name="name" value="apertium-es-ca"/>
         <property name="type" value="bil"/>
         <property name="sl" value="es"/>
         <property name="tl" value="ca"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-es-ca.es-ca.dix"/>
         <property name="version" value="stable"/>
      </resource>
   </resource-set>
   
   <!-- Simple fichier corpus -->
   <resource>
      <property name="name" value="corpus-es"/>
      <property name="type" value="corpus"/>
      <property name="sl" value="es"/>
      <property name="src" value="corpus-es.crp"/>        
   </resource>
   
   <!-- Repository (fichier comme ça) -->
   <resource>
      <property name="name" value="other-resources-1"/>
      <property name="type" value="lrd"/>
      <property name="src" value="other-ling-resources-file.xml"/>        
   </resource>
   
</ling-resources>

Voir aussi