Document de ressources linguistiques

From Apertium
Jump to navigation Jump to search

In English

Un Document de ressources linguistiques (LRD) est un document XML consistant en un ensemble de ressources linguistiques (dictionnaires, modèles croisés, corpus, liens vers d'autres LRD, etc.).

Ce document peut être utilisé, par exemple, avec apertium-crossdics pour indiquer quelles ressources (dictionnaires et modèles croisés) peuvent être croisés.

Structure du document

Aperçu

<?xml version="1.0" encoding="UTF-8"?>

<ling-resources>
   <name>...</name>
   <description>...</description>
   
   <resource>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      ...
   </resource>

   <resource-set>
      <name>...</name>
      <description>...</description>

      <resource>
         <property name="..." value="..."/>
         ...
      </resource>
      <resource>
         <property name="..." value="..."/>
         ...
      </resource>
      ...
   </resource-set>  

   <resource>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      <property name="..." value="..."/>
      ...
   </resource>
   ...  
</ling-resources>

Ressource

Une ressource est définie avec un ensemble de propriétés.

<resource>
   <property name="name" value="apertium-es"/>
   <property name="type" value="mon"/>
   <property name="sl" value="es"/>
   <property name="for-crossing" value="yes"/>
   <property name="src" value="apertium-es-ca.es.dix"/>
   <property name="version" value="stable"/>
</resource>

Les valeurs possibles pour les ressources sont :

  • name: le nom de la ressource.
  • type: le type de ressource. Les valeurs possibles sont :
    • mon: dictionnaire morphologique.
    • bil: dictionnaire bilingue.
    • crp: corpus.
    • lrd: lien vers un document de ressources linguistiques.
    • cross-model: document de modèle croisé.
  • sl: langue source (par exemple, dans les dictionnaires morphologiques et bilingues)
  • tl: langue cible (par exemple, dans les dictionnaires bilingues)
  • src: source (URL ou chemin d'accès)
  • version: version de la ressource (par exemple, pour les dictionnaires: stable, unstable, pre-alpha, etc).
  • plus ?

Ensemble de ressources

Il est possible de grouper un certain nombre de ressources avec la balise resource-set, comme suit :

<resource-set>
   <name></name>
   <description></description>
   <resource>
      <property name="" value=""/>
      ...
   </resource>
   <resource>
      <property name="" value=""/>
      ...
   </resource>
   ...
</resource-set>

Cette organisation peut être utile pour grouper les données linguistiques de certaines paires de langues.

Types de ressources

Certaines des ressources peuvent être définies.

Dictionnaire morphologique

<resource>
   <property name="name" value="apertium-es"/>
   <property name="type" value="mon"/>
   <property name="sl" value="es"/>
   <property name="src" value="apertium-es-ca.es.dix"/>
   <property name="version" value="stable"/>
</resource>

Dictionnaire bilingue

<resource>
   <property name="name" value="apertium-es-ca"/>
   <property name="type" value="bil"/>
   <property name="sl" value="es"/>
   <property name="tl" value="ca"/>
   <property name="src" value="apertium-es-ca.es-ca.dix"/>
   <property name="version" value="stable"/>
</resource>

Modèle croisé

<resource>
   <property name="name" value="cm-es-ca-en"/>
   <property name="type" value="cross-model"/>
   <property name="sl" value="es"/>
   <property name="tl" value="en"/>
   <property name="src" value="cross-model-es-ca-en.xml"/>
</resource>

Corpus

<resource>
   <property name="name" value="corpus-es"/>
   <property name="type" value="crp"/>
   <property name="sl" value="es"/>
   <property name="src" value="es-corpus.crp"/>
</resource>

Document de ressources linguistiques

<resource>
   <property name="name" value="other-ling-resources"/>
   <property name="type" value="lrd"/>
   <property name="src" value="other-ling-resources.xml"/>
</resource>

Exemple de document de ressources linguistiques

<?xml version="1.0" encoding="UTF-8"?>

<!-- Ressources linguistiques-->
<ling-resources>
   <name>Mes ressources linguistiques</name>
    <description>Mes ressources linguistiques : dictionnaires morphologique et bilingues, modèles croisés, corpus, etc.</description>
   
    <resource-set>
      <name>Mes ressources linguistiques pour obtenir la paire de langues Anglais-Espagnol.</name>
      <description>Une description de cet ensemble de ressources</description>

      <!-- modèle croisé en-ca-es -->
      <resource>
         <property name="name" value="cross-model-en-ca-es"/>
         <property name="type" value="cross-model"/>
         <property name="sl" value="en"/>
         <property name="tl" value="es"/>      
         <property name="for-crossing" value="yes"/>
         <property name="src" value="cross-model-es-ca-en.xml"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- modèle croisé es-ca-en -->
      <resource>
         <property name="name" value="cross-model-es-ca-en"/>
         <property name="type" value="cross-model"/>
         <property name="sl" value="es"/>
         <property name="tl" value="en"/>      
         <property name="for-crossing" value="yes"/>
         <property name="src" value="cross-model-es-ca-en.xml"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire morphologique 'es' -->
      <resource>
         <property name="name" value="apertium-es"/>
         <property name="type" value="mon"/>
         <property name="sl" value="es"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-es-ca.es.dix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire morphologique 'en' -->
      <resource>
         <property name="name" value="apertium-en"/>
         <property name="type" value="mon"/>
         <property name="sl" value="en"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-en-ca.en.metadix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire bilingue 'en-ca' -->   
      <resource>
         <property name="name" value="apertium-en-ca"/>
         <property name="type" value="bil"/>
         <property name="sl" value="en"/>
         <property name="tl" value="ca"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-en-ca.en-ca.dix"/>
         <property name="version" value="stable"/>
      </resource>
      
      <!-- dictionnaire bilingue 'es-ca' -->
      <resource>
         <property name="name" value="apertium-es-ca"/>
         <property name="type" value="bil"/>
         <property name="sl" value="es"/>
         <property name="tl" value="ca"/>
         <property name="for-crossing" value="yes"/>
         <property name="src" value="apertium-es-ca.es-ca.dix"/>
         <property name="version" value="stable"/>
      </resource>
   </resource-set>
   
   <!-- Simple fichier corpus -->
   <resource>
      <property name="name" value="corpus-es"/>
      <property name="type" value="corpus"/>
      <property name="sl" value="es"/>
      <property name="src" value="corpus-es.crp"/>        
   </resource>
   
   <!-- Repository (fichier comme ça) -->
   <resource>
      <property name="name" value="other-resources-1"/>
      <property name="type" value="lrd"/>
      <property name="src" value="other-ling-resources-file.xml"/>        
   </resource>
   
</ling-resources>

Voir aussi