Contraintes grammaticales

From Apertium
Revision as of 14:32, 19 February 2013 by Polo (talk | contribs)
Jump to navigation Jump to search

Constraint Grammar est un outil qui peut être utilisé pour baliser les parties de discours des textes ambigus. Il y a des constraint grammars libres développés en dehors du projet Apertium pour : le norvégien (le tagueur Oslo-Bergen), les langues sames (de Giellatekno) et le féroïen (également de Giellatekno).

Terminologie

Voir aussi : Format du flux Apertium

équivalent Apertium : ^mots/mot<n><pl>/mot<vblex><pres><p3><sg>$
  • baseform — le lemme d'un mot.
  • reading — l'analyse simple d'un mot.
équivalent Apertium : ^mot<n><pl>$

Note sur les parenthèses

L'utilisation de parenthèses pour distinguer entre les balises et les listes/ensembles semble être le principal point de confusion pour les personnes apprenant CG. Si on a les balises morphologiques balise1 et balise2, alors on peut avoir des règles comme ceci :

LIST ensemble1 = balise1 ;
LIST ensemble2 = (balise1 balise2) ; # trouve un mot avec à la fois balise1 et balise2
LIST ensemble3 = balise1 balise2 ;   # trouve un mot avec balise1 ou balise2
LIST mot = "hello" ;

SELECT:1a (balise1) (1 mot) ;
SELECT:1b  ensemble1  (1 mot) ;   # équivalent à 1a

SELECT:2a (balise1 balise2) (1 mot) ;
SELECT:2b  ensemble2       (1 mot) ;   # équivalent à 2a

SELECT:3a balise1 (1 mot) ;
SELECT:3b balise2 (1 mot) ;
SELECT:3c ensemble3 (1 mot) ;   # équivalent à 3a et 3b combinés

SELECT:1c  ensemble1  (1 ("hello")) ; # équivalent à 1a (ou 1b)

Langues utilisant CG dans Apertium

Voir aussi

Liens externes