Contraintes grammaticales
Jump to navigation
Jump to search
Constraint Grammar est un outil qui peut être utilisé pour baliser les parties de discours des textes ambigus. Il y a des constraint grammars libres développés en dehors du projet Apertium pour : le norvégien (le tagueur Oslo-Bergen), les langues sames (de Giellatekno) et le féroïen (également de Giellatekno).
Contents
Terminologie[edit]
Voir aussi : Format du flux Apertium
- cohort — une forme de surface d'un mot, avec son analyse (unités lexicales possibles), une unité lexicale ambiguë.
- équivalent Apertium :
^mots/mot<n><pl>/mot<vblex><pres><p3><sg>$
- équivalent Apertium :
- baseform — le lemme d'un mot.
- reading — l'analyse simple d'un mot.
- équivalent Apertium :
^mot<n><pl>$
- équivalent Apertium :
- motform — une forme de surface d'un mot.
Note sur les parenthèses[edit]
L'utilisation de parenthèses pour distinguer entre les balises et les listes/ensembles semble être le principal point de confusion pour les personnes apprenant CG. Si on a les balises morphologiques balise1
et balise2
, alors on peut avoir des règles comme ceci :
LIST ensemble1 = balise1 ; LIST ensemble2 = (balise1 balise2) ; # trouve un mot avec à la fois balise1 et balise2 LIST ensemble3 = balise1 balise2 ; # trouve un mot avec balise1 ou balise2 LIST mot = "hello" ; SELECT:1a (balise1) (1 mot) ; SELECT:1b ensemble1 (1 mot) ; # équivalent à 1a SELECT:2a (balise1 balise2) (1 mot) ; SELECT:2b ensemble2 (1 mot) ; # équivalent à 2a SELECT:3a balise1 (1 mot) ; SELECT:3b balise2 (1 mot) ; SELECT:3c ensemble3 (1 mot) ; # équivalent à 3a et 3b combinés SELECT:1c ensemble1 (1 ("hello")) ; # équivalent à 1a (ou 1b)
Langues utilisant CG dans Apertium[edit]
Voir aussi[edit]
- Apertium et les contraintes grammaticales (vislcg3) -- installation et utilisation
- Introduksjon til føringsgrammatikk -- un HOWTO, en norvégien bokmål