Speling format (français)

From Apertium
Revision as of 09:57, 6 October 2014 by Bech (talk | contribs) (Lien page anglaise)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

In English

Le Speling format est une manière de représenter la "forme complète" des listes de vocabulaire d'une manière qui rend la génération de paradigmes, and de paires lemme-paradigme facile pour les monodices d' Apertium. C'est similaire dans le principe au format "étendu" de lttoolbox, mais avec l'avantage que la partie-de-discours est séparée du reste des sous-catégories/caractéristiques.

Le format est largement organisé comme suit :

lemme; forme de surface; caractéristiques; partie-de-discours

Donc par exemple en Anglais on pourrait voir quelques inflection du nom représentées comme :

house; house; sg; n
house; houses; pl; n
computer; computer; sg; n
computer; computers; pl; n
bird; bird; sg; n
bird; birds; pl; n
wolf; wolf; sg; n
wolf; wolves; pl; n

En français, il est bon de préciser également le genre :

maison; maison; sg; n.f
maison; maisons; pl; n.f
ordinateur; ordinateur; sg; n.m
ordinateur; ordinateurs; pl; n.m
loup; loup; sg; n.m
loup; loups; pl; n.m
oiseau; oiseau; sg; n.m
oiseau; oiseaux; pl; n.m
canal; canal; sg; n.m
canal; canaux; pl; n.m

ou en espagnol :

casa; casa; sg; n.f
casa; casas; pl; n.f
...

Depuis des listes comme celles-ci, dans les langues avec une morphologie d'inflection basique on peut générer des paradigmes quasiment sans détour, ou pour les langues avec une morphologie plus riche, générer alternativement des paradigmes partiels.

Le format est répertorié auprès de speling.org qui collecte des listes de forme complètes pour spell-checkers dans plusieurs langues Germaniques et le Finnois.

Voir aussi[edit]