Questions fréquentes

From Apertium
Jump to: navigation, search

In English

[edit] Pourquoi utilisez-vous XML et pas une base de données ?

XML n'est il pas un format vraiment peu efficace pour stocker des dictionnaires, tous ces espaces et balises, ils sont compliqués à lire, ne serait-il pas mieux d'avoir toute l'information dans une base de données, comme Postgres ou MySQL ? Ou même dans des fichiers texte ordinaires ?

Réponse
  • Chaque élément de données est explicitement étiqueté avec une balise descriptive nommée avec une signification claire associée
  • La structure des documents peut être facilement validée au moyen de DTDs ou de schémas
  • Plusieurs technologies existent pour XML (conversion depuis et vers XML, interopérabilité).
  • XML est assez facile à traiter avec des outils de traitement de texte comme sed, cut et awk.

Vous pouvez lire plus de détails tant pratiques que théoriques sur notre format pour mémoriser les dictionnaires ici : Dictionnaire morphologique.

[edit] Est ce que Apertium supporte les verbes séparables ?

Plusieurs langues, par exemple la plupart des langues Germaniques (à l'exception de l'anglais) et le Hongrois possèdent un phénomène appelé "verbes séparables", également appelé "prépositions attachées" ou par d'autres noms. C'est lorsque l'infinitif du verbe possède une partie qui est détachée et déplacée lorsque le verbe est conjugué. Par exemple en afrikaans, le verbe "annoncer" est "aankondig". La partie aan est séparée lorsque le verbe est conjugué, donc par exemple :

verbs
Les astronomes annoncent [la découverte].
Sterrekundiges kondig [die ontdekking] aan.

Toutefois, au passé on aurait :

Les astronomes ont annoncé [la découverte].
Sterrekundiges het [die ontdekking] aangekondig.

Tout seul, "kondig" ne signifie rien.

Réponse

Essentiellement non, pour l'instant on ne supporte pas les verbes séparables. Le problème pour Apertium se produit quand la partie non séparée ne signifie rien, il est pour l'instant impossible d'analyser un mot en deux parties quand elles sont séparées par quelque-chose d'aussi nébuleux qu'un groupe nominal (NP). Il y a un certain nombre de hacks qui peuvent être essayés pour contourner cette déficience, mais aucune ne fonctionne proprement. Si vous aimeriez plus d'information là dessus, ou avez des idées sur la manière de traiter ça ou de s'en accommoder, veuillez voir notre page Separable verbs (lien direct ?).

[edit] Comment puis-je contribuer à ce projet ?

Indépendamment du type de contribution que vous voulez faire, les deux choses pour commencer sont de s'inscrire à la mailing list apertium-stuff, qui est l'endroit où vont la plupart des discussions. Également, venez flâner sur le canal IRC #apertium sur irc.freenode.net.

Pour décider sur quoi vous voulez contribuer, regardez à Développement (français) et Projects (à traduire ?) pour quelques idées qu'on a eu en programmation, pour l'extension du moteur de traduction, et regardez dans les différentes branches ou dans la Liste des paires de langues si vous êtes intéressé par les problèmes linguistiques. Si vous pouvez trouver quelque-chose qui vous intéresse ou pique votre curiosité, envoyez juste un email ou demandez à quelqu'un sur l'irc et on sera heureux de vous aider.

Personal tools