Apertium has moved from SourceForge to GitHub.
If you have any questions, please come and talk to us on #apertium on irc.freenode.net or contact the GitHub migration team.

Notation WX

From Apertium
Jump to: navigation, search

In English

La notation WX est utilisée pour représenter l'alphabet Devanagari, qui est utilisé par le sanskrit, l'hindi, le népalais, le marathi, le bengali et plusieurs autres langages indiens en ASCII. L'écriture Devanagari possède aussi un support Unicode.

Contents

[edit] Table

[edit] Détails

<anudev> Il y a quelques problèmes concernant l'attribution de certaines lettres de l'hindi avec Unicode.
<anudev> Ils ne sont toujours pas résolus.
<anudev> Actuellement il y a le problème des voyelles séparées et des matras.
<avinesh_> Pourriez-vous donner un exemple ?
<anudev> On n'a pas besoin de voyelles et de matras(marqueurs) différemment.
<avinesh_> Pour chaque matra il y a une représentation en wx.
<anudev> Comme a, aa, ii.
<avinesh_> ouais
<anudev> mais encore ी ू े 
<anudev> ne sont pas nécessaires
<spectie> matras = ?
<avinesh_> matra est la dernière représentation
<anudev> matras = marqueurs
<anudev> ka
<anudev> kaa
<anudev> on écrira kaa comme kA en wx
<anudev> Dans unicode il y a une place séparée pour A et le marqueur aa
<anudev> on a besoin du même code pour chacun,
<avinesh_> sry (?) pas encore obtenir ur (?) point pourquoi devrait-on utiliser wx à la place de unicode ?
<avinesh_> mais les gens suivent seulement une convention soit le A soit le aa 
<avinesh_> pas les deux
<avinesh_> je veux dire que si vous voyez un document 
<avinesh_> il sera généralement conforme
<anudev> Je veux dire qu'on écrit A aussi bien pour la voyelle que pour le marqueur
<avinesh_> oh..
<avinesh_> ok
<avinesh_> tien
<anudev> mais unicode écrira différemment pour A comme voyelle et comme matra
<avinesh_> je voie
<anudev> donc ça crée une complication inutile
<spectie> donc le problème est que dans unicode
<spectie> les caractères combinés ont un point de code séparé
<spectie> et dans WX ils sont unifiés en un seul point de code ?
<spectie> = une lettre
<anudev> oui
<spectie> pourquoi ne pas utiliser la normalisation unicode ?

[edit] Exemples

  • राम = र्+आ+म्+अ (rAma)
  • कृष्ण = क्+ऋ+ष्+ण्+अ (kqRNa)

[edit] Liens externes (en anglais)


Personal tools