Languages of India

From Apertium
Jump to navigation Jump to search

The Indian languages belong to six language families: Indo-Aryan language family,Austroasiatic language family,Dravidian language family, Sino-Tibetan language family,Tai–Kadai language family and Great Andamanese languages.

Status

Name Language Stems Covergae Loctaion
Apertium-hin Hindi 37,833 ~83.1% Apertium-hin
Apertium-urd Urdu 14,943 ~64.6% Apertium-urd


Existing language pairs

Text in italics denotes language pairs in the incubator. Regular text denotes a developing language pair in staging, while text in bold denotes a stable well-working language pair in trunk and text in bold and italics denotes a pair in staging. Bidix stems as counted with dixcounter are displayed below.


eng hin asm ben guj mal mar pan snd tel urd
eng - eng-hin
asm-eng
bn-en
mal-eng
mar-eng
eng-tel
1
hin eng-hin
- as-hi
833
bn-hi
guj-hin
Apertium-guj-hin/stats
mar-hin
pa-hi
snd-hin
urd-hin
{{#l

st:Apertium-urd-hin/stats|urd-hin_stems}}

asm asm-eng
?
as-hi
833
- asm-ben
ben bn-en
bn-hi
asm-ben
-
guj guj-hin
-
mal mal-eng
9,095
-
mar mar-eng
102
mar-hin
- tel-m ar
Apertium-tel-mar/stats ||
pan pa-hi
- ur-pa
0
snd snd-hin
- ur d-snd
Apertium-urd-snd/stats
tel eng-tel
1
tel-mar
{{#l

st:Apertium-tel-mar/stats|tel-mar_stems}} || || || - ||

urd 'urd-hin
'
ur-pa


0 || urd-snd' '
Apertium-urd-snd/stats || || -

afr eng-afr
Apertium-eng-afr/stats
bul bg-en
cat en-ca
35,873
ckb ckb-eng
Apertium-ckb-eng/stats
cym cy-en
11,608
dan da-en
deu eng-deu
Apertium-eng-deu/stats
ell ell-eng
830
epo eo-en
32,337
eus eu-en
14,356
fas [[Apertium-ur-fa|ur-fa]

]
?

fin fin-eng
fra fra-eng
194
gla en-gd
gle en-ga
glg en-gl
30,049
glv en-gv
hat ht-en
haw haw-eng
Apertium-haw-eng/stats
hbs 'hbs-eng
'
hun hun-eng
1,253
hye hye-eng
ina eng-ina
Apertium-eng-ina/stats
isl 'isl-eng
'
ita en-it
kan kan-mar
{{#ls

t:Apertium-kan-mar/stats|kan-mar_stems}} || || || ||

kaz 'eng-kaz
'
kir ky-en
kmr kmr-eng
15,563
lat la-en
lav en-lv
lit en-lt
lvs eng-lvs
2,694
mfe mfe-en
mkd mk-en
33,350
mlt en-mt
nep ne-en
nld en-nl
nor nor-eng
pes pes-eng
Apertium-pes-eng/stats
pol en-pl
por en-pt
rus en-ru
sah sah-eng
?
sco eng-sco
172
sin si-en
sjo sjo-eng
?
slv sl-en
spa 'en-es
'
sqi en-sq
srn eng-srn
5,145
swa swa-eng
Apertium-swa-eng/stats
swe swe-eng
Apertium-swe-eng/stats
tat tat-eng
13,653
tgk tg-en
tha tha-eng
?
tur tr-en
vie vi-en
zlm zlm-eng
?

Indian languages by subgroup

Vulnerability

This table summarizes the vulnerability of various Indian languages. Vulnerability data is derived from the ‘Atlas of the World’s Languages in Danger, © UNESCO, http://www.unesco.org/culture/languages-atlas’,IASSCORE and Wikipedia.



Most widely spoken languages of India

  1. Hindi
  2. English
  3. Bengali
  4. Marathi
  5. Telegu
  6. Tamil
  7. Malayalam
  8. Kashmiri
  9. Urdu
  10. Sanskrit

Samples

Article 1 of the Universal Declaration of Human Rights:

All human beings are born free and equal in dignity and rights. They are endowed with reason and conscience and should act towards one another in a spirit of brotherhood.

Language Text
Hindi सभी मनुष्यों को गौरव और अधिकारों के मामले में जन्मजात स्वतन्त्रता और समानता प्राप्त है । उन्हें बुद्धि और अन्तरात्मा की देन प्राप्त है और परस्पर उन्हें भाईचारे के भाव से बर्ताव करना चाहिए ।
Marathi सर्व मानवी व्यक्ति जन्मतःच स्वतंत्र आहेत व त्यांना समान प्रतिष्ठा व समान अधिकार आहेत. त्यांना विचारशक्ति व सदसविद्वेकबुद्धि लाभलेली आहे. व त्यांनी एकमेकांशी बंधुत्याच्या भावनेने आचरण करावे.
Sanskrit सर्वे मानवाः स्वतन्त्राः समुत्पन्नाः वर्तन्ते अपि च, गौरवदृशा अधिकारदृशा च समानाः एव वर्तन्ते। एते सर्वे चेतना-तर्क-शक्तिभ्यां सुसम्पन्नाः सन्ति। अपि च, सर्वेऽपि बन्धुत्व-भावनया परस्परं व्यवहरन्तु।
Urdu تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوئے ہیں۔ انہیں ضمیر اور عقل ودیعت ہوئی ہے۔ اس لئے انہیں ایک دوسرے کے ساتھ بھائی چارے کا سلوک کرنا چاہیئے۔
Bangla সমস্ত মানুষ স্বাধীনভাবে সমান মর্যাদা এবং অধিকার নিয়ে জন্মগ্রহণ করে। তাঁদের বিবেক এবং বুদ্ধি আছে; সুতরাং সকলেরই একে অপরের প্রতি ভ্রাতৃত্বসুলভ মনোভাব নিয়ে আচরণ করা উচিত।
Gujarati પ્રતિષ્ઠા અને અધિકારોની દૃષ્ટિએ સર્વ માનવો જન્મથી સ્વતંત્ર અને સમાન હોય છે. તેમનામાં વિચારશક્તિ અને અંતઃકરણ હોય છે અને તેમણે પરસ્પર બંધુત્વની ભાવનાથી વર્તવું જોઇએ.
Punjabi ਸਾਰਾ ਮਨੁੱਖੀ ਪਰਿਵਾਰ ਆਪਣੀ ਮਹਿਮਾ, ਸ਼ਾਨ ਅਤੇ ਹੱਕਾਂ ਦੇ ਪੱਖੋਂ ਜਨਮ ਤੋਂ ਹੀ ਆਜ਼ਾਦ ਹੈ ਅਤੇ ਸੁਤੇ ਸਿੱਧ ਸਾਰੇ ਲੋਕ ਬਰਾਬਰ ਹਨ । ਉਨ੍ਹਾਂ ਸਭਨਾ ਨੂੰ ਤਰਕ ਅਤੇ ਜ਼ਮੀਰ ਦੀ ਸੌਗਾਤ ਮਿਲੀ ਹੋਈ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਭਰਾਤਰੀਭਾਵ ਦੀ ਭਾਵਨਾ ਰਖਦਿਆਂ ਆਪਸ ਵਿਚ ਵਿਚਰਣਾ ਚਾਹੀਦਾ ਹੈ ।
Kannada ಎಲ್ಲಾ ಮಾನವರೂ ಸ್ವತಂತ್ರರಾಗಿಯೇ ಜನಿಸಿದ್ದಾರೆ. ಹಾಗೂ ಘನತೆ ಮತ್ತು ಹಕ್ಕುಗಳಲ್ಲಿ ಸಮಾನರಾಗಿದ್ದಾರೆ. ವಿವೇಕ ಮತ್ತು ಅಂತಃಕರಣಗಳನ್ನು ಪಡೆದವರಾದ್ದರಿಂದ ಅವರು ಪರಸ್ಪರ ಸಹೋದರ ಭಾವದಿಂದ ವರ್ತಿಸಬೇಕು.
Malayalam മനുഷ്യരെല്ലാവരും തുല്യാവകാശങ്ങളോടും അന്തസ്സോടും സ്വാതന്ത്ര്യത്തോടുംകൂടി ജനിച്ചിട്ടുള്ളവരാണ്‌. അന്യോന്യം ഭ്രാതൃഭാവത്തോടെ പെരുമാറുവാനാണ്‌ മനുഷ്യന്നു വിവേകബുദ്ധിയും മനസ്സാക്ഷിയും സിദ്ധമായിരിക്കുന്നത്‌.
Telegu ప్రతిపత్తిస్వత్వముల విషయమున మానవులెల్లరును జన్మతః స్వతంత్రులును సమానులును నగుదురు. వారు వివేచన-అంతఃకరణ సంపన్నులగుటచే పరస్పరము భ్రాతృభావముతో వర్తింపవలయును.
Tamil எல்லா மனிதர்களும் ஒருவருக்கொருவர் தொடர்பில் சுதந்திரமாகவும், சமமாகவும், சமமாகவும் பிறந்தவர்கள். அவர்கள் புத்திஜீவிகள் வாரியாக இருக்க பரஸ்பரம் சாய்ந்திருக்க வேண்டும்.