Difference between revisions of "Languages of India"

From Apertium
Jump to navigation Jump to search
Line 36: Line 36:
 
!rowspan=2| stems
 
!rowspan=2| stems
 
!rowspan=2| coverage
 
!rowspan=2| coverage
!rowspan=2| location
 
!rowspan=2 class="unsortable"| primary authors
 
 
|-class="sortbottom"
 
|-class="sortbottom"
 
! -1
 
! -1
Line 51: Line 49:
 
|align="right"| {{#lst:apertium-hin/stats|stems}}
 
|align="right"| {{#lst:apertium-hin/stats|stems}}
 
|align="center"| [[Apertium-hin#Current_State|~{{:Apertium-kaz/stats/average}}%]]
 
|align="center"| [[Apertium-hin#Current_State|~{{:Apertium-kaz/stats/average}}%]]
  +
|-
|| {{#http://wiki.apertium.org/wiki/Apertium-hin|location}}
 
|| {{#lst:apertium-hin/stats|authors}}
+
|| <code>[[apertium-mar]]</code>
  +
|| [[मराठी]]
  +
|| {{#lst:apertium-mar/stats|nativename}}
  +
|| <code>mr</code>
  +
|| <code>mar</code>
  +
|| HFST (lexc+twol)
  +
|| working
  +
|align="right"| {{#lst:apertium-mar/stats|stems}}
  +
|align="center"| [[Apertium-mar#Current_State|~{{:Apertium-mar/stats/average}}%]]
 
|-
 
|-
 
|}
 
|}

Revision as of 06:31, 18 December 2019

The Indian languages belong to six language families: Indo-Aryan language family,Austroasiatic language family,Dravidian language family, Sino-Tibetan language family,Tai–Kadai language family and Great Andamanese languages.

Status

Name Language Stems Covergae Loctaion
Apertium-hin Hindi 37,833 ~83.1% Apertium-hin
Apertium-urd Urdu 14,943 ~64.6% Apertium-urd


Transducers

name Language native name ISO 639 formalism state stems coverage
-1 -3
apertium-hin Hindi हिन्दी hi hin HFST (lexc+twol) working 37,833 ~94.5%
apertium-mar मराठी mr mar HFST (lexc+twol) working 14,886 [[Apertium-mar#Current_State|~Apertium-mar/stats/average%]]

Existing language pairs

Text in italics denotes language pairs in the incubator. Regular text denotes a developing language pair in staging, while text in bold denotes a stable well-working language pair in trunk and text in bold and italics denotes a pair in staging. Bidix stems as counted with dixcounter are displayed below.

eng hin
eng - eng-hin
hin eng-hin
-
asm asm-eng
?
as-hi
833
ben bn-en
bn-hi
guj guj-hin
mal mal-eng
9,095
mar mar-eng
102
mar-hin
pan pa-hi
snd snd-hin
tel eng-tel
1
urd 'urd-hin
'


Indian languages by subgroup

Vulnerability

This table summarizes the vulnerability of various Indian languages. Vulnerability data is derived from the ‘Atlas of the World’s Languages in Danger, © UNESCO, http://www.unesco.org/culture/languages-atlas’,IASSCORE and Wikipedia.



Most widely spoken languages of India

  1. Hindi
  2. English
  3. Bengali
  4. Marathi
  5. Telegu
  6. Tamil
  7. Malayalam
  8. Kashmiri
  9. Urdu
  10. Sanskrit

Samples

Article 1 of the Universal Declaration of Human Rights:

All human beings are born free and equal in dignity and rights. They are endowed with reason and conscience and should act towards one another in a spirit of brotherhood.

Language Text
Hindi सभी मनुष्यों को गौरव और अधिकारों के मामले में जन्मजात स्वतन्त्रता और समानता प्राप्त है । उन्हें बुद्धि और अन्तरात्मा की देन प्राप्त है और परस्पर उन्हें भाईचारे के भाव से बर्ताव करना चाहिए ।
Marathi सर्व मानवी व्यक्ति जन्मतःच स्वतंत्र आहेत व त्यांना समान प्रतिष्ठा व समान अधिकार आहेत. त्यांना विचारशक्ति व सदसविद्वेकबुद्धि लाभलेली आहे. व त्यांनी एकमेकांशी बंधुत्याच्या भावनेने आचरण करावे.
Sanskrit सर्वे मानवाः स्वतन्त्राः समुत्पन्नाः वर्तन्ते अपि च, गौरवदृशा अधिकारदृशा च समानाः एव वर्तन्ते। एते सर्वे चेतना-तर्क-शक्तिभ्यां सुसम्पन्नाः सन्ति। अपि च, सर्वेऽपि बन्धुत्व-भावनया परस्परं व्यवहरन्तु।
Urdu تمام انسان آزاد اور حقوق و عزت کے اعتبار سے برابر پیدا ہوئے ہیں۔ انہیں ضمیر اور عقل ودیعت ہوئی ہے۔ اس لئے انہیں ایک دوسرے کے ساتھ بھائی چارے کا سلوک کرنا چاہیئے۔
Bangla সমস্ত মানুষ স্বাধীনভাবে সমান মর্যাদা এবং অধিকার নিয়ে জন্মগ্রহণ করে। তাঁদের বিবেক এবং বুদ্ধি আছে; সুতরাং সকলেরই একে অপরের প্রতি ভ্রাতৃত্বসুলভ মনোভাব নিয়ে আচরণ করা উচিত।
Gujarati પ્રતિષ્ઠા અને અધિકારોની દૃષ્ટિએ સર્વ માનવો જન્મથી સ્વતંત્ર અને સમાન હોય છે. તેમનામાં વિચારશક્તિ અને અંતઃકરણ હોય છે અને તેમણે પરસ્પર બંધુત્વની ભાવનાથી વર્તવું જોઇએ.
Punjabi ਸਾਰਾ ਮਨੁੱਖੀ ਪਰਿਵਾਰ ਆਪਣੀ ਮਹਿਮਾ, ਸ਼ਾਨ ਅਤੇ ਹੱਕਾਂ ਦੇ ਪੱਖੋਂ ਜਨਮ ਤੋਂ ਹੀ ਆਜ਼ਾਦ ਹੈ ਅਤੇ ਸੁਤੇ ਸਿੱਧ ਸਾਰੇ ਲੋਕ ਬਰਾਬਰ ਹਨ । ਉਨ੍ਹਾਂ ਸਭਨਾ ਨੂੰ ਤਰਕ ਅਤੇ ਜ਼ਮੀਰ ਦੀ ਸੌਗਾਤ ਮਿਲੀ ਹੋਈ ਹੈ ਅਤੇ ਉਨ੍ਹਾਂ ਨੂੰ ਭਰਾਤਰੀਭਾਵ ਦੀ ਭਾਵਨਾ ਰਖਦਿਆਂ ਆਪਸ ਵਿਚ ਵਿਚਰਣਾ ਚਾਹੀਦਾ ਹੈ ।
Kannada ಎಲ್ಲಾ ಮಾನವರೂ ಸ್ವತಂತ್ರರಾಗಿಯೇ ಜನಿಸಿದ್ದಾರೆ. ಹಾಗೂ ಘನತೆ ಮತ್ತು ಹಕ್ಕುಗಳಲ್ಲಿ ಸಮಾನರಾಗಿದ್ದಾರೆ. ವಿವೇಕ ಮತ್ತು ಅಂತಃಕರಣಗಳನ್ನು ಪಡೆದವರಾದ್ದರಿಂದ ಅವರು ಪರಸ್ಪರ ಸಹೋದರ ಭಾವದಿಂದ ವರ್ತಿಸಬೇಕು.
Malayalam മനുഷ്യരെല്ലാവരും തുല്യാവകാശങ്ങളോടും അന്തസ്സോടും സ്വാതന്ത്ര്യത്തോടുംകൂടി ജനിച്ചിട്ടുള്ളവരാണ്‌. അന്യോന്യം ഭ്രാതൃഭാവത്തോടെ പെരുമാറുവാനാണ്‌ മനുഷ്യന്നു വിവേകബുദ്ധിയും മനസ്സാക്ഷിയും സിദ്ധമായിരിക്കുന്നത്‌.
Telegu ప్రతిపత్తిస్వత్వముల విషయమున మానవులెల్లరును జన్మతః స్వతంత్రులును సమానులును నగుదురు. వారు వివేచన-అంతఃకరణ సంపన్నులగుటచే పరస్పరము భ్రాతృభావముతో వర్తింపవలయును.
Tamil எல்லா மனிதர்களும் ஒருவருக்கொருவர் தொடர்பில் சுதந்திரமாகவும், சமமாகவும், சமமாகவும் பிறந்தவர்கள். அவர்கள் புத்திஜீவிகள் வாரியாக இருக்க பரஸ்பரம் சாய்ந்திருக்க வேண்டும்.