Turkish and Azerbaijani

From Apertium
Jump to navigation Jump to search

Noun morphology

Turkish has several cases:

absolute, definite-accusative, dative, locative, ablative, genitive

It also has pronominal clitics.

Typically these are applied in the following order:

  1. plural suffix
  2. suffix of possession
  3. case-ending
  4. personal suffix
kitap for ex. is the stem
kitap + plural + pronoun 
kitaplar is the "books"

a noun has five cases

object direction is the "i case"

give me that book for ex.
bana o kitabı ver

"that book"
o kitabı 

that is directed to object

from that book = o kitaptan
in that book = o kitapta

"from my book"
kitab+ım+dan

"from my books"
kitap+lar+ım+dan

Agglutination case

verb= gitmek stem=git

I'm going = gidiyorum (tr) 
          = gidirem (azerbaijani)

gid+iyor+um (present continous, pr1, turkish)
ge+di+rem  (present continous, pr1, azerbaijani)

git (lemma) -i -yor (for continous tense) -um (for first personal pronoun)   (turkish)
git (lemma) -i -r(for continous tense)  -em (for first personal pronoun)  (azerbaijani)

Vowel harmony

See also: Vowel harmony

Both Turkish and Azerbaijani, along with most other Turkic languages exhibit vowel harmony. See the following table of inflections for the word pivə, "beer" in Azerbaijani. Underscore indicates a vowel that has been "harmonised".

Azerbaijani Gloss
pivə beer
pivələr beers
pivələrim my beers
pivədən from beer
pivələrdən from beers

This will pose a problem for both analysis and generation of word forms. In analysis it is possible to overanlayse words, e.g. say have a paradigm for "a → e" for the plural ending -ler, which would accept both -ler and -lar. Then we would analyse both the correct form: biralar and an incorrect form biraler. This causes problems because of ambiguity (we shouldn't be analysing non-existant words!), especially on short words. It remains to be seen if this ambiguity will be too great.

One example of ambiguity would be with the word for "book", kitab. The form kitabı means "his book", but the form kitabi (or kitabî) means "bookish". This should not be too much of a problem as the two are different parts of speech and should be taken care of in the tagging stage.

The other problem is generation, we do not currently have a way in apertium to enforce vowel harmony, it may be possible to use an alternate spell-checker to do this (e.g. hunspell has specialised algorithms for both Azerbaijani and Turkish, or possible we could use post-gen or write a new post-gen module for this.

Test case

  • Turkish: biram var.
  • Azerbaijani: pivəm var

beer+p1 have

I have a beer.

  • Turkish: iki biram var
  • Azerbijani: iki pivəm var

two beer+p1 have

I have two beers

Noun

  • abs — absolute
  • dac — definite-accusative
  • dat — dative
  • abl — ablative
  • loc — locative
  • gen — genitive
  • com — comitative

Underlined denotes the affix.

Turkish

Bira
person n.sg.abs n.sg.dac n.sg.dat n.sg.loc n.sg.abl n.sg.gen n.sg.com
none bira birayı biraya birada biradan biranın birayla
p1.sg biram bira birama biramda biramdan biramın biramla
p2.sg biran biranı birana biranda birandan biranın biranla
p3.sg bira birasını birasına birasında birasından birasının birasıyla
p1.pl biramız biramızı biramıza biramızda biramızdan biramızın biramızla
p2.pl biranız biranızı biranıza biranızda biranızdan biranızın biranızla
p3.pl bira birasını birasına birasında birasından birasının birasıyla
person n.pl.abs n.pl.dac n.pl.dat n.pl.loc n.pl.abl n.pl.gen n.pl.com
none biralar biraları biralara biralarda biralardan biraların biralarla
p1.sg biralarım biralarımı biralarıma biralarımda biralarımda biralarımın biralarımla
p2.sg biraların biralarını biralarına biralarında biralarından biralarının biralarınla
p3.sg biraları biralarını biralarına biralarında biralarından biralarının biralarınla
p1.pl biralarımız biralarımızı biralarımıza biralarımızda biralarımızdan biralarımızın biralarmızla
p2.pl biralarınız biralarınızı biralarınıza biralarınızda biralarınızdan biralarınızın biralarınızla
p3.pl biraları biralarını biralarına biralarında biralarından biralarının biralarıyla

The consonants with black are only there to combine the vowels next to them, they don't belong this form. If the stem (the noun in this case) ends with consonant, those extra letters will fall. For example if the word is tabut (which ends with the letter t) n.sg.dac without person case will be tabutu (u is because of the harmonization).

Kitab

Azerbaijani

person n.sg.abs n.sg.dac n.sg.dat n.sg.loc n.sg.abl n.sg.gen
"none" kitab kitabı kitaba kitaba kitapdan kitabın kitabla
p1.sg kitabım kitabımı kitabıma kitabımda kitabımdan kitabımın kitabımla
p2.sg kitabın kitabını kitabına kitabında kitabdan kitabın kitabla
p3.sg kitabı kitabını kitabına kitabında kitabından kitabının kitabıyla
p1.pl kitabımız kitabımızı kitabımıza kitabımızda kitabımızdan kitabımızın kitabımızla
p2.pl kitabınız kitabınızı kitabınıza kitabınızda biranızdan kitabınızın kitabınızla
p3.pl kitabı kitabını kitabına kitabında kitabından kitabının kitabıyla
person n.pl.abs n.pl.dac n.pl.dat n.pl.loc n.pl.abl n.pl.gen
none kitablar kitabları kitablara kitablarda kitablardan kitabların kitablarla
p1.sg kitablarım kitablarımı kitablarıma kitablarımda kitablarımda kitablarımın kitablarımla
p2.sg kitabların kitablarını kitablarına kitablarında kitablarından kitablarının kitablarınla
p3.sg kitabları kitablarını kitablarına kitablarında kitablarından kitablarının kitablarınla
p1.pl kitablarımız kitablarımızı kitablarımıza kitablarımızda kitablarımızdan kitablarımızın kitablarımızla
p2.pl kitablarınız kitablarınızı kitablarınıza kitablarınızda kitablarınızdan kitablarınızın kitablarınızla
p3.pl kitabları kitablarını kitablarına kitablarında kitablarından kitablarının kitablarıyla
person n.sg.abs n.sg.dac n.sg.dat n.sg.loc n.sg.abl n.sg.gen n.sg.com
none pivə pivəni pivə pivə pivədən pivənin pivəylə
p1.sg pivəm pivəmi pivə pivəmdə pivəmdən pivəmin pivəmlə
p2.sg pivən pivəni pivə pivəndə pivəndən pivənin pivənlə
p3.sg pivəsi pivəsini pivəsinə pivəsində pivəsindən pivəsinin pivəsilə
p1.pl pivəmiz pivəiz pivəmizə pivəmizdə pivəmizdən pivəmizin pivəmizlə
p2.pl pivəniz pivənizi pivənizə pivənizdə pivənizdən pivənizin pivənizlə
p3.pl pivəsi pivəsini pivəsinə pivəsində pivəsindən pivəsinin pivəsilə
person n.pl.abs n.pl.dac n.pl.dat n.pl.loc n.pl.abl n.pl.gen n.pl.com
none pivələr Pivələri Pivələrə Pivələrdə Pivələrdən Pivələrin Pivələrlə
p1.sg pivələrim Pivələrimi Pivələrəimə Pivələrimdə Pivələrdimdən Pivələrimin Pivələrimlə
p2.sg pivələrin Pivələrivi Pivələrəivə Pivələrində Pivələrdindən Pivələrivin Pivələrinlə
p3.sg pivələri Pivələrini Pivələrəinə Pivələrində Pivələrindən Pivələrinin Pivələrilə
p1.pl pivələrimiz Pivələrimizi Pivələrəimizə Pivələrimizdə Pivələrimizdən Pivələrimizin Pivələrimizlə
p2.pl pivələriniz Pivələrinizi Pivələrəinizə Pivələrinizdə Pivələrinizdən Pivələrinizin Pivələrinizlə
p3.pl pivələri Pivələrini Pivələrəinə Pivələrində Pivələrindən Pivələrinin Pivələrilə

Comparison

Turkish Azerbaijani Gloss Symbols
bira pivə beer n.sg
biralar pivələr beers n.pl
biram pivəm my beer n.sg.p1
biralarım pivələrim my beers n.pl.p1
biradan pivədən from the beer n.sg.abl
biralardan pivələrdən from the beers n.pl.abl
biramdan pivəmdən from my beer n.sg.p1.abl
biralarımdan pivələrimdən from my beers n.pl.p1.abl

Verb

Turkish Azerbaijani Gloss
içerim içirəm I drink
içersin içirsən You drink
içer içir He drinks
içer içir She drinks
içer içir It drinks
içersiniz içirsiniz You (pl.) drink
içeriz içirik We drink
içerler içirlər They drink

Symbols

All tenses have 4 forms,

  • Affirmative stative (aff.stat)
  • Affirmative interrogative (aff.int)
  • Negative stative (neg.stat)
  • Negative interrogative (neg.int)

For each of 6 persons:

  • First person, singular (p1.sg)
  • Second person, singular (p2.sg)
  • Third person, singular (p3.sg)
  • First person, plural (p1.pl)
  • Second person, plural (p2.pl)
  • Third person, plural (p3.pl)

And here is the list by mood, then tense:

  • Indicative mood
    • Present Continuous Simple Tense (pres.cont)
    • Simple (Aorist) Tense (pres)
    • Past Definite
    • Past Progressive, dubitative
    • Indefinite Past (Past Aorist)
    • Past Progressive, narrative (past.cont.nar)
    • Past Perfect, narrative
    • Doubtful Distant Past (ddp)
    • Past in the Future
    • Past Conditional, narrative (past.cond.nar)
    • Past Conditional, dubitative (past.cond.dub)
    • Future Simple
    • Future in the Past
    • Future dubitative
    • Future conditional
  • Imperative mood (imp)
    • Simple Tense (imp.pres)
  • Conditional mood (cond)
    • Simple Tense (cond.pres)
    • Present Progressive (cond.cont
    • Aorist/Present
    • Past Definite
    • Indefinite Past
  • Subjunctive mood (subj)
    • Simple Tense (subj.pres)
    • Past, narrative (subj.past.nar)
    • Past, reportative (subj.past.rep)
  • Necessitative mood tenses (nec)
    • Simple Tense (nec.pres)
    • Past, Narrative (nec.past.nar)
    • Past, dubitative (nec.past.dub)

Examples

Turkish

Bütün insanlar hür, haysiyet ve haklar bakımından eşit doğarlar. Akıl ve vicdana sahiptirler ve birbirlerine karşı kardeşlik zihniyeti ile hareket etmelidirler.

Azerbaijani

Bütün insanlar ləyaqət və hüquqlarına görə azad və bərabər doğulurlar. Onların şüuralrı və vicdanları var və bir-birlərinə münasibətdə qardaşlıq runhunda davranmalıdırlar.

Azerbaijani (turkified)

Bütün insanlar azadlıq, ləyaqət və haqlarına görə bərabər doğulurlar. Onların ağılları və vicdanları var və onlar bir-birlərinə münasibətdə qardaşlıq ruhunda davranmalıdırlar.

An example to show that there is not a widely need of word reorder.

Turkish

Bilişim ve haberleşe teknolijlerinin asıl altyapı göstergelerinde biri olan telefon iletişimi ülke halkının en çok istifade ettiği iletişim aracı olmaya devam etmektedir.

Azerbaijani

İnformasiya və kommunikasiya texnologiyalarının əsas infrastruktur göstəricilərindən biri olan telefon rabitəsi ölkə əhalisinin ən çox istifadə etdiyi rabitə vasitəsi olmakda davam edir.

English

The telephone communication which is one the essential infrasturtucre indicators of information and telecommunication, continues to be one of the most utilized communication device by the people of the country.