Turkish and Azerbaijani
Noun morphology
Turkish has several cases:
absolute, definite-accusative, dative, locative, ablative, genitive
It also has pronominal clitics.
Typically these are applied in the following order:
- plural suffix
- suffix of possession
- case-ending
- personal suffix
kitap for ex. is the stem kitap + plural + pronoun kitaplar is the "books" a noun has five cases object direction is the "i case" give me that book for ex. bana o kitabı ver "that book" kitabı that is directed to object from that book = kitaptan in that book = kitapta "from my book" kitab+ım+dan "from my books" kitap+lar+ım+dan
Agglutination case
verb= gitmek stem=git
I'm going = gidiyorum (tr) = gidirem (azerbaijani) gid+iyor+um (present continous, pr1, turkish) gid+ir+em (present continous, pr1, azerbaijani) git (lemma) -i -yor (for continous tense) -um (for first personal pronoun) (turkish) git (lemma) -i -r(for continous tense) -em (for first personal pronoun) (azerbaijani)
Vowel harmony
- See also: Vowel harmony
Both Turkish and Azerbaijani, along with most other Turkic languages exhibit vowel harmony. See the following table of inflections for the word pivə, "beer" in Azerbaijani. Underscore indicates a vowel that has been "harmonised".
Azerbaijani | Gloss |
---|---|
pivə | beer |
pivələr | beers |
pivələrim | my beers |
pivədən | from beer |
pivələrdən | from beers |
This will pose a problem for both analysis and generation of word forms. In analysis it is possible to overanlayse words, e.g. say have a paradigm for "a → e" for the plural ending -ler, which would accept both -ler and -lar. Then we would analyse both the correct form: biralar and an incorrect form biraler. This causes problems because of ambiguity (we shouldn't be analysing non-existant words!), especially on short words. It remains to be seen if this ambiguity will be too great.
One example of ambiguity would be with the word for "book", kitab. The form kitabı means "his book", but the form kitabi (or kitabî) means "bookish". This should not be too much of a problem as the two are different parts of speech and should be taken care of in the tagging stage.
The other problem is generation, we do not currently have a way in apertium to enforce vowel harmony, it may be possible to use an alternate spell-checker to do this (e.g. hunspell
has specialised algorithms for both Azerbaijani and Turkish, or possible we could use post-gen or write a new post-gen module for this.
Test case
- Turkish: biram var.
- Azerbaijani: pivəm var
beer+p1 have
I have a beer.
- Turkish: iki biram var
- Azerbijani: iki pivəm var
two beer+p1 have
I have two beers
Noun
abs
— absolutedac
— definite-accusativedat
— dativeabl
— ablativeloc
— locativegen
— genitivecom
— comitative
Underlined denotes the affix.
Turkish
person | n.sg.abs | n.sg.dac | n.sg.dat | n.sg.loc | n.sg.abl | n.sg.gen | n.sg.com |
---|---|---|---|---|---|---|---|
none | bira | birayı | biraya | birada | biradan | biranın | birayla |
p1.sg | biram | biramı | birama | biramda | biramdan | biramın | biramla |
p2.sg | biran | biranı | birana | biranda | birandan | biranın | biranla |
p3.sg | birası | birasını | birasına | birasında | birasından | birasının | birasıyla |
p1.pl | biramız | biramızı | biramıza | biramızda | biramızdan | biramızın | biramızla |
p2.pl | biranız | biranızı | biranıza | biranızda | biranızdan | biranızın | biranızla |
p3.pl | birası | birasını | birasına | birasında | birasından | birasının | birasıyla |
person | n.pl.abs | n.pl.dac | n.pl.dat | n.pl.loc | n.pl.abl | n.pl.gen | n.pl.com |
none | biralar | biraları | biralara | biralarda | biralardan | biraların | biralarla |
p1.sg | biralarım | biralarımı | biralarıma | biralarımda | biralarımda | biralarımın | biralarımla |
p2.sg | biraların | biralarını | biralarına | biralarında | biralarından | biralarının | biralarınla |
p3.sg | biraları | biralarını | biralarına | biralarında | biralarından | biralarının | biralarınla |
p1.pl | biralarımız | biralarımızı | biralarımıza | biralarımızda | biralarımızdan | biralarımızın | biralarmızla |
p2.pl | biralarınız | biralarınızı | biralarınıza | biralarınızda | biralarınızdan | biralarınızın | biralarınızla |
p3.pl | biraları | biralarını | biralarına | biralarında | biralarından | biralarının | biralarıyla |
The consonants with black are only there to combine the vowels next to them, they don't belong this form. If the stem (the noun in this case) ends with consonant, those extra letters will fall. For example if the word is tabut (which ends with the letter t) n.sg.dac without person case will be tabutu (u is because of the harmonization).
Kitab
Azerbaijani
person | n.sg.abs | n.sg.dac | n.sg.dat | n.sg.loc | n.sg.abl | n.sg.gen | |
---|---|---|---|---|---|---|---|
"none" | kitab | kitabı | kitaba | kitaba | kitapdan | kitabın | kitabla |
p1.sg | kitabım | kitabımı | kitabıma | kitabımda | kitabımdan | kitabımın | kitabımla |
p2.sg | kitabın | kitabını | kitabına | kitabında | kitabdan | kitabın | kitabla |
p3.sg | kitabı | kitabını | kitabına | kitabında | kitabından | kitabının | kitabıyla |
p1.pl | kitabımız | kitabımızı | kitabımıza | kitabımızda | kitabımızdan | kitabımızın | kitabımızla |
p2.pl | kitabınız | kitabınızı | kitabınıza | kitabınızda | biranızdan | kitabınızın | kitabınızla |
p3.pl | kitabı | kitabını | kitabına | kitabında | kitabından | kitabının | kitabıyla |
person | n.pl.abs | n.pl.dac | n.pl.dat | n.pl.loc | n.pl.abl | n.pl.gen | |
none | kitablar | kitabları | kitablara | kitablarda | kitablardan | kitabların | kitablarla |
p1.sg | kitablarım | kitablarımı | kitablarıma | kitablarımda | kitablarımda | kitablarımın | kitablarımla |
p2.sg | kitabların | kitablarını | kitablarına | kitablarında | kitablarından | kitablarının | kitablarınla |
p3.sg | kitabları | kitablarını | kitablarına | kitablarında | kitablarından | kitablarının | kitablarınla |
p1.pl | kitablarımız | kitablarımızı | kitablarımıza | kitablarımızda | kitablarımızdan | kitablarımızın | kitablarımızla |
p2.pl | kitablarınız | kitablarınızı | kitablarınıza | kitablarınızda | kitablarınızdan | kitablarınızın | kitablarınızla |
p3.pl | kitabları | kitablarını | kitablarına | kitablarında | kitablarından | kitablarının | kitablarıyla |
person | n.sg.abs | n.sg.dac | n.sg.dat | n.sg.loc | n.sg.abl | n.sg.gen | n.sg.com |
---|---|---|---|---|---|---|---|
none | pivə | ||||||
p1.sg | pivəm | ||||||
p2.sg | |||||||
p3.sg | |||||||
p1.pl | |||||||
p2.pl | |||||||
p3.pl | |||||||
person | n.pl.abs | n.pl.dac | n.pl.dat | n.pl.loc | n.pl.abl | n.pl.gen | n.pl.com |
none | pivəler | ||||||
p1.sg | pivələrim | ||||||
p2.sg | |||||||
p3.sg | |||||||
p1.pl | |||||||
p2.pl | |||||||
p3.pl | |||||||
Comparison
Turkish | Azerbaijani | Gloss | Symbols |
---|---|---|---|
bira | pivə | beer | n.sg
|
biralar | pivələr | beers | n.pl
|
biram | pivəm | my beer | n.sg.p1
|
biralarım | pivələrim | my beers | n.pl.p1
|
biradan | pivədən | from the beer | n.sg.abl
|
biralardan | pivələrdən | from the beers | n.pl.abl
|
biramdan | pivəmdən | from my beer | n.sg.p1.abl
|
biralarımdan | pivlərimdən | from my beers | n.pl.p1.abl
|
Verb
Turkish | Azerbaijani | Gloss |
---|---|---|
içerim | içirəm | I drink |
içersin | içirsən | You drink |
içer | içir | He drinks |
içer | içir | She drinks |
içer | içir | It drinks |
içersiniz | içirsiz | You (pl.) drink |
içeriz | içirik | We drink |
içerler | içirlər | They drink |
Symbols
All tenses have 4 forms,
- Affirmative stative (
aff.stat
) - Affirmative interrogative (
aff.int
) - Negative stative (
neg.stat
) - Negative interrogative (
neg.int
)
And here is the list by mood, then tense:
- Indicative mood
- Present Continuous Simple Tense (
pres.cont
) - Simple (Aorist) Tense (
pres
) - Past Definite
- Past Progressive, dubitative
- Indefinite Past (Past Aorist)
- Past Progressive, narrative (
past.cont.nar
) - Past Perfect, narrative
- Doubtful Distant Past (
ddp
) - Past in the Future
- Past Conditional, narrative (
past.cond.nar
) - Past Conditional, dubitative (
past.cond.dub
) - Future Simple
- Future in the Past
- Future dubitative
- Future conditional
- Present Continuous Simple Tense (
- Imperative mood (
imp
)- Simple Tense (
imp.pres
)
- Simple Tense (
- Conditional mood (
cond
)- Simple Tense (
cond.pres
) - Present Progressive (
cond.cont
- Aorist/Present
- Past Definite
- Indefinite Past
- Simple Tense (
- Subjunctive mood (
subj
)- Simple Tense (
subj.pres
) - Past, narrative (
subj.past.nar
) - Past, reportative (
subj.past.rep
)
- Simple Tense (
- Necessitative mood tenses (
nec
)- Simple Tense (
nec.pres
) - Past, Narrative (
nec.past.nar
) - Past, dubitative (
nec.past.dub
)
- Simple Tense (
Examples
- Turkish
Bütün insanlar hür, haysiyet ve haklar bakımından eşit doğarlar. Akıl ve vicdana sahiptirler ve birbirlerine karşı kardeşlik zihniyeti ile hareket etmelidirler.
- Azerbaijani
Bütün insanlar ləyaqət və hüquqlarına görə azad və bərabər doğulurlar. Onların şüuralrı və vicdanları var və bir-birlərinə münasibətdə qardaşlıq runhunda davranmalıdırlar.
- Azerbaijani (turkified)
Bütün insanlar azadlıq, ləyaqət və haqlarına görə bərabər doğulurlar. Onların ağılları və vicdanları var və onlar bir-birlərinə münasibətdə qardaşlıq ruhunda davranmalıdırlar.
An example to show that there is not a widely need of word reorder.
- Turkish
Bilişim ve haberleşe teknolijlerinin asıl altyapı göstergelerinde biri olan telefon iletişimi ülke halkının en çok istifade ettiği iletişim aracı olmaya devam etmektedir.
- Azerbaijani
İnformasiya və kommunikasiya texnologiyalarının əsas infrastruktur göstəricilərindən biri olan telefon rabitəsi ölkə əhalisinin ən çox istifadə etdiyi rabitə vasitəsi olmakda davam edir.
- English
The telephone communication which is one the essential infrasturtucre indicators of information and telecommunication, continues to be one of the most utilized communication device by the people of the country.