Difference between revisions of "Annotation guidelines for Kazakh"

From Apertium
Jump to navigation Jump to search
 
(27 intermediate revisions by 3 users not shown)
Line 5: Line 5:
 
==Nominal compounds==
 
==Nominal compounds==
   
  +
When choosing between {{tag|attr}} and {{tag|nom}} in noun1-noun2 compounds, the choice basically depends on if noun2 is marked for possession. If it is marked for possession then you should chose {{tag|nom}}, if not, then choose {{tag|attr}}.
<!-- N N compounds (attr) -->
 
  +
<!-- indef. izafet -->
 
  +
* {{tag|attr}}:
<!-- def. izafet -->
 
  +
** '''көрші''' елдер
  +
* {{tag|nom}}:
  +
** '''əлем''' чемпионаты
  +
  +
However, there are cases when noun2 is marked for possession but noun1 is not its possessor, e.g.
  +
"жазба әдебиеті" in a phrase "қазақ жазба әдебиеті".
  +
<pre>
  +
қазақ жазба әдебиеті
  +
Kazakh.NOM written.ATTR literature.3SG
  +
</pre>
  +
If we blindly applied the above rule for "жазба әдебиеті", then we would tag "жазба" as {{tag|nom}}, but actually "әдебиеті" is possessed by "қазақ", not by "жазба".
  +
Moreover, it is possible to drop "i" in "жазба әдебиеті", thus "жазба" is {{tag|attr}}.
  +
  +
  +
  +
<!-- def. izafet: Иранның экономиясы-->
   
 
==Specific words==
 
==Specific words==
Line 13: Line 29:
 
==="-DA"===
 
==="-DA"===
   
The word "-DA" can be a conjunction, joining two noun/verb phrases, or a postadverb, meaning 'also'.
+
The word "-DA" can be a conjunction or a postadverb:
   
  +
* <code>cnjcoo</code> [joins two or more noun/verb phrases; it's conjoining two parallel things in the same phrase, as opposed to saying that it's adding one thing to something from before]
* <code>cnjcoo</code>
 
 
** Үстелде қалам '''да''', қарындаш '''та''', дәптер '''де''' жатыр.
 
** Үстелде қалам '''да''', қарындаш '''та''', дәптер '''де''' жатыр.
 
** Абай әуелі ауылдағы Ғабитхан молдадан сауатын ашады '''да''', 10 жасқа толған соң 3 жыл Семейдегі Ахмет Риза медресесінде оқиды.
 
** Абай әуелі ауылдағы Ғабитхан молдадан сауатын ашады '''да''', 10 жасқа толған соң 3 жыл Семейдегі Ахмет Риза медресесінде оқиды.
* <code>postadverb</code>
+
* <code>postadverb</code> [means 'also', 'even', or used for emphasis]
 
** Мен '''де''' барамын.
 
** Мен '''де''' барамын.
  +
** Аузы қисық болса '''да''' байдын баласы сөйлесін.
   
 
==="бұл", "мынау", "осы", "мына", "анау", "ана", "сол"===
 
==="бұл", "мынау", "осы", "мына", "анау", "ана", "сол"===
Line 28: Line 45:
 
** '''Мынау''' үй жаңа.
 
** '''Мынау''' үй жаңа.
 
* <code>prn</code>
 
* <code>prn</code>
** '''Мынау''' терезе емес.
+
** '''Мынау''' терезе емес.
 
[[Category:Kazakh]]
 
[[Category:Kazakh]]
  +
  +
The way to tell is whether it's part of the following noun phrase (det dem) or separate from it (prn)
   
 
===Verbs in dictionary form===
 
===Verbs in dictionary form===
Line 40: Line 59:
   
 
With gerunds you often get embedded arguments, like "кітап" in the example above.
 
With gerunds you often get embedded arguments, like "кітап" in the example above.
  +
  +
If there is an adjective or determiner preceding: noun.
  +
  +
Some cases are ambiguous: Балалардың '''оқу'''ы жақсы болды. Here, it's unclear whether бала is the subject of a verbal noun or the possessor of a noun. In cases like this, the context can sometimes provide some intuition; e.g., in "Балалардың '''оқу'''ы басталды.", оқу seems more like a noun and less like a gerund. In such ambiguous cases, if you have an intuition, go with that. If not, go with verbal noun (the reason being that we would need more things in our lexicon, and also that these "noun" are derived from verbs anyway).
  +
  +
===Perfect participle or Verbal adverb===
  +
  +
Perfect participle (<code>prc_perf</code>) if there is an auxiliary following, otherwise verbal adverb (<code>gna_perf</code>)
 
* <code>prc_perf</code>
  +
** Ол кәзір '''ұйықтап''' жатыр.
  +
* <code>gna_perf</code>
  +
** Мектепті '''бітіріп''', университетке түстім.
  +
** Орталық Азиядан арий тайпалары '''келіп''' қоныстанды.
  +
There is also other evidence that ''келіп'' in the example above is a verbal adverb: In particular, you can put arguments/adjuncts of ''қоныстанды'' between ''келіп'' and ''қоныстанды'', like "Орталық Азиядан арий тайпалары келіп бұл аймақта қоныстанды." In this case the two verbs function
  +
as separate predicates, which participle+auxiliary constructions don't do.
  +
  +
==Futher reading==
  +
  +
* http://web.stanford.edu/~lelia/krejci_glass.pdf

Latest revision as of 17:35, 19 February 2016

Verbal noun or noun[edit]

Nominal compounds[edit]

When choosing between <attr> and <nom> in noun1-noun2 compounds, the choice basically depends on if noun2 is marked for possession. If it is marked for possession then you should chose <nom>, if not, then choose <attr>.

  • <attr>:
    • көрші елдер
  • <nom>:
    • əлем чемпионаты

However, there are cases when noun2 is marked for possession but noun1 is not its possessor, e.g. "жазба әдебиеті" in a phrase "қазақ жазба әдебиеті".

қазақ       жазба          әдебиеті
Kazakh.NOM  written.ATTR   literature.3SG

If we blindly applied the above rule for "жазба әдебиеті", then we would tag "жазба" as <nom>, but actually "әдебиеті" is possessed by "қазақ", not by "жазба". Moreover, it is possible to drop "i" in "жазба әдебиеті", thus "жазба" is <attr>.



Specific words[edit]

"-DA"[edit]

The word "-DA" can be a conjunction or a postadverb:

  • cnjcoo [joins two or more noun/verb phrases; it's conjoining two parallel things in the same phrase, as opposed to saying that it's adding one thing to something from before]
    • Үстелде қалам да, қарындаш та, дәптер де жатыр.
    • Абай әуелі ауылдағы Ғабитхан молдадан сауатын ашады да, 10 жасқа толған соң 3 жыл Семейдегі Ахмет Риза медресесінде оқиды.
  • postadverb [means 'also', 'even', or used for emphasis]
    • Мен де барамын.
    • Аузы қисық болса да байдын баласы сөйлесін.

"бұл", "мынау", "осы", "мына", "анау", "ана", "сол"[edit]

The word "бұл" (along with "мынау", "осы", "мына", "анау", "ана", "сол") can be either a determiner, modifying a noun phrase, or a pronoun, replacing a noun phrase.

  • det.dem
    • Мынау үй жаңа.
  • prn
    • Мынау — терезе емес.

The way to tell is whether it's part of the following noun phrase (det dem) or separate from it (prn)

Verbs in dictionary form[edit]

A verb in a dictionary form (gerund) can sometimes be a noun.

  • ger
    • Кітап оқу адамдарды ақылдырақ етеді.
  • n
    • Оқу басталды.

With gerunds you often get embedded arguments, like "кітап" in the example above.

If there is an adjective or determiner preceding: noun.

Some cases are ambiguous: Балалардың оқуы жақсы болды. Here, it's unclear whether бала is the subject of a verbal noun or the possessor of a noun. In cases like this, the context can sometimes provide some intuition; e.g., in "Балалардың оқуы басталды.", оқу seems more like a noun and less like a gerund. In such ambiguous cases, if you have an intuition, go with that. If not, go with verbal noun (the reason being that we would need more things in our lexicon, and also that these "noun" are derived from verbs anyway).

Perfect participle or Verbal adverb[edit]

Perfect participle (prc_perf) if there is an auxiliary following, otherwise verbal adverb (gna_perf)

  • prc_perf
    • Ол кәзір ұйықтап жатыр.
  • gna_perf
    • Мектепті бітіріп, университетке түстім.
    • Орталық Азиядан арий тайпалары келіп қоныстанды.

There is also other evidence that келіп in the example above is a verbal adverb: In particular, you can put arguments/adjuncts of қоныстанды between келіп and қоныстанды, like "Орталық Азиядан арий тайпалары келіп бұл аймақта қоныстанды." In this case the two verbs function as separate predicates, which participle+auxiliary constructions don't do.

Futher reading[edit]