Әуезов corpus

From Apertium
Revision as of 06:16, 5 December 2011 by Firespeaker (talk | contribs) (Created page with 'The Äwezov corpus is a short corpus of several works of fiction in Kazakh by Muxtar Äwezov. It's currently about 92K words and consists of the following works of the following…')
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search

The Äwezov corpus is a short corpus of several works of fiction in Kazakh by Muxtar Äwezov.

It's currently about 92K words and consists of the following works of the following sizes (in number of words):

   4052 Мұхтар Әуезов - Барымта
  13351 Мұхтар Әуезов - Абай жолы - 1. Жолда
  15283 Мұхтар Әуезов - Абай жолы - 2. Бел-белесте
  14063 Мұхтар Әуезов - Абай жолы - 3. Шытырманда
  16015 Мұхтар Әуезов - Абай жолы - 4. Қайтқанда
   9323 Мұхтар Әуезов - Абай жолы - 5. Қат - қабатта
   7401 Мұхтар Әуезов - Көксерек
   6139 Мұхтар Әуезов - Кінәшіл бойжеткен
   6326 Мұхтар Әуезов - Қорғансыздың күні
  91953 total