Kazakh and Tatar/Remaining unanalysed forms

From Apertium
Jump to navigation Jump to search

apertium-kaz

Әуезов

  • 70 ^ғой/*ғой$
  • 65 ^ды/*ды$
  • 58 ^жиып/*жиып$
  • 58 ^Е/*Е$
  • 57 ^Ақжелке/*Ақжелке$
  • 47 ^жиын/*жиын$
  • 43 ^ертіп/*ертіп$
  • 35 ^жиылып/*жиылып$
  • 34 ^соншалық/*соншалық$ — pronoun form
  • 30 ^ты/*ты$
  • 28 ^атаулының/*атаулының$
  • 28 ^ақырғы/*ақырғы$<attr> of ақыр<adv>
  • 27 ^е/*е$
  • 26 ^ді/*ді$
  • 26 ^ғып/*ғып$
  • 25 ^аттылар/*аттылар$ — I think this is a literary <p3><pl> past tense, which we should at least analyse
  • 23 ^бұ/*бұ$
  • 21 ^жиылған/*жиылған$
  • 20 ^кей/*кей$
  • 18 ^Тектіғұл/*Тектіғұл$
  • 18 ^О/*О$
  • 17 ^Ойбай/*Ойбай$<ij>
  • 17 ^о/*о$
  • 17 ^қамданып/*қамданып$

Is there a verb жиы- ??

bible

  • 897 ^Исраилдің/*Исраилдің$ — Исраил<cog><m> = Israel
  • 319 ^іспетті/*іспетті$
  • 242 ^Таурат/*Таурат$
  • 237 ^Иерусалимге/*Иерусалимге$ — Иерусалим<top>
  • 198 ^гөр/*гөр$
  • 177 ^Иерусалимнің/*Иерусалимнің$ — Иерусалим<top>
  • 172 ^жек/*жек$ — жек көр- ?
  • 163 ^Иерусалимде/*Иерусалимде$ — Иерусалим<top>
  • 160 ^әркім/*әркім$ — a pronoun "anyone"
  • 156 ^ертіп/*ертіп$
  • 150 ^Ей/*Ей$<ij> ?
  • 136 ^Исраилге/*Исраилге$ — Исраил<cog><m> = Israel
  • 111 ^Манаса/*Манаса$
  • 105 ^леуіліктер/*леуіліктер$ Леуі is the name of a tribe ("Levi", after a patriarch?); леуіліктер is the Levites
  • 96 ^Исраилді/*Исраилді$ — Исраил<cog><m> = Israel
  • 93 ^күнәға/*күнәға$ — this is weird
  • 89 ^шүкірлік/*шүкірлік$
  • 87 ^Еліше/*Еліше$
  • 85 ^қалайша/*қалайша$ — adverbial form of an interogative pronoun "how"/"how so"
  • 82 ^Иерусалимдегі/*Иерусалимдегі$ — Иерусалим<top>
  • 78 ^Едом/*Едом$Edom
  • 77 ^жұрттық/*жұрттық$<attr> of жұрт
  • 76 ^о/*о$
  • 75 ^қызметкерлер мен/*қызметкерлер мен$

quran

  • 975 ^С/*С$
  • 972 ^Ғ/*Ғ$
  • 177 ^ға/*ға$
  • 83 ^ерекше мейірімді/*ерекше мейірімді$
  • 75 ^нендей/*нендей$ — a pronoun form, but is it standard? literary? ...?
  • 57 ^ның/*ның$
  • 51 ^көктер мен/*көктер мен$
  • 49 ^Көктер мен/*Көктер мен$
  • 44 ^адам баласы/*адам баласы$
  • 36 ^Раббына/*Раббына$
  • 34 ^Алладан басқа/*Алладан басқа$
  • 28 ^Одан басқа/*Одан басқа$
  • 25 ^шүкірлік/*шүкірлік$
  • 25 ^адам баласына/*адам баласына$
  • 23 ^ты/*ты$
  • 20 ^ды/*ды$
  • 20 ^бұрынғылардың/*бұрынғылардың$ — бұрын<adv>+ғы<adj><subst><pl><gen>, or something like that
  • 20 ^бір мерзімге/*бір мерзімге$
  • 18 ^күндізді/*күндізді$
  • 18 ^көмес/*көмес$
  • 18 ^жек/*жек$ — жер көр- ?
  • 16 ^көместі/*көместі$
  • 16 ^бұрынғылар/*бұрынғылар$ — бұрын<adv>+ғы<adj><subst><pl>, or something like that
  • 16 ^аса дана/*аса дана$

azattyq

  • 1864 ^ның/*ның$
  • 1457 ^тың/*тың$
  • 584 ^ға/*ға$
  • 582 ^Барлау/*Барлау$
  • 574 ^нің/*нің$
  • 572 ^барлау/*барлау$
  • 552 ^болып табылады/*болып табылады$
  • 510 ^түсіндіреді/*түсіндіреді$ — түсін<v><iv><caus><aor><p3><sp>
  • 510 ^құқын/*құқын$
  • 460 ^күнге дейін/*күнге дейін$
  • 438 ^сөзінше/*сөзінше$ — hrmm
  • 426 ^пайыздық/*пайыздық$
  • 420 ^вице/*вице$ part of вице министр or вице президент or the like?
  • 415 ^жарақат/*жарақат$
  • 414 ^ауған/*ауған$ — "Afghan" as a nationality, with same endings as other nationalities (there's a lexicon for this, right?)
  • 391 ^KazakhGold/*KazakhGold$ — put this in as a company, I guess...
  • 390 ^әділ/*әділ$<adj> "just, righteous"
  • 389 ^қаншалықты/*қаншалықты$<acc> of қаншалық ← қанша<adv>
  • 380 ^тиімді/*тиімді$
  • 375 ^құжат/*құжат$
  • 375 ^әлдеқайда/*әлдеқайда$ — "somewhere"
  • 371 ^ықтимал/*ықтимал$
  • 368 ^тағылған/*тағылған$ — тақ<v><tv><pass> + various GAн forms
  • 365 ^тиек/*тиек$

Wikipedia 2011

Only the relevant stuff from the top (most stuff is single letters)

  • 665 ^болып табылады/*болып табылады$
  • 300 ^ның/*ның$
  • 278 ^ге/*ге$
  • 164 ^ДНҚ/*ДНҚ$
  • 159 ^ден/*ден$
  • 157 ^ға/*ға$
  • 153 ^ақшалай/*ақшалай$
  • 126 ^мамандығы/*мамандығы$ — мамандық = "field of specialisation / специальность"
  • 114 ^талдау/*талдау$
  • 109 ^нақтылы/*нақтылы$
  • 109 ^барлау/*барлау$
  • 106 ^жылдан бастап/*жылдан бастап$
  • 106 ^дың/*дың$
  • 99 ^сақтандыру/*сақтандыру$
  • 95 ^жеткілікті/*жеткілікті$
  • 92 ^нарықтық/*нарықтық$