Difference between revisions of "Apertium-sah"

From Apertium
Jump to navigation Jump to search
(Created page with "==Current status== {{LangStats | lang = sah | corpus1 = wikipedia }} Category:Yakut")
 
 
(19 intermediate revisions by 3 users not shown)
Line 1: Line 1:
 
==Current status==
 
==Current status==
   
{{LangStats | lang = sah | corpus1 = wikipedia }}
+
{{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }}
   
  +
==To do==
[[Category:Yakut]]
 
  +
  +
1.
  +
  +
<pre>^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$</pre>
  +
  +
should be: сөбүлээ - cөбүл'''үү'''р, үҥкүлээ - үҥкүл'''үү'''р, көрүлээ - көрүл'''үү'''р, ...
  +
  +
үөскээ - үөск'''үү'''р
  +
  +
2.
  +
  +
уһун<v><iv><aor><p3><sg> - уһунар; should be: устар
  +
  +
таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар
  +
  +
сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар
  +
  +
3. Contracted forms
  +
  +
нэһилиэгигэр -> нэһилиэгэр
  +
  +
олоҕугар -> олоҕор
  +
  +
түмүгүгэр -> түмүгэр
  +
  +
өрүтүгэр -> өттүгэр
  +
  +
үөрэҕигэр -> үөрэҕэр
  +
  +
суругугар -> суругар
  +
  +
атаҕыгар -> атаҕар
  +
  +
бөлөҕүгэр -> бөлөҕөр
  +
  +
каталогыгар -> каталогар
  +
  +
4.
  +
  +
дьахтар<n><pl><nom> дьахта'''рд'''ар
  +
  +
should be: дьахта'''лл'''ар
  +
  +
5. where to add частицы:
  +
* эбит, илик
  +
  +
Оҥоро иликпин "Я ещё не сделал";
  +
  +
Оҥоро иликкин "Ты ещё не сделал";
  +
  +
Оҥоро иликпит "Мы ещё не сделали";
  +
  +
Кэлбит эбиттэр "Они, оказывается, пришли"
  +
  +
* соҕус
  +
  +
ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;
  +
  +
6.
  +
  +
спорт - N5 спортын - N1 спортун - спордун - which form is correct?
  +
  +
торт - N5 тортын - N1 тортун - тордун - which form is correct?
  +
  +
7. where to add?
  +
  +
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;
  +
  +
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе
  +
  +
8.
  +
  +
сорох:сорох DET-IND ; ! "некоторый"
  +
  +
сорохтор, сорохторо
  +
  +
9. ger plus dat
  +
  +
оҥорорго, барарга
  +
  +
10. буолуо, буолуон
  +
  +
11. буоллар
  +
 
[[Category:Sakha]]

Latest revision as of 14:45, 6 July 2018

Current status[edit]

{{#set_param_default | corpus1 | None }} {{#set_param_default | corpus2 | None }} {{#set_param_default | corpus3 | None }} {{#set_param_default | corpus4 | None }} {{#set_param_default | corpus5 | None }} {{#set_param_default | corpus6 | None }} {{#set_param_default | corpus7 | None }} {{#set_param_default | corpus8 | None }} {{#set_param_default | corpus9 | None }} {{#set_param_default | corpus10 | None }}

  • Number of stems: 11,531 {{#ifneq | | | () }}
  • Disambiguation rules: 2
  • Coverage: ~89.6%

{{#ifneq | wikipedia | None |

{{#ifneq | | | | }}

}}

{{#ifneq | kyym | None |

{{#ifneq | | | | }}

}}

{{#ifneq | udhr | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus4}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus5}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus6}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus7}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus8}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus9}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus10}}} | None |

{{#ifneq | | | | }}

}}

corpuswordscoverage
<nowinter>[[|wikipedia]]</nowinter>wikipedia1.00M ~87.46%
<nowinter>[[|kyym]]</nowinter>kyym1.02M ~88.19%
<nowinter>[[|udhr]]</nowinter>udhr1.7K ~93.00%
<nowinter>[[|{{{corpus4}}}]]</nowinter>{{{corpus4}}} ~%
<nowinter>[[|{{{corpus5}}}]]</nowinter>{{{corpus5}}} ~%
<nowinter>[[|{{{corpus6}}}]]</nowinter>{{{corpus6}}} ~%
<nowinter>[[|{{{corpus7}}}]]</nowinter>{{{corpus7}}} ~%
<nowinter>[[|{{{corpus8}}}]]</nowinter>{{{corpus8}}} ~%
<nowinter>[[|{{{corpus9}}}]]</nowinter>{{{corpus9}}} ~%
<nowinter>[[|{{{corpus10}}}]]</nowinter>{{{corpus10}}} ~%

To do[edit]

1.

^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$

should be: сөбүлээ - cөбүлүүр, үҥкүлээ - үҥкүлүүр, көрүлээ - көрүлүүр, ...

үөскээ - үөскүүр

2.

уһун<v><iv><aor><p3><sg> - уһунар; should be: устар

таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар

сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар

3. Contracted forms

нэһилиэгигэр -> нэһилиэгэр

олоҕугар -> олоҕор

түмүгүгэр -> түмүгэр

өрүтүгэр -> өттүгэр

үөрэҕигэр -> үөрэҕэр

суругугар -> суругар

атаҕыгар -> атаҕар

бөлөҕүгэр -> бөлөҕөр

каталогыгар -> каталогар

4.

дьахтар<n><pl><nom> дьахтардар

should be: дьахталлар

5. where to add частицы:

  • эбит, илик

Оҥоро иликпин "Я ещё не сделал";

Оҥоро иликкин "Ты ещё не сделал";

Оҥоро иликпит "Мы ещё не сделали";

Кэлбит эбиттэр "Они, оказывается, пришли"

  • соҕус

ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;

6.

спорт - N5 спортын - N1 спортун - спордун - which form is correct?

торт - N5 тортын - N1 тортун - тордун - which form is correct?

7. where to add?

оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;

бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе

8.

сорох:сорох DET-IND ; ! "некоторый"

сорохтор, сорохторо

9. ger plus dat

оҥорорго, барарга

10. буолуо, буолуон

11. буоллар