Difference between revisions of "Apertium-sah"

From Apertium
Jump to navigation Jump to search
 
(16 intermediate revisions by the same user not shown)
Line 2: Line 2:


{{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }}
{{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }}

==To do==

1.

<pre>^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$</pre>

should be: сөбүлээ - cөбүл'''үү'''р, үҥкүлээ - үҥкүл'''үү'''р, көрүлээ - көрүл'''үү'''р, ...

үөскээ - үөск'''үү'''р

2.

уһун<v><iv><aor><p3><sg> - уһунар; should be: устар

таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар

сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар

3. Contracted forms

нэһилиэгигэр -> нэһилиэгэр

олоҕугар -> олоҕор

түмүгүгэр -> түмүгэр

өрүтүгэр -> өттүгэр

үөрэҕигэр -> үөрэҕэр

суругугар -> суругар

атаҕыгар -> атаҕар

бөлөҕүгэр -> бөлөҕөр

каталогыгар -> каталогар

4.

дьахтар<n><pl><nom> дьахта'''рд'''ар

should be: дьахта'''лл'''ар

5. where to add частицы:
* эбит, илик

Оҥоро иликпин "Я ещё не сделал";

Оҥоро иликкин "Ты ещё не сделал";

Оҥоро иликпит "Мы ещё не сделали";

Кэлбит эбиттэр "Они, оказывается, пришли"

* соҕус

ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;

6.

спорт - N5 спортын - N1 спортун - спордун - which form is correct?

торт - N5 тортын - N1 тортун - тордун - which form is correct?

7. where to add?

оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;

бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе

8.

сорох:сорох DET-IND ; ! "некоторый"

сорохтор, сорохторо

9. ger plus dat

оҥорорго, барарга

10. буолуо, буолуон

11. буоллар


[[Category:Sakha]]
[[Category:Sakha]]

Latest revision as of 14:45, 6 July 2018

Current status[edit]

{{#set_param_default | corpus1 | None }} {{#set_param_default | corpus2 | None }} {{#set_param_default | corpus3 | None }} {{#set_param_default | corpus4 | None }} {{#set_param_default | corpus5 | None }} {{#set_param_default | corpus6 | None }} {{#set_param_default | corpus7 | None }} {{#set_param_default | corpus8 | None }} {{#set_param_default | corpus9 | None }} {{#set_param_default | corpus10 | None }}

  • Number of stems: 11,531 {{#ifneq | | | () }}
  • Disambiguation rules: 2
  • Coverage: ~89.6%

{{#ifneq | wikipedia | None |

{{#ifneq | | | | }}

}}

{{#ifneq | kyym | None |

{{#ifneq | | | | }}

}}

{{#ifneq | udhr | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus4}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus5}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus6}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus7}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus8}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus9}}} | None |

{{#ifneq | | | | }}

}}

{{#ifneq | {{{corpus10}}} | None |

{{#ifneq | | | | }}

}}

corpuswordscoverage
<nowinter>[[|wikipedia]]</nowinter>wikipedia1.00M ~87.46%
<nowinter>[[|kyym]]</nowinter>kyym1.02M ~88.19%
<nowinter>[[|udhr]]</nowinter>udhr1.7K ~93.00%
<nowinter>[[|{{{corpus4}}}]]</nowinter>{{{corpus4}}} ~%
<nowinter>[[|{{{corpus5}}}]]</nowinter>{{{corpus5}}} ~%
<nowinter>[[|{{{corpus6}}}]]</nowinter>{{{corpus6}}} ~%
<nowinter>[[|{{{corpus7}}}]]</nowinter>{{{corpus7}}} ~%
<nowinter>[[|{{{corpus8}}}]]</nowinter>{{{corpus8}}} ~%
<nowinter>[[|{{{corpus9}}}]]</nowinter>{{{corpus9}}} ~%
<nowinter>[[|{{{corpus10}}}]]</nowinter>{{{corpus10}}} ~%

To do[edit]

1.

^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$

should be: сөбүлээ - cөбүлүүр, үҥкүлээ - үҥкүлүүр, көрүлээ - көрүлүүр, ...

үөскээ - үөскүүр

2.

уһун<v><iv><aor><p3><sg> - уһунар; should be: устар

таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар

сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар

3. Contracted forms

нэһилиэгигэр -> нэһилиэгэр

олоҕугар -> олоҕор

түмүгүгэр -> түмүгэр

өрүтүгэр -> өттүгэр

үөрэҕигэр -> үөрэҕэр

суругугар -> суругар

атаҕыгар -> атаҕар

бөлөҕүгэр -> бөлөҕөр

каталогыгар -> каталогар

4.

дьахтар<n><pl><nom> дьахтардар

should be: дьахталлар

5. where to add частицы:

  • эбит, илик

Оҥоро иликпин "Я ещё не сделал";

Оҥоро иликкин "Ты ещё не сделал";

Оҥоро иликпит "Мы ещё не сделали";

Кэлбит эбиттэр "Они, оказывается, пришли"

  • соҕус

ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;

6.

спорт - N5 спортын - N1 спортун - спордун - which form is correct?

торт - N5 тортын - N1 тортун - тордун - which form is correct?

7. where to add?

оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;

бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе

8.

сорох:сорох DET-IND ; ! "некоторый"

сорохтор, сорохторо

9. ger plus dat

оҥорорго, барарга

10. буолуо, буолуон

11. буоллар