Difference between revisions of "Apertium-sah"
(→To do) |
(→To do) |
||
(5 intermediate revisions by the same user not shown) | |||
Line 32: | Line 32: | ||
үөрэҕигэр -> үөрэҕэр |
үөрэҕигэр -> үөрэҕэр |
||
суругугар -> суругар |
|||
атаҕыгар -> атаҕар |
|||
бөлөҕүгэр -> бөлөҕөр |
|||
каталогыгар -> каталогар |
|||
4. |
4. |
||
Line 63: | Line 71: | ||
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели; |
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели; |
||
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе |
|||
8. |
8. |
||
Line 69: | Line 79: | ||
сорохтор, сорохторо |
сорохтор, сорохторо |
||
9. ger plus dat |
|||
оҥорорго, барарга |
|||
10. буолуо, буолуон |
|||
11. буоллар |
|||
[[Category:Sakha]] |
[[Category:Sakha]] |
Latest revision as of 14:45, 6 July 2018
Current status[edit]
{{#set_param_default | corpus1 | None }} {{#set_param_default | corpus2 | None }} {{#set_param_default | corpus3 | None }} {{#set_param_default | corpus4 | None }} {{#set_param_default | corpus5 | None }} {{#set_param_default | corpus6 | None }} {{#set_param_default | corpus7 | None }} {{#set_param_default | corpus8 | None }} {{#set_param_default | corpus9 | None }} {{#set_param_default | corpus10 | None }}
- Number of stems: 11,531 {{#ifneq | | | () }}
- Disambiguation rules: 2
- Coverage: ~89.6%
{{#ifneq | wikipedia | None |
{{#ifneq | | | | }}}}
{{#ifneq | kyym | None |
{{#ifneq | | | | }}}}
{{#ifneq | udhr | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus4}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus5}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus6}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus7}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus8}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus9}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus10}}} | None |
{{#ifneq | | | | }}}}
corpus | words | coverage | |
---|---|---|---|
<nowinter>[[|wikipedia]]</nowinter> | wikipedia | 1.00M | ~87.46% |
<nowinter>[[|kyym]]</nowinter> | kyym | 1.02M | ~88.19% |
<nowinter>[[|udhr]]</nowinter> | udhr | 1.7K | ~93.00% |
<nowinter>[[|{{{corpus4}}}]]</nowinter> | {{{corpus4}}} | ~% | |
<nowinter>[[|{{{corpus5}}}]]</nowinter> | {{{corpus5}}} | ~% | |
<nowinter>[[|{{{corpus6}}}]]</nowinter> | {{{corpus6}}} | ~% | |
<nowinter>[[|{{{corpus7}}}]]</nowinter> | {{{corpus7}}} | ~% | |
<nowinter>[[|{{{corpus8}}}]]</nowinter> | {{{corpus8}}} | ~% | |
<nowinter>[[|{{{corpus9}}}]]</nowinter> | {{{corpus9}}} | ~% | |
<nowinter>[[|{{{corpus10}}}]]</nowinter> | {{{corpus10}}} | ~% |
To do[edit]
1.
^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$
should be: сөбүлээ - cөбүлүүр, үҥкүлээ - үҥкүлүүр, көрүлээ - көрүлүүр, ...
үөскээ - үөскүүр
2.
уһун<v><iv><aor><p3><sg> - уһунар; should be: устар
таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар
сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар
3. Contracted forms
нэһилиэгигэр -> нэһилиэгэр
олоҕугар -> олоҕор
түмүгүгэр -> түмүгэр
өрүтүгэр -> өттүгэр
үөрэҕигэр -> үөрэҕэр
суругугар -> суругар
атаҕыгар -> атаҕар
бөлөҕүгэр -> бөлөҕөр
каталогыгар -> каталогар
4.
дьахтар<n><pl><nom> дьахтардар
should be: дьахталлар
5. where to add частицы:
- эбит, илик
Оҥоро иликпин "Я ещё не сделал";
Оҥоро иликкин "Ты ещё не сделал";
Оҥоро иликпит "Мы ещё не сделали";
Кэлбит эбиттэр "Они, оказывается, пришли"
- соҕус
ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;
6.
спорт - N5 спортын - N1 спортун - спордун - which form is correct?
торт - N5 тортын - N1 тортун - тордун - which form is correct?
7. where to add?
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе
8.
сорох:сорох DET-IND ; ! "некоторый"
сорохтор, сорохторо
9. ger plus dat
оҥорорго, барарга
10. буолуо, буолуон
11. буоллар