Difference between revisions of "Apertium-sah"
(→To do) |
|||
(16 intermediate revisions by the same user not shown) | |||
Line 2: | Line 2: | ||
{{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }} |
{{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }} |
||
==To do== |
|||
1. |
|||
<pre>^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$</pre> |
|||
should be: сөбүлээ - cөбүл'''үү'''р, үҥкүлээ - үҥкүл'''үү'''р, көрүлээ - көрүл'''үү'''р, ... |
|||
үөскээ - үөск'''үү'''р |
|||
2. |
|||
уһун<v><iv><aor><p3><sg> - уһунар; should be: устар |
|||
таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар |
|||
сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар |
|||
3. Contracted forms |
|||
нэһилиэгигэр -> нэһилиэгэр |
|||
олоҕугар -> олоҕор |
|||
түмүгүгэр -> түмүгэр |
|||
өрүтүгэр -> өттүгэр |
|||
үөрэҕигэр -> үөрэҕэр |
|||
суругугар -> суругар |
|||
атаҕыгар -> атаҕар |
|||
бөлөҕүгэр -> бөлөҕөр |
|||
каталогыгар -> каталогар |
|||
4. |
|||
дьахтар<n><pl><nom> дьахта'''рд'''ар |
|||
should be: дьахта'''лл'''ар |
|||
5. where to add частицы: |
|||
* эбит, илик |
|||
Оҥоро иликпин "Я ещё не сделал"; |
|||
Оҥоро иликкин "Ты ещё не сделал"; |
|||
Оҥоро иликпит "Мы ещё не сделали"; |
|||
Кэлбит эбиттэр "Они, оказывается, пришли" |
|||
* соҕус |
|||
ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много; |
|||
6. |
|||
спорт - N5 спортын - N1 спортун - спордун - which form is correct? |
|||
торт - N5 тортын - N1 тортун - тордун - which form is correct? |
|||
7. where to add? |
|||
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели; |
|||
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе |
|||
8. |
|||
сорох:сорох DET-IND ; ! "некоторый" |
|||
сорохтор, сорохторо |
|||
9. ger plus dat |
|||
оҥорорго, барарга |
|||
10. буолуо, буолуон |
|||
11. буоллар |
|||
[[Category:Sakha]] |
[[Category:Sakha]] |
Latest revision as of 14:45, 6 July 2018
Current status[edit]
{{#set_param_default | corpus1 | None }} {{#set_param_default | corpus2 | None }} {{#set_param_default | corpus3 | None }} {{#set_param_default | corpus4 | None }} {{#set_param_default | corpus5 | None }} {{#set_param_default | corpus6 | None }} {{#set_param_default | corpus7 | None }} {{#set_param_default | corpus8 | None }} {{#set_param_default | corpus9 | None }} {{#set_param_default | corpus10 | None }}
- Number of stems: 11,531 {{#ifneq | | | () }}
- Disambiguation rules: 2
- Coverage: ~89.6%
{{#ifneq | wikipedia | None |
{{#ifneq | | | | }}}}
{{#ifneq | kyym | None |
{{#ifneq | | | | }}}}
{{#ifneq | udhr | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus4}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus5}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus6}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus7}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus8}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus9}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus10}}} | None |
{{#ifneq | | | | }}}}
corpus | words | coverage | |
---|---|---|---|
<nowinter>[[|wikipedia]]</nowinter> | wikipedia | 1.00M | ~87.46% |
<nowinter>[[|kyym]]</nowinter> | kyym | 1.02M | ~88.19% |
<nowinter>[[|udhr]]</nowinter> | udhr | 1.7K | ~93.00% |
<nowinter>[[|{{{corpus4}}}]]</nowinter> | {{{corpus4}}} | ~% | |
<nowinter>[[|{{{corpus5}}}]]</nowinter> | {{{corpus5}}} | ~% | |
<nowinter>[[|{{{corpus6}}}]]</nowinter> | {{{corpus6}}} | ~% | |
<nowinter>[[|{{{corpus7}}}]]</nowinter> | {{{corpus7}}} | ~% | |
<nowinter>[[|{{{corpus8}}}]]</nowinter> | {{{corpus8}}} | ~% | |
<nowinter>[[|{{{corpus9}}}]]</nowinter> | {{{corpus9}}} | ~% | |
<nowinter>[[|{{{corpus10}}}]]</nowinter> | {{{corpus10}}} | ~% |
To do[edit]
1.
^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$
should be: сөбүлээ - cөбүлүүр, үҥкүлээ - үҥкүлүүр, көрүлээ - көрүлүүр, ...
үөскээ - үөскүүр
2.
уһун<v><iv><aor><p3><sg> - уһунар; should be: устар
таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар
сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар
3. Contracted forms
нэһилиэгигэр -> нэһилиэгэр
олоҕугар -> олоҕор
түмүгүгэр -> түмүгэр
өрүтүгэр -> өттүгэр
үөрэҕигэр -> үөрэҕэр
суругугар -> суругар
атаҕыгар -> атаҕар
бөлөҕүгэр -> бөлөҕөр
каталогыгар -> каталогар
4.
дьахтар<n><pl><nom> дьахтардар
should be: дьахталлар
5. where to add частицы:
- эбит, илик
Оҥоро иликпин "Я ещё не сделал";
Оҥоро иликкин "Ты ещё не сделал";
Оҥоро иликпит "Мы ещё не сделали";
Кэлбит эбиттэр "Они, оказывается, пришли"
- соҕус
ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;
6.
спорт - N5 спортын - N1 спортун - спордун - which form is correct?
торт - N5 тортын - N1 тортун - тордун - which form is correct?
7. where to add?
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе
8.
сорох:сорох DET-IND ; ! "некоторый"
сорохтор, сорохторо
9. ger plus dat
оҥорорго, барарга
10. буолуо, буолуон
11. буоллар