Difference between revisions of "Apertium-sah"
(→To do) |
|||
(17 intermediate revisions by 2 users not shown) | |||
Line 1: | Line 1: | ||
==Current status== |
==Current status== |
||
− | {{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym }} |
+ | {{LangStats | lang = sah | corpus1 = wikipedia | corpus2 = kyym | corpus3 = udhr }} |
+ | |||
+ | ==To do== |
||
+ | |||
+ | 1. |
||
+ | |||
+ | <pre>^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$</pre> |
||
+ | |||
+ | should be: сөбүлээ - cөбүл'''үү'''р, үҥкүлээ - үҥкүл'''үү'''р, көрүлээ - көрүл'''үү'''р, ... |
||
+ | |||
+ | үөскээ - үөск'''үү'''р |
||
+ | |||
+ | 2. |
||
+ | |||
+ | уһун<v><iv><aor><p3><sg> - уһунар; should be: устар |
||
+ | |||
+ | таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар |
||
+ | |||
+ | сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар |
||
+ | |||
+ | 3. Contracted forms |
||
+ | |||
+ | нэһилиэгигэр -> нэһилиэгэр |
||
+ | |||
+ | олоҕугар -> олоҕор |
||
+ | |||
+ | түмүгүгэр -> түмүгэр |
||
+ | |||
+ | өрүтүгэр -> өттүгэр |
||
+ | |||
+ | үөрэҕигэр -> үөрэҕэр |
||
+ | |||
+ | суругугар -> суругар |
||
+ | |||
+ | атаҕыгар -> атаҕар |
||
+ | |||
+ | бөлөҕүгэр -> бөлөҕөр |
||
+ | |||
+ | каталогыгар -> каталогар |
||
+ | |||
+ | 4. |
||
+ | |||
+ | дьахтар<n><pl><nom> дьахта'''рд'''ар |
||
+ | |||
+ | should be: дьахта'''лл'''ар |
||
+ | |||
+ | 5. where to add частицы: |
||
+ | * эбит, илик |
||
+ | |||
+ | Оҥоро иликпин "Я ещё не сделал"; |
||
+ | |||
+ | Оҥоро иликкин "Ты ещё не сделал"; |
||
+ | |||
+ | Оҥоро иликпит "Мы ещё не сделали"; |
||
+ | |||
+ | Кэлбит эбиттэр "Они, оказывается, пришли" |
||
+ | |||
+ | * соҕус |
||
+ | |||
+ | ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много; |
||
+ | |||
+ | 6. |
||
+ | |||
+ | спорт - N5 спортын - N1 спортун - спордун - which form is correct? |
||
+ | |||
+ | торт - N5 тортын - N1 тортун - тордун - which form is correct? |
||
+ | |||
+ | 7. where to add? |
||
+ | |||
+ | оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели; |
||
+ | |||
+ | бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе |
||
+ | |||
+ | 8. |
||
+ | |||
+ | сорох:сорох DET-IND ; ! "некоторый" |
||
+ | |||
+ | сорохтор, сорохторо |
||
+ | |||
+ | 9. ger plus dat |
||
+ | |||
+ | оҥорорго, барарга |
||
+ | |||
+ | 10. буолуо, буолуон |
||
+ | |||
+ | 11. буоллар |
||
[[Category:Sakha]] |
[[Category:Sakha]] |
Latest revision as of 14:45, 6 July 2018
Current status[edit]
{{#set_param_default | corpus1 | None }} {{#set_param_default | corpus2 | None }} {{#set_param_default | corpus3 | None }} {{#set_param_default | corpus4 | None }} {{#set_param_default | corpus5 | None }} {{#set_param_default | corpus6 | None }} {{#set_param_default | corpus7 | None }} {{#set_param_default | corpus8 | None }} {{#set_param_default | corpus9 | None }} {{#set_param_default | corpus10 | None }}
- Number of stems: 11,531 {{#ifneq | | | () }}
- Disambiguation rules: 2
- Coverage: ~89.6%
{{#ifneq | wikipedia | None |
{{#ifneq | | | | }}}}
{{#ifneq | kyym | None |
{{#ifneq | | | | }}}}
{{#ifneq | udhr | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus4}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus5}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus6}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus7}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus8}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus9}}} | None |
{{#ifneq | | | | }}}}
{{#ifneq | {{{corpus10}}} | None |
{{#ifneq | | | | }}}}
corpus | words | coverage | |
---|---|---|---|
<nowinter>[[|wikipedia]]</nowinter> | wikipedia | 1.00M | ~87.46% |
<nowinter>[[|kyym]]</nowinter> | kyym | 1.02M | ~88.19% |
<nowinter>[[|udhr]]</nowinter> | udhr | 1.7K | ~93.00% |
<nowinter>[[|{{{corpus4}}}]]</nowinter> | {{{corpus4}}} | ~% | |
<nowinter>[[|{{{corpus5}}}]]</nowinter> | {{{corpus5}}} | ~% | |
<nowinter>[[|{{{corpus6}}}]]</nowinter> | {{{corpus6}}} | ~% | |
<nowinter>[[|{{{corpus7}}}]]</nowinter> | {{{corpus7}}} | ~% | |
<nowinter>[[|{{{corpus8}}}]]</nowinter> | {{{corpus8}}} | ~% | |
<nowinter>[[|{{{corpus9}}}]]</nowinter> | {{{corpus9}}} | ~% | |
<nowinter>[[|{{{corpus10}}}]]</nowinter> | {{{corpus10}}} | ~% |
To do[edit]
1.
^сөбүлиир/сөбүлээ<v><tv><prc_aor>/сөбүлээ<v><tv><gpr_aor>/сөбүлээ<v><tv><ger_aor><nom>/сөбүлээ<v><tv><aor><p3><sg>$
should be: сөбүлээ - cөбүлүүр, үҥкүлээ - үҥкүлүүр, көрүлээ - көрүлүүр, ...
үөскээ - үөскүүр
2.
уһун<v><iv><aor><p3><sg> - уһунар; should be: устар
таҕыс<v><iv><aor><p3><sg> - таҕыһар; should be: тахсар
сырыт<v><iv><aor><p3><sg> - сырытар; should be: сылдьар
3. Contracted forms
нэһилиэгигэр -> нэһилиэгэр
олоҕугар -> олоҕор
түмүгүгэр -> түмүгэр
өрүтүгэр -> өттүгэр
үөрэҕигэр -> үөрэҕэр
суругугар -> суругар
атаҕыгар -> атаҕар
бөлөҕүгэр -> бөлөҕөр
каталогыгар -> каталогар
4.
дьахтар<n><pl><nom> дьахтардар
should be: дьахталлар
5. where to add частицы:
- эбит, илик
Оҥоро иликпин "Я ещё не сделал";
Оҥоро иликкин "Ты ещё не сделал";
Оҥоро иликпит "Мы ещё не сделали";
Кэлбит эбиттэр "Они, оказывается, пришли"
- соҕус
ичигэс соҕус тепловатый; аҕыйах соҕус довольно мало, маловато; элбэх соҕус довольно много;
6.
спорт - N5 спортын - N1 спортун - спордун - which form is correct?
торт - N5 тортын - N1 тортун - тордун - which form is correct?
7. where to add?
оннооҕор - модальное сл. даже; тем более; оннооҕор оҕолор чуумпурбуттар даже дети присмирели;
бастатан - модальное сл. прежде всего, в первую очередь; бастатан, тэрээһин үлэ туһунан прежде всего об организационной работе
8.
сорох:сорох DET-IND ; ! "некоторый"
сорохтор, сорохторо
9. ger plus dat
оҥорорго, барарга
10. буолуо, буолуон
11. буоллар