Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"
Line 16: | Line 16: | ||
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику. |
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику. |
||
В практической части курса планируется завершить аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм <code>kaz-tagger</code>. |
В практической части курса планируется завершить (и обсудить) аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм <code>kaz-tagger</code>. |
||
День 1: Lexc |
День 1: Lexc |
Revision as of 08:32, 11 June 2018
Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz
Астана, Қазақстан Республикасы (Астана, Республика Казахстан)
13-19 июня 2018 г.
Цель
Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.
Программа
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
В практической части курса планируется завершить (и обсудить) аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc
, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм kaz-tagger
.
День 1: Lexc
День 2: Lexc
День 3: Twol
День 4: CG
День 5: CG