Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"

From Apertium
Jump to navigation Jump to search
Line 16: Line 16:
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.


В практической части курса планируется завершить аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм <code>kaz-tagger</code>.
В практической части курса планируется завершить (и обсудить) аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм <code>kaz-tagger</code>.


День 1: Lexc
День 1: Lexc

Revision as of 08:32, 11 June 2018

Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz

Астана, Қазақстан Республикасы (Астана, Республика Казахстан)

13-19 июня 2018 г.

Цель

Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.

Программа

Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.

В практической части курса планируется завершить (и обсудить) аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм kaz-tagger.

День 1: Lexc

День 2: Lexc

День 3: Twol

День 4: CG

День 5: CG