Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"

From Apertium
Jump to navigation Jump to search
 
(4 intermediate revisions by the same user not shown)
Line 16: Line 16:
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.


В практической части курса планируется завершить (и обсудить) аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером <code>kaz-tagger</code>.
В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером <code>kaz-tagger</code>.


<center>
<center>
Line 44: Line 44:
|}
|}
</center>
</center>

=== Слайды ===

# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf

=== Тексты для чтения ===

# https://ftyers.github.io/079-osnov-programm/classes/01.html
# http://www.norvig.com/spell-correct.html

Latest revision as of 22:32, 24 June 2018

Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz

Астана, Қазақстан Республикасы (Астана, Республика Казахстан)

13-19 июня 2018 г.

Цель[edit]

Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.

Программа[edit]

Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.

В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером kaz-tagger.

День Время Тема
Среда
(13 июня)
09:00 — 12:00 Введение
14:00 — 17:00 Морфология и морфотактика (lexc)
Четверг
(14 июня)
09:00 — 12:00 Морфология и морфотактика (lexc)
14:00 — 17:00 Морфология и морфотактика (lexc)
Пятница
(15 июня)
09:00 — 12:00 Морфофонология (twol)
14:00 — 17:00 Морфофонология (twol)
Понедельник
(18 июня)
09:00 — 12:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)
Вторник
(19 января)
09:00 — 13:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)

Слайды[edit]

  1. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
  2. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
  3. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
  4. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf

Тексты для чтения[edit]

  1. https://ftyers.github.io/079-osnov-programm/classes/01.html
  2. http://www.norvig.com/spell-correct.html