Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"

From Apertium
Jump to navigation Jump to search
 
(6 intermediate revisions by the same user not shown)
Line 8: Line 8:
 
</center>
 
</center>
   
===Цель===
+
=== Цель ===
   
 
Цель курсов &mdash; дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.
 
Цель курсов &mdash; дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.
Line 16: Line 16:
 
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
 
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
   
В практической части курса планируется завершить аннотацию первых 2000 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггорм <code>kaz-tagger</code>.
+
В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером <code>kaz-tagger</code>.
   
  +
<center>
День 1: Lexc
 
  +
{| class="wikitable"
  +
|- style="background: #ececec"
  +
! День !! Время !! Тема
  +
|-
  +
|rowspan=2 align="center"|Среда<br/>(13 июня) || 09:00 &mdash; 12:00 || Введение
  +
|-
  +
| 14:00 &mdash; 17:00 || Морфология и морфотактика (lexc)
  +
|-
  +
|rowspan=2 align="center"|Четверг<br/>(14 июня) || 09:00 &mdash; 12:00 || Морфология и морфотактика (lexc)
  +
|-
  +
| 14:00 &mdash; 17:00 || Морфология и морфотактика (lexc)
  +
|-
  +
|rowspan=2 align="center"|Пятница<br/>(15 июня) || 09:00 &mdash; 12:00 || Морфофонология (twol)
  +
|-
  +
| 14:00 &mdash; 17:00 || Морфофонология (twol)
  +
|-
  +
|rowspan=2 align="center"|Понедельник<br/>(18 июня) || 09:00 &mdash; 12:00 || Разрешение морфологической неоднозначности (CG)
  +
|-
  +
| 14:00 &mdash; 17:00 || Разрешение морфологической неоднозначности (CG)
  +
|-
  +
|rowspan=2 align="center"|Вторник<br/>(19 января) || 09:00 &mdash; 13:00 || Разрешение морфологической неоднозначности (CG)
  +
|-
  +
| 14:00 &mdash; 17:00 || Разрешение морфологической неоднозначности (CG)
  +
|}
  +
</center>
   
  +
=== Слайды ===
День 2: Lexc
 
   
  +
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
День 3: Twol
 
  +
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
  +
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
  +
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf
   
  +
=== Тексты для чтения ===
День 4: CG
 
   
  +
# https://ftyers.github.io/079-osnov-programm/classes/01.html
День 5: CG
 
  +
# http://www.norvig.com/spell-correct.html

Latest revision as of 22:32, 24 June 2018

Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz

Астана, Қазақстан Республикасы (Астана, Республика Казахстан)

13-19 июня 2018 г.

Цель[edit]

Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.

Программа[edit]

Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.

В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером kaz-tagger.

День Время Тема
Среда
(13 июня)
09:00 — 12:00 Введение
14:00 — 17:00 Морфология и морфотактика (lexc)
Четверг
(14 июня)
09:00 — 12:00 Морфология и морфотактика (lexc)
14:00 — 17:00 Морфология и морфотактика (lexc)
Пятница
(15 июня)
09:00 — 12:00 Морфофонология (twol)
14:00 — 17:00 Морфофонология (twol)
Понедельник
(18 июня)
09:00 — 12:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)
Вторник
(19 января)
09:00 — 13:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)

Слайды[edit]

  1. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
  2. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
  3. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
  4. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf

Тексты для чтения[edit]

  1. https://ftyers.github.io/079-osnov-programm/classes/01.html
  2. http://www.norvig.com/spell-correct.html