Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"
(8 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
<center> |
<center> |
||
<span style="font-size: large">Курс-консультация по аудиту и расширению |
<span style="font-size: large">Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера ''apertium-kaz''</span> |
||
Астана, Қазақстан Республикасы (Астана, Республика Казахстан) |
Астана, Қазақстан Республикасы (Астана, Республика Казахстан) |
||
Line 8: | Line 8: | ||
</center> |
</center> |
||
===Цель=== |
=== Цель === |
||
Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на |
Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на свободной платформе машинного перевода Apertium и связанных с ней программах. |
||
=== Программа === |
=== Программа === |
||
Line 16: | Line 16: | ||
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику. |
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику. |
||
В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером <code>kaz-tagger</code>. |
|||
День 1: Lexc |
|||
<center> |
|||
День 2: Lexc |
|||
{| class="wikitable" |
|||
|- style="background: #ececec" |
|||
! День !! Время !! Тема |
|||
|- |
|||
|rowspan=2 align="center"|Среда<br/>(13 июня) || 09:00 — 12:00 || Введение |
|||
|- |
|||
| 14:00 — 17:00 || Морфология и морфотактика (lexc) |
|||
|- |
|||
|rowspan=2 align="center"|Четверг<br/>(14 июня) || 09:00 — 12:00 || Морфология и морфотактика (lexc) |
|||
|- |
|||
| 14:00 — 17:00 || Морфология и морфотактика (lexc) |
|||
|- |
|||
|rowspan=2 align="center"|Пятница<br/>(15 июня) || 09:00 — 12:00 || Морфофонология (twol) |
|||
|- |
|||
| 14:00 — 17:00 || Морфофонология (twol) |
|||
|- |
|||
|rowspan=2 align="center"|Понедельник<br/>(18 июня) || 09:00 — 12:00 || Разрешение морфологической неоднозначности (CG) |
|||
|- |
|||
| 14:00 — 17:00 || Разрешение морфологической неоднозначности (CG) |
|||
|- |
|||
|rowspan=2 align="center"|Вторник<br/>(19 января) || 09:00 — 13:00 || Разрешение морфологической неоднозначности (CG) |
|||
|- |
|||
| 14:00 — 17:00 || Разрешение морфологической неоднозначности (CG) |
|||
|} |
|||
</center> |
|||
=== Слайды === |
|||
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf |
|||
День 3: Twol |
|||
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf |
|||
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf |
|||
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf |
|||
=== Тексты для чтения === |
|||
День 4: CG |
|||
# https://ftyers.github.io/079-osnov-programm/classes/01.html |
|||
День 5: CG |
|||
# http://www.norvig.com/spell-correct.html |
Latest revision as of 22:32, 24 June 2018
Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz
Астана, Қазақстан Республикасы (Астана, Республика Казахстан)
13-19 июня 2018 г.
Contents
Цель[edit]
Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.
Программа[edit]
Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc
, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером kaz-tagger
.
День | Время | Тема |
---|---|---|
Среда (13 июня) |
09:00 — 12:00 | Введение |
14:00 — 17:00 | Морфология и морфотактика (lexc) | |
Четверг (14 июня) |
09:00 — 12:00 | Морфология и морфотактика (lexc) |
14:00 — 17:00 | Морфология и морфотактика (lexc) | |
Пятница (15 июня) |
09:00 — 12:00 | Морфофонология (twol) |
14:00 — 17:00 | Морфофонология (twol) | |
Понедельник (18 июня) |
09:00 — 12:00 | Разрешение морфологической неоднозначности (CG) |
14:00 — 17:00 | Разрешение морфологической неоднозначности (CG) | |
Вторник (19 января) |
09:00 — 13:00 | Разрешение морфологической неоднозначности (CG) |
14:00 — 17:00 | Разрешение морфологической неоднозначности (CG) |
Слайды[edit]
- https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
- https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
- https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
- https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf