Difference between revisions of "User:Ilnar.salimzyan/Курс по apertium-kaz"

From Apertium
Jump to navigation Jump to search
 
(10 intermediate revisions by the same user not shown)
Line 1: Line 1:
<center>
<center>
<span style="font-size: large">Курс-консультация по аудиту и расширению морфологиского трансдуктора и теггера ''apertium-kaz''</span>
<span style="font-size: large">Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера ''apertium-kaz''</span>


Астана, Қазақстан Республикасы (Астана, Республика Казахстан)
Астана, Қазақстан Республикасы (Астана, Республика Казахстан)
Line 8: Line 8:
</center>
</center>


===Цель===
=== Цель ===


Цель курсов &mdash; дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на открытой платформы свободного машинного перевода Apertium и связанных с ней программах.
Цель курсов &mdash; дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере ''apertium-kaz'', который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.


=== Программа ===
=== Программа ===


Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
День 1: Lexc


В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь ''apertium-kaz'' <code>apertium-kaz.kaz.lexc</code>, а также добавить [[Constraint Grammar]]-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером <code>kaz-tagger</code>.
День 2: Lexc


<center>
День 3: Twol
{| class="wikitable"
|- style="background: #ececec"
! День !! Время !! Тема
|-
|rowspan=2 align="center"|Среда<br/>(13 июня) || 09:00 &mdash; 12:00 || Введение
|-
| 14:00 &mdash; 17:00 || Морфология и морфотактика (lexc)
|-
|rowspan=2 align="center"|Четверг<br/>(14 июня) || 09:00 &mdash; 12:00 || Морфология и морфотактика (lexc)
|-
| 14:00 &mdash; 17:00 || Морфология и морфотактика (lexc)
|-
|rowspan=2 align="center"|Пятница<br/>(15 июня) || 09:00 &mdash; 12:00 || Морфофонология (twol)
|-
| 14:00 &mdash; 17:00 || Морфофонология (twol)
|-
|rowspan=2 align="center"|Понедельник<br/>(18 июня) || 09:00 &mdash; 12:00 || Разрешение морфологической неоднозначности (CG)
|-
| 14:00 &mdash; 17:00 || Разрешение морфологической неоднозначности (CG)
|-
|rowspan=2 align="center"|Вторник<br/>(19 января) || 09:00 &mdash; 13:00 || Разрешение морфологической неоднозначности (CG)
|-
| 14:00 &mdash; 17:00 || Разрешение морфологической неоднозначности (CG)
|}
</center>

=== Слайды ===

# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
# https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf


=== Тексты для чтения ===
День 4: CG


# https://ftyers.github.io/079-osnov-programm/classes/01.html
День 5: CG
# http://www.norvig.com/spell-correct.html

Latest revision as of 22:32, 24 June 2018

Курс-консультация по аудиту и расширению морфологического трансдуктора и теггера apertium-kaz

Астана, Қазақстан Республикасы (Астана, Республика Казахстан)

13-19 июня 2018 г.

Цель[edit]

Цель курсов — дать практические знания, необходимые для уверенного расширения и исправления ошибок в существующем морфологическом трансдукторе & теггере apertium-kaz, который основан на свободной платформе машинного перевода Apertium и связанных с ней программах.

Программа[edit]

Курсы состоят из 30 часов, по 6 часов на протяжении 5 дней. Программа, прежде всего, включает практику.

В практической части курса планируется завершить (и обсудить) аннотацию первых 2500 токенов из перевода «Маленького принца» на казахский язык, добавить недостающие основы в словарь apertium-kaz apertium-kaz.kaz.lexc, а также добавить Constraint Grammar-правила для снятия неоднозначностей в анализах в файл apertium-kaz.kaz.rlx и познакомиться со статистическим теггером kaz-tagger.

День Время Тема
Среда
(13 июня)
09:00 — 12:00 Введение
14:00 — 17:00 Морфология и морфотактика (lexc)
Четверг
(14 июня)
09:00 — 12:00 Морфология и морфотактика (lexc)
14:00 — 17:00 Морфология и морфотактика (lexc)
Пятница
(15 июня)
09:00 — 12:00 Морфофонология (twol)
14:00 — 17:00 Морфофонология (twol)
Понедельник
(18 июня)
09:00 — 12:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)
Вторник
(19 января)
09:00 — 13:00 Разрешение морфологической неоднозначности (CG)
14:00 — 17:00 Разрешение морфологической неоднозначности (CG)

Слайды[edit]

  1. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session0a.pdf
  2. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session1.pdf
  3. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session2b.pdf
  4. https://svn.code.sf.net/p/apertium/svn/branches/xupaixkar/slides/session3.pdf

Тексты для чтения[edit]

  1. https://ftyers.github.io/079-osnov-programm/classes/01.html
  2. http://www.norvig.com/spell-correct.html