Difference between revisions of "Курсы машинного перевода для языков России"

From Apertium
Jump to navigation Jump to search
Line 27: Line 27:
! День !! Время !! Тема
! День !! Время !! Тема
|-
|-
|rowspan=2 align="center"|Понедельник<br/>(23 января) || 09:00 -- 13:00 || Обзор
|rowspan=2 align="center"|Понедельник<br/>(23 января) || 09:00 &mdash; 13:00 || Обзор
|-
|-
| 14:00 -- 18:00 || Основы словарей
| 14:00 &mdash; 18:00 || Основы словарей
|-
|-
|rowspan=2 align="center"|Вторник<br/>(24 января) || Первая половина дня || Расширенные словари
|rowspan=2 align="center"|Вторник<br/>(24 января) || 09:00 &mdash; 13:00 || Расширенные словари
|-
|-
| Вторая половина дня || Разрешение морфологической неоднозначности
| 14:00 &mdash; 18:00 || Разрешение морфологической неоднозначности
|-
|-
|rowspan=2 align="center"|Среда<br/>(25 января) || Первая половина дня || Лексическая передача
|rowspan=2 align="center"|Среда<br/>(25 января) || 09:00 &mdash; 13:00 || Лексическая передача
|-
|-
| Вторая половина дня || Структурная передача
| 14:00 &mdash; 18:00 || Структурная передача
|-
|-
|rowspan=2 align="center"|Четверг<br/>(26 января) || Первая половина дня || Продвинутая структурная передача
|rowspan=2 align="center"|Четверг<br/>(26 января) || 09:00 &mdash; 13:00 || Продвинутая структурная передача
|-
|-
| Вторая половина дня || Последовательность данных, качество и оценка
| 14:00 &mdash; 18:00 || Последовательность данных, качество и оценка
|-
|-
|rowspan=2 align="center"|Пятница<br/>(27 января) || Первая половина дня || Планирование проекта по созданию переводчика
|rowspan=2 align="center"|Пятница<br/>(27 января) || 09:00 &mdash; 13:00 || Планирование проекта по созданию переводчика
|-
|-
| Вторая половина дня || Практические вопросы и ответы
| 14:00 &mdash; 18:00 || Практические вопросы и ответы
|}
|}
</center>
</center>

Revision as of 20:01, 30 December 2011

Курс машинного перевода для языков России

Шупашкар, Чӑваш Респубики (Чебоксары, Чувашская Республика)

Университетский Центр Интернет Чувашского государственного университета
Московский проспект 15, корпус Ж, 2 этаж

с 23 по 27 января 2012 г.

Цель

Цель курса — дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, внутри славянских языков (напр., с македонского на болгарский язык), с романского на романский, германского с германский, и с тюркского на тюркский. Стоит отметить, что команда Apertium проявляет большой интерес к региональным языкам и активно поддерживает те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.

Специальные знания по информатике или лингвистике не являются необходимыми. Достаточно быть пользователем компьютера, хорошо владеть основой грамматики, владеть более, чем одним языком, и интересоваться машинным переводом.

Участники получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например Google Summer of Code.

Программа

Курс состоит из 40 часов, по 8 часов на протяжении 5 дней. Программа, прежде всего, включает практику. По возможности, рекомендуется использование собственного ноутбука (с Линуксом) .

День Время Тема
Понедельник
(23 января)
09:00 — 13:00 Обзор
14:00 — 18:00 Основы словарей
Вторник
(24 января)
09:00 — 13:00 Расширенные словари
14:00 — 18:00 Разрешение морфологической неоднозначности
Среда
(25 января)
09:00 — 13:00 Лексическая передача
14:00 — 18:00 Структурная передача
Четверг
(26 января)
09:00 — 13:00 Продвинутая структурная передача
14:00 — 18:00 Последовательность данных, качество и оценка
Пятница
(27 января)
09:00 — 13:00 Планирование проекта по созданию переводчика
14:00 — 18:00 Практические вопросы и ответы

Преподаватели

  • Францис Мортон Таерз -- аспирант факультета компьютерных наук университета Алаканта (Испания). Имеет степень бакалавра по программированию Уэльского университета, Аберистуита и степень магистра в области лингвистики университета Восточной Англии. Работает в качестве инженера по лингвистическому проектировании в области лингвистических технологий компании Промпсит (Prompsit). Был избран членом Комитета по реализации проектов компании Апертиум (Apertium), и назначен секретарем. Является активным членом нескольких групп, работающих в области лингвистического проектирования для развития миноритарных и региональных языков. Например, это Специальная группа по развитию речевых и лингвистических технологий для миноритарных языков (SALTMIL). Принимал участие во многих международных семинарах и конференциях и имеет ряд опубликованных статей по теме машинного перевода в сборниках, вышедших по итогам конференций, и в международных журналах. В области машинного перевода его профессиональный интерес составляют маргинализованныe, миноритарные, региональные и малоиспользуемые языки; родственные языки; морфо-синтаксический анализ и снятие омонимии; типы машинного периода, основанные на введении правил; лексическая выборка.
  • Джонатан Норт Вашингтон -- аспирант лингвистического факультета Университета Индианы (США). В 2005 г. получил степень бакалавра по лингвистике и по антропологии Брандайсского Университета в Волтаме, Массачусетс, а в 2010-м году стал магистром лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (в большей степени казахский и кыргызский) и особенно их пересечение. В данное время работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.
  • Трун Тростерюд -- доцент языкознании в университете Тромсе. Он лингвист (университет Тронхейма, 1989 г.) и кандидат языкознании (университет Тромсё, 2004 г., диссертация о определенных аспектах морфологической структуры уральских языков). С 1999 он работал над лингвистической технологией с вниманием на конечные машины для саамских языков и других уральских языков. Он также работал над автоматическим синтаксическим анализом и над основанным на правилах машинным переводом.

Участие

  • Участие бесплатное
  • Количество участников ограничено (20 человек)
  • Необходимо записаться до 15 января
  • Участники, посетившие 90% часов курса (72 из 80 часов) и сдавшие практические задания, получат сертификат.

Языки

Основными языками курса будут английский и русский. Будет проводиться перевод с английского на русский язык.

Документы курса будут на русском языке.

Проживание

Иногородние участники могут ночевать в Лицее-интернате им. Г.С. Лебедева. Комнаты двухместные. Цена: 300 руб./ночь. Студенты могут получить скидку.

Запись

Для участия необходимо записаться до 15 января. Запишитесь!