Difference between revisions of "Курсы машинного перевода для языков России"

From Apertium
Jump to navigation Jump to search
Line 34: Line 34:
| Вторая половина дня || Разрешение морфологической неоднозначности
| Вторая половина дня || Разрешение морфологической неоднозначности
|-
|-
|rowspan=2|Среда<br/>(25 января) || Первая половина дня || Лексическая передача
|rowspan=2 align="center"|Среда<br/>(25 января) || Первая половина дня || Лексическая передача
|-
|-
| Вторая половина дня || Структурная передача
| Вторая половина дня || Структурная передача
|-
|-
|rowspan=2|Четверг<br/>(26 января) || Первая половина дня || Продвинутая структурная передача
|rowspan=2 align="center"|Четверг<br/>(26 января) || Первая половина дня || Продвинутая структурная передача
|-
|-
| Вторая половина дня || Последовательность данных, качество и оценка
| Вторая половина дня || Последовательность данных, качество и оценка
|-
|-
|rowspan=2|Пятница<br/>(27 января) || Первая половина дня || Планирование проекта по созданию переводчика
|rowspan=2 align="center"|Пятница<br/>(27 января) || Первая половина дня || Планирование проекта по созданию переводчика
|-
|-
| Вторая половина дня || Практические вопросы и ответы
| Вторая половина дня || Практические вопросы и ответы

Revision as of 19:32, 18 December 2011

Курс машинного перевода для языков России

Шупашкар, Чӑваш Респубики (Чебоксары, Чувашская Республика)

Факультет чувашской филологии и культуры, Чувашский государственный университет

с 23 по 27 января 2012 г.

Цель

Цель курса дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например внутри славянских языков (напр., с македонского на болгарский язык), с романского на романский, германского с германский, и с тюркского на тюркский. Стоит отметить, что сотрудники Apertium проявляют большой интерес к региональным языкам и активно поддерживают те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.

Специалиьные знания по информатике или лингвистике не являются необходимыми. Достаточно быть пользователем компьютера, хорошо владеть основой грамматики, владеть более, чем одним языком, и интересоваться машинным переводом.

Участники получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например Google Summer of Code.

Программа

Курс состоит из 40 часов, по 8 часов на протяжении 5 дней. Программа, прежде всего, включает практику. По возможности, рекомендуется использование собственного ноутбука (с Линуксом) .

День Время Тема
Понедельник
(23 января)
Первая половина дня Обзор
Вторая половина дня Основы словарей
Вторник
(24 января)
Первая половина дня Расширенные словари
Вторая половина дня Разрешение морфологической неоднозначности
Среда
(25 января)
Первая половина дня Лексическая передача
Вторая половина дня Структурная передача
Четверг
(26 января)
Первая половина дня Продвинутая структурная передача
Вторая половина дня Последовательность данных, качество и оценка
Пятница
(27 января)
Первая половина дня Планирование проекта по созданию переводчика
Вторая половина дня Практические вопросы и ответы

Преподаватели

  • Францис Мортон Таерз -- аспирант факультета компьютерных наук университета Алаканта (Испания). Имеет степень бакалавра по программированию Уэльского университета, Аберистуита и степень магистра в области лингвистики университета Восточной Англии. Работает в качестве инженера по лингвистическому проектировании в области лингвистических технологий компании Промпсит (Prompsit). Был избран членом Комитета по реализации проектов компании Апертиум (Apertium), и назначен секретарем. Является активным членом нескольких групп, работающих в области лингвистического проектирования для развития миноритарных и региональных языков. Например, это Специальная группа по развитию речевых и лингвистических технологий для миноритарных языков (SALTMIL). Принимал участие во многих международных семинарах и конференциях и имеет ряд опубликованных статей по теме машинного перевода в сборниках, вышедших по итогам конференций, и в международных журналах. В области машинного перевода его профессиональный интерес составляют маргинализованныe, миноритарные, региональные и малоиспользуемые языки; родственные языки; морфо-синтаксический анализ и снятие омонимии; типы машинного периода, основанные на введении правил; лексическая выборка.
  • Джонатан Норт Вашингтон -- аспирант лингвистического факультета Университета Индианы (США). В 2005 г. получил степень бакалавра по лингвистике и по антропологии Брандайсского Университета в Волтаме, Массачусетс, а в 2010-м году стал магистром лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (в большей степени казахский и кыргызский) и особенно их пересечение. В данное время работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт. 

Участие

  • Участие бесплатное
  • Количество участников ограничено (20 человек)
  • Необходимо записаться до 15 января
  • Участники, посетившие 90% часов курса (72 из 80 часов) и сдавшие практические задания, получат сертификат.

Языки

Основными языками курса будут английский и русский. Проводится перевод с английского на русский язык.

Документы курса будут на русском языке.

Проживание

Иногородние участники могут ночевать в Лицее-интернате им. Г.С. Лебедева. Комнаты двухместные. Цена: 300 руб./ночь. Студенты могут получить скидку.

Запись

Для участия необходимо записаться до 15 января.

Запишитесь!