Курсы машинного перевода для языков России
Курсы-консультации по совместной разработке научно-прикладных проектов в области машинного перевода
Шупашкар, Чӑваш Республики (Чебоксары, Чувашская Республика)
Университетский Центр Интернет Чувашского государственного университета
Московский проспект 15, корпус Ж, 2 этаж
с 23 по 27 января 2012 г.
Цель[edit]
Цель курсов — дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, внутри славянских языков (напр., с македонского на болгарский язык), с романского на романский, с германского на германский и с тюркского на тюркский. Стоит отметить, что команда Apertium проявляет большой интерес к региональным языкам и активно поддерживает те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.
Специальные знания по информатике или лингвистике не являются необходимыми. Достаточно быть пользователем компьютера, хорошо владеть основами грамматики, владеть более чем одним языком и интересоваться машинным переводом.
Участники получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например Google Summer of Code.
Программа[edit]
- См. также: Программа
Курсы состоят из 40 часов, по 8 часов на протяжении 5 дней. Программа, прежде всего, включает практику.
День | Время | Тема |
---|---|---|
Понедельник (23 января) |
09:00 — 13:00 | Обзор |
14:00 — 18:00 | Основы словарей | |
Вторник (24 января) |
09:00 — 13:00 | Расширенные словари |
14:00 — 18:00 | Разрешение морфологической неоднозначности | |
Среда (25 января) |
09:00 — 13:00 | Лексическая передача |
14:00 — 18:00 | Структурная передача | |
Четверг (26 января) |
09:00 — 13:00 | Противопоставления уральских языков Противопоставления тюркских языков Продвинутая структурная передача I |
14:00 — 18:00 | Продвинутая структурная передача II | |
Пятница (27 января) |
09:00 — 13:00 | Последовательность данных, качество и оценка |
14:00 — 18:00 | Планирование проекта и практические вопросы и ответы |
Преподаватели[edit]
- Трун Тростерюд -- доцент языкознания в университете Тромсё. Он лингвист (университет Тронхейма, 1989 г.) и кандидат филологических наук (университет Тромсё, 2004 г., диссертация об определенных аспектах морфологической структуры уральских языков). С 1999 он работал над лингвистической технологией с вниманием на конечные машины для саамских языков и других уральских языков. Он также работал над автоматическим синтаксическим анализом и над основанным на правилах машинным переводом.
- Францис Мортон Таерз -- аспирант факультета компьютерных наук университета Алаканта (Испания). Имеет степень бакалавра по программированию Уэльского университета, Аберистуита и степень магистра лингвистики университета Восточной Англии. Работает в качестве инженера по лингвистическому проектированию в области лингвистических технологий компании Промпсит (Prompsit). Был избран членом Комитета по реализации проектов компании Апертиум (Apertium) и назначен секретарем. Является активным членом нескольких групп, работающих в области лингвистического проектирования для развития миноритарных и региональных языков. В частности, это Специальная группа по развитию речевых и лингвистических технологий для миноритарных языков (SALTMIL). Принимал участие во многих международных семинарах и конференциях и имеет ряд опубликованных статей по теме машинного перевода в сборниках, вышедших по итогам конференций, и в международных журналах. В области машинного перевода его профессиональный интерес составляют маргинализованныe, миноритарные, региональные и малоиспользуемые языки; родственные языки; морфо-синтаксический анализ и снятие омонимии; типы машинного перевода, основанные на использовании правил; лексическая выборка.
- Джонатан Норт Вашингтон -- аспирант лингвистического факультета Университета Индианы (США). В 2005 г. получил степень бакалавра по лингвистике и по антропологии Брандайсского Университета в Волтаме, Массачусетс, а в 2010-м году стал магистром лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (в большей степени казахский и кыргызский) и особенно их пересечение. В данное время работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.
Участие[edit]
- Участие бесплатное
- Количество участников ограничено (20 человек)
- Необходимо записаться до 15 января
- Участники, посетившие 90% часов курсов (72 из 80 часов) и сдавшие практические задания, получат сертификат.
Языки[edit]
Основными языками курсов будут английский и русский. Будет проводиться перевод с английского на русский язык.
Документы курсов будут на русском языке.
Проживание[edit]
Иногородние участники могут ночевать в Лицее-интернате им. Г.С. Лебедева. Комнаты двухместные. Цена: 300 руб./ночь. Студенты могут получить скидку.
Пресса[edit]
- 29.12.2011. Курс машинного перевода для языков России
- 16.01.2012. Курсы машинного перевода в Чебоксарах. Автоматический переводчик на чувашский язык 18.01.2012. Куçаруçăсен курсĕ ĕçлеме пуçлать
- 18.01.2012. Куçаруçăсен курсĕ ĕçлеме пуçлать
- 26.01.2012. В Чебоксарах готовят разработчиков систем машинного перевода с уральских языков
- 29.01.2012. Раççĕй чĕлхисен машина куçарăвĕн курсĕ иртрĕ
- 30.01.2012. Раççей чĕлхисен машина куçарăвĕн курсĕ
Запись[edit]
Для участия необходимо записаться до 15 января. Запишитесь!