Курсы машинного перевода для языков России

From Apertium
Revision as of 09:58, 16 December 2011 by Hectoralos (talk | contribs)
Jump to navigation Jump to search
Курс машинного перевода для языков России

Шупашкар, Чӑваш Респубики (Чебоксары, Чувашская Республика)

Факультет чувашской филологии и культуры, Чувашский государственный университет

с 23 по 27 января 2012 г.

Цель

Цель курса дать практическое знание, как создать автоматический переводчик с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На ней создано около 40 автоматических переводчиков, ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, славянский со славянским (напр., с македонского на булгарский язык), романский с романским, германский с германским, и тюркский с тюркским. Стоит отметить, что сотрудники Apertium проявляют большой интерес к региональным языкам и активно поддерживают эти языки, у которых малые ресурсы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.

Специальность по информатику или лингвистики не является необходимой. Достаточно быт пользователь компьютера, хорошо владеть основные грамматику, владеть больше одного языка, и заинтересоваться машинном переводе.

Posem que els participants sortiran preparats amb coneixements que els faran competitius per participar en GSoC 2012? (Si sí, com formular-ho)

Программа

день утром / вечером тема
Понедельник 23 января утром Обзор
Понедельник 23 января вечером Основы словарей
Вторник 24 января утром Расширенные словари
Вторник 24 января вечером Морфологические ---неоднозначности---
Среда 25 января утром Лексическая передача
Среда 25 января вечером Структурная передача
Четверг 26 января утром ---Продвинутая--- структурная передача
Четверг 26 января вечером Последовательность данных, качество и оценка
Пятница 27 января утром Планирование развития
Пятница 27 января вечером Практические вопросы и ответы

Программа будет, прежде всего, практичной. Использование собственного ноутбука (с Линуксом) рекомендуется, по возможности.

Преподаватели

  • Francis Morton Tyers is a PhD student of machine translation at the Universitat d'Alacant, he received a Bachelor's degree in Software Engineering from the University of Wales, Aberystwyth and a Master's degree in Linguistics from the University of East Anglia. He also works as a language engineer for Prompsit Language Engineering. He was elected member of the Project Management Committee of Apertium, and nominated secretary. He is also involved in other groups related to language technology for minority and regional languages, such as the Special Interest Group in Speech and Language Technology for Minority Languages (SALTMIL). He has reviewed for a number of international workshops and conferences and has publications in the field of machine translation in a number of conference proceedings and international journals. In machine translation his interests are: marginalised, minority, regional, under-resourced or lesser-used languages; closely-related languages; morphosyntactic analysis and disambiguation; rule-based approaches; lexical selection.
  • Джонатан Норт Вашингтон -- аспирант, учащийся на лингвистическом факультете Университета Индианы. Он получил степень бакалавра и по лингвистике и по антропологии от Брандайсского Университета в Волтаме, Массачуcетс, в 2005-м году, и в 2010-м году получил магистратуру из лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (особенно казахский и кыргызский), и особенно их пересечение. Сейчас он работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.

Участие

  • Участие бесплатно
  • Участие ограничено на 20 человека
  • Необходимо записаться до 15 января
  • Участники, посещавшие 90% времени курса (72 из 80 часов) и сдавшие практические задание, получат сертификат.

Языки

Основные языки курса будет английский и русский. Будет перевод с английского на русский язык.

Документы курса будут на русском языке.

Проживание

Com inscriure's