Difference between revisions of "Курсы машинного перевода для языков России"
Hectoralos (talk | contribs) |
Hectoralos (talk | contribs) |
||
Line 18: | Line 18: | ||
===Программа=== |
===Программа=== |
||
⚫ | |||
Курс состоят из 40 часов, по 8 часов на протяжении 5 дней. Программа будет, прежде всего, практичной. Использование собственного ноутбука (с Линуксом) рекомендуется, по возможности. |
|||
⚫ | |||
{| class="wikitable" |
{| class="wikitable" |
||
|- style="background: #ececec" |
|- style="background: #ececec" |
Revision as of 11:52, 16 December 2011
Шупашкар, Чӑваш Респубики (Чебоксары, Чувашская Республика)
Факультет чувашской филологии и культуры, Чувашский государственный университет
с 23 по 27 января 2012 г.
Цель
Цель курса дать практическое знание, как создать автоматический переводчик с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На ней создано около 40 автоматических переводчиков, ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, славянский со славянским (напр., с македонского на булгарский язык), романский с романским, германский с германским, и тюркский с тюркским. Стоит отметить, что сотрудники Apertium проявляют большой интерес к региональным языкам и активно поддерживают эти языки, у которых малые ресурсы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.
Специальность по информатике или лингвистике не является необходимой. Достаточно быт пользователь компьютера, хорошо владеть основные грамматику, владеть больше одного языка, и заинтересоваться машинном переводе.
Участники получат знания, с которыми они смогут выдвинуться в способные кандидаты в конкурсах для грантов по созданию новых автоматических переводчиков, например Google Summer of Code.
Программа
Курс состоят из 40 часов, по 8 часов на протяжении 5 дней. Программа будет, прежде всего, практичной. Использование собственного ноутбука (с Линуксом) рекомендуется, по возможности.
День | Время | Тема |
---|---|---|
Понедельник 23 января | Первая половина дня | Обзор |
Понедельник 23 января | Вторая половина дня | Основы словарей |
Вторник 24 января | Первая половина дня | Расширенные словари |
Вторник 24 января | Вторая половина дня | Морфологические ---неоднозначности--- |
Среда 25 января | Первая половина дня | Лексическая передача |
Среда 25 января | Вторая половина дня | Структурная передача |
Четверг 26 января | Первая половина дня | ---Продвинутая--- структурная передача |
Четверг 26 января | Вторая половина дня | Последовательность данных, качество и оценка |
Пятница 27 января | Первая половина дня | Планирование развития |
Пятница 27 января | Вторая половина дня | Практические вопросы и ответы |
Преподаватели
- Francis Morton Tyers -- аспирант, учащийся на факулете компьютерных наук Университета Алаканта (Испания). He received a Bachelor's degree in Software Engineering from the University of Wales, Aberystwyth and a Master's degree in Linguistics from the University of East Anglia. He also works as a language engineer for Prompsit Language Engineering. He was elected member of the Project Management Committee of Apertium, and nominated secretary. He is also involved in other groups related to language technology for minority and regional languages, such as the Special Interest Group in Speech and Language Technology for Minority Languages (SALTMIL). He has reviewed for a number of international workshops and conferences and has publications in the field of machine translation in a number of conference proceedings and international journals. In machine translation his interests are: marginalised, minority, regional, under-resourced or lesser-used languages; closely-related languages; morphosyntactic analysis and disambiguation; rule-based approaches; lexical selection.
- Джонатан Норт Вашингтон -- аспирант, учащийся на лингвистическом факультете Университета Индианы (США). Он получил степень бакалавра и по лингвистике и по антропологии от Брандайсского Университета в Волтаме, Массачуcетс, в 2005-м году, и в 2010-м году получил магистратуру из лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (особенно казахский и кыргызский), и особенно их пересечение. Сейчас он работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.
- Трун Тростеруд (?)
Участие
- Участие бесплатно
- Участие ограничено на 20 человека
- Необходимо записаться до 15 января
- Участники, посещавшие 90% времени курса (72 из 80 часов) и сдавшие практические задание, получат сертификат.
Языки
Основные языки курса будут английский и русский. Проводится перевод с английского на русский язык.
Документы курса будут на русском языке.
Проживание
Участники не из города могут ночевать в Лисее-интернате им. Г.С. Лебедева. Комнаты двух-кроватные. Цена: 300 руб./ночь. Студенты могут получить частичную расплату.
Запись
Необходимо записаться до 15 января.