Difference between revisions of "Курсы машинного перевода для языков России"

From Apertium
Jump to navigation Jump to search
 
(80 intermediate revisions by 6 users not shown)
Line 1: Line 1:
<center>
==Курс машинного перевода для языков России==
<span style="font-size: large">Курсы-консультации по совместной разработке научно-прикладных проектов в области машинного перевода</span>


* '''Где''': Шупашкар, Чӑваш Респубики (Чебоксары, Чувашская Республика),
Шупашкар, Чӑваш Республики (Чебоксары, Чувашская Республика)

[http://www.chuvsu.ru/~chfik/ Факультет чувашской филологии и культуры, Чувашский государственный университет]
[http://www.chuvsu.ru/~ui/, Университетский Центр Интернет Чувашского государственного университета]<br/>
* '''Когда''': с 23 по 27 января 2012 г.
[http://www.cheboksary.ws/#xy=56.1417985127387,47.229602391334545&z=16&t=coordinate Московский проспект 15, корпус Ж, 2 этаж]

с 23 по 27 января 2012 г.

</center>


===Цель===
===Цель===


Цель курса дать практическое знание, как создать автоматический переводчик с помощью платформы свободного машинного перевода Apertium и связанных с ней программ. На ней создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Прежде всего, идёт речь об автоматических переводчиках между родственными языками например между романскими, германскими, славянскими или тюркскими. Стоит отметить, что Apertium активно поддерживает языки с малыми ресурсами, а сотрудники Apertium выражают заинтересованность в малоиспользуемых языках, таких как баскский, бретонский, чувашский, марийский и саамский.
Цель курсов &mdash; дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, внутри славянских языков (напр., с македонского на болгарский язык), с романского на романский, с германского на германский и с тюркского на тюркский. Стоит отметить, что команда Apertium проявляет большой интерес к региональным языкам и активно поддерживает те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.


Специальность по информатику или лингвистики не является необходимой. Достаточно быт пользователь компьютера, хорошо владеть основные грамматику, владеть больше одного языка, и заинтересоваться машинном переводе.
Специальные знания по информатике или лингвистике не являются необходимыми. Достаточно быть пользователем компьютера, хорошо владеть основами грамматики, владеть более чем одним языком и интересоваться машинным переводом.


Участники получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например [http://code.google.com/intl/ca/soc/ Google Summer of Code].
Posem que els participants sortiran preparats amb coneixements que els faran competitius per participar en GSoC 2012? (Si sí, com formular-ho)


===Программа===
===Программа===
:''См. также: [[Машинный перевод для языков России/Программа|Программа]]''
Курсы состоят из 40 часов, по 8 часов на протяжении 5 дней. Программа, прежде всего, включает практику.


<center>
Программа будет, прежде всего, практичной.
{| class="wikitable"
|- style="background: #ececec"
! День !! Время !! Тема
|-
|rowspan=2 align="center"|Понедельник<br/>(23 января) || 09:00 &mdash; 13:00 || Обзор
|-
| 14:00 &mdash; 18:00 || Основы словарей
|-
|rowspan=2 align="center"|Вторник<br/>(24 января) || 09:00 &mdash; 13:00 || Расширенные словари
|-
| 14:00 &mdash; 18:00 || Разрешение морфологической неоднозначности
|-
|rowspan=2 align="center"|Среда<br/>(25 января) || 09:00 &mdash; 13:00 || Лексическая передача
|-
| 14:00 &mdash; 18:00 || Структурная передача
|-
|rowspan=2 align="center"|Четверг<br/>(26 января) || 09:00 &mdash; 13:00 || Противопоставления уральских языков<br/>Противопоставления тюркских языков<br/>Продвинутая структурная передача I
|-
| 14:00 &mdash; 18:00 || Продвинутая структурная передача II
|-
|rowspan=2 align="center"|Пятница<br/>(27 января) || 09:00 &mdash; 13:00 || Последовательность данных, качество и оценка
|-
| 14:00 &mdash; 18:00 || Планирование проекта и практические вопросы и ответы
|}
</center>


===Преподаватели===
* Понедельник 23-I
* Вторник 24-I
* Среда 25-I
* Четверг 26-I
* Пятница 27-I


* '''Трун Тростерюд''' -- доцент языкознания в университете Тромсё. Он лингвист (университет Тронхейма, 1989 г.) и кандидат филологических наук (университет Тромсё, 2004 г., диссертация об определенных аспектах морфологической структуры уральских языков). С 1999 он работал над лингвистической технологией с вниманием на конечные машины для саамских языков и других уральских языков. Он также работал над автоматическим синтаксическим анализом и над основанным на правилах машинным переводом.
No el trobo per fer una traducció orientativa


* '''Францис Мортон Таерз''' -- аспирант факультета компьютерных наук университета Алаканта (Испания). Имеет степень бакалавра по программированию Уэльского университета, Аберистуита и степень магистра лингвистики университета Восточной Англии. Работает в качестве инженера по лингвистическому проектированию в области лингвистических технологий компании Промпсит (Prompsit). Был избран членом Комитета по реализации проектов компании Апертиум (Apertium) и назначен секретарем. Является активным членом нескольких групп, работающих в области лингвистического проектирования для развития миноритарных и региональных языков. В частности, это Специальная группа по развитию речевых и лингвистических технологий для миноритарных языков (SALTMIL). Принимал участие во многих международных семинарах и конференциях и имеет ряд опубликованных статей по теме машинного перевода в сборниках, вышедших по итогам конференций, и в международных журналах. В области машинного перевода его профессиональный интерес составляют маргинализованныe, миноритарные, региональные и малоиспользуемые языки; родственные языки; морфо-синтаксический анализ и снятие омонимии; типы машинного перевода, основанные на использовании правил; лексическая выборка.
===Преподаватель===


* '''Джонатан Норт Вашингтон''' -- аспирант лингвистического факультета Университета Индианы (США). В 2005 г. получил степень бакалавра по лингвистике и по антропологии Брандайсского Университета в Волтаме, Массачусетс, а в 2010-м году стал магистром лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (в большей степени казахский и кыргызский) и особенно их пересечение. В данное время работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.
Aquí hem de posar un breu CV del molt honorable professor :)


===Участие===
===Участие===


* Участие бесплатно
* Участие бесплатное
* Количество участников ограничено (20 человек)
* Участие ограничено на 20 человека
* Необходимо записаться до 15 января
* Необходимо записаться до 15 января
* Участники, посещавшие 90% времени курса (72 из 80 часов) и сдавшие практические задание, получат сертификат.
* Участники, посетившие 90% часов курсов (72 из 80 часов) и сдавшие практические задания, получат сертификат.


===Языки===
===Языки===


Основными языками курсов будут английский и русский. Будет проводиться перевод с английского на русский язык.
Курс будет проведён на английском языке с переводом на русский.

Документы курсов будут на русском языке.

===Проживание===

Иногородние участники могут ночевать в [http://www.edu.cap.ru/?t=eduid&eduid=4953 Лицее-интернате им. Г.С. Лебедева]. Комнаты двухместные. Цена: 300 руб./ночь. Студенты могут получить скидку.

=== Пресса ===

* [http://ru.chuvash.org/news/1045.html 29.12.2011. Курс машинного перевода для языков России]
* [http://gov.cap.ru/list4/news/rec.aspx?gov_id=13&link=&preurl=.&FKey=F_JURL_ID&id=1327517 16.01.2012. Курсы машинного перевода в Чебоксарах. Автоматический переводчик на чувашский язык 18.01.2012. Куçаруçăсен курсĕ ĕçлеме пуçлать]
* [http://chuvash.org/news/1916.html 18.01.2012. Куçаруçăсен курсĕ ĕçлеме пуçлать]
* [http://finugor.ru/node/22706 26.01.2012. В Чебоксарах готовят разработчиков систем машинного перевода с уральских языков]
* [http://www.chuvash.org/news/1945.html 29.01.2012. Раççĕй чĕлхисен машина куçарăвĕн курсĕ иртрĕ]
* [http://www.chuvsu.ru/~chfik/?q=cv/node/809 30.01.2012. Раççей чĕлхисен машина куçарăвĕн курсĕ]

===Запись===

'''Для участия необходимо записаться до 15 января.''' [https://docs.google.com/spreadsheet/viewform?formkey=dDRMQlBjeHJfUEx3a3BhOGtZYjVxbFE6MQ Запишитесь!]

__NOTOC__


===Com inscriure's===


[[Category:Машинный перевод для языков России|*]]
==Проект: Турецко-чувашский переводчик==

Latest revision as of 00:28, 26 January 2013

Курсы-консультации по совместной разработке научно-прикладных проектов в области машинного перевода

Шупашкар, Чӑваш Республики (Чебоксары, Чувашская Республика)

Университетский Центр Интернет Чувашского государственного университета
Московский проспект 15, корпус Ж, 2 этаж

с 23 по 27 января 2012 г.

Цель[edit]

Цель курсов — дать практические знания по созданию автоматического переводчика с помощью открытой платформы свободного машинного перевода Apertium и связанных с ней программ. На данной платформе создано около 40 автоматических переводчиков и ещё многие находятся в процессе создания. Речь, прежде всего, идёт об автоматических переводчиках между родственными языками, например, внутри славянских языков (напр., с македонского на болгарский язык), с романского на романский, с германского на германский и с тюркского на тюркский. Стоит отметить, что команда Apertium проявляет большой интерес к региональным языкам и активно поддерживает те языки, ресурсы которых малы, такие как баскский, бретонский, осетинский, чеченский, марийский, коми, чувашский, саха, казахский и киргизский.

Специальные знания по информатике или лингвистике не являются необходимыми. Достаточно быть пользователем компьютера, хорошо владеть основами грамматики, владеть более чем одним языком и интересоваться машинным переводом.

Участники получат знания, которые позволят им участвовать в конкурсах на получение грантов по созданию новых автоматических переводчиков, например Google Summer of Code.

Программа[edit]

См. также: Программа

Курсы состоят из 40 часов, по 8 часов на протяжении 5 дней. Программа, прежде всего, включает практику.

День Время Тема
Понедельник
(23 января)
09:00 — 13:00 Обзор
14:00 — 18:00 Основы словарей
Вторник
(24 января)
09:00 — 13:00 Расширенные словари
14:00 — 18:00 Разрешение морфологической неоднозначности
Среда
(25 января)
09:00 — 13:00 Лексическая передача
14:00 — 18:00 Структурная передача
Четверг
(26 января)
09:00 — 13:00 Противопоставления уральских языков
Противопоставления тюркских языков
Продвинутая структурная передача I
14:00 — 18:00 Продвинутая структурная передача II
Пятница
(27 января)
09:00 — 13:00 Последовательность данных, качество и оценка
14:00 — 18:00 Планирование проекта и практические вопросы и ответы

Преподаватели[edit]

  • Трун Тростерюд -- доцент языкознания в университете Тромсё. Он лингвист (университет Тронхейма, 1989 г.) и кандидат филологических наук (университет Тромсё, 2004 г., диссертация об определенных аспектах морфологической структуры уральских языков). С 1999 он работал над лингвистической технологией с вниманием на конечные машины для саамских языков и других уральских языков. Он также работал над автоматическим синтаксическим анализом и над основанным на правилах машинным переводом.
  • Францис Мортон Таерз -- аспирант факультета компьютерных наук университета Алаканта (Испания). Имеет степень бакалавра по программированию Уэльского университета, Аберистуита и степень магистра лингвистики университета Восточной Англии. Работает в качестве инженера по лингвистическому проектированию в области лингвистических технологий компании Промпсит (Prompsit). Был избран членом Комитета по реализации проектов компании Апертиум (Apertium) и назначен секретарем. Является активным членом нескольких групп, работающих в области лингвистического проектирования для развития миноритарных и региональных языков. В частности, это Специальная группа по развитию речевых и лингвистических технологий для миноритарных языков (SALTMIL). Принимал участие во многих международных семинарах и конференциях и имеет ряд опубликованных статей по теме машинного перевода в сборниках, вышедших по итогам конференций, и в международных журналах. В области машинного перевода его профессиональный интерес составляют маргинализованныe, миноритарные, региональные и малоиспользуемые языки; родственные языки; морфо-синтаксический анализ и снятие омонимии; типы машинного перевода, основанные на использовании правил; лексическая выборка.
  • Джонатан Норт Вашингтон -- аспирант лингвистического факультета Университета Индианы (США). В 2005 г. получил степень бакалавра по лингвистике и по антропологии Брандайсского Университета в Волтаме, Массачусетс, а в 2010-м году стал магистром лингвистического факультета Университета Вашингтона в Сиэтле. Его исследовательские интересы включают фонологическую теорию, фонетику, сравнительно-историческое языкознание, тюркские языки (в большей степени казахский и кыргызский) и особенно их пересечение. В данное время работает с данными натурных исследований, собранными в течение 2008-ого года в Кыргызстане по гранту Фулбрайт.

Участие[edit]

  • Участие бесплатное
  • Количество участников ограничено (20 человек)
  • Необходимо записаться до 15 января
  • Участники, посетившие 90% часов курсов (72 из 80 часов) и сдавшие практические задания, получат сертификат.

Языки[edit]

Основными языками курсов будут английский и русский. Будет проводиться перевод с английского на русский язык.

Документы курсов будут на русском языке.

Проживание[edit]

Иногородние участники могут ночевать в Лицее-интернате им. Г.С. Лебедева. Комнаты двухместные. Цена: 300 руб./ночь. Студенты могут получить скидку.

Пресса[edit]

Запись[edit]

Для участия необходимо записаться до 15 января. Запишитесь!