Task ideas for Google Code-in/Russian

From Apertium
Jump to navigation Jump to search

http://google-melange.appspot.com/gci/homepage/google/gci2011

Что это Google Code-In ?

Google Code-In is a contest held by Google to introduce pre-university students to the many kinds of contributions that make open-source software development possible. It runs from the 21st November, 2011 to the 16th January, 2012. We invite students from all over the world to produce a variety of open-source code, documentation, training materials and user experience research for the organisations participating this year. These tasks include:

  • Код: Tasks related to writing or refactoring code
  • Документация: Tasks related to creating/editing documents
  • Outreach/маркетинг: Tasks related to community management and outreach/marketing
  • Гарантия качества: Tasks related to testing and ensuring code is of high quality
  • Исследование: Tasks related to studying a problem and recommending solutions
  • Training: Tasks related to helping others learn more
  • Перевод: Tasks related to localisation
  • User Interface: Tasks related to user experience research or user interface design and interaction

Список задания

Тип работы Степень трудности Заглавие Описание Время
(часы)
Менторы
код 1. Трудное Преобразовать существующий ресурс: Морфологический анализатор русского языка (существительные) Взять Freeling анализатор (список морфологических форм) и преобразовать существительные в формат lttoolbox. 8–10 Francis Tyers
код 1. Трудное Преобразовать существующий ресурс: Морфологический анализатор русского языка (прилагательные) Взять Freeling анализатор (список морфологических форм) и преобразовать прилагательные в формат lttoolbox. 8–10 Francis Tyers
код 1. Трудное Преобразовать существующий ресурс: Морфологический анализатор русского языка (глаголы) Взять Freeling анализатор (список морфологических форм) и преобразовать глаголы в формат lttoolbox. 8–10 Francis Tyers
перевод 2. Нормальное Перевести руководство HFST на русский язык Перевести страницу Starting a new language with HFST на русский язык. 5–8 Francis Tyers
код 3. Лёгкое Преобразовать существующий ресурс: Reta Vortaro Русский-Эсперанто Взять Russian-Esperanto lexicon и преобразовать в формат lttoolbox. 2–4 Jimregan
исследование 2. Нормальное Противопоставление: Русский язык и эсперанто Создать множество тестовых фраз (смотреть различные страницы 'Pending tests' и 'Regression tests' в Вики) для перевода между русским и эсперанто. Тесты должны содержать как можно больше черт языков. Некоторые из примеров можно найти в грамматике, другие могут быть придуманы. Это не будет включать в себя программирование, только грамматический анализ. 4–6 Hectoralos
исследование 2. Нормальное Противопоставление: Чувашский и русский языки Создать множество тестовых фраз (смотреть различные страницы 'Pending tests' и 'Regression tests' в Вики) для перевода между чувашским и русским языками. Тесты должны содержать как можно больше черт языков. Некоторые из примеров можно найти в грамматике, другие могут быть придуманы. Это не будет включать в себя программирование, только грамматический анализ.. 4–6 Hectoralos
исследование 2. Нормальное Противопоставление: Чувашский и татарский языки Создать множество тестовых фраз (смотреть различные страницы 'Pending tests' и 'Regression tests' в Вики) для перевода между чувашским и татарским языками. Тесты должны содержать как можно больше черт языков. Некоторые из примеров можно найти в грамматике, другие могут быть придуманы. Это не будет включать в себя программирование, только грамматический анализ.. 4–6 Hectoralos
исследование 2. Нормальное Противопоставление: Чувашский и турецкий языки Создать множество тестовых фраз (смотреть различные страницы 'Pending tests' и 'Regression tests' в Вики) для перевода между чувашским и турецким языками. Тесты должны содержать как можно больше черт языков. Некоторые из примеров можно найти в грамматике, другие могут быть придуманы. Это не будет включать в себя программирование, только грамматический анализ.. 4–6 Hectoralos
исследование 3. Лёгкое Рукой создать русскоязычный корпус с морфологическими разметками

Исправлять ошибки в анализированном тексте, для тренировки маркировшика слов. Это вовлечёт взять текст без авторских прав (например из Википедии), анализирует и морфологически маркирует его, и изменит не правильные анализы с правильными. Предпочтительно использовать маркировшик LanguageTool.

Fix tagging errors in a piece of analysed text, for use in tagger training. This will involve taking some free text (such as from Wikipedia), running it through the analyser and tagger, and replacing incorrect analyses with the correct one. It may be preferable to use LanguageTool's tagger. || align=center| 2–4 || Jimregan