Difference between revisions of "Курсы машинного перевода для языков России/Раздел 2"
Firespeaker (talk | contribs) (→Изменяемость: better example) |
|||
Line 1: | Line 1: | ||
{{TOCD}} |
{{TOCD}} |
||
Данный раздел будет посвящен знакомству с более сложными |
Данный раздел будет посвящен знакомству с более сложными темами в словарях Apertium. В первом разделе мы увидели, как делать простые словарные записи, и рассмотрели парадигмы. В данном разделе мы рассмотрим как вводить словосочетания. |
||
This session aims to give an introduction to some more advanced topics in the Apertium dictionaries. We have seen in session 1 how to make simple dictionary entries, and looked at paradigms. In this session we'll make entries for multiwords. |
|||
==Теория== |
==Теория== |
||
Говоря о словосочетаниях |
Говоря о словосочетаниях, мы должны приниматься во внимание несколько аспектов. |
||
===Композиционность=== |
===Композиционность=== |
||
Line 12: | Line 11: | ||
{{comment|TODO; find examples}} |
{{comment|TODO; find examples}} |
||
Словосочетание является |
Словосочетание является составным, если его значение можно вывести из значений слов, которые его составляют. Однако это не означает, что оно останется составным при переводе. Например: |
||
* ''Телефонная будка''{{slc|ru}} |
* ''Телефонная будка''{{slc|ru}} - составное, значение становится понятным из значений двух компонентов. |
||
* ''Juego de etiquetas''{{slc|es}} - это |
* ''Juego de etiquetas''{{slc|es}} - это составное словосочетание, но отдельные его компоненты в данных значениях употребляются редко. |
||
* ''Итальянская забастовка''{{slc|ru}} |
* ''Итальянская забастовка''{{slc|ru}} - это частично не составное словосочетание, значение целого выражения непонятно, если знать отдельные значения двух составляющих слов. |
||
* ''Kafa çekmek''{{slc|tr}} - коллокация ( |
* ''Kafa çekmek''{{slc|tr}} - коллокация (не составное), общее значение не может быть получено из значений его компонентов. |
||
Учитывать |
Учитывать композиционность важно при переводе, потому что составное словосочетние по ошибке может быть рассмотрено как два отдельных простых слова, хотя должен быть список всех не составных словосочетаний (коллокаций). |
||
===Изменяемость=== |
===Изменяемость=== |
||
Line 27: | Line 26: | ||
В словосочетаниях могут меняться как окончания, например, во французском языке ''vaut la peine, valait la peine'', так и слова, в киргизском: ''башым айланып жатат, башым '''катуу''' айланып жатат'' "у меня голова кружится", "у меня голова '''очень''' кружится". Некоторые глаголы в словосочетаниях могут принимать пассивную форму. |
В словосочетаниях могут меняться как окончания, например, во французском языке ''vaut la peine, valait la peine'', так и слова, в киргизском: ''башым айланып жатат, башым '''катуу''' айланып жатат'' "у меня голова кружится", "у меня голова '''очень''' кружится". Некоторые глаголы в словосочетаниях могут принимать пассивную форму. |
||
Окончания слов могут изменяться или только в |
Окончания слов могут изменяться или только в одном слове: |
||
* в конце, ''pazartesi gün, pazartesi gün'''ler'''''{{slc|tr}} or |
* в конце, ''pazartesi gün, pazartesi gün'''ler'''''{{slc|tr}} or |
||
* в середине ''hôtel de ville, hôtel'''s''' de ville''{{slc|fr}} |
* в середине ''hôtel de ville, hôtel'''s''' de ville''{{slc|fr}} |
||
Или в обоих |
Или в обоих словах: |
||
* ''телефонная будка, телефонн'''ой''' будк'''и''''' {{slc|ru}} |
* ''телефонная будка, телефонн'''ой''' будк'''и''''' {{slc|ru}} и |
||
* ''баш айлан-, баш'''ым''' айлан'''ып жатат''''' {{slc|ky}}. |
* ''баш айлан-, баш'''ым''' айлан'''ып жатат''''' {{slc|ky}}. |
||
* ''курсак ач-, курсаг'''ым''' ач'''ып жатат''''' {{slc|ky}}. |
* ''курсак ач-, курсаг'''ым''' ач'''ып жатат''''' {{slc|ky}}. |
||
===Contiguity (смежность)=== |
===Contiguity (смежность, примыкание)=== |
||
{{comment|TODO; find examples}} |
{{comment|TODO; find examples}} |
||
Наряду с внутренними изменениями, словосочетания делятся на contiguous (контактные) или (неконтактные) or discontiguous. Contiguous означает, что слова следуют друз за другом, разделенные пробелом. Большинство вышеприведенных примеров - это contiguous |
Наряду с внутренними изменениями, словосочетания делятся на contiguous (контактные) или (неконтактные) or discontiguous. Contiguous означает, что слова следуют друз за другом, разделенные пробелом. Большинство вышеприведенных примеров - это contiguous словосочетания. Но бывают и discontiguous, такие как фразовые глаголы в шведском и нидерландском, например: ''lopen uit de hand'', ''äta upp'' и ''tilføje'': |
||
* ''Twee jaar later '''loopt''' de situatie in het land onder de indruk van massabetogingen '''uit de hand'''.''{{slc|nl}} |
* ''Twee jaar later '''loopt''' de situatie in het land onder de indruk van massabetogingen '''uit de hand'''.''{{slc|nl}} |
Revision as of 06:41, 17 January 2012
Данный раздел будет посвящен знакомству с более сложными темами в словарях Apertium. В первом разделе мы увидели, как делать простые словарные записи, и рассмотрели парадигмы. В данном разделе мы рассмотрим как вводить словосочетания.
Теория
Говоря о словосочетаниях, мы должны приниматься во внимание несколько аспектов.
Композиционность
TODO; find examples
Словосочетание является составным, если его значение можно вывести из значений слов, которые его составляют. Однако это не означает, что оно останется составным при переводе. Например:
- Телефонная будка(
ru
) - составное, значение становится понятным из значений двух компонентов. - Juego de etiquetas(
es
) - это составное словосочетание, но отдельные его компоненты в данных значениях употребляются редко. - Итальянская забастовка(
ru
) - это частично не составное словосочетание, значение целого выражения непонятно, если знать отдельные значения двух составляющих слов. - Kafa çekmek(
tr
) - коллокация (не составное), общее значение не может быть получено из значений его компонентов.
Учитывать композиционность важно при переводе, потому что составное словосочетние по ошибке может быть рассмотрено как два отдельных простых слова, хотя должен быть список всех не составных словосочетаний (коллокаций).
Изменяемость
TODO; find examples
В словосочетаниях могут меняться как окончания, например, во французском языке vaut la peine, valait la peine, так и слова, в киргизском: башым айланып жатат, башым катуу айланып жатат "у меня голова кружится", "у меня голова очень кружится". Некоторые глаголы в словосочетаниях могут принимать пассивную форму.
Окончания слов могут изменяться или только в одном слове:
Или в обоих словах:
- телефонная будка, телефонной будки (
ru
) и - баш айлан-, башым айланып жатат (
ky
). - курсак ач-, курсагым ачып жатат (
ky
).
Contiguity (смежность, примыкание)
TODO; find examples
Наряду с внутренними изменениями, словосочетания делятся на contiguous (контактные) или (неконтактные) or discontiguous. Contiguous означает, что слова следуют друз за другом, разделенные пробелом. Большинство вышеприведенных примеров - это contiguous словосочетания. Но бывают и discontiguous, такие как фразовые глаголы в шведском и нидерландском, например: lopen uit de hand, äta upp и tilføje:
- Twee jaar later loopt de situatie in het land onder de indruk van massabetogingen uit de hand.(
nl
) - Alla stygga barnen åt tigern upp.(
sv
) - Føje et ord eller en sætning til den brugerdefinerede ordbog.(
da
)