Difference between revisions of "Documentación Español-Esperanto"

From Apertium
Jump to navigation Jump to search
(+ Klarigoj pri reguloj)
(Forigo: →‎Aldonaĵo: Kelkaj notoj pri la svarmo de reguloj: (metita kiel memstara paĝo))
Line 3,068: Line 3,068:
 
'''Diciembre 2007'''
 
'''Diciembre 2007'''
 
</center>
 
</center>
 
 
=Aldonaĵo: Kelkaj notoj pri la svarmo de reguloj=
 
La ĉi-sekva klarigo estas pri la kataluna, sed ĝi same taŭgas por la hispana. Ni aperigas ĝin ĉi tie, ĉar ĝi eble helpos ion.
 
 
 
Verŝajne la plimulto de reguloj rilatas al la inversigo de la ordo de la adjektivoj (kutime postmetita en la latinidaj lingvoj, malkiel en esperanto kaj la angla). Tio kaŭzas grandajn kapdolorojn kaj necesigas profundetan sintaksan analizon. Ekzemple vidu, kio okazas, se oni havas nur regulon N + ADJ -> ADJ NOM en frazoj kiel:
 
 
<blockquote>
 
* la casa gran -> la granda domo<br />
 
* la casa gran i bonica -> * la granda domo kaj bela<br />
 
* la classe mitjana-alta -> * la mezuma klaso-alta<br />
 
* el nen i la nena grans -> * la knabo kaj la grandaj knabino<br />
 
* ktp.
 
</blockquote>
 
 
Krome necesas pritrakti la kazojn (kaj iliaj kombinoj!):
 
 
<blockquote>
 
* kun artikolo (difinita aŭ nedifinita) aŭ sen ĝi<br />
 
* kun (antaŭmetita) poseda pronomo aŭ sen ĝi<br />
 
* kun (antaŭmetita) numeralo aŭ sen ĝi<br />
 
* kun adverbo(j) antaŭ la adjektivo aŭ sen ĝi<br />
 
* kun du, tri, kvar adjektivoj (kun/sen komoj, kun/sen "kaj"/"aŭ" inter ili)<br />
 
* ktp.
 
</blockquote>
 
 
Inversigo de fraz-ordo estas granda kapdoloro, ĉar la rezulto povas fariĝi plena galimatio, kaj tiel ne malofte okazis. Ĝuste en la lastaj semajnoj mi sufiĉe laboris pri tio, kaj mi kredas, ke nun la afero estas sufiĉe stabila.
 
 
 
Alia sinsekvo de reguloj venas de la traduko de "que" el la kataluna (kaj hispana kaj franca), kiuj povas esti:
 
 
<blockquote>
 
* ke<br />
 
* kiu(j)(n)<br />
 
* kio(n)<br />
 
* ol
 
</blockquote>
 
 
Kaj ofte estas eraro en la elekto de la pluraj "que", pro kio necesas tion pritrakti en la regulojn (t1x kaj t2x).
 
 
Fakte pri tio estas malfacile solvebla nekontentigaĵo: temas pri la kompreno de la nombro de la rilativa pronomo "kiu". Ĉar tio pli simplas por t1x (en kiu oni devas malfari miselekton de la senambiguilon), oni analizas "que" surbaze de la vorto antaŭ ĝi (mi simpligas):
 
 
<blockquote>
 
* verbo (+adv) + "que" -> verbo (+adv) + ke<br />
 
* nomo (+adj) + "que" -> nomo (+adj) + kiu
 
</blockquote>
 
 
En la dua kazo, oni decidas, ke la nombro de "kiu" estas tiu de la nomo, kiu antaŭas ĝin, ĉar plej ofte tiel okazas:
 
 
<blockquote>
 
* la casa que és bonica -> la domo kiu estas bela
 
</blockquote>
 
 
Tamen tio ne veras:
 
 
<blockquote>
 
* la casa dels veïns que és bonica -> * la domo de la najbaroj kiuj estas bela
 
</blockquote>
 
 
Necesus generi la nombron surbaze de tiu de la verbo post "que", sed tion oni povus nur fari en t2x kaj, laŭ la nuna strukturo, tio ŝajnas apenaŭ farebla. Por la momento mi fajfas (kaj finfine tiu problemo ne staras inter la plej urĝaj).
 
 
 
 
Fine (en t2x) estas grupo de reguloj tipaj por lingvoj kiel la kataluna kaj la hispana (sed ne la angla kaj la franca): la aldonado de subjekta pronomo.
 
 
<blockquote>
 
* menjo -> mi manĝas
 
</blockquote>
 
 
Kiel pri la akuzativo, montriĝas, ke aparte malfacilas aldoni ion ne ekzistantan en la fontolingvo: oni facile eraras. Do, en t2x estas amaso da reguloj por "flari", ĉu ekzistas eksplicita subjekto aŭ ĉu necesas aldoni pronomon. Kaj tiuokaze, kiun aldoni? (ekz. oni elektas "ĝi" por la tria persono singularo, ĉar mankas kompreno pri la genro de la subjekto)
 
 
 
Do jen kelkaj klarigoj pri la svarmo da reguloj en la kataluna (kaj hispana), dum ili mankas en la angla, kiu principe ŝajnas pli malproksima de esperanto (sed montriĝas, ke ĉefe leksike, ne sintakse). Mi pensas, ke iom da dokumentado de la problemoj povas helpi en ontaj okazoj.
 
 
 
 
[[Category:Language pairs]]
 
[[Category:Spanish and Esperanto]]
 

Revision as of 14:28, 7 September 2010

Introducción

El objetivo de este documento es doble, por un lado pretendemos dar una visión de la cobertura del prototipo ES-EO a los posibles usuarios del sistema y, por el otro, documentar la implementación que hemos seguido, de modo que, aquellos que quieran ampliar el sistema dispongan de información suficiente.

Este documento no contiene información sobre la plataforma apertium, sino sobre el sistema de traducción ES-EO montado sobre esta plataforma. De modo que lo que aquí documentamos son únicamente los datos lingüísticos del par de lenguas ES-EO, es decir, los léxicos para este par de lenguas y las reglas de transformación de la gramática.

Para una documentación completa de la plataforma Apertium remitimos al lector a http://xixona dlsi ua es/apertium-www

El primer capítulo, describe la cobertura del léxico y se muestran los resultados obtenidos sobre el corpus.

El segundo capítulo, describe y justifica los fenómenos tratados en las reglas de la gramática.

El resto del documento contiene una serie de anexos con ejemplos de traducciones y el listado de reglas de la gramática. Las muestras de traducciones tienen una doble finalidad, por un lado pretenden ejemplificar los fenómenos tratados mediante el uso de baterías de oraciones preparadas a tal fin. Estas baterías deben tomarse únicamente como un test o muestra de la cobertura de la gramática. El resto de las muestras de traducciones, muestran el resultado obtenido sobre textos del corpus o sobre textos extraídos de la red. Su objetivo es mostrar los resultados reales (incluyendo cobertura léxica y gramatical) obtenidos al utilizar el traductor ES-EO sobre textos ‘reales’. En todas las traducciones, la presencia de un asterisco delante de una palabra indica que ésta no está incluida en el léxico.


El lector puede acceder on-line al traductor ES-EO en la dirección http://xixona.dlsi.ua.es/apertium-unstable


1. El léxico

introducción

El sistema apertium consta de tres léxicos para cada par de lenguas: dos léxicos monolingües y un léxico bilingüe. Los léxicos monolingües contienen el vocabulario de cada lengua organizado en unidades léxicas. Cabe señalar que el concepto ‘unidad léxica’ lo define el desarrollador de acuerdo con las necesidades del sistema de traducción, así, si bien, la mayoría de unidades léxicas corresponden a un lema, en otros casos pueden corresponder a una expresión (tan larga y compleja como queramos) o, si así lo queremos, a una ‘raíz’ a partir de la cual se derivan y flexionan diferentes formas.


Las unidades léxicas incluyen información morfosintáctica sobre la palabra o palabras que describen. El tipo de información dependerá de la categoría a la que pertenece la palabra y de las necesidades que requiera la gramática. Para simplificar la construcción del diccionario, los léxicos apertium admiten la definición de paradigmas. Los paradigmas funcionan a modo de macros que, una vez asignados a las entradas léxicas, expanden la información asociada. Básicamente los paradigmas se utilizan para flexionar las formas del lema y asignarles la información morfosintáctica que les corresponda. El léxico español contiene un número considerable de paradigmas de flexión. La regularidad de la morfología del esperanto simplifica considerablemente el sistema de paradigmas del léxico EO.


El léxico bilingüe contiene las correspondencias entre unidades léxicas de ambas lenguas. Estas correspondencias son de ‘1 a 1’, es decir para cada unidad léxica de la lengua origen tenemos una unidad léxica de la lengua meta. Esto quiere decir que el sistema apertium no trata todavía la polisemia (asignación de más de una traducción a una entrada).


El léxico bilingüe es bidireccional, es decir: se utiliza para la traducción en ambos sentidos. En nuestro caso, y dado que nuestro prototipo únicamente incluye la traducción en el sentido ES-EO, el léxico bilingüe únicamente debe leerse en este sentido.


Creación de los léxicos

La confección de los diccionarios se ha visto perjudicada por la tardanza en conseguir un léxico fuente con cobertura suficiente. Dadas las circunstancias, la creación de los léxicos ES-EO ha seguido un proceso secuencial en el cual se han ido añadiendo entradas a medida que se iban obteniendo nuevos recursos. Esta secuencialidad nos ha obligado, para cada nuevo recurso, a cruzar los datos ya existentes con los de la nueva fuente para extraer únicamente aquellos que eran nuevos y a definir nuevos mecanismos de conversión entre los diferentes formatos de los léxicos fuente y el formato apertium.


Los diferentes recursos léxicos que hemos utilizado como fuente eran de “uso humano” por lo que carecían de información morfosintáctica y no estaban completamente formalizados. Esta circunstancia ha dificultado el proceso de conversión.


Cabe señalar que en los diferentes procesos de conversión automática o semi-automática de léxicos únicamente hemos tratado las categorías abiertas (sustantivos, verbos, adverbios y adjetivos).


Dada su complejidad, las categorías cerradas se han codificado manualmente. Esto se debe a diferentes factores: (i) los léxicos fuente carecían de información morfosintáctica (ii) debíamos respetar la categorización del sistema ES-CA con el fin de aprovechar las fuentes estadísticas para el tagger, esto es especialmente relevante para las categorías cerradas como determinantes, pronombres, conjunciones, relativos etc (iii) las necesidades propias de categorización de un sistema de traducción automático para las categorías cerradas.


Al carecer de diccionarios ES-EO recurrimos al diccionario en línea AULEX en formato html, accesible en la red (http://aulex ohui net/).


El procedimiento seguido para el vaciado del diccionario AULEX fue el siguiente:


  • Generación del diccionario bilingüe:

En primer lugar extrajimos automáticamente las correspondencias mono-sémicas (aquellas en las que únicamente teníamos una traducción posible).

Para las entradas con polisemia −más de una traducción por palabra− se ha elegido la traducción preferente de manera manual (hay que recordar que el sistema apertium actual no trata la polisemia con lo cual debemos elegir de entre las diferentes correspondencias aquella que consideramos preferente). Con el fin de no perder datos para futuras ampliaciones/migraciones del sistema, las lecturas no preferentes de las correspondencias ES-EO polisémicas no se han eliminado, sino que se han restringido[#sdfootnote1sym 1] (r=”LR”) y se ha incluido la entrada ES, la entrada EO y la entrada restringida ES-EO. De este modo, los léxicos ES-EO y EO incluyen más entradas que el léxico ES.

Al ser el nuestro un prototipo de traducción unidireccional ES-EO, el hecho de que el léxico EO contenga entradas sin correspondencia bilingüe (o con correspondencia bloqueada) no perjudica el sistema y facilita futuras ampliaciones.


  • Generación de los correspondientes diccionarios monolingües:

A los diccionarios ES y EO se les añadió la información morfológica y los paradigmas de flexión correspondientes. Para el léxico español hemos utilizado los paradigmas del sistema ES-CA añadiendo (o modificando) los que faltaban. Con el fin de garantizar la reusabilidad entre los datos lingüísticos de los diferentes recursos Apertium, hemos optado por realizar las menores modificaciones posibles a los paradigmas del sistema ES-CA.


- Inclusión de entradas no recogidas en el diccionario AULEX, con el fin de mejorar la cobertura. Para ello se extrajeron listas de frecuencias para priorizar las palabras más frecuentes y se realizaron pruebas de cobertura sobre el corpus.

- Inclusión de entradas multipalabra para mejorar la calidad de la traducción, haciendo especial hincapié en las locuciones adverbiales, perífrasis verbales, frases hechas y conectores ya que en estos casos la traducción palabra a palabra da resultados enojosos.


Dado que el diccionario AULEX contaba únicamente con unas 10.000 correspondencias ES-EO[#sdfootnote2sym 2], ampliamos el léxico a partir del diccionario bilingüe EO-CA.


Al final del proyecto (30-10-07) recibimos, al fin, el léxico HISP-ES.rtf amablemente cedido por Miguel Gutiérrez Adúriz. De este recurso extrajimos los sustantivos, adjetivos y algunos verbos que no constaban en nuestro léxico inicial. Dado el formato del léxico fuente y lo avanzado del proyecto, extrajimos las entradas mono-sémicas y aquellas que no contenian comentarios y podían ser ‘fácilmente’ incorporadas. Del resto de entradas, es decir: las polisémicas y aquellas cuyo formato no permitía la conversión semiautomática, únicamente pudimos tratar un pequeño grupo.




  • Cobertura del diccionario español para las principales categorías


nombres comunes

7.090

nombres propios

349

verbos

2.012

adverbios

433

adjetivos

1.818


El total de entradas en el léxico ES es de 12.300.



  • Cobertura sobre corpus


Hemos realizado las pruebas de cobertura sobre un corpus de 932.221 palabras (unas 2.500 páginas de texto) −formado por noticias de prensa−, entendiendo por palabra cualquier cadena entre blancos (comando “wc –w” sobre un corpus en formato de texto en Linux).


Al lanzar el traductor ES-EO sobre la totalidad del corpus hemos obtenido 105.989 “palabras” no encontradas, que representan el 11,36% de las “palabras” del corpus. Dicho de otro modo, el 88,64% de las “palabras” del corpus de contraste están incluidas en el léxico.


Si del conjunto de “palabras” no encontradas eliminamos las repetidas, obtenemos un total de 38.187 “palabras” diferentes no encontradas. Las más frecuentes, aquellas que superan las 100 ocurrencias, se listan a continuación junto con el número de ocurrencias ordenadas de menor a mayor:


100 *Carod

176 *crecimiento

100 *quedó

194 *Sant

101 *Reus

209 *Aznar

102 *ETA

220 *Josep

108 *Blair

236 *PSC

109 *tripartito

246 *i

112 *Bagdad

247 *Govern

115 *Antonio

254 *ex

115 *Rodríguez

255 *Joan

116 *EE.UU

270 *PSOE

118 *Saddam

277 *ERC

123 *Ronaldinho

312 *Maragall

130 *conseller

317 *Barça

133 *queda

326 *CiU

134 *Tarragona

337 *Generalitat

138 *Qaeda

362 *Bush

141 *Girona

398 *PP

145 *azulgrana


146 *Jordi


162 *Estatut


163 *Forum


171 *electoral


171 *Rijkaard






2. La gramática

El análisis contrastivo entre el Español y Esperanto y la frecuencia de uso ha determinado las reglas y prioridades a abordar en la gramática. A grandes rasgos, las reglas que hemos priorizado son aquellas que


  1. en primer lugar, garantizan una transferencia morfosintáctica y estructural básica entre las dos lenguas,
  2. abordan aspectos que deben generarse en la lengua meta y no están presentes en la lengua origen. En estos casos, el proceso de traducción no puede limitarse a la simple transferencia léxica (y/o estructural) entre el par de lenguas sino que debe generar la información necesaria para la lengua meta de la que no se dispone en la lengua origen (por ejemplo: la asignación de caso, la generación de pronombre sujeto para evitar el prod-drop, etc)
  3. implican transformaciones estructurales cuando no existe una correspondencia estructural iso-mórfica entre el par de lenguas (este es el caso de determinadas construcciones en las que el orden de entrada OSV debe generarse como SVO; determinados compuestos nominales del tipo N+de+N ...)


Cabe señalar que, dado el formalismo con el que tratamos y con el fin de no sobrecargar las reglas de la gramática con casuísticas innecesarias, el principio que hemos aplicado es el siguiente:

ante una correspondencia compleja entre las dos lenguas, si el fenómeno puede tratarse en el léxico mediante la creación de una unidad léxica multi-palabra hemos optado por la correspondencia léxica.

Este es el caso de entradas multi-palabra como: los pronombres objeto “a mí”, “a ti”, etc; construcciones verbales como “tener que”; construcciones pre-nominales complejas como “la mayoría de”, etc..


Así pues, a grandes rasgos, los fenómenos cubiertos por la gramática ES-EO son los siguientes:


  • Identificación del sintagma nominal,incluyendo premodificación y postmodificación. La identificación del SN es necesaria para garantizar la concordancia entre los elementos del propio sintagma y entre los de la oración.
  • La postmodificación nominal incluye las oraciones de relativo. Estas construcciones suponen un reto importante ya que al contrario que en español, el pronombre relativo del esperanto flexiona en número y caso. Las reglas de la gramática deben, por lo tanto, generar la forma correcta.
  • Asignación de caso (nominativo/acusativo) dependiendo de la función del SN. Al contrario que en español (que carece de flexión nominal de caso), el esperanto marca los objetos directos en acusativo.
  • Construcciones comparativas y superlativas.
  • Análisis de los pronombres del español para la correcta traducción al esperanto. Pronombres personales átonos (o clíticos) preverbales y post-verbales. Asignación de caso. El fenómeno del clitic doubling.
  • Identificación y generación de las formas verbales incluyendo formas verbales simples, compuestas y perífrasis verbales.
  • Tratamiento de la ausencia de sujeto o pro-drop del español. A diferencia del español, el esperanto no es una lengua pro-drop y, por lo tanto, necesitamos generar un pronombre sujeto cuando la oración en español carece de él.
  • Análisis de oraciones con orden invertido OVS. Hay casos en que la estructura de la oración en español no sigue el patrón SVO o no se corresponde de manera isomórfica con la del esperanto. Este es el caso de las construcciones interrogativas y las oraciones con inversión argumental (por ejemplo, los verbos del tipo 'gustar').
  • Construcciones con cláusulas subordinadas.
  • Construcciones con el patrón SER+ADJ+INF. Este tipo de construcciones implican un cambio estructural ya que la entrada SER+ADJ+INF se corresponde con ESTI+ADV+INF. En estos casos el adjetivo del español debe traducirse por adverbio en esperanto.


Cabe recordar que la aplicación de las reglas de la gramática depende de la cobertura del léxico, de modo que si una palabra del texto de entrada no se encuentra en el léxico, no puede ejecutarse la regla que en su caso se aplicaría.


A grandes rasgos, podemos decir que las reglas del primer nivel de análisis (T1X) se encargan de identificar y, en su caso, clasificar los sintagmas, mientras que las reglas del segundo nivel (T2X) actúan sobre estos sintagmas para establecer operaciones tales como la asignación de caso, la generación de sujeto elidido o determinadas transformaciones estructurales.


El sistema ES-EO tiene 98 reglas en el nivel T1X y 66 en el T2X listadas en los anexos 5 y 6 respectivamente.

Como ya hemos mencionado, las prioridades que hemos adobtado al definir el conjunto de reglas de la gramática se han establecido en buena medida en criterios de frecuencia. Así, por ejemplo, si observamos el número de ocurrencias de las 7 ‘palabras’ más frecuentes del corpus, vemos que la ‘palabra’ QUE es la tercera en la lista. Teniendo en cuenta que el primer sustantivo es años con 1330 ocurrencias seguido de año con 947, parte con 905 y presidente con 864, no es de estrañar que hayamos priorizado el análisis del QUE.

59.777 de

35.252 la

30.506 que

26.806 el

24.608 en

22.251 y

18.438 a


2.1. El sintagma nominal


Las reglas de detección de SN están incluidas en el primer nivel de análisis (T1X). Básicamente las reglas de SN tratan sobre:



a) Premodificación nominal


Las reglas de formación de SN cubren la premodificación nominal con un “determinante” o más. La categoría determinante comprende las subcategorías siguientes:



<def-cat n="det">

<cat-item tags="det dem *"/> demostrativos (este, ese, aquel,...)

<cat-item tags="det ind *"/> indefinidos (uno, cada, demás,...)

<cat-item tags="det def *"/> definidos (el, la, los, las,...)

<cat-item tags="det pos *"/> posesivos (mi, tu,...)

<cat-item tags="det qnt *"/> cuantificadores (bastantes, unos cuantos, demasiados,...)

<cat-item tags="predet *"/> predeterminantes (todos,…)

<cat-item tags="num *"/> numerales (dos, tres, mil,...)

</def-cat>


También se incluyen reglas con adjetivos en posición prenominal.



b) Postmodificación nominal


La postmodificación nominal comprende los adjetivos y las cláusulas de relativo. Los adjetivos pueden ir coordinados y admiten premodificación adverbial.


La postmodificación nominal incluye también las cláusulas de relativo. Básicamente, para cada regla de SN se ha creado la correspondiente regla con el pronombre relativo que (las cláusulas de relativo se explican más adelante).


A excepción de la estructura “N de N”, las reglas de SN no incluyen la postmodificación con sintagmas preposicionales. Los SSPP se tratan como cadenas de prep+SN en el segundo nivel, con esto evitamos la proliferación de reglas de SN.


Las estructuras N1+de+N2 sí se abordan en la formación de SN, ya que su traducción al esperanto debe generar un compuesto N2+N1. Estas reglas tienen restricciones atendiendo al número del segundo SN:



Las páginas de discusión

La diskutopagxoj



Las estructuras de SN más comunes del corpus son DET+N (con 70.397 ocurrencias) y DET+NOM+ADJ (con 14.314 ocurrencias), es destacable la diferencia estadística entre el primer y el segundo patrón.


En el Anexo 1, podemos observar algunos ejemplos de construcciones (y traducciones) de SSNN


2.1.1 Las cláusulas de relativo


En español, el pronombre relativo que es invariable, mientras que en esperanto éste concuerda con su antecedente en número y lleva caso nominativo o acusativo, dependiendo de la función que desempeñe en la cláusula subordinada. El proceso de traducción, por lo tanto, debe generar la forma KIU correctamente flexionada en número y caso (inexistente en español).


La asignación de número se determina en las reglas del primer nivel encargadas de identificar los SSNN, así se hace concordar el pronombre relativo KIU con el nombre inmediatamente anterior.


La asignación de caso se realiza en las reglas del segundo nivel (T2X) y, a grandes rasgos, se calcula teniendo en cuenta la concordancia entre el SN antecedente con el verbo y la presencia o no de un segundo SN. En el caso que el pronombre relativo KIU se analice como objeto, las reglas determinan si deben generar un pronombre sujeto o no para, así, eliminar el posible pro-drop del español.


A continuación listamos las reglas involucradas y algunos ejemplos:



SN SNrelatiu SNobj SV

el niño que nos vio → la knabo ''kiu'' nin vidis

SN SNrelatiu SNobj SV

el niño que nos dio el libro → la knabo ''kiu'' al ni donis la libron

SN SNrelatiu SN SV

el niño que ella vio → la knabo ''kiun'' sxi vidis

SN SNrelatiu SV SN

el niño que vio la casa → la knabo ''kiu'' vidis la domon

la niña que vieron los niños → la knabino ''kiun'' vidis la knaboj

SN SNrelatiu SV

la niña que vino → la knabino ''kiu'' vino

los niños que' viste → la knaboj ''kiujn'''''vi'' vestu






Ella compró las flores más bonitas que había en la tienda

Sxi acxetis la pli belajn florojn ''kiuj'' estis en la tendencu

El libro que leímos ayer era muy interesante

La libro ''kiun ni'' legis hieraux estis tre interesa


El chico que vino

La knabo ''kiu'' venis

Los chicos que vinieron

La knaboj ''kiuj'' venis

Todos los chicos que la niña vio

Cxiuj knaboj ''kiujn'' la knabino vidis



En el Anexo 2 mostramos los primeros ejemplos del corpus en los que aparece la palabra QUE.


2.1.2. Los comparativos y los superlativos

El más alto

La plej alta

Los más bonitos

La plej belaj

Estas flores son las más bonitas

Cxi tiuj floroj la plej belaj

El mejor

La pli bona

Estas flores no son tan bonitas como aquellas

Cxi tiuj floroj ne estas tiel belaj kiel tiuj

Él actuaba como si la culpa lo atormentara

Bli agis kvazaux la kulpo lin turmentis


2.2. La asignación del caso en los SSNN


En esperanto, el objeto directo lleva caso acusativo. Determinar la función de los SN es, pues, imprescindible para la asignación correcta del caso. A grandes rasgos, el proceso de asignación de caso se aplica de la forma siguiente:


- Las reglas de formación de SN al T1X (primer nivel) identifican los SN que en ningún momento pueden llevar caso acusativo mediante la macro 'nom_cas'. Este es el caso de sustantivos precedidos por premodificadores del tipo:


<list-item v="iom da"/>

<list-item v="la plimulto da"/>

<list-item v="tro da"/>

<list-item v="malpli da"/>

<list-item v="ne multe da"/>

<list-item v="suficxe da"/>

<list-item v="ne multe da"/>

<list-item v="tiom da"/>



  • En el segundo nivel (T2X), por norma general se analiza el SN postverbal como objeto directo (ver excepciones a la norma más a bajo). Aquí hemos partido de la base que el español es una lengua de orden Sueto Verbo Objeto SVO (las construcciones OVS se explican más a bajo).


  • Las reglas del T2X asignan caso acusativo a los SN objeto, a excepción de los que en el nivel anterior se hayan identificado como “no-acusativos”.


  • Para evitar análisis erróneos, como en el caso de las construcciones interrogativas y las construcciones con inversión argumental con verbos del tipo gustar (ambas con el orden invertido OBJ VERBO SUBJ) se han creado reglas específicas:



Construcciones interrogativas (OVS)

Las construcciones interrogativas introducidas por qué siguen el orden OVS. Por lo tanto, en estos casos, el SN preverbal no se analiza como sujeto sino como objeto directo. En el caso de tener un SN postverbal, éste se analiza como sujeto. Si, por el contrario, no tenemos SN postverbal, la regla se encarga de generar el pronombre sujeto correspondiente eliminando así el pro-drop del español:



SN V

Qué lees?

Kion ''vi'' legas?

SN V SN

Qué lee la niña?

Kion legas la knabino?





Construcciones con inversión argumental (OVS)


En español, las construcciones con verbos del tipo gustar presentan lo que llamamos inversión argumental y siguen el orden OVS. Por el contrario, en esperanto estos verbos se rigen por el orden SVO.



A mí me gustan las patatas

Mi sxatas la terpomojn

No me gusta comer verdura

Mi ne sxatas mangxi legomon


En este caso tenemos dos oraciones de inversión argumental con el verbo gustar. En ambas, el objeto directo del español pasa a ser sujeto en esperanto, mientras que el objeto inicial pasa a ser sujeto en la traducción final.


En el primer ejemplo, la oración tiene además lo que llamamos clitic doubling (duplicidad del objeto mediante un pronombre fuerte y un clítico). Esta duplicidad debe eliminarse en la lengua meta.


En el segundo ejemplo, el verbo gustar actúa como verbo de control, y por lo tanto tenemos un verbo subordinado en infinitivo. Como veremos más adelante, estas estructuras también están cubiertas por la gramática.


En el Anexo3 podemos ver algunos ejemplos de construcciones con inversión argumental.


2.3. El sintagma verbal

Las reglas que identifican el SV se encuentran en el primer nivel de análisis (t1X). Lo que aquí llamamos SV corresponde únicamente al núcleo del sintagma verbal, es decir, al verbo o a los verbos en casos de perífrasis y estructuras de control.


Las reglas del T1X tienen la función de (i) traspasar la información de flexión, (ii) clasificar los SSVV de acuerdo con el verbo implicado (volition, movimiento, etc) y (iii) en el caso de las formas compuestas, construcciones de control o perífrasis, identificarlas para formar un núcleo verbal compuesto.


Las reglas del T2X se encargan de aplicar los cambios estructurales necesarios cuando se trata de construcciones con orden OVS.



2.4. El sintagma verbal: perífrasis


Como norma general, las construcciones de control (VERBO+INFINITIVO) del español son isomorfas en esperanto. Las reglas del primer nivel detectan estructuras de este tipo y generan el correspondiente chunk.


El corpus que hemos utilizado tiene un total de 6.687 estructuras de control.



La niña quería leer

La knabino volis legi

La niña podía leer

La knabino povas legi



En todos los casos las construcciones de control (verbo + (prep) + infinitivo) se analizan como una única unidad, es decir, se genera un único chunk verbal del tipo “perífrasis” formado por los dos verbos, de manera que el resultado del primer análisis pueda entrar en las reglas del segundo nivel del mismo modo que si de un sólo verbo se tratara.


En el siguiente ejemplo vemos la salida del T1X para la oración quiero comer patatas. En este caso obtenemos dos chunks: un SV con las formas VOLI+MANGXI y un SN con el sustantivo TERPOMO:


^verbcj_perif<SV><vblex><pri><p3><pl><volition>{^voli<vblex><pres>$^mangxi<vblex><inf>$}$

^nom<SN><f><pl><nomi>{^terpomo<n><pl><4>$}$


De este modo, las reglas de determinación de caso del T2X pueden asignar acusativo al SN postverbal, independientemente de si tenemos una oración simple (María come patatas) o una construcción más compleja (María quiere comer patatas):


^verbcj_perif<SV><vblex><pri><p3><pl><volition>{^voli<vblex><pres>$^mangxi<vblex><inf>$}$

^nom<SN><f><pl><acc>{^terpomo<n><pl><4>$}$



Hay, sin embargo, casos más complejos en los que la traducción no es isomorfa, lo cual implica algún tipo de transformación estructural:





  1. Perífrasis de obligación: 'tener+que+infinitivo' / 'haber+de+infinitivo' (Ejemplo: tener que trabajar/comer).


La forma tener+que está entrada en el léxico como una multipalabra y, por lo tanto, se rige por la regla general de VERB+INF:


María tiene que trabajar

Maria 'devas' labori

Pedro tiene que comerse los macarrones

Petro 'devas' mangxi la makaronojn



Del mismo modo, la forma deber+de está entrada en el diccionario como multipalabra y, por lo tanto, se traduce con la regla general de VERB+INF:



María ha de trabajar

Maria 'devas' labori


La construcción ‘hay que + inf’ se trata a parte y se genera la expresión oni + devi + inf



b) Perífrasis de probabilidad 'deber+de+infinitivo' (Ejemplo: debe de ser tonto)


La idea de probabilidad que introduce la forma española deber de, se expresa en esperanto mediante el adverbio eble. Por lo tanto, se ha definido una regla específica que sustituye las formas deber+de por el adverbio eble y flexiona el verbo infinitivo original en la forma que corresponda, de acuerdo con la información del verbo de entrada deber:



Pedro debe de ser tonto

Petro eble estas malserioza

Los niños debían de estar leyendo

La knaboj 'eble estis legante



c) Perífrasis de inminencia: 'estar a punto de+infinitivo' (Ejemplo: estar a punto de salir/leer)


La perífrasis estar a punto de es una entrada multipalabra en el léxico español. La regla VERBestarapunto de+INF se encarga de generar la forma correspondiente del verbo esti y de la forma onta del infinitivo de entrada. La marca de número de la forma onta se toma de la flexión de número del verbo español:


Estoy a punto de salir

Estas elironta


La niña estaba a punto de leer el libro

La knabo estis legonta la libron

Las niñas estaban a punto de leer el libro

La knaboj estis legontaj la libron



d) Perífrasis con valor temporal: acabar de+infinitivo (Ejemplo: acaba de leer).


La perífrasis acabar+de está entrando como verbo multipalabra y la regla VERBacabarde+INF se encarga de añadir el adverbio jxust y flexionar el segundo verbo según corresponda.



Los chicos acaban de leer el libro

La knaboj jxus legas la libron



e) Perífrasis con valor temporal de futuro: ir+a+infinitivo (Ejemplo: ir a comer).


La estructura ir+a+infinitivo se traduce por la forma verbal en futuro del infinitivo, precedida por el adverbio tuij:



Voy a comer patatas

Mi tuj mangxos terpomojn


f) Perífrasis con valor continuativo o repetitivo: estar+gerundio (Ejemplo: estar leyendo).


Se traduce al presente, pasado o futuro dependiendo del auxiliar estar del español, que no se traduce al esperanto:


La niña está leyendo

La knabino legas

La niña estaba leyendo

La knabino legis



2.4.1 Las construcciones con cláusulas subordinadas


Las construcciones con cláusulas subordinadas son aquellas que siguen la estructura VERB+QUE+(SN)+VERB. Cuando en español no tenemos SN preverbal, se genera la forma pronominal correspondiente para evitar el pro-drop.



La chica dice que vendrá

La knabino diras ke ''gxi'' venos

La chica dice que la madre vendrá

La knabino diras ke la patrino venos



En el caso de verbos con valor imperativo (identificados y marcados en el nivel anterior como volition mediante la macro tipo_verbo) como en el caso de querer, ordenar o pedir, la forma verbal subordinada se flexiona en imperativo:



Yo quiero que vengas

Mii volas ke vi venu

Yo les pedí que vinieran

Mi ilin petis ke ili venu


María dice que le gusta comer patatas

Maria diras ke li sxatas mangxi terpomojn



  • Cláusulas con '''lo que


La expresión lo que está entrada en el léxico ES como pronombre relativo y se le asigna la traducción kio. Puesto que el relativo kio del esperanto flexiona en caso, debemos determinar la función de este pronombre. Para ello, la regla del T1X identifica las ocurrencias de lo que para que las reglas del T2X puedan asignar el caso según los contextos:



Incongruente con lo que hace

Nekongrua kun ''kion ili'' faras

A veces las cosas no son lo que son

Kelkfoje la ajxoj ne estas ''kio'' estas

Esto es lo que dicen los profesores

Tiu estas ''kion'' diras la profesoroj



2.5. Los verbos de movimiento y la asignación de caso acusativo

La macro del T1X 'tipus_verb' identifica los verbos de movimiento. Las reglas del segundo nivel identifican los SSVV marcados en el nivel anterior y asignan acusativo al sustantivo postverbal.


La chica entró en el comedor

Knabino eniris en la mangxocxambron


2.6. construcciones ‘ser+adj+inf’

Cuando en español tenemos la estructura SER+ADJ+INF, en esperanto debemos generar la estructura ESTI+ADV+INF. Para poder realizar este cambio de estructura hemos definido el paradigma de los adjetivos del esperanto de manera que genere la forma adverbial correspondiente añadiendo la terminación e a la raíz:


facila:facila<adj><sg><nomi>

facilaj:facila<adj><pl><nomi>

facilan:facila<adj><sg><acc>

facilajn:facila<adj><pl><acc>

facile:facila<adv>


Nótese que en este caso el paradigma del léxico EO aborda la tanto flexión como la derivación.

Con esto, las reglas del primer nivel pueden cambiar la categoría del adjetivo de entrada, ya que en este caso tenemos información del lema. La regla, por lo tanto, se encarga de (i) la correspondencia entre los lemas de entrada y salida y (ii) , al contrario que las reglas de adjetivo que transfieren también la información de flexión, de asignar la etiqueta ‘adv’ con lo que se garantiza la correcta generación del adverbio en esperanto:

<chunk name="adv" case="caseFirstWord">

<tags>

<tag><lit-tag v="adv"/></tag>

</tags>

<lu>

<clip pos="2" side="tl" part="lem"/>

<lit-tag v="adv"/>

</lu>

</chunk>


Ejemplos en los que el adjetivo de control del español se traduce por un adverbio en esperanto:

Es muy interesante viajar con el esperanto

Estas ''tre interese'' vojagxi 'kun' Esperanto

Es necesario poder dormir bien

Estas ''necese'' povi dormi bone


2.7. Los pronombres personales objeto (clíticos)


En español tenemos pronombres personales de objeto que se pueden realizar con la forma fuerte o como clíticos (Ejemplo: vimos a ella en el parque vs la vimos en el parque).


En los dos casos, la traducción al esperanto es la misma:



La vimos en el parque

Vidis ''sxin'' en la parko

Vimos a ella en el parque

Vidis ''sxin'' en la parko



Los pronombres objeto que aquí llamamos fuertes están entrados en el léxico como multipalabras (a mí, a ella, etc).


En esperanto el objeto directo lleva caso acusativo mientras que el objeto indirecto va precedido por la preposición al y en nominativo. Es necesario, por lo tanto, determinar la función de los pronombres para generar las formas correctas.


Cuando en español hay dos clíticos no tenemos demasiados problemas para determinar cual de ellos es el objeto directo y asignar caso acusativo en la generación. Para ello, las reglas del primer nivel se encargan de localizar secuencias de dos clíticos para generar las formas correctas: dativo para el primer clítico y acusativo para el segundo:



La niña me los dio

La knabino ''ilin al mi'' donis



En el caso de tener únicamente un clítico, es difícil determinar si corresponde al objeto directo o al objeto indirecto (en español tenemos la misma forma en ambos casos: me pegaron; me dieron un cachete). De este modo, las reglas del primer nivel inicialmente analizan el clítico como objeto directo. No es hasta el segundo nivel de análisis que podemos comprobar si detrás del verbo hay o no un SN susceptible de ser el verdadero objeto directo. En este caso, el SN postverbal se analiza como objeto directo −y, por lo tanto, se le asigna acusativo−y el clítico preverbal se genera como objeto indirecto:



La niña me pegó

La knabino ''min'' batis

La niña me dio el libro

La knabino ''al mi'' donis la libron


La niña me vio

La knabino ''min'' pentris

La niña me dio los libros

La knabino ''al mi'' donis la librojn



En estos ejemplos la misma forma me se traduce por min cuando se analiza como objeto directo y por la forma al mi cuando la presencia de un SN postverbal hace que se analice como objeto indirecto .


Véase el Anexo 3 para más ejemplos.


2.8. El clitic doubling


En español podemos tener duplicidad en los pronombres personales objeto. Así pues, pueden coocurrir un pronombre personal fuerte y un clítico co-referente. En estos casos, una correcta traducción al esperanto debería eliminar la duplicidad. Las reglas del primer nivel identifican cadenas de este tipo y eliminan la duplicidad:



A él le vimos en el parque

L''in'' vidis en la parko

A mi no me gusta comer verdura

Mi'' ne sxatas mangxi legomon



En el diccionario español, las formas a él, a mí, a ella, etc. , están entradas como multipalabras.



2.9. El pronombre se


Los problemas de análisis de la forma se del español son de sobra conocidos. Observando el corpus, finalmente hemos determinado eliminar el pronombre se; este enfoque es aceptable cuando tenemos un verbo pronominal o un benefactivo (la mayoría de los casos):



María se olvidó

Maria forgesas

María se comió todas las patatas

Maria mangxis cxiujn terpomojn



Obviamente el análisis no es correcto cuando el se corresponde al objeto indirecto, ya que en este caso deberíamos generar la forma correspondiente en esperanto. Dado que en numerosos casos, el objeto indirecto se duplica con un SN en función de objeto indirecto, la elisión de éste es finalmente correcta:


María se lo dio al niño

Maria lin donis al la knabo


Falta por abordar el uso del se en las llamadas construcciones medio pasivas.


2.10. La elisión del sujeto o pro-drop


El esperanto es una lengua que no admite pro-drop, por lo tanto, hemos de generar los pronombres personales sujeto cuando éstos están elididos.


Se han definido varias reglas que generan el pronombre sujeto en los contextos siguientes:


- marcador de frase + SV

- marcador de frase + ADV + SV

- qué + SV

- SV que SV


Los marcadores de frase incluyen los signos de puntuación y palabras (o conjunto de palabras) que típicamente introducen una oración como son dado que, puesto que, así pues, codificadas en el léxico con la categoría cnjadv. Las conjunciones y y o también son marcadores de frase.


Las reglas se aplican en estos contextos siempre que el verbo esté en alguna forma personal (no se aplican cuando tenemos infinitivos o verbos en imperativo).


Ejemplos:


Comen patatas, Quieren comer patatas →, ''Ili ''mangxas terpomojn , ''Ili'' volas mangxi terpomojn


En lo dos ejemplos abajo, las reglas actúan sobre el patrón “marcador de frase+(ADV)+SV” para generar la forma pronominal correspondiente. En el primer caso tenemos un signo de puntuación como marcador de frase y en el segundo una locución:


, quiero que vengas

, ''mi'' volas ke ''vi'' venus

dado que no vienes

pro tio ke vi ne venis



En los dos siguientes ejemplos actúan las reglas encargadas de detectar patrones de construcciones interrogativas. En el primer caso la ausencia de un SN post-verbal provoca la generación del pronombre sujeto. EN el segundo caso, el SN post-verbal se analiza como sujeto bloqueando, así, la generación del pronombre.


qué quieres?

Kion ''vi'' volas?

qué quiere la niña?

Kion volas la knabino?



El pro-drop en cláusulas de relativo también se aborda. Así, cuando el pronombre relativo se analiza como objeto directo y no hay ningún SN disponible para ser sujeto, se genera el pronombre sujeto que corresponda:



La chica que vi

la knabino ''kiun'''''mi'' vidis

La chica que nos vio

la knabino ''kiu'''''nin'' vidis

Los chicos que vio el profesor

la knaboj ''kiujn'' vidis la profesoro

Los chicos que vieron el profesor

la knaboj ''kiuj'' vidis la profesoron

2.11. Inversión argumental


Para verbos que, como gustar o encantar, implican inversión argumental, se han realizado reglas específicas que invierten el orden, de forma que el objeto pasa a sujeto y el sujeto postverbal del español pasa a objeto y, por lo tanto, se genera en acusativo. La macro ‘tipus_verb’ del T1X identifica los verbos del tipo gustar de modo que las reglas del T2X puedan actuar sobre ellos:


Ejemplos:


Te gustan las patatas

Vi sxatas la terpomojn

Me gusta leer

Mi sxatas legi

Me gusta leer libros

Mi sxatas legi librojn

Me gusta mucho leer libros

Mi tre sxatas legi librojn



Como ya hemos mencionado anteriormente, en estos casos se ha abordado el fenómeno de clitic doubling:


A mí me gustan los libros

Mi sxatas la librojn

A mí no me gustan las patatas

Mi ne sxatas la terpomojn


ANEXO 1: el sintagma nominal


Aquí podemos ver algunos ejemplos de construcciones de sintagma nominal en posición sujeto y objeto. Con ello podemos tener una visión general de las estructuras cubiertas. En ningún caso pueden tomarse estos ejemplos como muestra del léxico:



Barcelona

Barcelona

Casa

Domo

La casa

La domo

La casa grande

La granda domo

La casa más grande

La plej granda domo

La más grande

La plej granda

La casa es muy grande

La domo estas tre granda

Los hombres vieron una casa grande

La viroj vidis grandan domon

Mis casas grandes

Miaj grandaj domoj

Sus casas grandes y altas

Liaj grandaj kaj altaj domoj

Mi casa es muy grande y bonita

Mia domo estas tre granda kaj bela

Esta casa es grande

Cxi tiu domo estas granda

Aquella casa grande es muy bonita

Tiu granda domo estas tre bela

Aquellas casas pequeñas son muy bonitas

Tiuj malgrandaj domoj estas tre belaj

Un libro interesante

Interesa libro

Algunos coches rojos

Iuj rugxaj auxtoj

Todos los coches rojos

Cxiuj rugxaj auxtoj

Tres chicas

Tri knabinoj

Estas casas

Cxi tiuj domoj

Estas tres casas

Cxi tiuj tri domoj

Cada casa tiene una puerta

Cxiu domo havas pordon

Algunas casas

Iuj domoj

Un libro de consulta

Konsultolibro

Un libro de consulta muy interesante

Konsultolibro tre interesa

Un buen libro de consulta

Bona konsultolibro

Una mujer alta y delgada

Alta kaj maldika virino

Las tres mujeres altas y delgadas

La tri altaj kaj maldikaj virinoj

La chica que cantó

La knabino kiu kantis

La chica que vimos

La knabino kiun ni vidis

Los dos libros que leí

La du libroj kiujn mi legis

Todas las ventanas que pintó el hombre

Cxiuj fenestroj kiujn pentris la viro

Las casas son muy altas

La domoj estas tre altaj

Les casas son poco altas

Vi kasacias ilin estas ne multe altaj

Les casas son bastante altas

Vi kasacias ilin estas suficxe da altaj

Las casas son suficientemente altas

La domoj estas suficxe altaj

Las casas son más grandes que los coches

La domoj estas pli grandaj ol la auxtoj

Los coches son menos grandes que las casas

La auxtoj estas la malpli da grandaj kiu la domoj

Las casas son mucho más grandes que los coches

La domoj estas multe pli grandaj ol la auxtoj

Las casas son bastante más grandes que los coches

La domoj estas suficxe pli grandaj ol la auxtoj

Las casas son tan grandes como los coches

La domoj estas tiel grandaj kiel la auxtoj

Las casas son las mejores

La domoj estas la plibonigas

Las casas pintadas

La domoj grafitioj

Las casas están pintadas

La domoj estas grafitioj

Las casas están bastante pintadas

La domoj estas suficxe da grafitioj

La chica pinta las casas

La knabino pentras la domojn

Las chicas pintan las casas grandes

La knabinoj pentras la grandajn domojn

La chica pintará una casa

La knabino pentros domon

Las chicas pintaron unas casas

La knabinoj pentris domojn

La chica pinta las tres casas grandes

La knabino pentras la tri grandajn domojn

La chica pinta tres casas grandes

La knabino pentras tri grandajn domojn

La chica pinta las tres casas más grandes

La knabino pentras la tri pli grandajn domojn

Nuestras casas son grandes

Niaj domoj estas grandaj

Su hija pinta mis libros

Lia filino pentras miajn librojn

Esta chica leerá aquel libro

Cxi tiu knabino legos tiun libron

Unos cuantos chicos beben un poco de cerveza

Kelka knaboj trinkas iom de biero

La mayoría de los chicos pintaron alguna casa

La plimulto de la knaboj pentris iun domon

La otra chica no come bastantes patatas

La alia knabino ne mangxas suficxe da terpomoj

Unas cuantas chicas leen más libros

Kelka knabinoj legas pli libroj

Bastantes casas

Suficxe da domoj

La misma chica

La sama knabino

Una gran persona

Granda persono

Muchas casas

Multaj domoj

Pocas casas

Malmultaj domoj

Ambas casas

Ambauxj domoj

Otra chica

Alia knabino

Algunas casas

Iuj domoj

Cualquier casa

Ajna domo

Cada casa

Cxiu domo

Ninguna casa

Neniu domo

Unas cuantas casas

Kelka domoj

Un poco de cerveza

Iom de biero

Demasiadas casas

La tro da domoj

La mayoría de las casas

La plimulto de la domoj

Más casas

Pli domoj

Suficientes casas

Suficxaj kasacias

Todas las casas

Cxiuj domoj

Todas estas casas

Cxiuj cxi tiuj domoj

Todas aquellas casas

Cxiuj tiuj domoj

Menos casas

La malpli da domoj

La otra casa

La alia domo

Las otras casas

La aliaj domoj

Todas las otras casas

Cxiuj la aliaj domoj

Yo pinto la pared

Mi pentras la muron

Yo pinto tres paredes

Mi pentras tri murojn

Yo pinto las tres paredes

Mi pentras la tri murojn

Yo pinto estas tres paredes

Mi pentras cxi tiujn tri murojn

Yo pinto estas paredes

Mi pentras cxi tiujn murojn

Yo pinto algunas paredes

Mi pentras iujn murojn

Yo pinto estos muebles

Mi pentras cxi tiujn meblojn

Yo pinto algunos muebles

Mi pentras cxi tiujn meblojn

Yo pinto bastantes paredes

Mi pentras suficxe da muroj

Yo pinto la misma pared

Mi pentras la saman muron

Yo pinto muchas paredes

Mi pentras multajn murojn

Yo pinto pocas paredes

Mi pentras malmultajn murojn

Yo pinto las dos paredes

Mi pentras la du murojn

Yo pinto ambas paredes

Mi pentras ambauxjn murojn

Yo pinto otra pared

Mi pentras alian muron

Yo pinto cualquier pared

Mi pentras ajnan muron

Yo pinto cada pared

Mi pentras cxiun muron

Yo no pinto ninguna pared

Mi ne pentras neniun muron

Yo pinto unas cuantas casas

Mi pentras kelkan domojn

Yo bebo un poco de cerveza

Mi trinkas iom de biero

Yo pinto demasiadas paredes

Mi pentras la tro da muroj

Yo pinto la mayoría de las paredes

Mi pentras la plimulton de la muroj

Yo pinto más paredes

Mi pentras pli muroj

Yo pinto menos paredes

Mi pentras la malpli da muroj

Yo pinto todas las paredes

Mi pentras cxiujn murojn

Yo pinto la otra pared

Mi pentras la alia muro

Dos

Du

Tres

Tri

Diez

Dek

Cien

Cent

Mil

Mil

Doscientos

Du cent

Trescientos

Tri cent

Dos mil tres

Du mil tri

Veinticuatro

Dudek kvar

Setenta y tres

Sepdek tri

Setenta y tres mil doscientos

Sepdek tri mil du cent

Setenta y tres mil doscientos cuatro

Sepdek tri mil du cent kvar

Setenta y tres millones

Sepdek tri milionoj




ANEXO 2: el QUE en el corpus

En este anexo mostramos fragmentos del corpus (con su correspondiente traducción) en los que aparece la palabra QUE en cualquiera de sus formas. La presencia del asterisco delante de una palabra en la traducción, indica que ésta no existe en el léxico.



... a través del cual se pueden seguir las cifras que marcan la evolución del estudio de nuestra lengua.

...tra la kiu povas sekvi la ciferojn ''kiuj'' diskas la evoluon de la studo de nia lango.



Esta novena edición del Anuario, que celebra los quince años del Cervantes,.

Cxi tiu *novena eldono de la Jarlibro, ''kiu'' celebras la dekkvin jaroj de la *Cervantes,.



Y, para cerrar, un cuarto bloque que hace balance de la vida de la institución,.

Kaj, por fermi, kvara bloko ''kiu'' faras bilancon de la vivo de la institucio,.



poner a disposición de todos los interesados datos que sirvan de punto de partida para posteriores reflexiones.

ŝovi al dispozicio de ĉiuj la interesataj datumoj ''kiuj'' servas de punkto de partio por postaj interkonsiliĝoj.



un centenar de obras de artistas que han manifestado interés por la palabra pintada,.

Cento de agas de artistoj ''kiuj'' manifestis intereson por la vorto grafitio,.



, ha seleccionado 58 artistas que han trabajado en el ámbito de la lengua española,

, gxi selektis 58 artistoj ''kiuj'' laboris en la medio de la hispana lango,



, así como un texto del comisario que repasa la historia de esta forma de expresión,

, Tiel kiel teksto de la komisaro ''kiu'' reviziu la historio de cxi tiu formu de esprimo,



Lo importante es no olvidar que cualquier estilo puede llevar al éxito

Lin grava estas ne forgesi ''ke'' ajna stilo povas demeti al la sukceso



a la mejor reflexión sobre los problemas que interesan a los profesionales de la enseñanza de ...

Al la pli bona interkonsiligxo sur la problemoj ''kiuj'' interesas al la profesiaj de la instruado de ...



En el discurso, el significado de las palabras que pronunciamos no es enteramente inherente a los ...

En la parolado, la signifo de la vortoj ''kiujn'' ni prononcis ne estas *enteramente propra al la ...



Datos que indican el paso del subdesarrollo a la opulencia.

Datumoj ''kiuj'' indikas la pasxon de la subevoluo al la *opulencia.



Claro que esta invariabilidad porcentual

Certe ''ke'' ĉi tiu *invariabilidad *porcentual



...no debería sorprender a cualquiera que haya asistido recientemente a una boda,

...Gxi ne devus surprizi al cxiu ''kiu'' cheestita fago jxus al geedzigxo,



Los científicos nos enseñan que la evolución no es constante ni simétrica,

La sciencaj nin instruas ''ke'' la evoluo ne estas konstanta nek simetria,


la llamada de un instinto que les lleva al altar

La alvoko de instinkto ''kiu'' ilin demetas al la altaro



Los que se oponen a la prohibición suelen invocar la

Kiuj kontrauxstaras al la malpermeso kutimas alpregxi la



No dicen, sin embargo, que toda norma ha de adaptarse al sentido común.

Ili ne diras, tamen, ke ĉiu normo devas adapti al la aŭdita komuna



Un locutor de radio que defendiera la reencarnación del karma

La *locutor de radioaparato ''kiu'' protektis la *reencarnación de la karmo



También hay atuendos que perturban el orden,

Ankaŭ estas vestaroj ''kiuj'' perturbas la ordon,



Reconozco que estos símiles son exagerados e irrelevantes,

Mi rekonas ''ke'' cxi tiuj *símiles estas troigitaj kaj palaj,



, aunque no más que el reiterado argumento del piercing y la tanga

, Kvankam ne pli ol la repetita argumento de la *piercing kaj la tangao


ANEXO 3: verbos, clíticos y asignación de caso:


la chica leía. La knabino legis.

la chica leía los libros. La knabino legis la librojn.

la chica los leía. La knabino ilin legis.

. .

la chica leerá. La knabino legos.

la chica leyó los libros. La knabino legis la librojn.

la chica los leyó. La knabino ilin legis.


la chica leyó. La knabino legis.

la chica leyó los libros. La knabino legis la librojn.

la chica los leyó. La knabino ilin legis.


la chica quería leer. La knabino volis legi.

la chica quería leer los libros. La knabino volis legi la librojn.

la chica los quería leer. La knabino ilin volis legi.

la chica quería leerlos. La knabino volis legi ilin.


la chica ha querido leer. La knabino volis legi.

la chica ha querido leer los libros. La knabino volis legi la librojn.

la chica los ha querido leer. La knabino ilin volis legi.

la chica ha querido leerlos. La knabino volis legi ilin.


la chica ha podido leer. La knabino povis legi.

la chica ha podido leer los libros. La knabino povis legi la librojn.

la chica los ha podido leer. La knabino ilin povis legi.

la chica ha podido leerlos. La knabino povis legi ilin.


la chica había podido leer. La knabino estis povinta legi.

la chica había podido leer los libros. La knabino estis povinta legi la librojn.

la chica los había podido leer. La knabino ilin estis povinta legi.

la chica había podido leerlos. La knabino estis povinta legi ilin.


la chica habrá podido leer. La knabino estos povinta legi.

la chica habrá podido leer los libros. La knabino estos povinta legi la librojn.

la chica los habrá podido leer. La knabino ilin estos povinta legi.

la chica habrá podido leerlos. La knabino estos povinta legi ilin.


la chica quiso leer. La knabino volis legi.

la chica quiso leer los libros. La knabino volis legi la librojn.

la chica los quiso leer. La knabino ilin volis legi.

la chica quiso leerlos. La knabino volis legi ilin.


la chica me los leía. La knabino ilin al mi legis.

la chica me los ha querido leer. La knabino ilin al mi volis legi.

la chica me los leyó. La knabino ilin al mi legis.


la chica me daba los libros. La knabino al mi donis la librojn.

la chica me ha querido dar los libros. La knabino al mi volis doni la librojn.

la chica me dio los libros. La knabino al mi donis la librojn.

la chica ha querido darme los libros. La knabino al mi volis doni la librojn.


.

la chica las ha querido dar a su madre. La knabino ilin volis doni al lia patrino.

la chica ha querido darlas a su madre. La knabino volis doni ilin al lia patrino.

la chica me las ha querido dar. La knabino ilin al mi volis doni.

la chica ha querido dármelas. La knabino volis doni ilin al mi.



la chica me pintaba. La knabino min pentris.

la chica me leía las manos. La knabino al mi legis la manojn.

la chica le leía las manos. La knabino al li legis la manojn.

la chica se leía las manos. La knabino legis la manojn.



la chica tiene que leer todos los libros. La knabino devas legi cxiujn librojn.

la chica tenía que leer todos los libros. La knabino devis legi cxiujn librojn.

la chica debe estar leyendo los libros. La knabino devas esti legante la libroj.

La chica debe de estar leyendo. la knabino eble estas legante la libroj

la chica está a punto de leer el libro. La knabino estas legonta la libro.

las niñas estaban a punto de leer los libros. La knabinoj estis legontaj la libroj.

la chica acaba de leer el libro. La knabino jxus legis la libro.

las niñas están leyendo muchos libros. La knabinoj legas multajn librojn.

las niñas estarán leyendo muchos libros. La knabinoj legos multajn librojn.

Hay que ayudar Oni devas helpi

.

las niñas leerían muchos libros. La knabinoj legus multajn librojn.



cláusulas subordinadas:


mi madre dice que podemos comer. Mia patrino diras ke ni povas mangxi.

ellos creen que llegaremos tarde. Ili pensas ke ni alvenos postrestas.

el profesor quiere que estudiemos más?. La profesoro volas ke ni studu pli?.

considero que ella está mal. Mi konsideras ke ŝi estas malbone.



Verbos de movimiento:


, iremos a la montaña , ni iros al la monton

la chica entró en casa la knabino eniris en domon





ANEXO 4: inversión argumental, clitic-doubling:

me gustan las patatas. Mi sxatas la terpomojn.

me gustan la mayoría de las patatas. Mi sxatas la plimulton de la terpomoj.

me gusta leer. Mi sxatas legi.

me gusta leer libros. Mi sxatas legi librojn.

me gusta leer la mayoría de los libros. Mi sxatas legi la plimulton de la libroj.


no me gusta leer. Mi ne sxatas legi.

no me gustan las patatas. Mi ne sxatas la terpomojn.

no me gusta leer. Mi ne sxatas legi.

no me gusta leer libros. Mi ne sxatas legi librojn.

no me gusta leer la mayoría de los libros. Mi ne sxatas legi la plimulton de la libroj.

. .

a mí me gustan las patatas. Mi sxatas la terpomojn.

a mí me gusta leer. Mi sxatas legi.

a mí me gusta leer libros. Mi sxatas legi librojn.

a mí me gusta leer la mayoría de los libros. Mi sxatas legi la plimulton de la libroj.

a mí no me gustan las patatas. Mi ne sxatas la terpomojn.

a mí no me gusta leer. Mi ne sxatas legi.


me gustan la mayoría de las patatas. Mi sxatas la plimulton de la terpomoj.

no me gustan la mayoría de las patatas. Mi ne sxatas la plimulton de la terpomoj.


a mí me gustan la mayoría de las patatas. Mi sxatas la plimulton de la terpomoj.

a mí no me gustan la mayoría de las patatas. Mi ne sxatas la plimulton de la terpomoj.



me gustan mucho las patatas. Mi tre sxatas la terpomojn.

no me gustan mucho las patatas. Mi ne tre sxatas la terpomojn.

no me gusta mucho leer. Mi ne tre sxatas legi.


a mí me gustan mucho las patatas. Mi tre sxatas la terpomojn.

a mí no me gustan mucho las patatas. Mi ne tre sxatas la terpomojn.

a mí no me gusta mucho leer. Mi ne tre sxatas legi.


me gustan mucho la mayoría de las patatas. Mi tre sxatas la plimulton de la terpomoj.

no me gustan mucho la mayoría de las patatas. Mi ne tre sxatas la plimulton de la terpomoj.


a mí me gustan mucho la mayoría de las patatas. Mi tre sxatas la plimulton de la terpomoj.

a mí no me gustan mucho la mayoría de las patatas. Mi ne tre sxatas la plimulton de la terpomoj.


ANEXO 5: muestra de traducciones de textos de la red:

Muchas personas acuden al campo o a la montaña en busca de tranquilidad y calma, incluso quienes no ansían esta paz, se sorprenden del silencio que envuelve algunos caminos perdidos, en donde tan solo ocasionalmente se escucha el tímido canto de algún ave. Aquí cualquier sonido estridente resulta extremadamente molesto y es una agresión al ambiente. Recordemos también la facilidad con que se extiende el sonido en las montañas. Los aficionados a escuchar la radio aun en lugares mas apartados pueden optar por incluir audífonos que les permitan disfrutar sin alterar la tranquilidad del lugar. Si carecemos de ellos siempre se debe de mantener un volumen moderado. Ese volumen respetuoso también debe aplicarse a todo lo que hagamos, hablar, cantar, etc. ello no solo nos permite disfrutar del camino sin perturbar la tranquilidad del lugar, sino también acercarnos a algunas criaturas que de otra forma se ocultarían de nosotros.


Multaj personoj prezentiĝas al la kampo aŭ al la monto serĉante trankvileco kaj ĝi trankviligas, incluzive kiuj ne avidas ĉi tiun pacon, *sorprenden de la silento kiu *envuelve iuj perditaj vojoj, en kie tiel nur de tempo al tempo aŭskultas la timeman kanton de iu birdo. Tie ajna strida sono rezultas ekstreme tedas kaj estas la *agresión al la medio. Memoru ankaŭ la facileco kun kiu *extiende la sono en la montoj. La ŝatantoj al aŭskulti la radioaparato eĉ en lokoj sed alineoj povas elekti por inkludi *audífonos kiu ilin permesas ĝui sen ŝanĝi la trankvileco de la loko. Se ni malhavas de ili ĉiam eble substenas moderan volumon. Tiu volumo *respetuoso ankaŭ devu apliki al ĉiu kion ni faras, paroli, kanti, *etc. tiu Ne nur nin permesas ĝui de la vojo sen perturbi la trankvileco de la loko, fato ankaŭ alproksimigi nin al iuj infaninoj kiuj de alia formas kaŝus de ni.



Un proyecto de aprendizaje implica la creación y desarrollo de páginas de la Wikiversidad que describan y faciliten la experiencia educativa de los miembros de grupos de estudio. En palabras simples, un proyecto de aprendizaje es un conjunto de páginas destinadas a enseñar, a través de ejercicios o pruebas, un contenido determinado


projekto de *aprendizaje implicas la kreaĵon kaj disvolviĝon de paĝoj de la *Wikiversidad kiu preskribu kaj ili havigas la sperton *educativa de la grupomembroj de studo. En simplaj vortoj, projekto de *aprendizaje estas aro de destinitaj paĝoj al instrui, tra ekzercoj aŭ vi provas, determinita enhavo




Llamamos Operaciones básicas en ingeniería química al conjunto de procesos y transformaciones de carácter físico que aplicamos sobre un flujo de materia en régimen estacionario. Así, de ésta categoría se eliminan aquellas transformaciones en que interviene una reacción química, que veremos en Reactores químicos, y aquellas en las que se tiene en cuenta como variable el tiempo que dejaremos para el Control de procesos químicos.


*Llamamos bazaj Operacioj en ĥemia inĝenierio al la procesoaro kaj *transformaciones de fizika karaktero kiun ni aplikas sur materiofluo en reĝimo *estacionario. Tiel, de tiu kategorio eliminas tiuj *transformaciones ke intervenas ĥemian reakcion, kiu vidos en *Reactores ĥemiaj, kaj tiuj en kiuj konsideras kiel varia la tempo kiun ni lasos por la Kontrolo de ĥemiaj procesoj.




Las ciencias sociales son aquellas ciencias o disciplinas científicas que se ocupan de aspectos del comportamiento y actividades de los seres humanos. La historia es la ciencia que tiene como objeto de estudio el pasado de la humanidad y como método el propio de las ciencias sociales. El desarrollo y evolución de los diversos métodos históricos da orígen a la Historiografía. La historiografía es el conjunto de técnicas métodos propuestos para describir los hechos históricos acontencidos y registrados. La correcta praxis de la historiografía requiere el empleo correcto del método histórico y el sometimiento a los requerimientos típicos del método científico



La socialaj sciencoj estas tiuj sciencoj aŭ sciencaj disciplinoj kiu okupas de aspektoj de la *comportamiento kaj aktivecoj de la homoj. La historio estas la scienco kiu havas kiel celo de studo la estinteco de la homaro kaj kiel metodo la propra de la socialaj sciencoj. La disvolviĝo kaj evoluado de la diversaj metodoj historiaj donas originon al la *Historiografía. La *historiografía estas la teknikistinoaro proponitaj metodoj por preskribi la historiaj faktoj *acontencidos kaj enskribitaj. La ĝentila *praxis de la *historiografía admonas la ĝentilan postenon de la historia metodo kaj la *sometimiento al la tipaj asignoj de la scienca metodo




El agua es un tesoro preciado para todos los animales, por ello es fundamental respetar ríos, manantiales, mares, construcciones y sistemas de distribución de agua. Si necesitamos lavar algo, es necesario evitar el uso de detergentes y jabones, para limpiar utensilios un poco de arena nos ayuda a la limpieza. Para desechos fisiológicos es importante ubicar estos lugares en distancias considerables de los mantos acuáticos para evitar contaminación.


La akvo estas trezoro *preciado por ĉiuj bestoj, por tiu estas fundamente respekti riveroj, fontoj, maroj, konstruoj kaj sistemoj de dissendo de akvo. Se ni bezonas lavi iun, estas necese eviti la uzo de *detergentes kaj sapoj, por purigi uzaĵoj iom de sablo nin helpas al la pureco. Por forĵetaĵoj *fisiológicos estas grava/grave loki ĉi tiuj lokoj en konsiderindaj distancoj de la akvaj manteloj por eviti poluado.



Hoy en día es difícil encontrar a alguien que no haya oído hablar de Internet, pero no todo el mundo tiene claro lo que es exactamente, ni para qué sirve. Ahora aprenderemos un poco mas acerca de lo que comúnmente llamamos "la Red". Internet es una red de computadoras conectados entre sí, con la característica de que se trata de una RED ABIERTA y de CARÁCTER MUNDIAL. Esto permite a los Usuarios intercambiar todo tipo de información desde cualquier punto del planeta y durante las 24 horas del día.


Hay compañias que nunca han fabricado un producto y su marca ya es conocida mundialmente.En cuanto a organización, Internet no tiene en realidad una cabeza central, ni un único organismo que la regule o al que pedirle cuentas si funciona mal. Gran parte de la infraestructura es pública, de los gobiernos mundiales, organismos y universidades. Muchos grupos de trabajo trabajan para que funcione correctamente y continúe evolucionando. Otra gran parte de Internet es privada, y la gestionan empresas de servicios de Internet (que dan acceso) o simplemente publican contenidos. Como Internet está formada por muchas redes independientes, que hablan el mismo lenguaje, ni siquiera están claros sus límites.


Estas computadoras están unidas por diversos medios: líneas telefónicas conmutadas, red digital integrada, enlaces satelitales, microondas, fibra óptica, cable coaxial, etc.


Nuntempe estas malfacile trovi al iu kiu ne aŭdis paroli de *Internet, sed ne ĉiuj havas certe kio estas ĝuste, nek por kion ĝi servas. Ni nun ellernos iom sed alproksimigas de kio *comúnmente *llamamos "la Reto". *Internet Estas komputiloreto *conectados inter oni, kun la karakterizaĵo kiu klopodas MALFERMITAN RETON kaj de MONDA KARAKTERO. Tiu permesas al la Uzantoj interŝanĝi ĉiu informotipo de ajna punkto de la planedo kaj dum la 24 horoj de la tago. Estas *compañias kiu neniam fabrikis produkton kaj lia diskas jam estas konata *mundialmente.Koncerne al organizo, *Internet ne havas en realaĵo centra kapo, nek sola institucio kiu ŝin reguligas aŭ al la kiu peti lin rakontas se ĝi funkcias malbone. Granda dividas de la infrastrukturo estas publika, de la mondaj registaroj, institucioj kaj universitatoj. Multaj laborogrupoj laboras por ke ĝi funkcias ĝuste kaj ĝi daŭrigas evoluante. Alia granda dividas de *Internet estas privata, kaj la *gestionan industrioj de servicoj de *Internet (kiu donas lukon) aŭ ili simple eldonas enhavojn. Kiel *Internet estas formita por multaj sendependaj retoj, kiu parolas la saman lingvon, eĉ ne estas *claros liaj limoj.'Ĉi'tiuj 'komputiloj estas kunigitaj por diversaj duonaj: komutitaj telefonaj linioj, cifereca reto *integrada, ligoj *satelitales, mikroondoj, optika fibro, kablo *coaxial, *etc.

ANEXO 6: reglas de la gramática T1X:



Reglas para la identificación de SN:


<rule comment="REGLA: ANTROPÒNIM (Barcelona)">

<rule comment="REGLA: ART ANTROPÒNIM (La María - María; se elimina el artículo)">

<rule comment="REGLA: ART TOPÓNIMO (Los Pirineos - Pireneoj; se elimina el artículo)">

<rule comment="REGLA: tot TOPÓNIMO (toda Europa -> la tuta Eŭropo)">

<rule comment="REGLA: ART NOM más ADJ (EOes, más -> plej ex: la casa más grande -> la plej granda domo)">

<rule comment="REGLA: ART más ADJ (EOes, más -> plej ex: la más grande -> la plej granda)">

<rule comment="REGLA: DET NOM (EOes ex. los libros, las casas -> la libroj, la domoj)">

<rule comment="REGLA: DET NUM NOM (EOes, ex. las dos chicas, estos tres libros -> la du knaboj, cxi tiuj tri libroj)">

<rule comment="REGLA: QNT DET NOM (EOes, todos los niños-> cxiuj knaboj; la majoria de los niños -> la plimulto da knaboj)">

<rule comment="REGLA: DET ADJ NOM (EOes) el mismo chico; una gran persona -> la sama knabo, granda homo">

<rule comment="REGLA: ADJ NOM (EOes) nuestra casa">

<rule comment="REGLA: DET NOM ADJ (EOes, aquella casa grande, un libro interesante, alguns coches viejos -> tiu granda domo, interesa libro, iuj verdaj auxtoj)">

<rule comment="REGLA: DET NUM NOM ADJ (EOes, ex. aquellas tres casas pequeñas, los tres libros viejos, todos los coches grandes -> tiuj tri malgrandaj domoj, la tri malnovaj libroj, cxiuj grandaj auxtoj)">

<rule comment="REGLA: QNT DET NOM ADJ (EOes, ex. todos los coches blancos -> cxiuj blankaj auxtoj)">

<rule comment="REGLA: DET NOM ADV ADJ (EOes, una niña extremadamente bonita -ekstreme bela knabino )" >

<rule comment="REGLA: DET NUM NOM ADV ADJ (EOes, ex. esas dos caaes tan grandes -> tiuj tri tiel grandaj domoj)">

<rule comment="REGLA: DET NOM ADJ conj ADJ (EOes, coordinació d'adjectius modificant el mateix nom, ex. una mujer alta y delgada -> alta kaj maldika virino)">

<rule comment="REGLA: DET NUM NOM ADJ conj ADJ (EOes, coordinació d'ajectius las dos mujeres altas y delgadas -> la du altaj kaj plataj virinoj)">

<rule comment="REGLA: DET NOM DE NOM ADJ (EOes)(pertenece a las sreglas de formación de compuestos, en este caso queremos evitar la formación del compuesto ya que tenemos un adjetivo ex. los animales de zonas cálidas -> la besto de varmaj zonoj)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: DET NOM DE NOM (EOes)(pertenece a ala reglas de formación de compuestos a aprtir de N+de+N, ex. un libro de consulta -> konsultolibro)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: DET NUM NOM DE NOM ADJ (EOes)(pertenece a las reglas de formación de compuestos a partir de N+de+N, en este caso NO queremos el compuesto)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: DET NUM NOM DE NOM (EO)(regla de formación de compuestos a partir de N+de+N), los dos libros de consulta -> la du konsultolibroj">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: QNT DET NOM DE NOM ADJ (EOes)(pertenece a las rfelgas de formación de compuestos a partir de N+de+N, en este caso NO queremos que se forme el compuesto)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: QNT DET NOM DE NOM (EOes)(pertence a las regla de formación de compuestos a partir de N+de+N)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: DET ADJ NOM DE NOM (EOes) (pertenece a las relgas de formación de compuestos a partir de N+de+N)">

Como el resto de reglas sobre creación de compuestos NOM NOM en esperanto, esta regla ha sido desactivada. Hèctor Alòs i Font 05:06, 23 April 2009 (UTC)

<rule comment="REGLA: NOM (EO)">

<rule comment="REGLA: NOM ADJ (EOes, sintagmas nominales sin especificadores)">

<rule comment="REGLA: NOM ADJ ADJ (EOes, sintagmas nominales sin especificadores)">

<rule comment="REGLA: NOM ADJ Y ADJ (EOes, sintagmas nominales sin especificadores)">


<rule comment="REGLA: NOM QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: DET ADJ NOM QUE (EOes) el mismo chico; una gran persona -> la sama knabo, granda homo; reglas paratratar el QUE relativo 'que -> kiu' ">

<rule comment="REGLA: DET NOM QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: DET NUM NOM QUE (EOes reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: QNT DET NOM QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu')">

<rule comment="REGLA: DET NOM ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: DET NUM NOM ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: QNT DET NOM ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu')">

<rule comment="REGLA: DET NOM ADV ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu')">

<rule comment="REGLA: DET NUM NOM ADV ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: DET NOM ADJ conj ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">

<rule comment="REGLA: DET NUM NOM ADJ conj ADJ QUE (EOes, reglas paratratar el QUE relativo 'que -> kiu' )">



<rule comment="REGLA: ADJECTIU (quan no acompanya res o va amb desconeguda) (EOes)">

<rule comment="REGLA: ADV ADJECTIU QUE ('más/menos grande que - ') (EOes)">

<rule comment="REGLA: ADV QUE ('más/menos que - ') (EOes)">


<rule comment="REGLA: DETERMINANT (perquè no doni error si va davant de desconegudes i no es pot assignar nombre) (EO)">


reglas de identificación de SV:


<rule comment="VERB QUE (KE) (EOes)">

<rule comment="VERB ADV QUE () (EOes)">

<rule comment="VERB COMA ADV COMA QUE () (EOes)">

<rule comment="VERBestar + GERUNDI + QUE (estar diciendo que EOes)">

<rule comment="VERBestar + ADV + GERUNDI + QUE (estar siempre diciendo que EOes)">

<rule comment="VERBestar_a_punto_de + INF + QUE (estar a punto de que EOes)">

<rule comment="VERBacabarde + INF + QUE (acabar de EO)">


<rule comment="VERBestar + GERUNDI (está cantando > kantas, EOes)">

<rule comment="VERBestar + ADV + GERUNDI (estar siempre/constantemente cantando EOes -> cxiam kantas)">

<rule comment="VERBestar_a_punto_de + INF (está a punto de venir -> estas venonta EOes)">

<rule comment="HABER VERBacabarde + INF (ha acabado de EOes)">

<rule comment="VERBacabarde + INF (acabar de EOes)">

<rule comment="VERBseguir + GER (sigue siendo EOes)">

<rule comment="VERBecharse + INF (echarse a cantar/ponerse a cantar EOes)">

<rule comment="VERBdeberde + INF (deber de + inf EOes)">

<rule comment="VERBhayque + INF (hay que + inf EOes)">

<rule comment="IR + A + INF (ir a leer -> tuj legos; se traduce a futuro EOes)">

<rule comment="VERB + ADJ + INF (el ADJ passa a ADV: siempre es interesante leer -> cxiam estas interese legi EOes)">

<rule comment="VERB + ADV + ADJ + INF (el ADJ passa a ADV: es muy intereante leer -> estas tre interese legi EOes)">

<rule comment="REGLA: ADV ADJECTIU ('muy/poco//bastante//increiblemente grande - ') (EOes)">

<rule comment="VERB conjugat ( pinto ) (EO)">

<rule comment="PARA + INF (EOes regla exlusivamente para error del tagger">

<rule comment="PARA INF_IMP + ENCL + ENCL + INF (EOes exclusivamente para el tagger- )">

<rule comment="PARA INF_IMP + ENCL + INF (EOes; exclusivamente para el tagger poderlos comprar; EO- )">

<rule comment="VERB conjugat + INF (quería cantar; EOes)">

<rule comment="HABER + PP (él ha leído aquel libro -> Li legis tiun libron; traducido a pasado) (EOes)">

<rule comment="HABER + PP + QUE (ha dicho que -> diris ke; para corregir el KE) (EOes)">

<rule comment="VERB conjugat + INF + QUE (quería decir que; EOes)">

<rule comment="HAVER + PP + INF (ha decidido marchar -> decidis marsxi ) (EOes)">


reglas para el tratamiento de los clíticos:


<rule comment="PROCLITIC PROCLITIC (me los; te los; se la EOes)">

<rule comment="PRO_FUERTE PROCLITIC (a mi me, a ella le, ... regla para simplirficar el clitic doubling EOes 'a mi me' -> min)">

<rule comment="PRO_FUERTE ADV PROCLITIC (a mi me, a ella le, ... regla para simplirficar el clitic doubling EOes 'a mi no me' -> min ne)">

<rule comment="PRO_FUERTE PROCLITIC (a mi)">

<rule comment="PRO_FUERTE PROCLITIC PROCLITIC (a mi me lo, a ella se los, ... regla para simplificar el clitic doubling EOes 'a mi me lo' -> lin al mi )">

<rule comment="PROCLITIC (EO)">

<rule comment="INF_IMP + ENCL + ENCL + INF (podermelos comprar; El clítico pasa al final EOes )">

<rule comment="INF_IMP + ENCL + INF (EOes; poderlos comprar; EO-)">

<rule comment="VERBMOD + ENCL + INF (haver-los de comprar EO )">

<rule comment="VERBMOD + ENCL (per quan va davant desconegudes, perquè no peti: poder-ho xxx - )">



<rule comment="REGLA: PARTICIPI + POR -> querido por -> amata de">

<rule comment="REGLA: PARTICIPI (perquè no enviï gènere ni nombre quan va sol (per tal que no doni error). ">

<rule comment="REGLA: VERBinf no conjugat (perquè posi bé la cua en multiparaules)">

<rule comment="REGLA: VERBger no conjugat (perquè posi bé la cua en multiparaules)">

<rule comment="ADV">

<rule comment="ADV ITG">

<rule comment="PRONOM tònic/interrogatiu/possessiu EO">

<rule comment="PRONOM indefinit i companyia (EO)">

<rule comment="PRONOM relatiu EO">

<rule comment="PREP + PRONOM relatiu EO( dels quals, pels que, als que ...)">

<rule comment="PRN personal">

<rule comment="CNJ">

<rule comment="de">

<rule comment="PREP">


<rule comment="REGLA: COMA QUE (EO, reglas para tratar el QUE relativo 'que -> kiu' )">


ANEXO 7: reglas de la gramática T2X:

'

<rule comment="REGLA: SVvolition cnjsub SV ( quiero que vengas - volas ke vi venu; la subordinada en imperativo. EOes)">

<rule comment="REGLA: punt_cnjadv SVvolition cnjsub SV ( . quiero que vengas - Mi volas ke vi venu; la subordinada en imperativo. EOes)">

<rule comment="REGLA: SVvolition cnjsub SV SNacc ( quiero que comas patatas - volas ke vi mangxu terpomojn; la subordinada en imperativo, el SN2 en acusativo. EOes)">

<rule comment="REGLA: punt_cnjadv SVvolition cnjsub SV SNacc( . quiero que vengas - Mi volas ke vi venu; la subordinada en imperativo. EOes)">

'

<rule comment="REGLA: SV cnjsub SV ( creo que vendrá -> kreas ke gxi venos; EOes)">

<rule comment="REGLA: SV cnjsub SV ( . creo que vendrá -> . Mi kreas ke gxi venos; EOes)">

<rule comment="REGLA: SV cnjsub SV SNacc( creo que lee libros -> kreas ke gxi legas librojn; EOes)">

<rule comment="REGLA: SV cnjsub SV SNacc( . creo que lee libros -> . Mi kreas ke gxi legas librojn; EOes)">

'

<rule comment="REGLA: SNobj SVagradar SNacc (inversión argumental EO; me gustan los libros, me gusta leer libros -> mi sxatas la librojn, mi sxatas legi librojn)">

<rule comment="REGLA: SNobj SVagradar (inversión argumental EO; me gusta leer -> mi sxatas legi)">

<rule comment="REGLA: ADV SNobj SVagradar SNacc (inversión argumental EO; 'NO me gustan los niños -> mi ne sxatas la knabojn')">

<rule comment="REGLA: CNJADV SNobj SVagradar SNacc (inversión argumental EO; 'si te gustan los libros -> se vi sxatas la knabojn')">

<rule comment="REGLA: ADV SNobj SVagradar (inversión argumental EO; 'NO me gusta leer')">

<rule comment="REGLA: CNJADV SNobj SVagradar (inversión argumental EO; 'SI te gusta leer')">

<rule comment="REGLA: SNobj SVagradar ADV SNacc (inversión argumental EO; me gustan mucho las patatas)">

<rule comment="REGLA: ADV SNobj SVagradar ADV SNacc (inversión argumental EO; no me gustan mucho las patatas -> mi ne tre sxatas la terpomojn)">

<rule comment="REGLA: CNJADV SNobj SVagradar ADV SNacc (inversión argumental EO; si te gustan muchos las patatas)">

<rule comment="REGLA: SNobj SVagradar ADV SVinf (inversión argumental EO; me gusta mucho leer -> mi tre sxatas legi librojn)">

<rule comment="REGLA: SNobj SVagradar ADV SVinf (inversión argumental EO; me gusta mucho leer libros -> mi tre sxatas legi librojn)">

<rule comment="REGLA: ADV SNobj SVagradar ADV SVinf (inversión argumental EO; no me gusta mucho pescar)">

<rule comment="REGLA: CNJADV SNobj SVagradar ADV SVinf (inversión argumental EO; si te gusta mucho pescar)">

<rule comment="REGLA: ADV SNobj SVagradar ADV SVinf (inversión argumental EO; no me gusta mucho pescar)">


'

<rule comment="REGLA: SNitg SV SN (EOes para el acusativo dels SN interrogativos con changecase=nomi; asignamos acusativo al primer SN ya que suponemos que el segundo serà el sujeto: qué come la niña? -> kion mangxas la knabino?)">

<rule comment="REGLA: SNitg SV (EOes para el acusativo de las SN sujeto en 'a quién viste? o qué viste? que tienen changecase=nomi; Añade el pronombre sueto (no pro-drop) si el verbo está conjugado ; qué comes? -> kion vi mangxas?)">

<rule comment="REGLA: SNitg PRO SV (EOes para el acusativo de les SN sujeto en 'o qué je dijiste? que tienen changecase=nomi; Añade el pronombre sueto (no pro-drop) si el verbo está conjugado y modifica el PRO para generarlo como objeto indirecto; qué le dijiste? -> kion vi al li diris?)">


'

<rule comment="REGLA: SN PRO SV SN (EOes; la niña me dio el libro -> la knabino al mi donis la libron; el clitico pasa a objecto indirecto precedido por al y el SN objeto se genera en cusativo)">

<rule comment="REGLA: SN SV PRO SN (EOes; la niña prometió darme el libro -> la knabino al mi promesis doni la libron; el clitico pasa a objecto indirecto precedido por al y el SN objecto se genera en acusativo">

<rule comment="REGLA: PRO SV SN (EOes; me dio el libro -> al min doni la libron;)">

<rule comment="REGLA: SV PRO SN (EOes; quiso darme el libro -> al mi volis doni la libron. ">


'

<rule comment="REGLA: punt_cnjadv PRO SV SN (EOes; me dió el libro -> , gxi al mi donis la libron)">

<rule comment="REGLA: punt_cnjadv SV PRO SN (EOes , prometieron darnos el libro -> , ili al ni promesis doni la libron)">


'

<rule comment="REGLA: SN SV SN and SNacc(EOes )">

<rule comment="REGLA: SN SV SN (EO la niña come patatas -> la knabino mangxas terpomojn)">

<rule comment="REGLA: SV SN and SN (EO per l'acusatiu dels SN objecte amb changecase=nomi)">

<rule comment="REGLA: SV SN (EO per l'acusatiu dels SN objecte amb changecase=nomi)">


'

<rule comment="REGLA: SN SVmoviment PREP SN (EOes; la niña se dirige hacia la escuala -> la knabino direktas al la lernejon)">

<rule comment="REGLA: SVmoviment PREP SN (EOes)">

<rule comment="REGLA: SN (per assignar gènere i nombre si hi ha GD i ND que no s'han pogut determinar, com passa en alguns pronoms: both, etc.)">

<rule comment="REGLA: SN SV">


'

<rule comment="REGLA: punt_cnjadv SV (EOes . voy. Quiero comer -> , mi iras. Mi volas mangxi)">

<rule comment="REGLA: punt_cnjadv PROobj SV (EOes . los leeré -> Mi legos ilin )">

<rule comment="REGLA: punt_cnjadv SV SN (EOes . . como patatas; quiero comer patatas -> mi volas mangxi terpomojn)">

<rule comment="REGLA: punt_cnjadv ADV SV (. EO . NO Menjo, vull menjar (inclou els cnjadv com a marcadors d'inici de frase))">

<rule comment="REGLA: punt_cnjadv ADV SV SNacc(EOes)">

<rule comment="REGLA: punt_cnjadv SV SA de inf (. Era difícil d'ajudar EO eliminem el DE (inclou els cnjadv com a marcadors d'inici de frase))">

<rule comment="REGLA: punt_cnjadv SVmoviment PREP SN (EO per l'acusatiu dels verbs de moviment amb changecase=nomi i afegir pronom subjecte)">


'

<rule comment="REGLA: SN SNrelatiu SNobj SV (. el niño que nos vió-> la knabo kiu nin vidis EOes))">

<rule comment="REGLA: SN SNrelatiu SNobj SV SN (. el niño que nos dio el libro -> la knabo kiu al ni donis la libron EOes))">

<rule comment="REGLA: SN SNrelatiu SN SV (. el nen que ella vió -> la knabo kiun sxi vidis EOes))">

<rule comment="REGLA: SN SNrelatiu SV SN (EOes: el niño que vió la casa -> la knabo kiu vidis la domon; la niña que vieron los niños -> la knabino kiun vidis la knaboj)">

<rule comment="REGLA: SN SNrelatiu SV (. la niña que vino -> la knabino kiu vino; los niños que viste -> la knaboj kiujn vi vestu)">

<rule comment="REGLA: SNloque SNobj SV (. lo que nos dijo-> EOes))">

<rule comment="REGLA: SNloque SNobj SV SN (. lo que nos dijo el niño-> kion al li diris la knabo EOes))">

<rule comment="REGLA: SNloque SN SV (. lo que María dijo -> kion Maria diris EOes))">

<rule comment="REGLA: SNloque SV SN (EOes: lo que vió el niño )">

<rule comment="REGLA: SNloque SV (. lo que vino )">



[#sdfootnote1anc 1]Las entradas bilingües admiten restricciones de dirección que permiten bloquear traducciones no deseadas. La marca LR en una entrada bilingüe bloquea la traducción en el sentido ES-EO. De este modo, las correspondencias polisémicas tienen una entrada preferente no restringida y otra(s) correspondencias restringidas o bloqueadas.


[#sdfootnote2anc 2] Nos referimos a la totalidad de correspondencias del diccionario, no únicamente a las categorías abiertas

Créditos

Los créditos originales de este documento son los que siguen. El original, con permiso de los autores, fue viquificado por Fajro y puede encontrarse como primer elemento del historial de esta página.

Documentación del traductor automático Español-Esperanto

basado en la tecnología Apertium

para la empresa ABC ENCIKLOPEDIOJ S.L.


Xavi Batlle
Nuria Bel
Ester Pedreño
Marta Villegas

con la colaboración del dr. Lluís de Yzaguirre

Diciembre 2007