Atributos sintéticos

From Apertium
Jump to navigation Jump to search

Los atributos sintéticos (en inglés: placeholder attributes) son atributos que sólo existen en los diccionarios bilingües y que se usan para resolver cambios en las propiedades léxicas en determinadas traducciones. Por ejemplo, si traducimos estudiant (que tiene la misma forma para el masculino y para el femenino) del catalán al francés, tendremos que decidir si queremos generar étudiant (masculino) o bien étudiante (femenino). Por esta razón se hace necesario etiquetar el género de esta palabra en el bilingüe de alguna manera que indique que hay una decisión que debe ser tomada por el módulo de transferencia, ya que la información léxica de la palabra no permite tomar una decisión.

Atributos sintéticos en los traductores de Apertium[edit]

En los diccionarios bilingües de muchos de los traductores de Apertium (es-ca, es-pt, ca-es, ca-fr, es-fr, etc.), existen dos atributos, llamados <GD> (género por determinar) y <ND> (número por determinar), que delegan la decisión del género o el número al módulo de transferencia. A la salida de este módulo, estas etiquetas deben cambiarse por estas otras:

  • <GD> puede cambiarse por <m> (masculino) o <f> (femenino), pero no por <mf> (masculino y femenino).
  • <ND> puede cambiarse por <sg> (singular) o <pl> (plural), pero no por <sp> (singular y plural).

Para tomar estas decisiones se suelen adoptar las siguientes estrategias de decisión:

  • Mirar la información morfológica de las palabras anteriores y posteriores, buscando que tenga algún sentido lingüístico. Por ejemplo, un determinante puede marcar el género de una forma indiferenciada en lengua origen).
  • Tomar la información de una variable contextual.
  • Seleccionar una de las formas "a fuego" y esperar que sea la selección correcta más frecuente.