Difference between revisions of "Sardo e italiano/Work plan"

From Apertium
Jump to navigation Jump to search
Line 7: Line 7:
* Convertir el corrector ortográfico en analizador <code>.dix</code> (= ~40k entradas)
* Convertir el corrector ortográfico en analizador <code>.dix</code> (= ~40k entradas)
* Importar las palabras del glossario de la región (= 6425 entradas)
* Importar las palabras del glossario de la región (= 6425 entradas)
* Crear un corpus de sardo de [http://limbasnatziones.tempusnostru.it/home.page Limbas e natziones]
* <s>Crear un corpus de sardo LSC de [http://limbasnatziones.tempusnostru.it/home.page Limbas e natziones]</s> [http://ilazki.thinkgeek.co.uk/limbasnatziones.tar.gz descargar aquí]
* Importar las palabras que quedan de [http://sslmitdev-online.sslmit.unibo.it/linguistics/morph-it.php Morph-it!]
* Importar las palabras que quedan de [http://sslmitdev-online.sslmit.unibo.it/linguistics/morph-it.php Morph-it!]
* Añadir ~15,000 palabras al diccionario bilingüe (para tener al menos 20k correspondencias LSC-italiano).
* Añadir ~15,000 palabras al diccionario bilingüe (para tener al menos 20k correspondencias LSC-italiano).
Line 22: Line 22:
! Semana !! Fechas !! Cobertura !! Testvoc !! Evaluación !! !! (%) cov. conseg. !! (%) WER !! Cumplido ?
! Semana !! Fechas !! Cobertura !! Testvoc !! Evaluación !! !! (%) cov. conseg. !! (%) WER !! Cumplido ?
|-
|-
| 0 || 11 abril&mdash;17 abril || 78% || || 350 palabras || || 78.2, ??.? || 11.72, 24.00 || ✓
| 0 || 11 abril&mdash;17 abril || 78% || || 350 palabras || || 80.6, ??.? || 11.72, 24.00 || ✓
|-
|-
| 1 || 18 abril&mdash;24 abril || 78% || || || || ||
| 1 || 18 abril&mdash;24 abril || 78% || || || || ||

Revision as of 17:32, 18 April 2016

Personas:

  • Gianfranco, Hèctor, Fran

Tareas:

  • Convertir el corrector ortográfico en analizador .dix (= ~40k entradas)
  • Importar las palabras del glossario de la región (= 6425 entradas)
  • Crear un corpus de sardo LSC de Limbas e natziones descargar aquí
  • Importar las palabras que quedan de Morph-it!
  • Añadir ~15,000 palabras al diccionario bilingüe (para tener al menos 20k correspondencias LSC-italiano).
  • Trabajar en reglas de transferencia
  • Trabajar en reglas de desambiguación
  • Trabajar en reglas de selección léxica
  • Compilar un pequeño corpus paralelo de LSC-italiano.
  • Hacer el testvoc.
  • Hacer una evaluación (artículos de Wikipedia).

Plan semanal

Semana Fechas Cobertura Testvoc Evaluación (%) cov. conseg. (%) WER Cumplido ?
0 11 abril—17 abril 78% 350 palabras 80.6, ??.? 11.72, 24.00
1 18 abril—24 abril 78%
2 25 abril—1 mayo 78%
3 2 mayo—8 mayo 80% pr, cnj*, adv 500 palabras
4 9 mayo—15 mayo 80%
5 16 mayo—22 mayo 80.5%
6 23 mayo—29 mayo 81%
7 30 mayo—5 junio 81.5%
8 6 junio—12 junio 82%
9 13 junio—19 junio 82.5%
10 20 junio—26 junio 82.5%
11 27 junio—3 julio 84% n, prn, det, adj 500 palabras
12 4 julio—10 julio 85%
13 11 junio—17 julio 86%
14 18 julio—24 julio 87%
13 25 junio—31 julio 88%
14 1 agosto—7 agosto 89%
15 8 agosto—14 agosto 90% vblex 2000 palabras
16 15 agosto—21 agosto 90%