Catalan and Sardinian/Work plan

From Apertium
Jump to navigation Jump to search

Note: The Sardinian → Italian part of the project is optional and subject to all goals being achieved for the Catalan → Sardinian part.

Setmana Dates Avaluació Bidix
previst
(%) Cobertura
prevista
(%) WER
previst
Testvoc Avaluació Bidix
real
(%) Cobertura
real
(%) WER Err. Complert ?
0 català > sard 2877 77,7% 34,8%
1 30 maig—4 juny ~4000 ~79,0% 488.474 3239 77,4%
2 5 juny—11 juny ~6000 ~82,0% 774.697 4918 86,4% ½
3 12 juny—18 juny ~8000 ~83.5% 697.757 6532 88,4% ½
4 19 juny—25 juny ~10.000 ~84.5% 910.172 8694 90,1%
5 26 juny—2 juliol 26 juny—29 juny ~12.000 ~85.5% ~25% 7.491 8766 90,1%
6 3 juliol—9 juliol ~14.000 ~86.5%
7 10 juliol—16 juliol ~16.000 ~87.5%
8 17 juliol—23 juliol ~18.000 ~88.5%
9 24 juliol—30 juliol 24 juliol—28 juliol ~18.000 ~89.5% ~15%
10 31 juliol—6 agost ~20.000 ~90.0%
0 sard > italià 25.500 89,1% 31,9%
11 7 agost—13 agost ~25.500
12 14 agost—20 agost ~25.500 ~89,1% ~20%
13 21 agost—27 agost 21 agost—29 agost

Per a calcular els nombres

Errors (calcular en apertium-cat-srd/dev o apertium-srd-ita)
$ bash dev/testvoc/generation.sh cat-srd | wc -l  # en apertium-cat-srd
$ bash dev/testvoc/generation.sh ita-srd | wc -l  # en apertium-cat-srd
Bidix (calcular en apertium-cat-srd o apertium-srd-ita)
$ cat apertium-cat-srd.cat-srd.dix | grep '<l' | wc -l
$ cat apertium-srd-ita.srd-ita.dix | grep '<l' | wc -l
Cobertura (calcular en apertium-cat-srd o apertium-srd-ita)
$ cat ../apertium-cat/corpus/corpus_ca_wp100000.txt | apertium -d . cat-srd-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/cat-srd.coverage.txt
$ calc `cat /tmp/cat-srd.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/cat-srd.coverage.txt | wc -l`

$ cat srd.crp.txt | apertium -d . srd-ita-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/srd-ita.coverage.txt
$ calc `cat /tmp/srd-ita.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/srd-ita.coverage.txt | wc -l`

Veure també

Grfro3d/proposal_apertium_cat-srd_and_ita-srd