Occitan and French/Work plan
Revision as of 05:44, 16 March 2018 by Hectoralos (talk | contribs) (Created page with "Note: The French → Occitan part of the project is the main direction. {|class=wikitable ! Setmana !! Dates !! Avaluació !! Bidix<br/>previst !!(%) Cobertu...")
Note: The French → Occitan part of the project is the main direction.
Setmana | Dates | Avaluació | Bidix previst |
(%) Cobertura prevista |
(%) WER previst |
Testvoc | Avaluació | Bidix real |
(%) Cobertura real |
(%) WER | Err. | Complert ? |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | français > occitan | |||||||||||
1 | 30 maig—4 juny | ~4000 | ~79,0% | |||||||||
2 | 5 juny—11 juny | ~6000 | ~82,0% | |||||||||
3 | 12 juny—18 juny | ~8000 | ~83.5% | |||||||||
4 | 19 juny—25 juny | ~10.000 | ~84.5% | |||||||||
5 | 26 juny—2 juliol | 26 juny—29 juny | ~12.000 | ~85.5% | ~25% | pr, cnj*, adv | ||||||
6 | 3 juliol—9 juliol | ~14.000 | ~86.5% | prn, det | ||||||||
7 | 10 juliol—16 juliol | ~16.000 | ~87.5% | vblex | ||||||||
8 | 17 juliol—23 juliol | ~18.000 | ~88.5% | adj | ||||||||
9 | 24 juliol—30 juliol | 24 juliol—28 juliol | ~18.000 | ~89.5% | ~15% | n | ||||||
10 | 31 juliol—6 agost | ~20.000 | ~90.0% | |||||||||
13 | 21 agost—27 agost | 21 agost—29 agost | ~20.000 | ~90.0% | ||||||||
0 | occitan > français | |||||||||||
11 | 7 agost—13 agost | ~25.500 | pr, cnj*, adv | |||||||||
12 | 14 agost—20 agost | ~25.500 | ~89,1% | ~20% | prn, det, n, adj | |||||||
13 | 21 agost—27 agost | 21 agost—29 agost | vblex |
Per a calcular els nombres
- Errors (calcular en apertium-cat-srd/dev o apertium-srd-ita)
$ bash dev/testvoc/generation.sh fra-oci | wc -l # en apertium-oci-fra $ bash dev/testvoc/generation.sh oci-fra | wc -l # en apertium-oci-fra
- Bidix (calcular en apertium-oci-fra)
$ cat apertium-oci-fra.oci-fra.dix | grep '<l' | wc -l
- Cobertura (calcular en apertium-oci-fra)
$ cat ../apertium-fra/corpus/corpus_fra_wp100000.txt | apertium -d . fra-oci-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/fra-oci.coverage.txt $ calc `cat /tmp/fra-oci.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/fra-oci.coverage.txt | wc -l` $ cat ../apertium-cat/corpus/corpus_oci_wp100000.txt | apertium -d . oci-fra-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/oci-fra.coverage.txt $ calc `cat /tmp/oci-fra.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/oci-fra.coverage.txt | wc -l`