Difference between revisions of "Occitan and French/Work plan"

From Apertium
Jump to navigation Jump to search
Line 4: Line 4:
 
! Setmana !! Dates !! Descripció !! Bidix<br/>(sense np)<br/>previst !!(%) Cobertura<br/>prevista !! (%) WER<br/>previst !! Testvoc !! Avaluació !! Bidix<br/>real !! (%) Cobertura<br/>real !! (%) WER !! Err. !! Fet?
 
! Setmana !! Dates !! Descripció !! Bidix<br/>(sense np)<br/>previst !!(%) Cobertura<br/>prevista !! (%) WER<br/>previst !! Testvoc !! Avaluació !! Bidix<br/>real !! (%) Cobertura<br/>real !! (%) WER !! Err. !! Fet?
 
|-
 
|-
| 0 || <b>français > occitan</b> || || ~5700 || || || || || || || || ||
+
| 0 || <b>français > occitan</b> || || ~5 700 || || || || || || || || ||
 
|-
 
|-
| 1 || 14 mai&mdash;20 mai || || ~4000 || ~79,0% || || || || || || || ||
+
| 1 || 14 mai&mdash;20 mai || || ~10 000 || ~84,0% || || || || || || || ||
 
|-
 
|-
| 2 || 21 mai&mdash;11 mai || || ~6000 || ~82,0% || || || || || || || ||
+
| 2 || 21 mai&mdash;11 mai || || ~12 000 || ~86,0% || || || || || || || ||
 
|-
 
|-
| 3 || 28 mai&mdash;3 junh || || ~8000 || ~83.5% || || || || || || || ||
+
| 3 || 28 mai&mdash;3 junh || || ~14 000 || ~88.0% || || || || || || || ||
 
|-
 
|-
| 4 || 4 junh&mdash;10 junh || || ~10.000 || ~84.5% || || || || || || || ||
+
| 4 || 4 junh&mdash;10 junh || || ~16 000 || ~89.0% || || || || || || || ||
 
|-
 
|-
| 5 || 11 junh&mdash;17 junh || 26 juny&mdash;29 juny || ~12.000 || ~85.5% || ~25% || pr, cnj*, adv || || || || ||
+
| 5 || <b>11 junh&mdash;15 junh</b> || || ~18 000 || ~89.5% || ~35% || pr, cnj*, adv || || || || || ||
 
|-
 
|-
| 6 || 18 junh&mdash;24 junh || || ~14.000 || ~86.5% || || prn, det || || || || ||
+
| 6 || 18 junh&mdash;24 junh || || ~20 000 || ~90.0% || || prn, det || || || || || ||
 
|-
 
|-
| 7 || 25 junh&mdash;1 julhet || || ~16.000 || ~87.5% || || vblex || || || || ||
+
| 7 || 25 junh&mdash;1 julhet || || ~21 000 || ~90.5% || || vblex || || || || || ||
 
|-
 
|-
| 8 || 2 julhet&mdash;8 julhet || || ~18.000 || ~88.5% || || adj || || || || ||
+
| 8 || 2 julhet&mdash;8 julhet || || ~22 000 || ~91.0% || || adj || || || || || ||
 
|-
 
|-
| 9 || 9 julhet&mdash;15 julhet ||24 juliol&mdash;28 juliol|| ~18.000 || ~89.5% || ~15% || n || || || || ||
+
| 9 || <b>9 julhet&mdash;13 julhet</b> || || ~22 000 || ~91.0% || ~25% || n || || || || || ||
|-
 
| 10 || 16 julhet&mdash;22 julhet || || ~20.000 || ~90.0% || || || || || || ||
 
 
|-
 
|-
| 13 || 23 julhet&mdash;29 julhet ||21 agost&mdash;29 agost|| ~20.000 || ~90.0% || || || || || || ||
+
| 0 || <b>occitan > français</b> || || ~20 000 || || || || || || || || ||
 
|-
 
| 10 || 16 julhet&mdash;22 julhet || || ~20 500 || ~88.0% || || pr, cnj*, adv || || || || || ||
 
|-
 
|-
| 0 || <b>occitan > français</b> || || || || || || || || || || ||
+
| 13 || 23 julhet&mdash;29 julhet || || ~21 000 || ~89.0% || || prn, det, n, adj || || || || || ||
 
|-
 
|-
| 11 || 30 julhet&mdash;5 agost || || ~25.500 || || || pr, cnj*, adv || || || || ||
+
| 11 || 30 julhet&mdash;5 agost || || ~21 500 || ~90.0% || || vblex || || || || || ||
 
|-
 
|-
| 12 || 6 agost&mdash;14 agost || avaluacion finala || ~25.500 || ~89,1% || ~20% || prn, det, n, adj || || || || ||
+
| 12* || 6 agost&mdash;9 agost || || ~21.500 || ~90.5% || || || || || || || ||
 
|-
 
|-
| 13 || 21 agost&mdash;27 agost ||21 agost&mdash;29 agost|| || || || vblex || || || || ||
+
| 12** || <b>10 agost&mdash;14 agost</b> ||avaluacion finala|| || || ~35% || || || || || || ||
 
|-
 
|-
 
|}
 
|}

Revision as of 07:13, 16 March 2018

Note: The French → Occitan part of the project is the main direction.

Setmana Dates Descripció Bidix
(sense np)
previst
(%) Cobertura
prevista
(%) WER
previst
Testvoc Avaluació Bidix
real
(%) Cobertura
real
(%) WER Err. Fet?
0 français > occitan ~5 700
1 14 mai—20 mai ~10 000 ~84,0%
2 21 mai—11 mai ~12 000 ~86,0%
3 28 mai—3 junh ~14 000 ~88.0%
4 4 junh—10 junh ~16 000 ~89.0%
5 11 junh—15 junh ~18 000 ~89.5% ~35% pr, cnj*, adv
6 18 junh—24 junh ~20 000 ~90.0% prn, det
7 25 junh—1 julhet ~21 000 ~90.5% vblex
8 2 julhet—8 julhet ~22 000 ~91.0% adj
9 9 julhet—13 julhet ~22 000 ~91.0% ~25% n
0 occitan > français ~20 000
10 16 julhet—22 julhet ~20 500 ~88.0% pr, cnj*, adv
13 23 julhet—29 julhet ~21 000 ~89.0% prn, det, n, adj
11 30 julhet—5 agost ~21 500 ~90.0% vblex
12* 6 agost—9 agost ~21.500 ~90.5%
12** 10 agost—14 agost avaluacion finala ~35%

Per a calcular els nombres

Errors (calcular en apertium-fra-oci/dev)
$ bash dev/testvoc/generation.sh fra-oci | wc -l  # en apertium-oci-fra
$ bash dev/testvoc/generation.sh oci-fra | wc -l  # en apertium-oci-fra
Bidix (calcular en apertium-oci-fra)
$ cat apertium-oci-fra.oci-fra.dix | grep '<l'  | grep -v '¨np"' | wc -l
Cobertura (calcular en apertium-oci-fra)
$ cat ../apertium-fra/corpus/corpus_fra_wp100000.txt | apertium -d . fra-oci-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/fra-oci.coverage.txt
$ calc `cat /tmp/fra-oci.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/fra-oci.coverage.txt | wc -l`

$ cat ../apertium-cat/corpus/corpus_oci_wp100000.txt | apertium -d . oci-fra-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/oci-fra.coverage.txt
$ calc `cat /tmp/oci-fra.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/oci-fra.coverage.txt | wc -l`

Veire tanben