User:Capsot/Proposicion
Jump to navigation
Jump to search
Mentor possible: Hèctor Alòs
Contents
- 1 Competéncias e experiéncia
- 2 D'ont ven aqueste interès per la traduccion automatizada?
- 3 Per qué vos interèssa Apertium?
- 4 Quina de las tascas publicadas vos interèssan? Qu'avètz l'intencion de realizar?
- 5 Rasons per las que Google e Apertium vos deurián esponsorizar
- 6 Descripcion de cossí e qui ne serán los beneficiaris dins la societat
- 7 Plan de trabalh
Competéncias e experiéncia
D'ont ven aqueste interès per la traduccion automatizada?
Per qué vos interèssa Apertium?
Quina de las tascas publicadas vos interèssan? Qu'avètz l'intencion de realizar?
Rasons per las que Google e Apertium vos deurián esponsorizar
Descripcion de cossí e qui ne serán los beneficiaris dins la societat
Plan de trabalh
- Note: The French → Occitan part of the project is the main direction.
- Nòta: La part francés → occitan del projècte es la direccion principala.
- Note : La partie français → occitan du projet est la direction principale.
Setmana | Datas | Descripcion | Bidix (sens np) previst |
(%) Cobertura prevista |
(%) WER previst |
Testvoc | Avaloracion | Bidix real |
(%) Cobertura reala |
(%) WER | Err. | Fet? |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | francés > occitan | ~5,700 | ||||||||||
1 | 14 mai—20 mai | Melhorament del monodix occitan Adding prn, pr, cnj*, basic adv to bidix |
~6,000 | ~84,0% | ||||||||
2 | 21 mai—27 mai | Apondeson dels n, adj, adv al bidix a partir del Wiktionnaire francés | ~12,000 | ~86,0% | ||||||||
3 | 28 mai—3 junh | Apondeson del vblex al bidix a partir del Wiktionnaire francés Beginning a apondre los mots que mancan en òrdre decreissent de frequéncia fra > oci |
~14,000 | ~88.0% | ||||||||
4 | 4 junh—10 junh | Apondeson de mots Transferiment de règlas fra > oci |
~16,000 | ~89.0% | ||||||||
5 | 11 junh—15 junh Deliverable #1: Traductor del francés a l'occitan |
Apondeson de mots Transfer rules fra > oci |
~18,000 | ~89.5% | ~25% | |||||||
6 | 18 junh—24 junh | Apondeson de mots Transferiment de règlas fra > oci Començament del testvoc fra > oci |
~20,000 | ~90.0% | pr, cnj*, adv, prn, det | |||||||
7 | 25 junh—1 julhet | Apondeson de mots Transferiment de règlas fra > oci Testvoc fra > oci |
~21,000 | ~90.5% | vblex | |||||||
8 | 2 julhet—8 julhet | Apondeson de mots Transferiment de règlas fra > oci Testvoc fra > oci |
~22,000 | ~91.0% | adj | |||||||
9 | 9 julhet—13 julhet Deliverable #2: Traductor del francés a l'occitan |
Transfer rules fra > oci Testvoc fra > oci |
~22,000 | ~91.0% | ~15% | n | ||||||
0 | occitan > français | ~22,000 | ||||||||||
10 | 16 julhet—22 julhet | Adding missing words in decreasing order of frequency oci > fra Transfer rules oci > fra Testvoc oci > fra |
~22,500 | ~88.0% | pr, cnj*, adv, prn, det | |||||||
13 | 23 julhet—29 julhet | Adding words Transfer rules oci > fra Testvoc oci > fra |
~23,000 | ~89.0% | n, adj | |||||||
11 | 30 julhet—5 agost | Adding words Transfer rules oci > fra Testvoc oci > fra |
~23,500 | ~90.0% | vblex | |||||||
12* | 6 agost—9 agost | Final improvements | ||||||||||
12** | 10 agost—14 agost Deliverable #3: Occitan to French translator |
Final evalution | ~23,500 | ~90.0% | ~30% |
Per calcular los nombres
- Errors (calcular en apertium-fra-oci/dev)
$ bash dev/testvoc/generation.sh fra-oci | wc -l # en apertium-oci-fra $ bash dev/testvoc/generation.sh oci-fra | wc -l # en apertium-oci-fra
- Bidix (calcular en apertium-oci-fra)
$ cat apertium-oci-fra.oci-fra.dix | grep '<l' | grep -v '¨np"' | wc -l
- Cobertura (calcular en apertium-oci-fra)
$ cat ../apertium-fra/corpus/corpus_fra_wp100000.txt | apertium -d . fra-oci-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/fra-oci.coverage.txt $ calc `cat /tmp/fra-oci.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/fra-oci.coverage.txt | wc -l` $ cat ../apertium-cat/corpus/corpus_oci_wp100000.txt | apertium -d . oci-fra-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/oci-fra.coverage.txt $ calc `cat /tmp/oci-fra.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/oci-fra.coverage.txt | wc -l`