Difference between revisions of "User:Capsot/Proposicion"
		
		
		
		
		
		
		Jump to navigation
		Jump to search
		
				
		
		
		
		
		
		
		
	
m  | 
				|||
| Line 19: | Line 19: | ||
== Plan de trabalh ==  | 
  == Plan de trabalh ==  | 
||
*Note: The French → Occitan part of the project is the main direction.  | 
|||
* [[Occitan and French/Work plan | Veire plan de trabalh]]  | 
  |||
*<small>Nòta: La part francés → occitan del projècte es la direccion principala.</small>  | 
|||
*<small>Note : La partie français → occitan du projet est la direction principale.</small>  | 
|||
{|class=wikitable  | 
|||
! Setmana !! Datas                !!  Descripcion !!  Bidix<br/>(sens np)<br/>previst !!(%) Cobertura<br/>prevista !! (%) WER<br/>previst !! Testvoc  !! Avaloracion !! Bidix<br/>real !! (%) Cobertura<br/>reala !! (%) WER !! Err. !! Fet?  | 
|||
|-  | 
|||
| 0      || <b>francés > occitan</b> ||                  ||    ~5,700       ||          ||         ||   ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 1      || 14 mai—20 mai  || Melhorament del monodix occitan<br/>Adding prn, pr, cnj*, basic adv to bidix ||    ~6,000       ||  ~84,0%  ||         ||  ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 2      || 21 mai—27 mai  || Apondeson dels n, adj, adv al bidix a partir del Wiktionnaire francés ||    ~12,000       ||  ~86,0%  ||         ||  ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 3      || 28 mai—3 junh || Apondeson del vblex al bidix a partir del Wiktionnaire francés<br/>Beginning a apondre los mots que mancan en òrdre decreissent de frequéncia fra > oci ||    ~14,000       ||  ~88.0%  ||         ||  ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 4      || 4 junh—10 junh || Apondeson de mots<br/>Transferiment de règlas fra > oci ||  ~16,000       ||  ~89.0%  ||         ||  ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 5     || <b>11 junh—15 junh<br>Deliverable #1: Traductor del francés a l'occitan</b> || Apondeson de mots<br/>Transfer rules fra > oci ||  <b>~18,000</b>       ||  <b>~89.5%</b>  ||  <b>~25%</b>   ||  ||    ||    || ||   ||  ||    | 
|||
|-   | 
|||
| 6    || 18 junh—24 junh || Apondeson de mots<br/>Transferiment de règlas fra > oci<br/>Començament del testvoc fra > oci ||  ~20,000       ||  ~90.0%  ||         ||  pr, cnj*, adv, prn, det ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 7  || 25 junh—1 julhet || Apondeson de mots<br/>Transferiment de règlas fra > oci<br/>Testvoc fra > oci ||  ~21,000       ||  ~90.5%  ||         ||  vblex    ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 8  || 2 julhet—8 julhet || Apondeson de mots<br/>Transferiment de règlas fra > oci<br/>Testvoc fra > oci ||  ~22,000       ||  ~91.0%  ||         ||  adj     ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 9  || <b>9 julhet—13 julhet<br>Deliverable #2: Traductor del francés a l'occitan</b> || Transfer rules fra > oci<br/>Testvoc fra > oci ||  <b>~22,000</b>     ||  <b>~91.0%</b>  ||  <b>~15%</b>   ||  n        ||    ||    || ||   ||   ||   | 
|||
|-  | 
|||
| 0  || <b>occitan > français</b> ||  ||    ~22,000       ||          ||         ||   ||        ||    ||    || ||   ||   | 
|||
|-   | 
|||
| 10   || 16 julhet—22 julhet || Adding  missing words in decreasing order of frequency oci > fra<br/>Transfer rules oci > fra<br/>Testvoc oci > fra ||   ~22,500      ||  ~88.0%  ||       || pr, cnj*, adv, prn, det ||    ||    || ||   ||   ||   | 
|||
|-  | 
|||
| 13   || 23 julhet—29 julhet || Adding words<br/>Transfer rules oci > fra <br/>Testvoc oci > fra ||   ~23,000      ||  ~89.0%   ||       || n, adj ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 11    || 30 julhet—5 agost || Adding words<br/>Transfer rules oci > fra <br/>Testvoc oci > fra ||   ~23,500      ||  ~90.0% ||         || vblex ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 12*   || 6 agost—9 agost || Final improvements ||         ||    ||     || ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
| 12**   || <b>10 agost—14 agost<br>Deliverable #3: Occitan to French translator</b> || Final evalution|| <b>~23,500</b>  || <b>~90.0%</b> ||  <b>~30%</b>   ||             ||    ||    || ||   ||   ||   | 
|||
|-   | 
|||
|}  | 
|||
===Per calcular los nombres===  | 
|||
;Errors (calcular en apertium-fra-oci/dev)  | 
|||
<pre>  | 
|||
$ bash dev/testvoc/generation.sh fra-oci | wc -l  # en apertium-oci-fra  | 
|||
$ bash dev/testvoc/generation.sh oci-fra | wc -l  # en apertium-oci-fra  | 
|||
</pre>  | 
|||
;Bidix (calcular en apertium-oci-fra)  | 
|||
<pre>  | 
|||
$ cat apertium-oci-fra.oci-fra.dix | grep '<l'  | grep -v '¨np"' | wc -l  | 
|||
</pre>  | 
|||
;Cobertura (calcular en apertium-oci-fra)  | 
|||
<pre>  | 
|||
$ cat ../apertium-fra/corpus/corpus_fra_wp100000.txt | apertium -d . fra-oci-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/fra-oci.coverage.txt  | 
|||
$ calc `cat /tmp/fra-oci.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/fra-oci.coverage.txt | wc -l`  | 
|||
$ cat ../apertium-cat/corpus/corpus_oci_wp100000.txt | apertium -d . oci-fra-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/oci-fra.coverage.txt  | 
|||
$ calc `cat /tmp/oci-fra.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/oci-fra.coverage.txt | wc -l`  | 
|||
</pre>  | 
|||
Revision as of 20:16, 25 March 2018
Mentor possible: Hèctor Alòs
Contents
- 1 Competéncias e experiéncia
 - 2 D'ont ven aqueste interès per la traduccion automatizada?
 - 3 Per qué vos interèssa Apertium?
 - 4 Quina de las tascas publicadas vos interèssan? Qu'avètz l'intencion de realizar?
 - 5 Rasons per las que Google e Apertium vos deurián esponsorizar
 - 6 Descripcion de cossí e qui ne serán los beneficiaris dins la societat
 - 7 Plan de trabalh
 
Competéncias e experiéncia
D'ont ven aqueste interès per la traduccion automatizada?
Per qué vos interèssa Apertium?
Quina de las tascas publicadas vos interèssan? Qu'avètz l'intencion de realizar?
Rasons per las que Google e Apertium vos deurián esponsorizar
Descripcion de cossí e qui ne serán los beneficiaris dins la societat
Plan de trabalh
- Note: The French → Occitan part of the project is the main direction.
 - Nòta: La part francés → occitan del projècte es la direccion principala.
 - Note : La partie français → occitan du projet est la direction principale.
 
| Setmana | Datas | Descripcion | Bidix (sens np) previst  | 
(%) Cobertura prevista  | 
(%) WER previst  | 
Testvoc | Avaloracion | Bidix real  | 
(%) Cobertura reala  | 
(%) WER | Err. | Fet? | 
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | francés > occitan | ~5,700 | ||||||||||
| 1 | 14 mai—20 mai | Melhorament del monodix occitan Adding prn, pr, cnj*, basic adv to bidix  | 
~6,000 | ~84,0% | ||||||||
| 2 | 21 mai—27 mai | Apondeson dels n, adj, adv al bidix a partir del Wiktionnaire francés | ~12,000 | ~86,0% | ||||||||
| 3 | 28 mai—3 junh | Apondeson del vblex al bidix a partir del Wiktionnaire francés Beginning a apondre los mots que mancan en òrdre decreissent de frequéncia fra > oci  | 
~14,000 | ~88.0% | ||||||||
| 4 | 4 junh—10 junh | Apondeson de mots Transferiment de règlas fra > oci  | 
~16,000 | ~89.0% | ||||||||
| 5 | 11 junh—15 junh Deliverable #1: Traductor del francés a l'occitan  | 
Apondeson de mots Transfer rules fra > oci  | 
~18,000 | ~89.5% | ~25% | |||||||
| 6 | 18 junh—24 junh | Apondeson de mots Transferiment de règlas fra > oci Començament del testvoc fra > oci  | 
~20,000 | ~90.0% | pr, cnj*, adv, prn, det | |||||||
| 7 | 25 junh—1 julhet | Apondeson de mots Transferiment de règlas fra > oci Testvoc fra > oci  | 
~21,000 | ~90.5% | vblex | |||||||
| 8 | 2 julhet—8 julhet | Apondeson de mots Transferiment de règlas fra > oci Testvoc fra > oci  | 
~22,000 | ~91.0% | adj | |||||||
| 9 | 9 julhet—13 julhet Deliverable #2: Traductor del francés a l'occitan  | 
Transfer rules fra > oci Testvoc fra > oci  | 
~22,000 | ~91.0% | ~15% | n | ||||||
| 0 | occitan > français | ~22,000 | ||||||||||
| 10 | 16 julhet—22 julhet | Adding  missing words in decreasing order of frequency oci > fra Transfer rules oci > fra Testvoc oci > fra  | 
~22,500 | ~88.0% | pr, cnj*, adv, prn, det | |||||||
| 13 | 23 julhet—29 julhet | Adding words Transfer rules oci > fra Testvoc oci > fra  | 
~23,000 | ~89.0% | n, adj | |||||||
| 11 | 30 julhet—5 agost | Adding words Transfer rules oci > fra Testvoc oci > fra  | 
~23,500 | ~90.0% | vblex | |||||||
| 12* | 6 agost—9 agost | Final improvements | ||||||||||
| 12** | 10 agost—14 agost Deliverable #3: Occitan to French translator  | 
Final evalution | ~23,500 | ~90.0% | ~30% | 
Per calcular los nombres
- Errors (calcular en apertium-fra-oci/dev)
 
$ bash dev/testvoc/generation.sh fra-oci | wc -l # en apertium-oci-fra $ bash dev/testvoc/generation.sh oci-fra | wc -l # en apertium-oci-fra
- Bidix (calcular en apertium-oci-fra)
 
$ cat apertium-oci-fra.oci-fra.dix | grep '<l' | grep -v '¨np"' | wc -l
- Cobertura (calcular en apertium-oci-fra)
 
$ cat ../apertium-fra/corpus/corpus_fra_wp100000.txt | apertium -d . fra-oci-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/fra-oci.coverage.txt $ calc `cat /tmp/fra-oci.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/fra-oci.coverage.txt | wc -l` $ cat ../apertium-cat/corpus/corpus_oci_wp100000.txt | apertium -d . oci-fra-morph | sed 's/\$\W*\^/$\n^/g' > /tmp/oci-fra.coverage.txt $ calc `cat /tmp/oci-fra.coverage.txt | grep -v '\*' | wc -l `/`cat /tmp/oci-fra.coverage.txt | wc -l`