Difference between revisions of "User:Cgcarbonell"

From Apertium
Jump to navigation Jump to search
 
(32 intermediate revisions by 3 users not shown)
Line 6: Line 6:
 
'''Adresse de courriel''': cguillemcarbonell@gmail.com
 
'''Adresse de courriel''': cguillemcarbonell@gmail.com
   
  +
'''IRC #apertium channel''': Serpis
== Pourquoi je suis intéressée à la traduction automatique? ==
 
   
  +
'''SourceForge''' : serpis
   
  +
== Pourquoi suis-je intéressée à la traduction automatique? ==
J’ai étudié Traduction et Interprétariat à l’Université d’Alicante. Tout au long de mes études j’ai utilisé à plusieurs reprises des TA pour faire mes travaux. Cela m’a épargné beaucoup de travail et de temps, car je ne devais pas faire un travail de traduction, mais de postédition. En outre, la TA rend possible la compréhension de textes écrits dans une langue inconnue ou dans une que nous ne maîtrisons pas. De nos jours, nous appartenons à la génération du numérique où la communication en ligne est de plus en plus présente dans nos vies. La TA nous permet d’acquérir plus de connaissances grâce à l’échange d’information écrite en langues étrangères. À cet égard, la langue n’est plus une barrière pour la culture et pour la communication.
 
   
   
  +
J’ai étudié Traduction et Interprétariat à l’Université d’Alicante. Tout au long de mes études j’ai utilisé à plusieurs reprises des TA pour faire mes travaux. Cela m’a épargné beaucoup de travail et de temps, car je ne devais pas faire un travail de traduction, mais de postédition. En outre, la TA rend possible la compréhension de textes écrits dans une langue inconnue ou dans une que nous ne maîtrisons pas. De nos jours, nous appartenons à la génération du numérique où la communication en ligne est de plus en plus présente dans nos vies. La TA nous permet d’acquérir plus de connaissances grâce à l’échange d’informations écrites en langues étrangères. À cet égard, la langue n’est plus une barrière pour la culture et pour la communication.
== Pourquoi je suis intéressée au projet Apertim? ==
 
   
Apertium est une plateforme de traduction automatique de code source ouvert qui met à la portée de tous ceux qui le veulent, les outils nécessaires pour traduire de nombreuses paires de langues et il rend possible la communication entre les personnes. De la même manière, ce projet permet de participer aux développeurs des quatre coins du monde, en leur donnant la chance de connaître le monde de la traduction depuis une autre perspective.
 
   
  +
== Pourquoi suis-je intéressée au projet Apertium? ==
  +
  +
Apertium est une plateforme de traduction automatique de code source ouvert qui met à la portée de tous ceux qui le veulent, les outils nécessaires pour traduire de nombreuses paires de langues et il rend possible la communication entre les personnes. De la même manière, ce projet permet de participer aux développeurs des quatre coins du monde, en leur donnant la chance de connaître le monde de la traduction depuis une autre perspective. De mon côté, j’utilise souvent cette plateforme pour mes traductions en espagnol, français et catalan, et de la même manière qu’elle me rend un service je voudrais lui rend un autre en apportant des améliorations.
  +
  +
::: You could give a more personal perspective here --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 16:17, 21 March 2014 (UTC)
   
 
== Qu’est-ce que je propose ? ==
 
== Qu’est-ce que je propose ? ==
   
L’objectif de mon travail est celui d’améliorer la paire de langues fr-ca déjà existante. À travers de la plateforme online d’Apertium, j’ai fait des épreuves en traduisant des textes choisis au hasard et j’ai remarqué que des améliorations peuvent être faites, aussi bien des dictionnaires que des règles de transfert. De même, pour ce qui est du catalan, le TA donne le produit en la variété orientale, tandis que la variété occidentale n’existe pas pour cette combinaison langagière. Pour la fin de la période du GSoC, j’aimerais bien avoir une nouvelle version de la paire fr-cat en variété occidentale.
+
L’objectif de mon travail est celui d’améliorer la paire de langues fr-ca déjà existante. À travers de la plateforme en ligne d’Apertium, j’ai fait des épreuves en traduisant des textes choisis au hasard et j’ai remarqué que des améliorations peuvent être faites, aussi bien des dictionnaires que des règles de transfert. De même, pour ce qui est du catalan, le TA donne le produit en la variété orientale, tandis que la variété occidentale n’existe pas pour cette combinaison langagière. Pour la fin de la période du GSoC, j’aimerais bien avoir une nouvelle version de la paire fr-cat en variété occidentale.
   
'''Titre :''' Nouvelle version de la paire de langues fr-ca.
 
   
  +
=== Titre ===
'''Raisons pour lesquelles Google et Apertium devraient me sponsoriser :'''
 
  +
Nouvelle version de la paire de langues fr-ca.
  +
  +
===Raisons pour lesquelles Google et Apertium devraient me sponsoriser===
   
 
La paire de langues fr-cat a besoin d’une amélioration pour arriver à une traduction plus précise des textes.
 
La paire de langues fr-cat a besoin d’une amélioration pour arriver à une traduction plus précise des textes.
   
'''Avantage pour la société :'''
+
===Avantage pour la société===
   
À l’époque actuelle, le français se situe au 6e rang des langues les plus utilisées. Elle compte plus de 220 millions de francophones à travers le monde. L’OIF estime que pour l’année 2015, le nombre de locuteurs français devrait atteindre plus de 700 millions. Cela veut dire qu’il y a de nombreux documents qui circulent en langue française. Si mon projet s’achève, plus de 9 millions de locuteurs catalans pourraient bénéficier des traductions en ligne améliorées du français au catalan.
+
À l’époque actuelle, le français se situe au 6e rang des langues les plus utilisées. Elle compte plus de 220 millions de francophones à travers le monde. L’OIF estime que pour l’année 2050, le nombre de locuteurs français devrait atteindre plus de 700 millions. Cela veut dire qu’il y a de nombreux documents qui circulent en langue française. Si mon projet s’achève, plus de 9 millions de locuteurs catalans pourraient bénéficier des traductions en ligne améliorées du français au catalan.
   
  +
== Habilités et compétences ==
'''Plans pour cet été :'''
 
  +
  +
J’ai étudié Traduction et Interprétariat à l’Université d’Alicante (Espagne), comprenant une bourse de stage Erasmus d’une année scolaire à l’Université de Versailles (France). Maintenant, je fais un master de formation et enseignement du FLE. Je suis bilingue de naissance (espagnol, catalan) et j’ai le diplôme du niveau C2 en catalan et du C1 en français selon le CECRL.
  +
J’ai des compétences en XML et HML.
  +
  +
  +
==Plans pour cet été==
   
 
Pendant 5 semaines (du 21 juin jusqu’au 26 juillet), je me trouverais à Dublin pour attendre un cours intensif pour améliorer mon anglais. Durant cette période, je dédierai du temps à travailler sur le projet Apertium.
 
Pendant 5 semaines (du 21 juin jusqu’au 26 juillet), je me trouverais à Dublin pour attendre un cours intensif pour améliorer mon anglais. Durant cette période, je dédierai du temps à travailler sur le projet Apertium.
  +
  +
  +
== Planification du travail ==
  +
  +
21 avril – 19 mai :
  +
  +
* Rapprochement au monde Apertium et familiarisation avec ses outils.
  +
* Naviguer sur les documents disponibles sur le Wiki.
  +
* Analyser le monodix fr-ca et prendre de notes de possibles erreurs à corriger.
  +
* Profiter des dictionnaires gratuits déjà existants sur le net.
  +
  +
--> Semaine 1 :
  +
* Vérifier le monodix.
  +
  +
Semaine 2 :
  +
* Vérifier le ca monodix.
  +
  +
Semaine 3 :
  +
*Vérifier le ca monodix.
  +
  +
Semaine 4 :
  +
* Vérifier le ca monodix.
  +
  +
::: What does "verification" mean here? Do you mean evaluation? --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 17:29, 21 March 2014 (UTC)
  +
  +
:::I mean to test, to check.
  +
  +
Semaine 5 :
  +
* Ajouter des entrées à l’aide d’un corpus testvoc.
  +
  +
::: How will you decide which entries to add? --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 17:29, 21 March 2014 (UTC)
  +
::: By using a corpus testvoc.
  +
  +
Semaine 6 (Dublin):
  +
* Ajouter des entrées à l’aide d’un corpus testvoc.
  +
  +
Semaine 7 (Dublin) :
  +
* Ajouter et corriger des règles de transfert.
  +
  +
::: How will you know which rules need adding or correcting? --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 17:29, 21 March 2014 (UTC)
  +
  +
::: Detecting the errors of the corpus testvoc.
  +
  +
Semaine 8 (Dublin) :
  +
* Ajouter et corriger des règles de transfert.
  +
  +
Semaine 9 (Dublin) :
  +
* Tester et vérifier le travail.
  +
  +
Semaine 10 (Dublin) :
  +
* Tester et vérifier le travail.
  +
  +
Semaine 11 :
  +
* Tester et vérifier le travail.
  +
  +
::: This should be explained better --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 17:29, 21 March 2014 (UTC)
  +
::: Checking if all runs well.
  +
  +
Semaine 12 :
  +
*Derniers arrangements.
  +
  +
Semaine 13 :
  +
* Remise de la paire travaillée avec la moindre erreur possible.
  +
  +
  +
::: How will you measure the error? --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 17:29, 21 March 2014 (UTC)
  +
::: By using apertium-eval-translator for WER and PER.
  +
  +
::: You have to provide a weekly plan saying what you will do each week, as in the template. Mark the Dublin weeks in some way. --[[User:Mlforcada|Mlforcada]] ([[User talk:Mlforcada|talk]]) 16:21, 21 March 2014 (UTC)
  +
  +
== Défi de codage ==
  +
  +
;Français
  +
  +
<pre>
  +
MUGUET DE MAI
  +
  +
Le Muguet ou Muguet de mai (Convallaria majalis) est une herbacée des régions tempérées dont les fleurs printanières, petites et blanches,
  +
forment des grappes de clochettes très odorantes. C'est une plante toxique, voire mortelle après avoir mangé le périanthe. En zone européenne
  +
tempérée, en forêt, là où sa présence est naturelle, il serait (avec la pervenche) un bon bioindicateur d'ancienneté et de la naturalité de
  +
la forêt. Le muguet fleurit au printemps.
  +
Selon la classification classique, il fait partie de la famille des Liliaceae. Selon la classification phylogénétique, il fait partie de la
  +
famille des Ruscaceae ou des Asparagaceae (qui l'avait d'abord placé dans la famille des Convallariaceae).
  +
  +
  +
HISTOIRE
  +
  +
Le muguet fleurit quand vient le printemps, il a donc été depuis longtemps une plante idéale pour célébrer la nouvelle saison, les beaux jours
  +
qui reviennent et pour attirer les bonnes grâces pour de futures bonnes récoltes.
  +
  +
LÉGENDES ET MYTHES
  +
  +
Jadis, le Convallaria majalis, était considéré comme une plante magique hypocrite associée à la magie.
  +
La légende grecque veut que le muguet fut créé par Apollon, dieu du mont Parnasse, pour en tapisser le sol, afin que ses neuf muses
  +
ne s'abîment pas les pieds.
  +
Les Romains célébraient au début du mois de mai les Florales, en l'honneur de Flora, la déesse des fleurs.
  +
Le brin de muguet, porte-bonheur a souvent été associé à la Madone, les larmes versées par la Vierge Marie au pied de la croix auraient donné
  +
naissance aux fleurs de muguet en forme de clochettes blanches. Toutefois ses baies rouges contiennent un puissant bouillon d’onze heures.
  +
La déesse nordique Ostara, célébrée à l'équinoxe de printemps, était associée au muguet. Des « Mâts de Mai », ou bien des « Arbres de Mai »,
  +
étaient parfois utilisés dans le cadre des festivités d'Ostara.
  +
  +
Le muguet est une plante vivace, qui se multiplie dans les sous-bois essentiellement grâce à son rhizome traçant, appelé « griffe »
  +
  +
(portion de rhizome pourvue d’un grand nombre de racines et qui porte un bourgeon vivant). Chaque brin de muguet (ou hampe) est entouré
  +
de deux feuilles. Les fleurs sont toutes disposées du même côté de la hampe. En automne, le muguet donne des fruits sous la forme de petites
  +
baies rouges qui sont un puissant bouillon d’onze heures.
  +
  +
Avant floraison, le muguet de mai peut être confondu avec l'ail des ours, ce qui présente un danger pour les amateurs de ce dernier.
  +
La distinction peut facilement se faire grâce à l'odeur aillée dégagée par les feuilles froissées de l'ail des ours uniquement, ainsi que
  +
par la consistance des feuilles, plus coriaces chez le muguet.
  +
  +
On le trouve à peu près partout en France, à l'exception des régions méditerranéennes. On le trouve à travers tout l'hémisphère Nord dans les
  +
régions tempérées fraîches en Asie, en Europe et en Amérique du Nord.
  +
  +
  +
Cette plante nécessite une température moyenne d'été supérieure à 10 °C, ce qui la rend adaptée même aux régions fraiches du nord de l'Europe.
  +
Elle a cependant besoin de la lumière, faute de quoi elle ne fleurit pas.
  +
La floraison a lieu entre avril et juillet. L'idéal symbolique voudrait que la fleur fleurisse pour le 1er mai mais il n'est que rarement exaucé.
  +
Il arrive même que la plante soit fanée à cette date. En Amérique du Nord, la floraison est rare avant la mi-mai.
  +
  +
</pre>
  +
  +
;Apertium
  +
  +
<pre>
  +
*MUGUET DE MAIG
  +
  +
El *Muguet o *Muguet de maig (*Convallaria *majalis) és una *herbacée de les regions temperades de les quals les flors*printanières,
  +
petites i blanques, formen *grappes de campanetes molt *odorantes. És una planta *toxique, fins i tot mortal després d'haver menjat
  +
el *périanthe. En zona europea temperada, en bosc, allà on la seva presència és natural, seria (amb la *pervenche) un bon
  +
*bioindicateur de *ancienneté i de la *naturalité del bosc. El *muguet *fleurit a la primavera.
  +
Segons la *classification clàssica, fet part de la família de les *Liliaceae. Segons la *classification *phylogénétique,
  +
fet part de la família de les *Ruscaceae o de les *Asparagaceae (que l'havia en principi posat en la família de les*Convallariaceae).
  +
  +
HISTÒRIA
  +
  +
El *muguet *fleurit quan ve la primavera, ha doncs estat des de molt de temps una planta ideal per celebrar la nova estació,
  +
els bonics dies qui tornen i per atreure les bones gràcies per de futures bones *récoltes.
  +
  +
LLEGENDES I *MYTHES
  +
  +
Antany, el *Convallaria *majalis, havia considerat com una planta *magique *hypocrite *associée a la màgia.
  +
La llegenda grega vol que el *muguet hagué creat per *Apollon, déu del mont *Parnasse, per en *tapisser el sòl,
  +
amb la finalitat que els seus nou *muses no s'espatllen pas els peus.
  +
  +
Els *Romains celebraven al començament del mes de maig els *Florales, en l'honor de *Flora, la deessa de les flors.
  +
El *brin de *muguet, porta-felicitat ha sovint estat *associé a la *Madone, les llàgrimes *versées per la Verge Casa al
  +
peu de la creu haurien donat naixement a les flors de *muguet en forma de campanetes blanques. Tanmateix les seves badies
  +
vermelles contenen un poderós *bouillon d’onze hores. La deessa *nordique *Ostara, celebrada a la *équinoxe de primavera,
  +
era *associée al *muguet. Alguns Pals de Maig », o ben dels « Arbres de Maig », eren de vegades utilitzats en el marc
  +
dels *festivités de *Ostara.
  +
  +
El *muguet és una planta *vivace, qui es multiplica en les sota-boscos essencialment gràcies al seu *rhizome traçant,
  +
trucat « *griffe » (porció de *rhizome proveïda d’un gran nombre d'arrels i qui porta un *bourgeon vivint). Cada *brin
  +
de*muguet (o asta) ha envoltat de dos fulls. Les flors són totes disposades del mateix costat de l'asta. En tardor,
  +
el *muguet dóna fruites sota la forma de petites badies vermelles qui són un poderós *bouillon d’onze hores.
  +
Abans *floraison, el *muguet de maig pot haver confós amb el *ail dels óssos, el que presenta un perill pels aficionats
  +
d'aquest últim. La distinció pot fàcilment fer-se gràcies a la *odeur *aillée *dégagée pels fulls *froissées del
  +
*ail dels óssos únicament, així com per la *consistance dels fulls, més *coriaces en el *muguet.
  +
  +
S'ho troba a poc prop per tot arreu a França, a l'excepció de les regions *méditerranéennes. S'ho troba a través de
  +
tot l'hemisferi Nord en les regions temperades fresques a Àsia, a Europa i a Amèrica del Nord.
  +
Aquesta planta necessita una temperatura mitjana d'estiu superior a 10 °C, el que la ret *adaptée mateix a les
  +
regions*fraiches del nord de l'Europa. Ha no obstant això necessitat de la llum, falta de *quoi ella no *fleurit pas.
  +
  +
La *floraison ha lloc entre abril i juliol. L'ideal simbòlic voldria que la flor *fleurisse pel 1*er maig però no
  +
és més que rarament *exaucé. Arriba fins i tot que la planta sigui *fanée a aquesta data. A Amèrica del Nord,
  +
la *floraison és escassa abans la *mi-maig.
  +
  +
https://fr.wikipedia.org/wiki/Muguet_de_mai
  +
  +
</pre>
  +
  +
;Français
  +
  +
<pre>
  +
CATACOMBES DE PARIS
  +
  +
Les catacombes de Paris, terme improprement utilisé pour nommer l'ossuaire municipal, sont d'anciennes carrières souterraines situées dans
  +
le 14e arrondissement de Paris, reliées entre elles par des galeries d'inspection. Elles sont transformées en ossuaire à la fin du xviiie siècle
  +
avec le transfert des dépouilles de six millions de Parisiens, évacués des cimetières pour des raisons de salubrité publique. Elles prennent alors
  +
le nom de Catacombes, par analogie avec les nécropoles souterraines de la Rome antique, bien qu'elles n'aient quasiment jamais servi
  +
de sépulture initiale.
  +
  +
D'environ 1,7 km de long, situées à vingt mètres sous la surface, elles sont officiellement visitées par environ 300 000 visiteurs par an à partir
  +
de la place Denfert-Rochereau et constituent un musée de la ville de Paris, dépendant du musée Carnavalet. Cette partie ouverte au public
  +
ne représente qu'une infime fraction (environ un huit-centième) des vastes carrières souterraines de Paris, qui s'étendent sous plusieurs
  +
arrondissements de la capitale. Il existe aussi d'autres ossuaires souterrains à Paris, inaccessibles au public, et qui demeurent
  +
particulièrement méconnus.
  +
  +
  +
  +
Ce site est desservi par la station de métro Denfert-Rochereau. (RER) Ce site est également desservi par la station de RER : Denfert-Rochereau.
  +
  +
Contexte : carrières souterraines de Paris
  +
  +
Près de trois cents kilomètres de galeries s'étalent sous Paris intra-muros, sur parfois trois niveaux de carrières. La profondeur moyenne est
  +
d'environ vingt mètres sous le niveau du sol naturel. Lorsque ces carrières étaient actives, on en extrayait de la pierre à bâtir, qui a permis
  +
pendant plusieurs siècles de construire les bâtiments de Paris sans importer d'autre matériau de construction. Mais il existait aussi des
  +
vides souterrains constitués par les anciennes carrières de gypse (au pied du Sacré-Cœur, par exemple). Ces vides sont quasiment tous comblés
  +
ou foudroyés (carrière volontairement effondrée par explosion des piliers). Seule subsiste la grotte des Buttes-Chaumont qui est, en réalité,
  +
une partie d'une ancienne carrière souterraine. On assimile abusivement les Catacombes à l'ensemble des carrières de la capitale, bien qu'elles
  +
n'en représentent en réalité qu'une infime fraction. À la fin du xviiie siècle, pour faire face à la saturation des cimetières parisiens et aux
  +
problèmes croissants d'insalubrité, la décision est prise de déplacer les ossements dans les carrières souterraines.
  +
  +
https://fr.wikipedia.org/wiki/Catacombes_de_Paris
  +
  +
</pre>
  +
  +
  +
;Apertium
  +
<pre>
  +
*CATACOMBES DE PARÍS
  +
  +
Els *catacombes de París, terme impròpiament utilitzat per nomenar el *ossuaire municipal, són d'antigues
  +
carreres*souterraines situades en la 14e *arrondissement de París, connectades entre elles per galeries d'inspecció.
  +
Han transformat en *ossuaire al final del *xviiie segle amb el trasllat dels desposseeixes de sis milions de Parisencos,
  +
*évacués dels cementiris per raons de *salubrité pública. Prenen llavors el nom de *Catacombes, per *analogie amb
  +
els*nécropoles *souterraines de la Roma antiga, encara que no hagin pràcticament mai servit de *sépulture *initiale.
  +
  +
D'aproximadament 1,7 km de llarg, situades a vint metres sota la superfície, són oficialment visitades per aproximadament
  +
300 000 visitants per any a marxar del lloc *Denfert-*Rochereau i constitueixen un museu de la ciutat de París,
  +
*dépendant del museu *Carnavalet. Aquesta part oberta al públic no representa que una *infime *fraction(aproximadament
  +
un vuit-*centième) de les vastes carreres *souterraines de París, qui s'estenen sota diverses*arrondissements de la
  +
capital. Existeix també d'uns altres *ossuaires *souterrains a París, inaccessibles al públic, i qui romanen particularment *méconnus.
  +
  +
Aquest lloc és *desservi per la *station de metro *Denfert-*Rochereau. (*RER) Aquest lloc és igualment *desservi per
  +
la*station de *RER : *Denfert-*Rochereau.
  +
  +
Context : carreres *souterraines de París
  +
  +
Prop de tres cents quilòmetres de galeries s'estenen sota Apostes *intra-*muros, sobre de vegades tres nivells de carreres.
  +
La profunditat mitjana és d'aproximadament vint metres sota el nivell del sòl natural. Quan aquestes carreres eren actives,
  +
se n'extreia de la pedra a construir, qui ha permesos durant diversos segles de construir els edificis de París sense importar
  +
d'altre *matériau de construcció.
  +
  +
Però existia també buits *souterrains constituïts per les antigues carreres de *gypse (al peu del Jurat-Cœ*ur, per exemple).
  +
Aquests buits són pràcticament tots *comblés o *foudroyés(carrera voluntàriament *effondrée per explosió de les *piliers).
  +
Sola subsisteix la gruta de les *Buttes-*Chaumont qui és, en realitat, una part d'una antiga carrera *souterraine. Es
  +
*assimile *abusivement els *Catacombes al junts de les carreres de la capital, encara que no en representen en realitat
  +
que una *infime *fraction. Al final del *xviiie segle, per fer cara a la *saturation dels cementiris parisencos i
  +
als problemes *croissants de *insalubrité, la decisió ha pres de desplaçar les *ossements en les carreres *souterraines.
  +
  +
  +
</pre>
  +
  +
[[Category:GSoC 2014 Student proposals|Cgcarbonell]]

Latest revision as of 05:44, 17 April 2014

Coordonnées[edit]

Nom: Cristina Guillem

Adresse de courriel: cguillemcarbonell@gmail.com

IRC #apertium channel: Serpis

SourceForge : serpis

Pourquoi suis-je intéressée à la traduction automatique?[edit]

J’ai étudié Traduction et Interprétariat à l’Université d’Alicante. Tout au long de mes études j’ai utilisé à plusieurs reprises des TA pour faire mes travaux. Cela m’a épargné beaucoup de travail et de temps, car je ne devais pas faire un travail de traduction, mais de postédition. En outre, la TA rend possible la compréhension de textes écrits dans une langue inconnue ou dans une que nous ne maîtrisons pas. De nos jours, nous appartenons à la génération du numérique où la communication en ligne est de plus en plus présente dans nos vies. La TA nous permet d’acquérir plus de connaissances grâce à l’échange d’informations écrites en langues étrangères. À cet égard, la langue n’est plus une barrière pour la culture et pour la communication.


Pourquoi suis-je intéressée au projet Apertium?[edit]

Apertium est une plateforme de traduction automatique de code source ouvert qui met à la portée de tous ceux qui le veulent, les outils nécessaires pour traduire de nombreuses paires de langues et il rend possible la communication entre les personnes. De la même manière, ce projet permet de participer aux développeurs des quatre coins du monde, en leur donnant la chance de connaître le monde de la traduction depuis une autre perspective. De mon côté, j’utilise souvent cette plateforme pour mes traductions en espagnol, français et catalan, et de la même manière qu’elle me rend un service je voudrais lui rend un autre en apportant des améliorations.

You could give a more personal perspective here --Mlforcada (talk) 16:17, 21 March 2014 (UTC)

Qu’est-ce que je propose ?[edit]

L’objectif de mon travail est celui d’améliorer la paire de langues fr-ca déjà existante. À travers de la plateforme en ligne d’Apertium, j’ai fait des épreuves en traduisant des textes choisis au hasard et j’ai remarqué que des améliorations peuvent être faites, aussi bien des dictionnaires que des règles de transfert. De même, pour ce qui est du catalan, le TA donne le produit en la variété orientale, tandis que la variété occidentale n’existe pas pour cette combinaison langagière. Pour la fin de la période du GSoC, j’aimerais bien avoir une nouvelle version de la paire fr-cat en variété occidentale.


Titre[edit]

Nouvelle version de la paire de langues fr-ca.

Raisons pour lesquelles Google et Apertium devraient me sponsoriser[edit]

La paire de langues fr-cat a besoin d’une amélioration pour arriver à une traduction plus précise des textes.

Avantage pour la société[edit]

À l’époque actuelle, le français se situe au 6e rang des langues les plus utilisées. Elle compte plus de 220 millions de francophones à travers le monde. L’OIF estime que pour l’année 2050, le nombre de locuteurs français devrait atteindre plus de 700 millions. Cela veut dire qu’il y a de nombreux documents qui circulent en langue française. Si mon projet s’achève, plus de 9 millions de locuteurs catalans pourraient bénéficier des traductions en ligne améliorées du français au catalan.

Habilités et compétences[edit]

J’ai étudié Traduction et Interprétariat à l’Université d’Alicante (Espagne), comprenant une bourse de stage Erasmus d’une année scolaire à l’Université de Versailles (France). Maintenant, je fais un master de formation et enseignement du FLE. Je suis bilingue de naissance (espagnol, catalan) et j’ai le diplôme du niveau C2 en catalan et du C1 en français selon le CECRL. J’ai des compétences en XML et HML.


Plans pour cet été[edit]

Pendant 5 semaines (du 21 juin jusqu’au 26 juillet), je me trouverais à Dublin pour attendre un cours intensif pour améliorer mon anglais. Durant cette période, je dédierai du temps à travailler sur le projet Apertium.


Planification du travail[edit]

21 avril – 19 mai :

  • Rapprochement au monde Apertium et familiarisation avec ses outils.
  • Naviguer sur les documents disponibles sur le Wiki.
  • Analyser le monodix fr-ca et prendre de notes de possibles erreurs à corriger.
  • Profiter des dictionnaires gratuits déjà existants sur le net.

--> Semaine 1 :

  • Vérifier le monodix.

Semaine 2 :

  • Vérifier le ca monodix.

Semaine 3 :

  • Vérifier le ca monodix.

Semaine 4 :

  • Vérifier le ca monodix.
What does "verification" mean here? Do you mean evaluation? --Mlforcada (talk) 17:29, 21 March 2014 (UTC)
I mean to test, to check.

Semaine 5 :

  • Ajouter des entrées à l’aide d’un corpus testvoc.
How will you decide which entries to add? --Mlforcada (talk) 17:29, 21 March 2014 (UTC)
By using a corpus testvoc.

Semaine 6 (Dublin):

  • Ajouter des entrées à l’aide d’un corpus testvoc.

Semaine 7 (Dublin) :

  • Ajouter et corriger des règles de transfert.
How will you know which rules need adding or correcting? --Mlforcada (talk) 17:29, 21 March 2014 (UTC)
Detecting the errors of the corpus testvoc.

Semaine 8 (Dublin) :

  • Ajouter et corriger des règles de transfert.

Semaine 9 (Dublin) :

  • Tester et vérifier le travail.

Semaine 10 (Dublin) :

  • Tester et vérifier le travail.

Semaine 11 :

  • Tester et vérifier le travail.
This should be explained better --Mlforcada (talk) 17:29, 21 March 2014 (UTC)
Checking if all runs well.

Semaine 12 :

  • Derniers arrangements.

Semaine 13 :

  • Remise de la paire travaillée avec la moindre erreur possible.


How will you measure the error? --Mlforcada (talk) 17:29, 21 March 2014 (UTC)
By using apertium-eval-translator for WER and PER.
You have to provide a weekly plan saying what you will do each week, as in the template. Mark the Dublin weeks in some way. --Mlforcada (talk) 16:21, 21 March 2014 (UTC)

Défi de codage[edit]

Français
MUGUET DE MAI

Le Muguet  ou Muguet de mai (Convallaria majalis) est une herbacée des régions tempérées dont les fleurs printanières, petites et blanches, 
forment des grappes de clochettes très odorantes. C'est une plante toxique, voire mortelle après avoir mangé le périanthe. En zone européenne 
tempérée, en forêt, là où sa présence est naturelle, il serait (avec la pervenche) un bon bioindicateur d'ancienneté et de la naturalité de 
la forêt. Le muguet fleurit au printemps.
Selon la classification classique, il fait partie de la famille des Liliaceae. Selon la classification phylogénétique, il fait partie de la 
famille des Ruscaceae ou des Asparagaceae (qui l'avait d'abord placé dans la famille des Convallariaceae).


HISTOIRE

Le muguet fleurit quand vient le printemps, il a donc été depuis longtemps une plante idéale pour célébrer la nouvelle saison, les beaux jours 
qui reviennent et pour attirer les bonnes grâces pour de futures bonnes récoltes.

LÉGENDES ET MYTHES

Jadis, le Convallaria majalis, était considéré comme une plante magique hypocrite associée à la magie.
La légende grecque veut que le muguet fut créé par Apollon, dieu du mont Parnasse, pour en tapisser le sol, afin que ses neuf muses 
ne s'abîment pas les pieds.
Les Romains célébraient au début du mois de mai les Florales, en l'honneur de Flora, la déesse des fleurs.
Le brin de muguet, porte-bonheur a souvent été associé à la Madone, les larmes versées par la Vierge Marie au pied de la croix auraient donné 
naissance aux fleurs de muguet en forme de clochettes blanches. Toutefois ses baies rouges contiennent un puissant bouillon d’onze heures.
La déesse nordique Ostara, célébrée à l'équinoxe de printemps, était associée au muguet. Des « Mâts de Mai », ou bien des « Arbres de Mai », 
étaient parfois utilisés dans le cadre des festivités d'Ostara.

Le muguet est une plante vivace, qui se multiplie dans les sous-bois essentiellement grâce à son rhizome traçant, appelé « griffe » 

(portion de rhizome pourvue d’un grand nombre de racines et qui porte un bourgeon vivant). Chaque brin de muguet (ou hampe) est entouré 
de deux feuilles. Les fleurs sont toutes disposées du même côté de la hampe. En automne, le muguet donne des fruits sous la forme de petites 
baies rouges qui sont un puissant bouillon d’onze heures.

Avant floraison, le muguet de mai peut être confondu avec l'ail des ours, ce qui présente un danger pour les amateurs de ce dernier. 
La distinction peut facilement se faire grâce à l'odeur aillée dégagée par les feuilles froissées de l'ail des ours uniquement, ainsi que 
par la consistance des feuilles, plus coriaces chez le muguet.

On le trouve à peu près partout en France, à l'exception des régions méditerranéennes. On le trouve à travers tout l'hémisphère Nord dans les 
régions tempérées fraîches en Asie, en Europe et en Amérique du Nord.


Cette plante nécessite une température moyenne d'été supérieure à 10 °C, ce qui la rend adaptée même aux régions fraiches du nord de l'Europe. 
Elle a cependant besoin de la lumière, faute de quoi elle ne fleurit pas.
La floraison a lieu entre avril et juillet. L'idéal symbolique voudrait que la fleur fleurisse pour le 1er mai mais il n'est que rarement exaucé.
Il arrive même que la plante soit fanée à cette date. En Amérique du Nord, la floraison est rare avant la mi-mai.

Apertium
*MUGUET DE MAIG 

El *Muguet o *Muguet de maig (*Convallaria *majalis) és una *herbacée de les regions temperades de les quals les flors*printanières, 
petites i blanques, formen *grappes de campanetes molt *odorantes. És una planta *toxique, fins i tot mortal després d'haver menjat 
el *périanthe. En zona europea temperada, en bosc, allà on la seva presència és natural, seria (amb la *pervenche) un bon 
*bioindicateur de *ancienneté i de la *naturalité del bosc. El *muguet *fleurit a la primavera. 
Segons la *classification clàssica, fet part de la família de les *Liliaceae. Segons la *classification *phylogénétique, 
fet part de la família de les *Ruscaceae o de les *Asparagaceae (que l'havia en principi posat en la família de les*Convallariaceae). 

HISTÒRIA 

El *muguet *fleurit quan ve la primavera, ha doncs estat des de molt de temps una planta ideal per celebrar la nova estació, 
els bonics dies qui tornen i per atreure les bones gràcies per de futures bones *récoltes. 

LLEGENDES I *MYTHES 

Antany, el *Convallaria *majalis, havia considerat com una planta *magique *hypocrite *associée a la màgia. 
La llegenda grega vol que el *muguet hagué creat per *Apollon, déu del mont *Parnasse, per en *tapisser el sòl, 
amb la finalitat que els seus nou *muses no s'espatllen pas els peus. 

Els *Romains celebraven al començament del mes de maig els *Florales, en l'honor de *Flora, la deessa de les flors. 
El *brin de *muguet, porta-felicitat ha sovint estat *associé a la *Madone, les llàgrimes *versées per la Verge Casa al 
peu de la creu haurien donat naixement a les flors de *muguet en forma de campanetes blanques. Tanmateix les seves badies 
vermelles contenen un poderós *bouillon d’onze hores. La deessa *nordique *Ostara, celebrada a la *équinoxe de primavera, 
era *associée al *muguet. Alguns Pals de Maig », o ben dels « Arbres de Maig », eren de vegades utilitzats en el marc 
dels *festivités de *Ostara. 

El *muguet és una planta *vivace, qui es multiplica en les sota-boscos essencialment gràcies al seu *rhizome traçant, 
trucat « *griffe » (porció de *rhizome proveïda d’un gran nombre d'arrels i qui porta un *bourgeon vivint). Cada *brin 
de*muguet (o asta) ha envoltat de dos fulls. Les flors són totes disposades del mateix costat de l'asta. En tardor, 
el *muguet dóna fruites sota la forma de petites badies vermelles qui són un poderós *bouillon d’onze hores. 
Abans *floraison, el *muguet de maig pot haver confós amb el *ail dels óssos, el que presenta un perill pels aficionats 
d'aquest últim. La distinció pot fàcilment fer-se gràcies a la *odeur *aillée *dégagée pels fulls *froissées del 
*ail dels óssos únicament, així com per la *consistance dels fulls, més *coriaces en el *muguet. 

S'ho troba a poc prop per tot arreu a França, a l'excepció de les regions *méditerranéennes. S'ho troba a través de 
tot l'hemisferi Nord en les regions temperades fresques a Àsia, a Europa i a Amèrica del Nord. 
Aquesta planta necessita una temperatura mitjana d'estiu superior a 10 °C, el que la ret *adaptée mateix a les 
regions*fraiches del nord de l'Europa. Ha no obstant això necessitat de la llum, falta de *quoi ella no *fleurit pas. 

La *floraison ha lloc entre abril i juliol. L'ideal simbòlic voldria que la flor *fleurisse pel 1*er maig però no 
és més que rarament *exaucé. Arriba fins i tot que la planta sigui *fanée a aquesta data. A Amèrica del Nord, 
la *floraison és escassa abans la *mi-maig. 

https://fr.wikipedia.org/wiki/Muguet_de_mai 

Français
CATACOMBES DE PARIS

Les catacombes de Paris, terme improprement utilisé pour nommer l'ossuaire municipal, sont d'anciennes carrières souterraines situées dans 
le 14e arrondissement de Paris, reliées entre elles par des galeries d'inspection. Elles sont transformées en ossuaire à la fin du xviiie siècle 
avec le transfert des dépouilles de six millions de Parisiens, évacués des cimetières pour des raisons de salubrité publique. Elles prennent alors 
le nom de Catacombes, par analogie avec les nécropoles souterraines de la Rome antique, bien qu'elles n'aient quasiment jamais servi 
de sépulture initiale.

D'environ 1,7 km de long, situées à vingt mètres sous la surface, elles sont officiellement visitées par environ 300 000 visiteurs par an à partir 
de la place Denfert-Rochereau et constituent un musée de la ville de Paris, dépendant du musée Carnavalet. Cette partie ouverte au public 
ne représente qu'une infime fraction (environ un huit-centième) des vastes carrières souterraines de Paris, qui s'étendent sous plusieurs 
arrondissements de la capitale. Il existe aussi d'autres ossuaires souterrains à Paris, inaccessibles au public, et qui demeurent 
particulièrement méconnus.



Ce site est desservi par la station de métro Denfert-Rochereau. (RER) Ce site est également desservi par la station de RER : Denfert-Rochereau.

Contexte : carrières souterraines de Paris

Près de trois cents kilomètres de galeries s'étalent sous Paris intra-muros, sur parfois trois niveaux de carrières. La profondeur moyenne est 
d'environ vingt mètres sous le niveau du sol naturel. Lorsque ces carrières étaient actives, on en extrayait de la pierre à bâtir, qui a permis 
pendant plusieurs siècles de construire les bâtiments de Paris sans importer d'autre matériau de construction. Mais il existait aussi des 
vides souterrains constitués par les anciennes carrières de gypse (au pied du Sacré-Cœur, par exemple). Ces vides sont quasiment tous comblés 
ou foudroyés (carrière volontairement effondrée par explosion des piliers). Seule subsiste la grotte des Buttes-Chaumont qui est, en réalité, 
une partie d'une ancienne carrière souterraine. On assimile abusivement les Catacombes à l'ensemble des carrières de la capitale, bien qu'elles 
n'en représentent en réalité qu'une infime fraction. À la fin du xviiie siècle, pour faire face à la saturation des cimetières parisiens et aux 
problèmes croissants d'insalubrité, la décision est prise de déplacer les ossements dans les carrières souterraines.

https://fr.wikipedia.org/wiki/Catacombes_de_Paris 


Apertium
*CATACOMBES DE PARÍS 

Els *catacombes de París, terme impròpiament utilitzat per nomenar el *ossuaire municipal, són d'antigues 
carreres*souterraines situades en la 14e *arrondissement de París, connectades entre elles per galeries d'inspecció. 
Han transformat en *ossuaire al final del *xviiie segle amb el trasllat dels desposseeixes de sis milions de Parisencos,
*évacués dels cementiris per raons de *salubrité pública. Prenen llavors el nom de *Catacombes, per *analogie amb 
els*nécropoles *souterraines de la Roma antiga, encara que no hagin pràcticament mai servit de *sépulture *initiale.  

D'aproximadament 1,7 km de llarg, situades a vint metres sota la superfície, són oficialment visitades per aproximadament 
300 000 visitants per any a marxar del lloc *Denfert-*Rochereau i constitueixen un museu de la ciutat de París,
*dépendant del museu *Carnavalet. Aquesta part oberta al públic no representa que una *infime *fraction(aproximadament 
un vuit-*centième) de les vastes carreres *souterraines de París, qui s'estenen sota diverses*arrondissements de la
capital. Existeix també d'uns altres *ossuaires *souterrains a París, inaccessibles al públic, i qui romanen particularment *méconnus. 
 
Aquest lloc és *desservi per la *station de metro *Denfert-*Rochereau. (*RER) Aquest lloc és igualment *desservi per 
la*station de *RER : *Denfert-*Rochereau. 

Context : carreres *souterraines de París 

Prop de tres cents quilòmetres de galeries s'estenen sota Apostes *intra-*muros, sobre de vegades tres nivells de carreres. 
La profunditat mitjana és d'aproximadament vint metres sota el nivell del sòl natural. Quan aquestes carreres eren actives, 
se n'extreia de la pedra a construir, qui ha permesos durant diversos segles de construir els edificis de París sense importar 
d'altre *matériau de construcció. 

Però existia també buits *souterrains constituïts per les antigues carreres de *gypse (al peu del Jurat-Cœ*ur, per exemple).
Aquests buits són pràcticament tots *comblés o *foudroyés(carrera voluntàriament *effondrée per explosió de les *piliers). 
Sola subsisteix la gruta de les *Buttes-*Chaumont qui és, en realitat, una part d'una antiga carrera *souterraine. Es 
*assimile *abusivement els *Catacombes al junts de les carreres de la capital, encara que no en representen en realitat 
que una *infime *fraction. Al final del *xviiie segle, per fer cara a la *saturation dels cementiris parisencos i 
als problemes *croissants de *insalubrité, la decisió ha pres de desplaçar les *ossements en les carreres *souterraines.