Difference between revisions of "English and Esperanto"

From Apertium
Jump to navigation Jump to search
 
(18 intermediate revisions by 3 users not shown)
Line 1: Line 1:
  +
(English notes below)
Esperantistoj, b.v. vidu [[Peto al esperantistoj]].
 
   
  +
Tio cxi celas fari kiel eble plej bonkvalitan masxinan tradukadon de la angla al Esperanto, pere de la sistemo [http://xixona.dlsi.ua.es/apertium-www/?lang=eo Apertium]. Legu ankaux la artikolon en [http://www.liberafolio.org/2008/komputraduko Libera Folio] kaj en [http://eo.wikipedia.org/wiki/Apertium Vikipedio].
   
  +
Vi povas nun [http://www.apertium.org/index.php?id=translatetext&lang=eo&dir=en-eo provi la publikitan tradukilon], eventuale [http://www.apertium.org/index.php?id=surfandtranslate&lang=eo&dir=en-eo retume], aux traduki [http://www.apertium.org/index.php?id=translatedoc&lang=eo&dir=en-eo dokumentojn] per gxi. Eblas ankaux uzu kiel [http://www.apertium.org/index.php?id=lookup&lang=eo&dir=en-eo vortaro]. La vortlistoj uzeblas ankaux en [http://www.tinylex.com/download.php mobiltelefono] kaj en [http://www.tinylex.com/download_palm.php Palm Pilot].
===Intros to Esperanto===
 
Perhaps http://en.wikiversity.org/wiki/Rules_of_Esperanto_grammar (or http://donh.best.vwh.net/Esperanto/rules.html) is a good overview.
 
   
  +
Tamen restas multaj mankoj ankoraux, kiujn ni prilaboradas.
And the affixes: http://esperanto.davidgsimpson.com/eo-affixes.html (short) http://steve-and-pattie.com/esperantujo/grparafx.html (longer)
 
  +
Por prijugxi la aktualan evoluon vi povas [http://xixona.dlsi.ua.es/testing/index.php?direction=en-eo provi la prilaboratan tradukilon], kvankam estas neniuj garantioj, gxi kutime bone funkcias.
   
  +
Eventuale venos ankaux la direkto [http://xixona.dlsi.ua.es/testing/index.php?direction=eo-en Esperanto → angla] kaj eble ecx pli da lingvoj.
Tenses are exlained in http://en.wikipedia.org/wiki/Esperanto_grammar#Verbs
 
  +
Jam ekzistas preta tradukilo [http://www.apertium.org/?id=translatetext&lang=eo&dir=es-eo hispana → Esperanto] kaj [http://www.apertium.org/?id=translatetext&lang=eo&dir=es-eo kataluna → Esperanto].
   
  +
B.v. ankaux vidu [[Peto al esperantistoj]].
===Wordlists===
 
http://freepages.rootsweb.ancestry.com/~wakefield/translations/engesp.html
 
   
  +
==Stato de la projekto==
http://www.mirrorservice.org/sites/download.sourceforge.net/pub/sourceforge/d/dm/dmdictionary/EngEsp.txt
 
  +
--[[User:Jacob Nordfalk|Jacob Nordfalk]] 14:47, 3 February 2009 (UTC)
   
  +
Farita:
===Transfer rules English->Esperanto===
 
  +
* Baza gramatiko kiel tiu uzata en [[English and Esperanto/Regression tests]]
  +
* Purigado kaj korektado de la baza vortaro
  +
* Baza vortaro de unusolaj 13000 vortoj, enportitaj de traduku.net
   
  +
Farata:
{| border="1" cellpadding="2" cellspacing="0" style="width:100%; background: #f9f9f9; border: 1px solid #aaaaaa; border-collapse: collapse; white-space: nowrap; text-align: left" class="sortable"
 
  +
* Publikigo de versio angla-Esperanto versio 0.9
|-
 
! en pattern !! eo pattern !! en !! eo !! status
 
   
  +
Farota:
|-
 
  +
* Iom pli kompleksaj gramatikaj problemoj, kiel vi povas vidi cxe [[English and Esperanto/Outstanding tests]].
| num.sp || num.sp || twenty-one:twenty-one<num><sp> || \@twenty-one:twenty-one || OK ||
 
  +
* Elekto kaj trakto de [[English and Esperanto/Proposed future tests]]
|-
 
  +
* Plibonigi la [[tagger]]. Unu en niaj grandaj problemoj estas la semambiguigo de la angla teksto. La t.n. [[tagger]] malbone elektas kaj pro tio ni devis rezigni pri multaj testoj ([[English and Esperanto/Rejected tests]]).
| adj || adj.sg.nom || aggressive || agresema || OK ||
 
  +
* Trovi kaj ekuzi kelkajn aliajn vortarojn ol traduku.net. Metu ilin en la dosierujo res/, flanke al tradukunet.txt kaj ni ekdiskutu kiel eluzi ilin.
|-
 
  +
* Trovi sistemon (kiujn simbolojn elekti) por -anta -onta -inta kaj -ata -ota -ita, cxar gxuste nun tiuj formoj ne ekzistas kaj cxu ne ili necesas por povi analizi kaj fari eo->en
| adj.pos || adj.sg.nom || his || lia || OK ||
 
  +
* Komencigxo de direkto eo->en - tia tradukilo mankegas, por lernantoj kaj por homoj kiuj emas fari siajn hejmpagxojn en Esperanto, sed volas tamen ne forbari ne-esperantistojn legi siajn (esperantlingvajn) tekstojn.
|-
 
  +
* Aldoni cxiuj eblajn vortojn de traduku.net kiun ni povas analizi, de ie ajn
| adj.sint || adj.sg.nom || big || granda || OK ||
 
  +
* starigi la derivitajn servojn, ekz.
|-
 
  +
- posxtelefona vortaro,
| adj.sint.comp || preadv. granda.adj.sg.nom || bigger || #pli || OK ||
 
  +
- reta tradukilo (simila al tiu de traduku.net)
|-
 
  +
- tradukservo por la esperanta vikipedio
| adj.sint.sup || preadv. granda.adj.sg.nom || biggest || #plej || OK ||
 
  +
* Konsideri [[Limited rule-based lexical selection]] - https://sourceforge.net/mailarchive/forum.php?thread_name=1221565388.3537.24.camel%40eki.prompsit.com&forum_name=apertium-stuff
|-
 
| adv || adv || after || poste || OK ||
 
|-
 
| adv.itg || adv.itg || how || kiel || OK ||
 
|-
 
| cnjadv || cnjadv || after || post kiam || OK ||
 
|-
 
| cnjcoo || cnjcoo || and || kaj || OK ||
 
|-
 
| cnjsub || cnjsub || that || ke || OK ||
 
|-
 
| det.def.pl || det.def.pl.nom || the || la || OK ||
 
|-
 
| det.def.sg || det.def.sg.nom || the || la || OK ||
 
|-
 
| det.def.sp || det.def.sp.nom || the || la || OK ||
 
|-
 
| det.dem.pl || det.dem.pl.nom || these || ĉi tiuj || OK ||
 
|-
 
| det.dem.sg || det.dem.sg.nom || this || ĉi tiu || OK ||
 
|-
 
| det.ind.pl || det.ind.pl.nom || both || ambaŭj || OK ||
 
|-
 
| det.ind.sg || det.ind.sg.nom || another || alia || OK ||
 
|-
 
| det.ind.sp || det.ind.sp.nom || any || ajna || OK ||
 
|-
 
| det.qnt.pl || det.qnt.pl.nom || few || malmultaj || OK ||
 
|-
 
| det.qnt.sg || det.qnt.sg.nom || less || la malpli da || OK ||
 
|-
 
| det.qnt.sp || det.qnt.sp.nom || enough || sufiĉe da || OK ||
 
|-
 
| ij || ij || goodbye || adiaŭ || OK ||
 
|-
 
| n.acr.sg || n.sg.nom || TV || televido || OK ||
 
|-
 
| np.al.sg || np.al.sg.nom || GCompris || GCompris || OK ||
 
|-
 
| np.ant.f.sg || np.ant.f.sg.nom || April || April || OK ||
 
|-
 
| np.ant.m.sg || np.ant.m.sg.nom || Robert || Robert || OK ||
 
|-
 
| np.cog.pl || np.cog.pl.nom || Stevensons || #Stevenson || OK ||
 
|-
 
| np.cog.sg || np.cog.sg.nom || Stevenson || Stevenson || OK ||
 
|-
 
| n.pl || n.pl.nom || hundreds || centoj || OK ||
 
|-
 
| np.top.sg || np.top.sg.nom || Afghanistan || Afganio || OK ||
 
|-
 
| n.sg || n.sg.nom || hundred || cento || OK ||
 
|-
 
| num.sg || num.sg || one || unu || OK ||
 
|-
 
| num.sp || num.sp || hundred || cent || OK ||
 
|-
 
| pr || pr || after || post || OK ||
 
|-
 
| preadv || preadv || any || tre || OK ||
 
|-
 
| predet.sp || sp || all || #\<sp\> || OK ||
 
|-
 
| prn.itg.sp || prn.itg.sg.nom || what || kio || OK ||
 
|-
 
| prn.obj.p1.mf.pl || prn.obj.p1.mf.pl || us || nin || OK ||
 
|-
 
| prn.obj.p1.mf.sg || prn.obj.p1.mf.sg || me || min || OK ||
 
|-
 
| prn.obj.p2.mf.sp || prn.obj.p2.mf.sp || you || vin || OK ||
 
|-
 
| prn.obj.p3.f.sg || prn.obj.p3.f.sg || her || ŝin || OK ||
 
|-
 
| prn.obj.p3.mf.pl || prn.obj.p3.mf.pl || them || ilin || OK ||
 
|-
 
| prn.obj.p3.m.sg || prn.obj.p3.m.sg || him || lin || OK ||
 
|-
 
| prn.obj.p3.nt.sg || prn.obj.p3.nt.sg || it || ĝin || OK ||
 
|-
 
| prn.ref.p1.mf.pl || prn.ref.p1.mf.pl || ourselves || #ni || OK ||
 
|-
 
| prn.ref.p1.mf.sg || prn.ref.p1.mf.sg || myself || #mi || OK ||
 
|-
 
| prn.ref.p2.mf.pl || prn.ref.p2.mf.pl || yourselves || #vi || OK ||
 
|-
 
| prn.ref.p2.mf.sg || prn.ref.p2.mf.sg || yourself || #vi || OK ||
 
|-
 
| prn.ref.p3.f.sg || prn.ref.p3.f.sg || herself || #si || OK ||
 
|-
 
| prn.ref.p3.mf.pl || prn.ref.p3.mf.pl || themselves || #si || OK ||
 
|-
 
| prn.ref.p3.m.sg || prn.ref.p3.m.sg || himself || #si || OK ||
 
|-
 
| prn.ref.p3.nt.sg || prn.ref.p3.nt.sg || itself || #si || OK ||
 
|-
 
| prn.subj.p1.mf.pl || prn.subj.p1.mf.pl || we || ni || OK ||
 
|-
 
| prn.subj.p1.mf.sg || prn.subj.p1.mf.sg || I || mi || OK ||
 
|-
 
| prn.subj.p2.mf.sp || prn.subj.p2.mf.sp || you || vi || OK ||
 
|-
 
| prn.subj.p3.f.sg || prn.subj.p3.f.sg || she || ŝi || OK ||
 
|-
 
| prn.subj.p3.mf.pl || prn.subj.p3.mf.pl || they || ili || OK ||
 
|-
 
| prn.subj.p3.m.sg || prn.subj.p3.m.sg || he || li || OK ||
 
|-
 
| prn.subj.p3.nt.sg || prn.subj.p3.nt.sg || it || ĝi || OK ||
 
|-
 
| prn.tn.pl || prn.tn.pl.nom || both || ambaŭ || OK ||
 
|-
 
| prn.tn.sg || prn.tn.sg.nom || another || alia || OK ||
 
|-
 
| prn.tn.sp || prn.tn.sg.nom || all || ĉiu || OK ||
 
|-
 
| rel.adv || rel.adv || where || kie || OK ||
 
|-
 
| rel.an.mf.sp || rel.an.mf.sp || which || #\<rel\> || OK ||
 
|-
 
| vaux.inf || vaux.inf || will || #\<vaux\> || OK ||
 
|-
 
| vaux.past || vaux.past || could || povis || OK ||
 
|-
 
| vaux.pres || vaux.pres || can || povas || OK ||
 
|-
 
| vbdo.past || vblex.past || did || faris || OK ||
 
|-
 
| vbdo.pres || vblex.pres || do || faras || OK ||
 
|-
 
| vbdo.pres.p3.sg || vblex.pres || does || faras || OK ||
 
|-
 
| vbhaver.ger || vblex.ger || having || havanta || OK ||
 
|-
 
| vbhaver.inf || vblex.inf || have || havi || OK ||
 
|-
 
| vbhaver.past || vblex.past || had || havis || OK ||
 
|-
 
| vbhaver.pres || vblex.pres || have || havas || OK ||
 
|-
 
| vbhaver.pres.p3.sg || vblex.pres || has || havas || OK ||
 
|-
 
| vblex.ger || vblex.ger || advertising || anoncanta || OK ||
 
|-
 
| vblex.imp || vblex.imp || affect || afekciu || OK ||
 
|-
 
| vblex.inf || vblex.inf || advertise || anonci || OK ||
 
|-
 
| vblex.past || vblex.past || advertised || anoncis || OK ||
 
|-
 
| vblex.pp || vblex.pp || advertised || anoncita || OK ||
 
|-
 
| vblex.pres || vblex.pres || advertise || anoncas || OK ||
 
|-
 
| vblex.pres.p3.sg || vblex.pres || advertises || anoncas || OK ||
 
|-
 
| vbser.ger || vbser.ger || being || estanta || OK ||
 
|-
 
| vbser.inf || vbser.inf || be || esti || OK ||
 
|-
 
| vbser.past || vbser.past || were || estis || OK ||
 
|-
 
| vbser.past.p1.sg || vbser.past || was || estis || OK ||
 
|-
 
| vbser.past.p3.sg || vbser.past || was || estis || OK ||
 
|-
 
| vbser.pp || vbser.pp || been || estita || OK ||
 
|-
 
| vbser.pres || vbser.pres || are || estas || OK ||
 
|-
 
| vbser.pres.p1.sg || vbser.pres || am || estas || OK ||
 
|-
 
| vbser.pres.p3.sg || vbser.pres || is || estas || OK ||
 
   
  +
==English notes==
|}
 
   
  +
Also see [[Users guide and notes Jacob]].
==Test set==
 
<pre>
 
<jacobn> Jim, Fran: I just looked at http://www.link.cs.cmu.edu/link/batch.html and to me is looks like that "carefully selected text" I was talking about a week ago which would be needed to define the most important features to get covered.
 
<jimregan2> Jacob, it's ok
 
<jimregan2> we already have carefully selected text for English :)
 
<jimregan2> ALL + plural
 
<jimregan2> ALL + adj + plural
 
<jacobn> what do you think, is http://www.link.cs.cmu.edu/link/batch.html + their translations to Esperanto suitable as test set?
 
<jimregan2> as one test set, yes
 
<jimregan2> I have another few, and I promise I'll get to them on Wednesday
 
<jacobn> Jim, I would like to include a " carefully selected text for English" in the en-eo test set. Do you have a better suggestion than http://www.link.cs.cmu.edu/link/batch.html ?
 
<jacobn> Fine
 
<jimregan2> heck - I'll even set a reminder :)
 
<jacobn> no hast necessary
 
<jimregan2> newspaper - type text is best
 
<jimregan2> I'll grab a few chunks from different books at project gutenberg
 
   
  +
===Intros to Esperanto===
<jimregan2> oh, you know about the '*' in the sentences, right?
 
  +
Perhaps http://en.wikiversity.org/wiki/Rules_of_Esperanto_grammar (or http://donh.best.vwh.net/Esperanto/rules.html) is a good overview.
<jacobn> the * ??
 
<jacobn> no, never met it
 
<jacobn> ;-)
 
<jimregan2> at the start of a lot of the sentences, there's a '*'
 
<jacobn> Oh that
 
<jacobn> yes, Ive read it
 
<jimregan2> that's a standard convention in linguistics to say 'this sentence is incorrect'
 
<jacobn> I would start with the non-* sentences
 
<jimregan2> just dump anything with '*'
 
<jimregan2> they're not worth any effort
 
</pre>
 
   
  +
And the affixes: http://esperanto.davidgsimpson.com/eo-affixes.html (short) http://steve-and-pattie.com/esperantujo/grparafx.html (longer)
==Tagging errors==
 
<pre>
 
(10:19:15) jacob: en-eo You can save multiple configurations, and switch between them easily.
 
- Vi povas sekurigi multajn agordojn, kaj ŝalti inter ili facile.
 
+ Vi povas savi *multiple agordoj, kaj ŝanĝo inter ilin facile.
 
(10:20:00) jacob: Why is "switch" in "switch between them" considered a noun?
 
(10:20:16) jacob: (ŝanĝo)
 
(10:20:19) francis: did you put it in the testing interface ?
 
(10:20:42) francis: the sentence
 
(10:20:47) francis: ^and/and<cnjcoo>$ ^switch/switch<n><sg>/switch<vblex><inf>/switch<vblex><pres>$ ^between/between<pr>$
 
(10:20:48) francis:
 
(10:20:54) francis: ^and<cnjcoo>$ ^switch<n><sg>$ ^between<pr>$
 
(10:20:54) francis:
 
(10:21:04) francis: the options for "switch" are noun, verb
 
(10:21:07) francis: it chooses noun
 
(10:21:13) francis: the tagger works on a statistical basis
 
(10:22:55) jacob: But "easily" can only be there if "switch" is a verb.
 
(10:23:34) jacob: "There is a switch between them" (noun)
 
(10:23:51) jacob: "switch between them" (noun or verb)
 
(10:24:11) jacob "switch between them easily" (can only be verb)
 
</pre>
 
   
  +
Tenses are exlained in http://en.wikipedia.org/wiki/Esperanto_grammar#Verbs
"switch between them easily" (can only be verb) - not true. 'You can put a switch between them easily' -- [[User:Jimregan|Jimregan]] 18:34, 15 September 2008 (UTC)
 
   
===A note about accusative===
+
===Wordlists===
  +
http://freepages.rootsweb.ancestry.com/~wakefield/translations/engesp.html
   
  +
http://www.mirrorservice.org/sites/download.sourceforge.net/pub/sourceforge/d/dm/dmdictionary/EngEsp.txt
The next kind of thing we should think about is the type of sentence
 
part that goes like this:
 
 
'the man you saw'
 
'the man the girl saw'
 
 
I don't know if we have to change word order here - probably not - but
 
the nominative and accusative are SNs 2 and 1 respectively.
 
 
But think about this:
 
 
'the man my brother became'
 
 
Adding accusative here is wrong, so what can we do about it? Not much.
 
Maybe in this specific instance, sure, but generally, we can only take
 
the common cases and hope for the best. There's been plenty of work
 
into statistical parsing, subject identification, etc., but it's still
 
not much better than picking the common cases, and hoping for the
 
best.
 
   
This is why we always tell people to have their translations checked
 
by a native speaker :)
 
   
==Jacob TODO==
 
<pre>
 
<jacobn> Ok, Ill try the web doc translator more, find the systematics, report a bug and attach files etc.
 
</pre>
 
   
 
==See also==
 
==See also==
Line 295: Line 60:
 
* [[English and Esperanto/Regression tests]]
 
* [[English and Esperanto/Regression tests]]
   
[[Category:Language pairs]]
+
[[Category:English and Esperanto|*]]
[[Category:English and Esperanto]]
 

Latest revision as of 13:30, 10 December 2010

(English notes below)

Tio cxi celas fari kiel eble plej bonkvalitan masxinan tradukadon de la angla al Esperanto, pere de la sistemo Apertium. Legu ankaux la artikolon en Libera Folio kaj en Vikipedio.

Vi povas nun provi la publikitan tradukilon, eventuale retume, aux traduki dokumentojn per gxi. Eblas ankaux uzu kiel vortaro. La vortlistoj uzeblas ankaux en mobiltelefono kaj en Palm Pilot.

Tamen restas multaj mankoj ankoraux, kiujn ni prilaboradas. Por prijugxi la aktualan evoluon vi povas provi la prilaboratan tradukilon, kvankam estas neniuj garantioj, gxi kutime bone funkcias.

Eventuale venos ankaux la direkto Esperanto → angla kaj eble ecx pli da lingvoj. Jam ekzistas preta tradukilo hispana → Esperanto kaj kataluna → Esperanto.

B.v. ankaux vidu Peto al esperantistoj.

Stato de la projekto[edit]

--Jacob Nordfalk 14:47, 3 February 2009 (UTC)

Farita:

Farata:

  • Publikigo de versio angla-Esperanto versio 0.9

Farota:

  • Iom pli kompleksaj gramatikaj problemoj, kiel vi povas vidi cxe English and Esperanto/Outstanding tests.
  • Elekto kaj trakto de English and Esperanto/Proposed future tests
  • Plibonigi la tagger. Unu en niaj grandaj problemoj estas la semambiguigo de la angla teksto. La t.n. tagger malbone elektas kaj pro tio ni devis rezigni pri multaj testoj (English and Esperanto/Rejected tests).
  • Trovi kaj ekuzi kelkajn aliajn vortarojn ol traduku.net. Metu ilin en la dosierujo res/, flanke al tradukunet.txt kaj ni ekdiskutu kiel eluzi ilin.
  • Trovi sistemon (kiujn simbolojn elekti) por -anta -onta -inta kaj -ata -ota -ita, cxar gxuste nun tiuj formoj ne ekzistas kaj cxu ne ili necesas por povi analizi kaj fari eo->en
  • Komencigxo de direkto eo->en - tia tradukilo mankegas, por lernantoj kaj por homoj kiuj emas fari siajn hejmpagxojn en Esperanto, sed volas tamen ne forbari ne-esperantistojn legi siajn (esperantlingvajn) tekstojn.
  • Aldoni cxiuj eblajn vortojn de traduku.net kiun ni povas analizi, de ie ajn
  • starigi la derivitajn servojn, ekz.
- posxtelefona vortaro,
- reta tradukilo (simila al tiu de traduku.net)
- tradukservo por la esperanta vikipedio

English notes[edit]

Also see Users guide and notes Jacob.

Intros to Esperanto[edit]

Perhaps http://en.wikiversity.org/wiki/Rules_of_Esperanto_grammar (or http://donh.best.vwh.net/Esperanto/rules.html) is a good overview.

And the affixes: http://esperanto.davidgsimpson.com/eo-affixes.html (short) http://steve-and-pattie.com/esperantujo/grparafx.html (longer)

Tenses are exlained in http://en.wikipedia.org/wiki/Esperanto_grammar#Verbs

Wordlists[edit]

http://freepages.rootsweb.ancestry.com/~wakefield/translations/engesp.html

http://www.mirrorservice.org/sites/download.sourceforge.net/pub/sourceforge/d/dm/dmdictionary/EngEsp.txt


See also[edit]