French and Esperanto/Notoj pri versioj

From Apertium
Jump to navigation Jump to search

En ĉi tiu paĝo ni provas klarigi kelkajn elementojn de la unua versio de la franca-esperanta tradukilo kaj skribi kelkajn notojn por orienti la sekvan version.

(ĉi tiu dosiero estas prilaborata, do nekompleta kaj nerelegita 11.02.09)

Notoj pri la unua versio (februaro 2011)

La tradukilo havas kelkajn novaĵetojn rilate al antaŭaj:

  • Ĝi distingas inter verboj transitivaj, netransitivaj kaj transitivaj-netransitivaj (kvankam multaj plu estas neklasifikitaj). Tio okazas nur en la esperanto-vortaro, t.e. en la fontlingvo (bedaŭrinde) verboj daŭre estas unuspecaj. Tio (kurioze) ne tiom helpas por pritrakti la akuzativojn (ĉar ofte en esperanto postverbaj nomgrupoj ne enkondukitaj de prepozicio plej ofte postulas akuzativon: mi venos venontan lundon), sed ĝi estas utilegega por elsarki la prepozicieca nedifinita artikolo de la franca (je mange des pommes → mi manĝas pomojn).
  • Ĝi aldonis al la verbo-paradigmoj de esperanto la eventualan econ "igi", kiu aldonas la sufikson ig. Tio permesas multe pli naturan tradukon de la strukturoj faire + INF de la franca ol la paŭson fari + INF (t.e. paroligi anstataŭ fari paroli).
    • La afero en si mem jam burĝone ekzistis per la eco adv de la adjektivoj, sed ĉi tie ĝi estas iom malsama, ĉar ĝi ne anstataŭas ecojn (ekz. la adjektivecon), sed aldoniĝas al la ceteraj (tiuokaze, al la verbeco kaj al la tenso).
    • Tia solvo eble povas esti uzata por pritrakti la pronomajn verbojn (vidu la notojn por dua versio).
  • Ĝi ekuzis en la fontlingva vortaro iom da laŭkuntekstaj tradukoj de plursignifaj vortoj, tamen daŭre tradukante la donitan kuntekston al pluraj morfologie sendependaj elementoj, por permesi ĝustan sintaksan analizon, ekz.
    • place → loko, place de → placo + de
    • parler → paroli, parler de → paroli + pri (ĉar la ĝis tiam unuopa uzo de unuopa "paroli pri" kaŭzas en la ceteraj ĝisnunaj tradukiloj superakuzativado: *mi parolas pri aferojn)
  • Ĝi ekuzis pli da verboklasifikoj en la transigaj reguloj (t1x):
    • Verboj kies rekta objekto estas nehoma por ŝanĝi la defaŭltan tradukon de la pronomoj le/la al ĝi(n) (anstataŭ li(n)/ŝi(n))
      • Notu, ke tio ne estas farita por la subjekto, kvankam tio ja taŭgus. Pronomoj montriĝas unu el la gravaj problemoj de la aŭtomata tradukilo: nuntempe ni konservas la genron de la pronomo de la fontolingvo. Tial ni havas aferojn kiel ŝi [=la tablo] estas granda, ĉar en la franca ni havas elle [=la table] est grande. Ni apenaŭ povas scii, al kio referencas la pronomo. (Pri la foja egeco de la fuŝo, vidu ekz. http://apertium.saluton.dk/common/tradurl.php?mark=&dir=fr-eo&inurl=http://fr.wikipedia.org/wiki/Canton_de_Vaud)
        • Simila problemo okazas ĉe posedaj pronomoj/adjektivoj: "sa table" = lia/ŝia/sia/ilia(/ĝia) tablo.
        • Iom malsama estas la problemo de la refleksivaj pronomoj, sed ankaŭ ĝi aperas sufiĉe ofte.
    • Verboj kies defaŭlta traduko estas ŝanĝata en konkretaj sintaksaj kuntekstoj:
      • Demander fariĝas peti (anstataŭ demandi), se ĝi aperas antaŭ infinitivo (kaj simile ĉe iuj aliaj verboj).
      • Aimer fariĝas ŝati (anstataŭ ami), se ĝi aperas antaŭ infinitivo aŭ antaŭ "ke".
    • Verboj kun la strukturo mi taksas bonA lian laboron (por ne supergeneri akuzativon kvazaŭ en frazo mi parolas la germanan).

Ŝtupoj

En interchunk daŭre la "gravitcentro" estas nomata ".t2x" kaj ĝia ĉefa celo estas la ĝustaloka aldono de akuzativoj. Antaŭ ol tio estas kvazaŭ preparaj fazoj kaj post ĝi estas kvazaŭ finpretigo. Pli ĝuste, efektive la tri unuaj ŝtupoj okupiĝas pri la preparado de la akuzativigo (per kiel eble plej granda grupigo de nomgrupoj), dum la kvara ŝtupo estas paralela/senrilata al akuzativigo.

  • antaux1_t2x ĉefe kunigas determinilojn kaj sendeterminilajn nom- kaŭ adjektiv-grupojn (t.e. "la" + "blanka domo"). Tio permesas, ke en t1x ni ŝparu amasegon da reguloj por la identigo de nomgrupoj aŭ adjektivo grupoj, ekz. sufiĉas rekonilo de "NOM ADJ", sen la bezono aldoni "DET NOM ADJ".
    • Notindas, ke eblus uzi similan sistemon por ŝpari regulojn por la nom grupo: Se ni havas rekonilon por "ADJ ADJ" kiel adjektiv-grupon kaj difinas en antaux1_t2x, ke "nomo + adjektiv-grupo -> nomgrupo", ni povas ŝpari la regulon "NOM ADJ ADJ".
  • antaux2_t2x ĉefe kunigas kunordigitajn nom- aŭ adjektiv-grupoj: tio permesos generi la akuzativon en frazo, kiel mi ŝatas la blankajn ursojn kaj la tutan arktan bestaron.
  • antaux3_t2x ĉefe okupiĝas pri la ĝusta nombra kunordigo de rilativoj (les enfants que je vois fariĝas la infanojn kiuj(n) mi vidas anstataŭ la infanoj kiu(n) mi vias - akuzativo estas aldonita en posta ŝtupo).
  • antaux4_t2x ĉefe okupiĝas pri la aldono de ĝusta tenso en subordigitaj frazoj (ekzemple de volitivo post por ke aŭ post vol-verbo)
    • Eventuale, ĉi tie eblus aldoni la generadon de la ĝusta tenso en la maldirekta parolo (il disait qu'il viendrait devus fariĝi li diris ke li venos anstataŭ li diris ke li venus).
  • t2x ĉefe okupiĝas pri la generado de la akuzativo (same en ĉefaj kiel en malĉefaj frazoj, kun aparta pritrakto de la rilativaj).
    • Estas kurioze konstati, ke la transitiveco de la verboj estas malmulte uzata en la generado de la akuzativo, pro tio ke (preskaŭ) ĉiu nesubjekta nom-grupo ne antaŭita de prepozicio postulas akuzativo, sekve necesas generi akuzativon ankaŭ en frazoj kun netransitiva verbo kiel li venos la venontan lundon. Tamen plej verŝajne eblas pli bone. Cetere estas interese rimarki, ke oni generas akuzativon nur en la postverba unua nomgrupo (iom simple dirite), sed ne en la ceteraj kaj plej verŝajne tio necesus laŭe al la regulo.
  • post_t2x okupiĝas pri la defaŭlta atribuo de nombro kaj genro al tiuj nomgrupoj, kiuj laŭlonge de la tuta transig-regula procezo ni ne povis kompreni, ĉu temis pri singularo aŭ pluralo, vira aŭ ina genro. Tio permesas simpligi la esperanto-vortarojn kaj igi ilin (pli) kongruajn al la esperanto-vortaroj de la ceteraj Apertium-tradukiloj.


Komparo kun la kataluna kaj la hispana

Kompare al la antaŭaj latinidaj tradukiloj (kataluna kaj hispana), montriĝis, ke la franca havas multe pli komplikan morfologion de nomoj kaj adjektivoj, ĉar ili nemalofte havas samajn formojn en singularo kaj pluralo kaŭ en vira aŭ ina genroj: La genro kaj nombro evidentiĝas ne en ĉiu unuopa vorto (kiel plej ofte okazas en la kataluna kaj hispana), sed ĝi devas esti trovata surbaze de la aliaj membroj de la nomgrupo (ekz. de la artikolo: un jeune artiste, une jeune artiste). Tio igas, ke en la morfologia franca vortaro svarmas formoj sp kaj mf, kiuj devas esti pritraktataj per reguloj. Aliflanke, ilia svarmo kaj la nova eblo uzi pli ol unu interchunk-ŝtupo, igi, ke en t1x oni plej ofte analizas senartikolajn nom- aŭ adjektiv-grupojn (simile al la tradukilo angla-esperanto) kaj la plena nomgrupo estas kunmetita nur en la unua ŝtupo de interchunk. Cetere, la nedifinita artikolo ne povas esti forigita jam en t1x, kiel en la angla, sed ĝi (ofte) plu estas necesa en tiu unu ŝtupo de interchunk por ekscii pri la nombro kaj genro de la nomgrupo. Nur tiam ĝi estas forigata.

La franca verbo, cetere, montriĝis ankaŭ aparte kapdoloriga unuflanke pro ties du malsamaj helpverboj, aliflanke pro ties kompleksaj neo-formoj (ĉefe per ne... pas, sed ankaŭ per pluraj aliaj: plus, jamais, aucun, ni... ni, que k.a.) kaj krome pro la ofta aldono de pronomoj, adverboj kaj eĉ subjunkcioj inter la helpverbo kaj la ĉefverbo kaj inter la komenca nea adverbo kaj la fina. Tio postulis grandegan kvanton da reguloj.

Plie, malkiel en la kataluna, la hispana kaj esperanto, sed kiel la angla, la franca uzas ŝajn-subjekton en nepersonaj verboj, kiun necesas forigi (il pleut → pluvas, il faut → necesas). Tamen ne ĉiam klaras, ĉu ni staras antaŭ nepersona frazo aŭ ne (il est nécessaire → estas necese / li/ĝi estas necesa).

Aliflanke, malkiel en la kataluna kaj la hispana, sed kiel esperanto, la franca ne estas lingvo pro-drop, do la franca tradukilo ne havas la kapdolorigan generadon de subjektaj pronomoj (menjo pomes → mi manĝas pomojn).

Notoj por la dua versio

Leksiko

  • Indas uzi pli bonan kaj kompletan liston de transitivaj/netransitivaj verboj
  • Indas uzi efektivan franca-esperantan vortaron (ideale tiun de Le Puil kaj Danvy) por enkonduki multajn plu mankantajn komunajn vortojn (ne inversigon de esperanto-franca vortaro, kiel ni faris ĉi tie)
  • Indas plu pluki proprajn nomojn, ekz. el Vikipedio
  • Entute malaperigi la fuŝajn verbojn + prepozicion kaj aldoni la novan strukturon uzantan <j/>
  • Cerbumi, kiel solvi la problemon de la vortoj sen supersignoj, ĉefe kiam temas pri vortoj skribitaj per majuskloj (kreado de nova sekcio kun la vortoj skribitaj majuskle verŝajne ne utilus, ĉar la finaĵoj de la paradigmoj aperus minuskle - kaj duobligo de la paradigmoj ŝajnas teruraĵo, eĉ se aŭtomata per metadix)
  • Eventuale ekuzi metadix por la aŭtomatecaj sekcioj
  • Verŝajne taŭgus pritrakti la prefiksojn en la franca (= tiuj por kiuj oni uzas streketon por disigi ilin de la radikoj) kiel apartan morfologian kategorion. Tio postulos retrejni la senambiguilon kaj aldoni pliajn regulojn en t1x (aŭ almenaŭ modifi la ekzistantajn).

Sintakso

  • Same kiel en la kataluna kaj la hispana, la pronomaj verboj montriĝas unu el la plej gravaj fontoj de mistradukoj
  • Ekzistas malfacile trakteblaj aferoj, pri kiuj indas pli serioze pripensi. Parto estas ligitaj al tio, ke en (la komencaj ŝtupoj de) interchunk ni kunigas sintaksajn grupojn en pli grandajn, sed ni povas nek legi nek modifi la internon de la content.
    • Tio igas, ke ni ne povas unugrupigi SN kaj SN, se ili estas alinombraj aŭ aligenraj
    • Tio igas, ke ni ne povas unugrupigi SA kaj SA, se ili estas alinombraj
    • La grupigo de V kaj ADV kaŭzas, ke ni malfacile povas enkonduki adverban akuzativon (iri tien)
  • Mi ne scias, kiagrade eblas trovi solvon, por ke majuskligoj de la tipo Communauté européenne fariĝu Eŭropa komunumo prefere ol eŭropa Komunumo (nuntempe iuj tipaj tiaspecaj terminoj estas mane aldonitaj al la vortaroj, kiel i.a. ĝuste ĉi tiu)
  • En la infinitivoj ial mankas la indiko pri verbo tipo. Tial movo-verboj en infinitivo ne generas akuzativon de direkto