User:Jimregan/English chunk rules

From Apertium
< User:Jimregan
Revision as of 14:03, 17 August 2009 by Jimregan (talk | contribs) (blah)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search
  • REGLA: ALL NOUNplural
  • REGLA: ALL ADJ NOUNplural

(In Catalan, these need 'els' in the middle)

  • REGLA: DET NOM
'the dog'
  • REGLA: NUM NOM
'two dogs'
  • REGLA: DET DET NOM
'your many pets'
  • REGLA: DET NUM NOM
'your three cats'
  • REGLA: NUM NUM NOM
'twenty three cats'
  • REGLA: DET DET NUM NOM
  • REGLA: DET NUM NUM NOM
  • REGLA: such a ADJ NOM
'such a nice day'
  • REGLA: ADJ NOM
  • REGLA: DET ADJ NOM
  • REGLA: NUM ADJ NOM
  • REGLA: DET DET ADJ NOM (your many beautiful cats)
  • REGLA: DET NUM ADJ NOM (your three beautiful cats)
  • REGLA: ADJ NUM ADJ NOM (top 100 listed companies)
  • REGLA: DET ADV (incl preadv) ADJ NOM
  • REGLA: NUM ADV (incl preadv) ADJ NOM
  • REGLA: PREADV ADJ NOM
  • REGLA: DET DET ADV (incl preadv) ADJ NOM (BCN)
  • REGLA: DET NUM ADV (incl preadv) ADJ NOM (BCN)
  • REGLA: PREADV ADJ NOM
'locally produced materials'
'very fast car'
  • REGLA: DET ADJ ADJ NOM
  • REGLA: DET DET ADJ ADJ NOM (BCN)
  • REGLA: DET ADV ADJ ADJ NOM (BCN a currently valid legislative delegation -> una delegació legislativa actualment vàlida)
  • REGLA: NUM ADV ADJ ADJ NOM (BCN two currently valid legislative delegations)
  • REGLA: NUM ADJ ADJ NOM
  • REGLA: DET NUM ADJ ADJ NOM (BCN)
  • REGLA: ADJ ADJ NOM
  • REGLA: DET NUM PREADV ADJ ADJ NOM (BCN)
  • REGLA: DET DETquant PREADV ADJ ADJ NOM (BCN)
  • REGLA: ADJ AND ADJ NOM (BCN)
  • REGLA: ADJ AND ADV ADJ NOM
  • REGLA: DET ADJ AND ADJ NOM (BCN)
  • REGLA: DET ADJ AND ADV ADJ NOM (BCN)
  • REGLA: DET ADV ADJ AND ADJ NOM (BCN: the most popular and largest city)
  • REGLA: DET ADJ, ADJ NOM (Those wild, wonderful places)
  • REGLA: ADJ, ADJ NOM (wild, wonderful places)
  • REGLA: APOS ADJ APOS NOM
'big' dog
  • REGLA: ADJ APOS NOM APOS
  • REGLA: DET ADJ APOS 'NOM' APOS
  • REGLA: DET APOS 'ADJ' APOS NOM
  • REGLA: NOM1 NOM2 -> NOM2 de NOM1
"software industry"
  • REGLA: DET NOM1 NOM2 -> DET NOM2 de NOM1
  • REGLA: NUM NOM1 NOM2 -> NUM NOM2 de NOM1 (Three street chairs)
  • REGLA: NUM-NOM1 NOM2 -> NOM2 de NUM NOM1(pl) (Three-month extension - extensió de tres mesos)
  • REGLA: ADJ-NOM1 NOM2 -> NOM2 de NOM1 ADJ (BCN open-source software)
  • REGLA: DET ADJ-NOM1 NOM2 -> DET NOM2 de NOM1 ADJ (BCN the open-source software)
  • REGLA: NUM ADJ-NOM1 NOM2 -> NOM NOM2 de NOM1 ADJ (BCN three open-source softwares)
  • REGLA: ADJ-NOM1 NOM2 NOM3-> NOM3 de NOM1 NOM ADJ (BCN open-source software systems) MG falta comprovar np i days
  • REGLA: DET ADJ-NOM1 NOM2 NOM3-> NOM3 de NOM1 NOM ADJ (BCN the open-source software systems)
  • REGLA: NUM ADJ-NOM1 NOM2 NOM3-> NOM3 de NOM1 NOM ADJ (BCN three open-source software systems)
  • REGLA: ADV-ADJ NOM2 -> NOM NOM2 de ADV NOM1 (BCN non-free software)
  • REGLA: NUM ADV-ADJ NOM2 (BCN non-free software)
  • REGLA: DET ADV-ADJ NOM2 (BCN the non-free software)
  • REGLA: DET DET NOM1 NOM2 -> DET DET NOM2 de NOM1
  • REGLA: DET NUM NOM1 NOM2 -> DET NUM NOM2 de NOM1
  • REGLA: DET NUM-NOM1 NOM2 ->DET NOM2 de NUM NOM1(pl) (A three-month extension - una extensió de tres mesos
  • REGLA: ADJ NOM1 NOM2 -> NOM2 de NOM1 ADJ
  • REGLA: DET ADJ NOM1 NOM2 -> DET NOM2 de NOM1 ADJ
  • REGLA: ADJ1 ADJ2 NOM1 NOM2 -> NOM2 de NOM1 ADJ2 ADJ1
  • REGLA: DET ADJ1 ADJ2 NOM1 NOM2 -> DET NOM2 de NOM1 ADJ2 ADJ1
  • REGLA: NOM1 NOM2 NOM3 -> NOM3 de NOM2 del NOM1
  • REGLA: NOMpropi1 NOMpropi2 NOMpropi3 -> NOMpropi1 NOMpropi2 NOMpropi3
  • REGLA: DET NOM1 NOM2 NOM3 -> DET NOM3 de NOM2 del NOM1
  • REGLA: ADJ NOM1 NOM2 NOM3 -> NOM3 de NOM2 de NOM1 ADJ (professional video game design -> disseny de joc de vídeo professional (?)
  • REGLA: DET ADJ NOM1 NOM2 NOM3 -> DET NOM3 de NOM2 de NOM1 ADJ
  • REGLA: NOM1 NOM2 NOM3 NOM4-> NOM4 de NOM3 de NOM2 de NOM1 (video game design industry -> indústria de disseny de joc de vídeo (?)
  • REGLA: DET NOM1 NOM2 NOM3 NOM4-> DET NOM4 de NOM3 de NOM2 de NOM1 (the video game design industry -> la indústria de disseny de joc de vídeo (?)
  • REGLA: NOM1 and NOM2 -> NOM1 i NOM2
  • REGLA: NOM1 and NOM2 NOM3 (BCN safety and security issues)
  • REGLA: ADJ NOM1 and NOM2 -> NOM1 i NOM2 ADJ ('native plants and animals')
  • REGLA: NOM GENITIU NOM NOM (Colombia's child welfare agency)
  • REGLA: DET ADJ NOM GENITIU NOM (the American public's imagination)
  • REGLA: NUM NOM1 OLD -> NUM NOM1 (300 years old - 300 años)
  • REGLA: NUM-NOM1-OLD NOM3 -> NOM3 de NUM NOM1(pl) (48-year-old man - home de 48 anys)
  • REGLA: NUM NOM1 OLD NOM3 -> NOM3 de NUM NOM1(pl) (48 year old man - home de 48 anys)
  • REGLA: DET NUM-NOM1-OLD NOM3 -> DET NOM3 de NUM NOM1(pl) (the 48-year-old man - l'home de 48 anys)
  • REGLA: DET NUM NOM1 OLD NOM3 -> DET NOM3 de NUM NOM1(pl) (the 48 year old man - l'home de 48 anys)
  • REGLA: NUM-NOM1-OLD NOM3 -> NOM3 de NUM NOM1(pl) (9-year-old - (nen) de 9 anys)
  • REGLA: NUM-NOM1-OLD NOM3 unknown -> NOM3 de NUM NOM1(pl) unknown (9-year-old xxxxxx - de 9 anys xxxxxx) - quan va abans d'una desconeguda no s'afegeix el nom (nen/persona)
  • REGLA: DET NUM-NOM1-OLD NOM3 -> DET NOM3 de NUM NOM1(pl) (the 9-year-old - el nen de 9 anys)
  • REGLA: DET NUM-NOM1-OLD NOM3 unknown-> DET NOM3 de NUM NOM1(pl) unknown (the 9-year-old xxxxxx - de 9 anys xxxxx)
  • REGLA: DET NOM ago (a week ago)
  • REGLA: NUM NOM ago (two weeks ago)
  • REGLA: NOM ago (years ago)
  • REGLA: DET NOM hence (several years hence)
  • REGLA: NUM NOM hence (two weeks hence)
  • REGLA: COMA WHICH (BCN noun, which noun -> el qual)
  • REGLA: PREP WHICH (to which all belong -> 'al qual(rel.nn)' i no 'a que(rel.an.)')
  • REGLA: NUMERAL. Si pot ser 'm' o 'f', sortirà com a GD. Caldrà tractar-ho en interchunk o postchunk.
  • REGLA: DETERMINANT
  • REGLA: NOM
  • REGLA: PRONOM
  • REGLA: PRONOM reflexiu
  • REGLA: DET NUM (per quan va davant de desconegudes, almenys que concordin entre ells) - The two xxx : el(s) dos xxx
  • REGLA: PREPOSICIÓ PRONOM_OBJECTE
'with him'
  • REGLA: DET NOM TO INF
  • REGLA: DET NOM TO INF
  • REGLA: NOM TO INF
  • REGLA: NOM TO INF + PRNobj
  • REGLA: DET ADJ NOM TO INF
  • REGLA: DET ADJ NOM TO INF PRNobj
'a book to read'
'the need to work'
  • REGLA: ADJECTIU + enough
'strong enough'
  • REGLA: ADJECTIU
  • REGLA: PREADV ADJECTIU
'very difficult'
  • REGLA: NPLOC-PP (London-based)
  • REGLA: DET NPLOC-PP (a London-based)
  • REGLA: ADJ TO INF (BCN: canviem la prep TO per DE; els adjectius que no compleixin la *REGLA s'han de codificar al lèxic. Queda com a GD i ND fins al interchunk)
  • REGLA: ADJ TO INF PRNobj (BCN: canviem la prep TO per DE; els adjectius que no compleixin la *REGLA s'han de codificar al lèxic. Queda com a GD i ND fins al interchunk)
  • REGLA: ADV ADJ TO INF (BCN: canviem la prep TO per DE; els adjectius que no compleixin la *REGLA s'han de codificar al lèxic. Queda com a GD i ND fins al interchunk)
  • REGLA: ADV ADJ TO INF ENC (BCN: canviem la prep TO per DE; els adjectius que no compleixin la *REGLA s'han de codificar al lèxic. Queda com a GD i ND fins al interchunk)
  • REGLA: VERB copulatiu
  • REGLA: VERB copulatiu PP (el verb 'ser' del passat agafa aquí la forma perifràstica
  • REGLA: VERB copulatiu ADV
  • REGLA: be_sorry coma/punt
  • REGLA: be sorry ADV
  • REGLA: be sorry ADV coma/punt
  • REGLA: VERB
  • REGLA: VERB+clític: finds it-> el troba
  • REGLA: VERB MODAL (have to, want to). Per quan apareix sol o amb un verb desconegut
  • REGLA: INF (per a col·locar la cua en les multiparaules)
  • REGLA: INF+clític
  • REGLA: TO INF (BCN canvia la prep 'a' per 'per' davant infinitiu')
  • REGLA: TO INF (BCN canvia la prep 'a' per 'per' davant infinitiu')
  • REGLA: PPRS (per a col·locar la cua en les multiparaules. per ara 'pprs' no es fa servir per res, he copiat la *REGLA del gerundi per treure com a chunk gerundi; si de cas, més endavant s'ha d'estudiar la utilitat del pprs.)
  • REGLA: PPRS+clític (ídem *REGLA anterior PPRS)
  • REGLA: GER (per a col·locar la cua en les multiparaules i el pronom dels verbs pronominals)
  • REGLA: GER+clític
  • REGLA: PREP GER
  • REGLA: PREP GER+clític
  • PREP HAVERger PARTICIPI (without having finished - sense haver(inf) acabat)
  • PREP HAVERger PARTICIPI clític (without having finished it - sense haver-lo acabat)
  • REGLA: non-GER NOM, non-eating area > àrea de no menjar
  • REGLA: non GER NOM, non eating area > àrea de no menjar
  • REGLA: det GER NOM, no eating area > cap àrea de menjar / an eating area - una àrea de menjar
  • REGLA: with no GER NOM, with no eating disorders > sense desordres de menjar
  • REGLA: no GER: no eating > no menjar
  • REGLA: ADV-GER: fast-growing > que creix/en ràpidament
  • REGLA: ADJ-GER: fast-growing > que creix/en ràpidament (tagger tria adj i no adv)
  • REGLA: NOM-GER: Holocaust-denying (bishop) > (bisbe) que nega holocaust
  • REGLA: DET ADV-GER: the fast-growing > que creix/en ràpidament
  • REGLA: DET ADJ-GER: the fast-growing > que creix/en ràpidament (tagger tria adj i no adv)
  • REGLA: DET NOM-GER: the Holocaust-denying (bishop) > el (bisbe) que nega holocaust
  • REGLA: VERB SUBS (living -> viure)
  • REGLA: VERB SUBS+clític (living it -> viure'l) ATENCIÓ: no he pogut comprovar si funciona -carmentano
  • REGLA: VERB PART. Seran GD i ND excepte 'ser' i 'estar'. Caldria afegir el pp en les regles d'adjectiu?)
  • REGLA: AUX (de temps) VERB (will come, would come)
  • REGLA: AUX (de temps) VERB (will come, would come) + clític: will sing it -> el cantarà
  • REGLA: AUX (de mode) VERB (can come, should come)
  • REGLA: AUX (de mode) VERB (can come, should come) + clític (she should sing it -> l'hauria de cantar)
  • REGLA: DO (aux) VERB (do come, did come -> vénen, van venir)
  • REGLA: DO (aux) VERB + clític (do come, did come -> vénen, van venir)
  • REGLA: MODAL conjugable + VERB (had to come - va/van haver de venir)
  • REGLA: MODAL conjugable + VERB + clític (had to sing it -> el van haver de cantar)
  • REGLA: AUX + MODAL conjugable + VERB (I will have to come - hauré de venir)
  • REGLA: AUX + MODAL conjugable + VERB + clític (I will have to sing it - l'hauré de cantar)
  • REGLA: AUX + MODAL conjugable + VERB (I will have to - hauré de)
  • HAVER PARTICIPI (have finished - han acabat)
  • HAVER PARTICIPI clític (have finished it - l'han acabat)
  • HAVER PARTICIPIcontrolverb TO INF (BCN)
  • REGLA: VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer'
  • REGLA: VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer
  • REGLA: AUX + VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer'
  • REGLA: AUX + ADV + VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer'
  • REGLA: AUX (temps) + VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer'
  • REGLA: AUX (temps) + ADV + VERBcontrol + to + INF (BCN 'try/need/... to do this -> intentar/necessitar/ fer'
  • REGLA: BE GER (am saying -> estic dient)
  • REGLA: BE GER clític (am saying it-> ho estic dient)
  • REGLA: BE ADV GER (is always/not working -> sempre/no està treballant
  • REGLA: BE ADV GER clític (is always singing it-> sempre l'està cantant
  • REGLA: BE CONTROLger TO INF(BCN am planning to go -> estic planejant anar)
  • REGLA: BE going to INF (am going to read -> llegiré; was going to read -> anava a llegir ) mireia
  • REGLA: BE going to INF clitic (am going to read it -> el llegiré; was going to read -> l'anava a llegir )
  • REGLA: BE ADV going to INF (am not/always going to read ->no llegiré; was not/always going to read -> no anava a llegir ) mireia
  • REGLA: BE ADV going to INF clitic (am not/always going to read ->no llegiré; was not/always going to read -> no anava a llegir )
  • REGLA: VERB + ING (BCN 'avoid doing -> evitar fer'
  • REGLA: AUX + VERB + ING (BCN 'can avoid doing -> pot evitar fer'
  • REGLA: AUX (temps) + VERB + ING (BCN 'will avoid doing this -> evitar fer'
  • REGLA: AUX ADV VERB (will always think -> sempre pensaré. will not think -> no pensaré.)
  • REGLA: AUX ADV VERB clític (will always sing it-> sempre el cantaré. will not sing it-> no el cantaré.)
  • REGLA: AUX ADV VERB (can always think -> sempre puc pensar)
  • REGLA: AUX ADV VERB clític (can always think it -> sempre el puc pensar)
  • REGLA: AUX ADV VERB (I do not think -> no penso. I do always think -> sempre penso)
  • REGLA: AUX ADV VERB clític (I do not sing it -> no el canto. I do always sing it-> sempre el canto)
  • AUX + ADV + MODAL conjugable + VERB (He will sometimes have to explain - Alguna vegada haurà d'explicar. He will not have to explain -> No haurà d'explicar. He does not have to explain - No ha d'explicar)
  • AUX + ADV + MODAL conjugable + VERB + clític (He will sometimes have to explain it- Alguna vegada l'haurà d'explicar. He will not have to explain it-> No l'haurà d'explicar. He does not have to explain it- No l'ha d'explicar)
  • HAVER ADV PARTICIPI (have always/not asked - Sempre/No han preguntat)
  • PRONOM HAVER PARTICIPI clític (have always/not asked it- Sempre/No l'han preguntat)
  • AUXtemps HAVER PARTICIPI (would have finished - hauria acabat)
  • AUXmod HAVER PARTICIPI (might have finished - podria haver acabat)
  • AUXtemps HAVER PARTICIPI clític (would have finished it - l'hauria acabat)
  • AUXmod HAVER PARTICIPI clític (might have finished it - el podria haver acabat)
  • AUXtemps HAVER PARTICIPIcontrolverb TO INF (would have decided to come)
  • AUXmod HAVER PARTICIPIcontrolverb TO INF (should have decided to come)
  • AUXtemps ADV HAVER PARTICIPI (would always/not have asked - Sempre/No hauria preguntat)
  • AUXmod ADV HAVER PARTICIPI (should always/not have asked - Sempre/No hauria d'haver preguntat)
  • AUXtemps PRONOM HAVER PARTICIPI clític (would always/not have asked it- Sempre/No ho hauria preguntat)
  • AUXmod PRONOM HAVER PARTICIPI clític (should always/not have asked it- Sempre/No ho hauria d'haver preguntat)
  • REL (funció de nom)
  • REL (funció adjectiva: visitors who search peace)
  • PRONOM tònic/interrogatiu/possessiu (queda com a GD o ND si és el cas)
  • PREP
  • genitiu

(For t2 rules)

  • THERE
  • ADV
  • ADV ITG
  • PREADV
  • CNJ
  • REGLA: reset variables
  • REGLA: reset variables