Difference between revisions of "Northern Sámi and Norwegian/Pending tests"

From Apertium
Jump to navigation Jump to search
Line 186: Line 186:
   
 
; some genitives sound better as compounds:
 
; some genitives sound better as compounds:
* {{test|sme|Son lea kulturbargi, geas lea boazodoalloduogáš.|H_n er en kulturarbeider, som har reindriftsbakgrunn,}}
+
* {{test|sme|Son lea kulturbargi, geas lea boazodoalloduogáš.|H_n er en kulturarbeider, som har reindriftsbakgrunn.}}
   
 
===Odd number phrases===
 
===Odd number phrases===

Revision as of 19:21, 29 May 2017


Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Regression tests.

Nouns

Adjectives

Verbs

Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?
Nektende perfektum
  • (sme) Son ii lean čállán. → H_n hadde ikke skrevet
^^^ mistagged (or Nickel's wrong)
  • (sme) allos leage čállán → la ham ikke ha skrevet
Nektende progressiv presens
  • (sme) ii livčče čállimin → h_n hadde ikke vært i ferd med å skrive
  • (sme) ii livčče čállime → h_n hadde ikke vært i ferd med å skrive
now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
  • (sme) allos leage čállimin → la ham ikke være i ferd å skrive
  • (sme) allos leage čállime → la ham ikke være i ferd å skrive
Potensialis presens
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas. → Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.
  • (sme) Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis → Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.
Insert 'nå' or 'så'?
Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
  • (sme) In dieđe leaččai go duohta → Jeg vet ikke om det nå var sant
Kondisjonalis
  • (sme) Hearggit ruhttet dego livčče ballame. → Kjørereinene løper som om de skulle være redde.
  • (sme) Mun mávssášin, jos don siđašit. → Jeg kunne betale, hvis du ønsket det.
Jeg hadde betalt, om du ønsket det?

Passive preterite

  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da h_ns far døde så ble det forbudt å snakke samisk i telefonen
insert 'å'

V2

  • (sme) It boađáše → Du kunne ikke komme


Negative, verb=>adv

  • (sme) Gummá go ii boahtán. → Rart at h_n ikke kom. :: Gummá is adjective, we can add it as adverb if it is documented
  • (sme) Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit. → Noe som man ikke utstår, ikke tør å se på eller å berøre.
dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
  • (sme) Buoremus dáidá muitalit buot → Det kan være best å fortelle alt


FV + FV

pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
  • (sme) geahččat gaivát → å glane
  • (sme) juhkat reavžut → å slurke

FV + IV pro gender

  • (sme) Ja de álggii muohttit → Og så begynte det å snø
  • (sme) Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat → Og så begynte det å snø og det ble så kjølig at h_ns klesplagg frøs

Causative

  • (sme) divuhit → la reparere
1) causative + illiative agent adverbial => å la ADVL MAINV
  • (sme) galggat gásttašahttit mánát báhppii → du skal la barnet døpes av presten
or
  • (sme) galggat gásttašahttit mánát báhppii → du skal la presten døpe barnet
  • (sme) geasa don geahčahat bohccuidat? → hvem lar du passe reinene?
2) transitive causative + accusative object => å få OBJ til å MAINV
  • (sme) Mu vuovssihii → Det fikk meg til å bli kvalm

Setningstilsvar vs advl/obj-setning

  • (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar skulle komme
CG mistaggings
  • (sme) Mun dihten heastta sus leamaš → Jeg visste at h_n har hatt hest
  • (sme) Mun dieđán ruđaid leamaš áhkus. → Jeg vet at bestemor har hatt penger.
pp, insert "er"
  • (sme) Son osku iežas bestojuvvon. → H_n tror h_n er frelst.
adverbialsetning
  • (sme) Albmi lei ruoksat, go beaivi luoitádii → Himmelen var rød, da sola gikk ned
setn.tilsvar m/gerundium som verbal
  • (sme) Albmi lei ruoksat beaivvi luoitádettiin → Himmelen var rød mens sola gikk ned

Object/adverbial placement

  • (sme) Sádde áinnas midjiide e-poasta. → Send gjerne en e-post til oss.
"send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker
  • (sme) Go lásiin bargá, de dat lea dego báhkka honnet → Når h_n arbeider med glass, så er det som varm honning
  • (sme) Larsen fas doapmá. → Larsen skynder seg igjen.
  • (sme) Larsen fas čállá reivve. → Larsen skriver brev igjen.
  • (sme) Larsen dieđusge doapmá. → Larsen skynder seg selvfølgelig.
  • (sme) Larsen dieđusge čállá reivve. → Larsen skriver selvfølgelig brev.

Pronouns

genitive/det.poss
  • (sme) Du dálkasis → I din medisin

Reflexive, ieš

  • (sme) ieš dat muitalii → h_n selv fortalte det
  • (sme) ieš mun dájun → jeg bare tøver
  • (sme) Mun ceggen vaikke ieš filbmafestivála → Jeg setter om så selv opp filmfestival
ceggen => particle verb

Anaphora resolution

t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x
(ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x)
  • (sme) Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret → Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.
um what is that ending?

Derivation

Verb / Actor / N
  • (sme) geavaheaddjiid almmolaš bálvalusaide → for/til offentlige tjenester for brukere
Verb / Der_h / Der_eapmi (all of them?)
  • (sme) ođđa áššiid dieđiheapmi → kunngjøring av nye saker
Verb / Der_n / N
  • (sme) dánsunkurssa → dansekurs
  • (sme) oažžun → å få
Verb / Der_st / V
  • (sme) báinnestit → de påvirker litt
better adverb?
N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
  • (sme) Ekonomalaš doarjagat → Økonomisk støtte
Is there any good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
I see no possible paraphrase

Noun phrases

accusative object predicative, add "være"
  • (sme) Gáhkuid son ráhkada buriid → Kakene h_n lager er gode
  • (sme) Gáhkuid son ráhkada hui buriid → Kakene h_n lager er svært gode
Illative
  • (sme) Atte mánnái biepmu → Gi mat til barnet
misc
  • (sme) Guovddáš gulaskuddan → Sentral høring
  • (sme) dán jagi válggas → i dette årets valg

Genitives

Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds
  • (sme) Dál son lea Badjemánáid beaiveruovttu hoavda → Nå er h_n sjef for Reindriftsbarnenes daghjem
  • (sme) Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui → Foreldrene drømte om å få bruk av et eget hus for barnehagen
for/som/til?
  • (sme) Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii → Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage
  • (sme) 10-jagi vuođđoskuvlla sámi oahppoplánat → samisk studieplan for den 10-årige grunnskolen
  • (sme) sámi árvvuid oahpaheami vuođđu → grunnlag for opplæring i samiske verdier
near-impossible, head moves in front of the whole coordination
  • (sme) skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu → grunnlaget for skolens samiskundervisning og undervisning i samiske verdier


place names → i
  • (sme) oahpaheddjiid Davvi-Norgga skuvllaide → lærerne ved skolene i Nord-Norge
  • (sme) Finnmárkku áviissaid čállosiin → I tekster i Finnmarks aviser
  • (sme) Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin → årsmøte i foreningen for Vest-Finnmarks lærere
  • (sme) Loabága sámegieloahpahusa árvvoštallan → Vurdering av samiskopplæringa i Lavangen
even some non-doubles
  • (sme) Dalle ledjen juo barggus Romssa Sámeskuvllas → Da var jeg allerede i arbeid ved Sameskolen i Troms
for language names, we would prefer gen→adj …
  • (sme) Gáivuona sámi giellaguovddáš → Kåfjord samiske språksenter
  • (sme) Sámegiela vuođđofága lea eatnigielfága → Samisk grunnfag er morsmålsfag
  • (sme) Oahpaheaddjin sámi vuođđoskuvllas → Som lærer i den samiske grunnskolen


some genitives sound better as compounds
  • (sme) Son lea kulturbargi, geas lea boazodoalloduogáš. → H_n er en kulturarbeider, som har reindriftsbakgrunn.

Odd number phrases

does this generalise?
  • (sme) 1814 Vuođđolága → Grunnloven av 1814



  • (sme) Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus → Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke
  • (sme) Dohko bođii almmái gii lei njealjátlohkái. → Dit kom en mann som var i trettiårene.
  • (sme) Čihččetlohkái nisu navdo goddon. → Kvinne i sekstiårene antaes blitt drept.

Definiteness

(also er/har)
  • (sme) Mus lea biepmu → Jeg har mat
  • (sme) Biepmu lea mus → Maten er hos meg
  • (sme) Du dálkasis sáhtii leamaš ávki → Din medisin kan ha vært til nytte
  • (sme) Dá livččii skeaŋka din čeahpes bárdnái → Dette hadde vært en gave til deres flinke sønn.

Adpositions

Post-positions → Prepositions... move "på grunn av" first
  • (sme) garra dálkki geažil → på grunn av det dårlige været

Coordination

Questions

  • (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
  • (sme) It go boađáše munnje veahkkin? → Kan du komme og hjelpe meg?
essive predicative, difficult..."kommer du ikke til meg som hjelp?"


  • (sme) De guldalan → Jeg lytter
eller, "Ja, jeg lytter"?


Subordinatied questions

  • (sme) Son diehtá bohtet go ruoktot → H_n vet om de kommer hjem.
insert 'om'
  • (sme) Son háliidii iskat ásse go olbmot doppe → H_n ville undersøke om det bodde folk der borte.
insert 'om' and 'det' (existential)
pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst

Prepositional choice

numbers, places.illative
  • (sme) 1964:s bođii Ráisii dálueamitskuvla → I 1964 kom det husmorskole til Nordreisa
or "kom det"?
  • (sme) 1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla → I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole
gen vs "av"
  • (sme) Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija → Skolen var for det meste bare en kopi av den vanlige norske skolen


med, not på
  • (sme) Jos válddát 60 poeaŋgga sámegielas → Hvis du tar 60 poeng i samisk
delete til
  • (sme) de sáhttá dat addit dutnje 60 000 ruvnnu → så kan det gi deg 60 000 kroner


delete som, "del av", not "del "
  • (sme) Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot → Reindriftssakene kunne bli en del av den saksmengden som skal behandles
also bearbeides=>behandles (lex.sel), kan=>vil (why?)
oassin is essive, but still we (might) want 'en del', not just 'del'


das → av det, some times
  • (sme) ahte ipmirdin maidege das mii daddjui → at jeg forsto noe av det som ble sagt
previous n-head overrides
  • (sme) Muittán ahte lei álo veahá ballu das → Jeg husker at det var alltid litt frykt for det

Miscellaneous

Ordstilling
  • (sme) Gal moai birgejetne iehčaneame → Vi to greier oss på egen hånd.


  • (sme) Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát. → De små vedkassene var benk og i tillegg våre egne matkister,
  • (sme) Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii. → Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.
  • (sme) Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus → Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet
  • (sme) 1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána → I 1997 fikk vi studieplan for 10-årig grunnskole
  • (sme) Lohke iežaset juhkan ollu alkohola → De sa at de hadde drukket mye alkohol
something up with ollu→mange/mye here (turns into 'flest')
  • (sme) Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide. → Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.
  • (sme) Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas. → Samene eller samene bor i Russland, Finland, Sverige og Norge.
-ge particle, and an adjective adverbial
  • (sme) Leago dát duođasge Sámi Radio oaivil? → Er dette altså virkelig Sameradioens mening?
Headline, 3sg->man, no finite verb in main clause
  • (sme) Heahpat hállat go gillá → Skam å snakke når man lider


  • (sme) Lehkos beaivi buorre → Ha en god dag
  • (sme) musnai leat muosáhusat namuhuvvon ministeriijas → jeg også har erfaringer fra nevnte ministerium


  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin → Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn
CG fixed; but bracketing trouble for "over grensen til Sverige"


  • (sme) ollen deid juohke sajis → jeg når dem på hvert sted
is this more or less correct?


  • (sme) okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča → en i februar, en i april, en om sommeren og en på seinhøsten

V->N (removed for now, might be able to do in postchunk)

V / Der2 / Actor => N
  • (sme) dadjaleaddji lea doppe → replisereren er der borte
TODO indefinite (en som repliserer)
  • (sme) stuora dadjaleaddji lea doppe → den store replisereren er der borte
  • (sme) Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin → Etter døden ble Kong Olav forhøyd som hellig
hmm

CG Disambiguation problems

  • (sme) Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat. → Forklaringene fantes ikke, bare kopier av samiske manus.
dušše gets the verb reading
  • (sme) Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii → Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk
CG solved
  • (sme) Dan gal dieđán váddása → Det vet jeg er vanskelig
CG solved
  • (sme) Barggan ruovttus lunšša rádjai → Jeg arbeider hjemme til lunsj
CG solved
  • (sme) Sámediggi Gironis koordinere ođđa prográmma. → Sametinget i Kiruna koordinerer det nye programmet.
CG solved
  • (sme) Maŋŋá go parlamentarisma ásahuvvui → Etter at parlamentarismen ble etablert
CG solved
  • (sme) Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka. → Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.
CG solved


  • (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
  • (sme) de jullot čoalkalit uksii vuos → så får de banke på døren først
CG solved


  • (sme) Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon → Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt
CG solved


  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da h_ns far døde så ble det forbudt å snakke samisk i telefonen
CG solved

gen vs acc

  • (sme) Dan dieđán váddása → Det vet jeg er vanskelig
CG solved

@HAB

  • (sme) Dál leat sus 137 gáicca → Nå har h_n 137 geiter
CG solved

CG lexical selection

go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi

  • (sme) Buoret lea johtit go orrut → Det er bedre å bevege seg enn å bli