Northern Sámi and Norwegian/Pending tests

From Apertium
< Northern Sámi and Norwegian
Revision as of 17:00, 4 December 2018 by Leneant (talk | contribs) (→‎Adpositions)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to navigation Jump to search


Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Regression tests.

Reported bad translations[edit]

Write a full North Saami sentence, and the correct Norwegian translation in this format:

  • (sme) Guovddáš gulaskuddan → Sentral høring

Nouns[edit]

Adjectives[edit]

Verbs[edit]

Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?
Nektende perfektum
  • (sme) Son ii lean čállán. → Hun/han hadde ikke skrevet
^^^ mistagged (or Nickel's wrong)
  • (sme) allos leage čállán → la ham ikke ha skrevet
Nektende progressiv presens
  • (sme) ii livčče čállimin → hun/han hadde ikke vært i ferd med å skrive
  • (sme) ii livčče čállime → hun/han hadde ikke vært i ferd med å skrive
now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
  • (sme) allos leage čállimin → la ham ikke være i ferd å skrive
  • (sme) allos leage čállime → la ham ikke være i ferd å skrive
Potensialis presens
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas. → Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.
  • (sme) Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis → Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.
Insert 'nå' or 'så'?
Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
  • (sme) In dieđe leaččai go duohta → Jeg vet ikke om det nå var sant
Kondisjonalis
  • (sme) Hearggit ruhttet dego livčče ballame. → Kjørereinene løper som om de skulle være redde.
  • (sme) Mun mávssášin, jos don siđašit. → Jeg kunne betale, hvis du ønsket det.
Jeg hadde betalt, om du ønsket det?

Passive preterite[edit]

  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
insert 'å'

V2[edit]

  • (sme) It boađáše → Du kunne ikke komme


Negative, verb=>adv[edit]

  • (sme) Gummá go ii boahtán. → Rart at hun/han ikke kom. :: Gummá is adjective, we can add it as adverb if it is documented
  • (sme) Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit. → Noe som man ikke utstår, ikke tør å se på eller å berøre.
dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
  • (sme) Buoremus dáidá muitalit buot → Det kan være best å fortelle alt


FV + FV[edit]

pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
  • geahččat gaivát|å glane
  • juhkat reavžut|å slurke

FV + IV pro gender[edit]

  • (sme) Ja de álggii muohttit → Og så begynte det å snø
  • (sme) Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat → Og så begynte det å snø og det ble så kjølig at hennes/hans klesplagg frøs

Causative[edit]

  • (sme) divuhit → la reparere
1) causative + illiative agent adverbial => å la ADVL MAINV
  • (sme) galggat gásttašahttit mánát báhppii → du skal la barnet døpes av presten
or
  • (sme) galggat gásttašahttit mánát báhppii → du skal la presten døpe barnet
  • (sme) geasa don geahčahat bohccuidat? → hvem lar du passe reinene?
2) transitive causative + accusative object => å få OBJ til å MAINV
  • (sme) Mu vuovssihii → Det fikk meg til å bli kvalm


CG mistaggings
  • (sme) Mun dihten heastta sus leamaš → Jeg visste at hun/han har hatt hest
  • (sme) Mun dieđán ruđaid leamaš áhkus. → Jeg vet at bestemor har hatt penger.
pp, insert "er"
  • (sme) Son osku iežas bestojuvvon. → Hun/han tror hun/han er frelst.
adverbialsetning
  • (sme) Albmi lei ruoksat, go beaivi luoitádii → Himmelen var rød, da sola gikk ned
setn.tilsvar m/gerundium som verbal
  • (sme) Albmi lei ruoksat beaivvi luoitádettiin → Himmelen var rød mens sola gikk ned

Object/adverbial placement[edit]

  • (sme) Sádde áinnas midjiide e-poasta. → Send gjerne en e-post til oss.
"send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker
  • (sme) Go lásiin bargá, de dat lea dego báhkka honnet → Når hun/han arbeider med glass, så er det som varm honning
  • (sme) Larsen fas doapmá. → Larsen skynder seg igjen.
  • (sme) Larsen fas čállá reivve. → Larsen skriver brev igjen.
  • (sme) Larsen dieđusge doapmá. → Larsen skynder seg selvfølgelig.
  • (sme) Larsen dieđusge čállá reivve. → Larsen skriver selvfølgelig brev.

Pronouns[edit]

genitive/det.poss
  • (sme) Du dálkasis → I din medisin

Reflexive, ieš[edit]

  • (sme) ieš dat muitalii → hun/han selv fortalte det
  • (sme) ieš mun dájun → jeg bare tøver
  • (sme) Mun ceggen vaikke ieš filbmafestivála → Jeg setter om så selv opp filmfestival
ceggen => particle verb

Anaphora resolution[edit]

t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x
(ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x)
  • (sme) Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret → Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.
um what is that ending?

Derivation[edit]

Verb / Actor / N
  • (sme) geavaheaddjiid almmolaš bálvalusaide → for/til offentlige tjenester for brukere
Verb / Der_h / Der_eapmi (all of them?)
  • (sme) ođđa áššiid dieđiheapmi → kunngjøring av nye saker
Verb / Der_n / N
  • (sme) dánsunkurssa → dansekurs
  • (sme) oažžun → å få
Verb / Der_st / V
  • (sme) báinnestit → de påvirker litt
better adverb?
N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
  • (sme) Ekonomalaš doarjagat → Økonomisk støtte
Is there any good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
I see no possible paraphrase

Noun phrases[edit]

accusative object predicative, add "være"
  • (sme) Gáhkuid son ráhkada buriid → Kakene hun/han lager er gode
  • (sme) Gáhkuid son ráhkada hui buriid → Kakene hun/han lager er svært gode
Illative
  • (sme) Atte mánnái biepmu → Gi mat til barnet


  • (sme) dán jagi válggas → i dette årets valg

Genitives[edit]

Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds
  • (sme) Dál son lea Badjemánáid beaiveruovttu hoavda → Nå er hun/han sjef for Reindriftsbarnenes daghjem
  • (sme) Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui → Foreldrene drømte om å få bruk av et eget hus for barnehagen
for/som/til?
  • (sme) Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii → Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage
  • (sme) 10-jagi vuođđoskuvlla sámi oahppoplánat → samisk studieplan for den 10-årige grunnskolen
  • (sme) sámi árvvuid oahpaheami vuođđu → grunnlag for opplæring i samiske verdier
near-impossible, head moves in front of the whole coordination
  • (sme) skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu → grunnlaget for skolens samiskundervisning og undervisning i samiske verdier


place names → i
  • (sme) oahpaheddjiid Davvi-Norgga skuvllaide → lærerne ved skolene i Nord-Norge
  • (sme) Finnmárkku áviissaid čállosiin → I tekster i Finnmarks aviser
  • (sme) Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin → årsmøte i foreningen for Vest-Finnmarks lærere
  • (sme) Loabága sámegieloahpahusa árvvoštallan → Vurdering av samiskopplæringa i Lavangen
even some non-doubles
  • (sme) Dalle ledjen juo barggus Romssa Sámeskuvllas → Da var jeg allerede i arbeid ved Sameskolen i Troms
for language names, we would prefer gen→adj …
  • (sme) Gáivuona sámi giellaguovddáš → Kåfjord samiske språksenter
  • (sme) Sámegiela vuođđofága lea eatnigielfága → Samisk grunnfag er morsmålsfag
  • (sme) Oahpaheaddjin sámi vuođđoskuvllas → Som lærer i den samiske grunnskolen


some genitives sound better as compounds
  • (sme) Son lea kulturbargi, geas lea boazodoalloduogáš. → Hun/han er en kulturarbeider, som har reindriftsbakgrunn.

Odd number phrases[edit]

does this generalise?
  • (sme) 1814 Vuođđolága → Grunnloven av 1814



  • (sme) Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus → Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke
  • (sme) Dohko bođii almmái gii lei njealjátlohkái. → Dit kom en mann som var i trettiårene.
  • (sme) Čihččetlohkái nisu navdo goddon. → Kvinne i sekstiårene antaes blitt drept.

Definiteness[edit]

(also er/har)
  • (sme) Mus lea biepmu → Jeg har mat
  • (sme) Biepmu lea mus → Maten er hos meg
  • (sme) Du dálkasis sáhtii leamaš ávki → Din medisin kan ha vært til nytte
  • (sme) Dá livččii skeaŋka din čeahpes bárdnái → Dette hadde vært en gave til deres flinke sønn.

Adpositions[edit]

Post-positions → Prepositions... move "på grunn av" first
  • (sme) garra dálkki geažil → på grunn av det dårlige været
  • (sme) Stáhta geaidnodoaimmahat lea dál čállán šiehtadusaid Guovdageainnu, Álttá, Láhpi ja Ákŋoluovtta muohtačorgenbargguide. → Statens vegvesen har nå skrevet avtalene for Kautokeinos, Altas, Loppas og Hasviks snøryddingarbeider.

Coordination[edit]

Questions[edit]

  • (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
  • (sme) It go boađáše munnje veahkkin? → Kan du komme og hjelpe meg?
essive predicative, difficult..."kommer du ikke til meg som hjelp?"


  • (sme) De guldalan → Jeg lytter
eller, "Ja, jeg lytter"?


Subordinatied questions[edit]

  • (sme) Son diehtá bohtet go ruoktot → Hun/han vet om de kommer hjem.
insert 'om'
  • (sme) Son háliidii iskat ásse go olbmot doppe → Hun/han ville undersøke om det bodde folk der borte.
insert 'om' and 'det' (existential)
pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst

Prepositional choice[edit]

numbers, places.illative
  • (sme) 1964:s bođii Ráisii dálueamitskuvla → I 1964 kom det husmorskole til Nordreisa
or "kom det"?
  • (sme) 1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla → I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole
gen vs "av"
  • (sme) Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija → Skolen var for det meste bare en kopi av den vanlige norske skolen


med, not på
  • (sme) Jos válddát 60 poeaŋgga sámegielas → Hvis du tar 60 poeng i samisk
delete til
  • (sme) de sáhttá dat addit dutnje 60 000 ruvnnu → så kan det gi deg 60 000 kroner


delete som, "del av", not "del "
  • (sme) Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot → Reindriftssakene kunne bli en del av den saksmengden som skal behandles
also bearbeides=>behandles (lex.sel), kan=>vil (why?)
oassin is essive, but still we (might) want 'en del', not just 'del'


das → av det, some times
  • (sme) ahte ipmirdin maidege das mii daddjui → at jeg forsto noe av det som ble sagt
previous n-head overrides
  • (sme) Muittán ahte lei álo veahá ballu das → Jeg husker at det var alltid litt frykt for det

Miscellaneous[edit]

Ordstilling
  • (sme) Gal moai birgejetne iehčaneame → Vi to greier oss på egen hånd.


  • (sme) Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát. → De små vedkassene var benk og i tillegg våre egne matkister,
  • (sme) Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii. → Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.
  • (sme) Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus → Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet
  • (sme) 1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána → I 1997 fikk vi studieplan for 10-årig grunnskole
  • (sme) Lohke iežaset juhkan ollu alkohola → De sa at de hadde drukket mye alkohol
something up with ollu→mange/mye here (turns into 'flest')
  • (sme) Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide. → Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.
  • (sme) Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas. → Samene eller samene bor i Russland, Finland, Sverige og Norge.
-ge particle, and an adjective adverbial
  • (sme) Leago dát duođasge Sámi Radio oaivil? → Er dette altså virkelig Sameradioens mening?
Headline, 3sg->man, no finite verb in main clause
  • (sme) Heahpat hállat go gillá → Skam å snakke når man lider


  • (sme) Lehkos beaivi buorre → Ha en god dag
  • (sme) musnai leat muosáhusat namuhuvvon ministeriijas → jeg også har erfaringer fra nevnte ministerium


  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin → Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn
CG fixed; but bracketing trouble for "over grensen til Sverige"


  • (sme) ollen deid juohke sajis → jeg når dem på hvert sted
is this more or less correct?


  • (sme) okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča → en i februar, en i april, en om sommeren og en på seinhøsten

V->N (removed for now, might be able to do in postchunk)[edit]

V / Der2 / Actor => N
  • (sme) dadjaleaddji lea doppe → replisereren er der borte
TODO indefinite (en som repliserer)
  • (sme) stuora dadjaleaddji lea doppe → den store replisereren er der borte
  • (sme) Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin → Etter døden ble Kong Olav forhøyd som hellig
hmm

CG Disambiguation problems[edit]

  • (sme) Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat. → Forklaringene fantes ikke, bare kopier av samiske manus.
dušše gets the verb reading
  • (sme) Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii → Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk
CG solved
  • (sme) Dan gal dieđán váddása → Det vet jeg er vanskelig
CG solved
  • (sme) Barggan ruovttus lunšša rádjai → Jeg arbeider hjemme til lunsj
CG solved
  • (sme) Sámediggi Gironis koordinere ođđa prográmma. → Sametinget i Kiruna koordinerer det nye programmet.
CG solved
  • (sme) Maŋŋá go parlamentarisma ásahuvvui → Etter at parlamentarismen ble etablert
CG solved
  • (sme) Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka. → Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.
CG solved


  • (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
  • (sme) de jullot čoalkalit uksii vuos → så får de banke på døren først
CG solved


  • (sme) Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon → Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt
CG solved


  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
CG solved

gen vs acc[edit]

  • (sme) Dan dieđán váddása → Det vet jeg er vanskelig
CG solved

@HAB[edit]

  • (sme) Dál leat sus 137 gáicca → Nå har hun/han 137 geiter
CG solved

genitiver[edit]

  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji. → Allerede 10. april mot natta reiste Harald over grensa.
Her er problemet at beaivvi som er genitiv ikke skal modifisere ija, man ha @ADVL-tagg.

CG lexical selection[edit]

go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi[edit]

  • (sme) Buoret lea johtit go orrut → Det er bedre å bevege seg enn å bli