Difference between revisions of "Northern Sámi and Norwegian/Regression tests"

From Apertium
Jump to navigation Jump to search
 
(673 intermediate revisions by 4 users not shown)
Line 1: Line 1:
{{TOCD}}
{{TOCD}}

Run with <code>t/update-latest</code> and then check <code>svn diff t</code> to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also [[../Pending tests|Pending tests]].

==Nouns==

* {{test|sme|Mus lea biila.|Jeg har en bil.}}
* {{test|sme|Mun válden biilla.|Jeg tok bilen.}}


; Accusative
* {{test|sme|Oainnátgo máná?|Ser du barnet?}}

; Genitive
* {{test|sme|Mii lea máná namma?|Hva er barnets navn?}}


; num nom.gen => num nom
* {{test|sme|Máhtte máksá guokte ruvnnu.|Máhtte betaler to kroner.}}
* {{test|sme|Girji máksá guokte ruvnnu.|Boka koster to kroner.}}
; num.mod nom => num nom
* {{test|sme|Guokte ruvnnu leat boahtán.|To kroner har kommet.}}


; det nom.gen nom (det.gender from first nom)
* {{test|sme|Dán lihtu ulbmil lea addit.|Denne alliansens mål er å gi.}}


===Nouns===
===Nouns===


* {{test|sme|biila|bil}}
* {{test|sme|Mii mannat politiijastašuvdnii.|Vi drar til politistasjonen.}}
* {{test|sme|biillat|biler}}
* {{test|sme|Mun bargen sin mielbargin.|Jeg arbeidet som deres medarbeider.}}
* {{test|sme|muohtasuddama|snøsmelting}}
* {{test|sme|giellarevitaliseren|språkrevitalisering}}


===Pronouns===
=== Proper nouns===
* {{test|sme|dan|dets}}
* {{test|sme|Gonagas Harald|Kong Harald}}
* friddja Norgii|til det frie Norge ?
* {{test|sme|Dat lea|Det er}}
* {{test|sme|Anne Tornensis Hætta|Anne Tornensis Hætta}}
* {{test|sme|Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje.|etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter.}}


=== Insert determiner===


* {{test|sme|Son lea čeahpes bárdni.|Han er en flink gutt.}}
* {{test|sme|Son lea čeahpes nieida.|Hun er ei flink jente.}}
* {{test|sme|Su namma lea Máret.|Hennes navn er Máret.}}
* {{test|sme|Buohtastahte eará gielaiguin.|Sammenlign med andre språk.}}


; or not:
* {{test|sme|Vuosttas instruvssat|De første instruksene}}
* {{test|sme|Áviisa almmuhuvvo gitta lávvardahkii.|Avisen publiseres helt til lørdag.}}
* {{test|sme|Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin.|Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.}}
* {{test|sme|Nuorta-Finnmárkui lea Ukjendord OS hutkame hukset guokte bieggamillopárkka|Til Øst-Finnmark er *Ukjendord AS i ferd med å finne på å bygge to vindmølleparker}}

==Pronouns==
* {{test|sme|dan|det}}
* {{test|sme|Dat leat ártegis olbmot.|De er rare folk.}}
* {{test|sme|Dat lea mu beavdi.|Det er mitt bord.}}
* {{test|sme|goappat|hver}}

===Reflexive, ieš emphatic===
; Nominative => selv
* {{test|sme|Jus in livčče mun ieš.|Hvis jeg ikke hadde vært meg selv.}}

* Máhttu lea ieš namma.|Kunnskapen er selve navnet.
: fragment, just to ensure 'selv'

===Reflexive pronoun inflected===
; Accusative => seg selv
* {{test|sme|Áhkku geahčai iežas speadjalis.|Bestemor så seg selv i speilet.}}
* {{test|sme|Son lábmii iežas.|Hun/han skadet seg selv.}}



; Postposijonskomplement => acc

* {{test|sme|Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá.|Vibeke Larsen så det som mistillitsuttalelse mot seg.}}
* {{test|sme|Mun oidnen dan eahpeluohttámuššan iežan vuostá.|Jeg så det som mistillit mot meg.}}


; Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
* {{test|sme|Váldde biergasiid iežat fárrui.|Ta tingene med deg.}}
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela.|Samiske barn behøver støtte for å bevare og utvikle sitt språk.| for å}}
* {{test|sme|Mun ferten čorget iežan lanja.|Jeg må rydde mitt rom.}}
* {{test|sme|Son čorgii iežas lanja.|Hun/han ryddet sitt rom.}}

* {{test|sme|Mun ohppen čállit sámegiela, iežan eatnigiela.|Jeg lærte å skrive samisk, mitt morsmål.}}
* {{test|sme|Moai válde dušše iežame biergasiid mielde.|Vi to tar bare våre ting med.}}
* {{test|sme|Doai váldibeahtti dušše iežade biergasiid mielde.|Dere to tar bare deres ting med.}}

; Genitive followed by Pron.Gen => egen
* {{test|sme|Dat lea mu iežan sivva.|Det er min egen skyld.}}

; Illativ => seg selv

* {{test|sme|Mánát guvle alcceseaset speadjalis.|Barna kikket på seg selv i speilet.}}
: "på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x

; Locative => selv
* {{test|sme|Mis leat alddámet ain šibihat.|Vi har selv enda husdyr.}}

; Comitative => seg selv
* {{test|sme|Mun jurddašin iežainan.|Jeg tenkte med meg selv.}}

; Essive => på egen hånd
* {{test|sme|Moai birgejetne iehčaneame.|Vi to greier oss på egen hånd.}}

; iehčanassii_1 => alene (adverb)
* {{test|sme|Mánát leat iehčanassii ruovttus.|Barna er alene hjemme.}}


===Nonreferential(?) pronouns===
* {{test|sme|ii mihkkege almenneha birra.|ingenting om allmenningen.}}
* {{test|sme|Gávdnetgo maidege?|Fant du noe?}}
* {{test|sme|ii mihkkege leat buorre.|ingenting er bra.}}
* {{test|sme|ii goabbáge leat buorre.|ingen av dem er bra.}}
* {{test|sme|in oastte goappáge.|jeg kjøper ikke noen.}}

==Anaphora resolution==

* {{test|sme|Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui.|Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.}}


==Adjectives==
* {{test|sme|Skuvllat ja oahpahusbáikkit leat deháleamos báikkit.|Skolene og undervisningsstedene er de viktigste stedene.}}
* {{test|sme|Goabbá lea deháleabbo, boraspire vai olmmoš?|Hvilken av de to er viktigere, rovdyr eller menneske?}}


===Adjectives===
* {{test|sme|deháleamos|viktigst}}
* {{test|sme|dehálaš|viktig}}
* {{test|sme|deháleabbo|viktigere}}


* {{test|sme|almmolaš bálvalusaide|til offentlige tjenester}}
* {{test|sme|almmolaš bálvalusaide|til offentlige tjenester}}
* {{test|sme|Mii dárbbašit sámegielat bargi.|Vi behøver samiskspråklig ansatt.}}


* {{test|sme|min nuoramus olbmot|våre yngste folk}}
===Verbs===
* {{test|sme|min nuoramus bárdnái|til vår yngste gutt}}
* {{test|sme|Muhtun guovlluin lea oahpahus deháleamos doaibma.|I noen områder er undervisning den viktigste oppgaven.}}
* {{test|sme|mu stuora váivái|til mitt store besvær}}

===superlatives===
* {{test|sme|Máŋga jagi son lea leamaš buoremusaid searvvis.|Mange år har hun/han vært blant de beste.}}

;adj-noun compound vs first cmp part alone
* {{test|sme|gáiddusoahpahussii|til fjernundervisning}}
* {{test|sme|gáiddus|fjerntliggende}}



* {{test|sme|smávvaaviisa|småavis}}


;non-synthetic
* {{test|sme|sávrribut|mer utholdende}}

;Pron.Indef → A.Attr hack
* {{test|sme|Sámi guovlluid iešguđet gielladilit.|Samiske områders ulike språksituasjoner.}}



;gender
* {{test|sme|Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái.|Jeg tror at dette har påvirket mer positivt deres identitetsutvikling.}}

===From Prfprc to Adjectives===
* {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}

==Adverbs==
* {{test|sme|Lea ain deháleabbo ovttasbargat bures.|Det er enda viktigere å samarbeide godt.}}

* {{test|sme|Máilbmi lea rievdan das rájes go son lávllui dien šuoŋa.|Verden har forandret seg siden hun/han sang denne melodien.}}

===Move adverb===
* {{test|sme|Sámediggepresideanta Larsen fas hállá.|Sametingspresident Larsen snakker igjen.}}

==Verbs==
* {{test|sme|goarun|jeg syr}}
* {{test|sme|goarun|jeg syr}}
; imp
* {{test|sme|gorrot|de syr}}
* {{test|sme|jeara|spør}}
====Pro-drop====
* {{test|sme|Sihko dán.|Stryk dette.}}


===Potensialis===

* {{test|sme|Máhtte ii leačča čállán.|Máhtte har så ikke skrevet.}}
* {{test|sme|Son ii leačča čállán.|Han har så ikke skrevet.}}
* {{test|sme|Mot leaččai dasto mánáide dain leairrain?|Hvordan var det så så for barn i de leirene?}}

===Kondisjonalis===
* {{test|sme|jearašin|jeg kunne spørre}}
* {{test|sme|jearašeimmet|vi kunne spørre}}
* {{test|sme|Itgo veahkehivčče mu?|Kunne du ikke hjelpe meg?}}

===Kondisjonalis med leat===
* {{test|sme|Livččii lunddolaš geahčadit dán.|Det hadde vært naturlig å granske dette.|main verb}}
* {{test|sme|Oahpaheaddjit livčče sáhttán gieđahallat ášši buorebut.|Lærerne hadde kunnet behandle saken bedre.|aux verb}}

===Pro-drop===
* {{test|sme|dihten|jeg visste}}
* {{test|sme|dihten|jeg visste}}
* {{test|sme|diđiide|dere to visste}}
* {{test|sme|diđiide|dere to visste}}
* {{test|sme|diđiimet|vi visste}}
* {{test|sme|diđiimet|vi visste}}


* {{test|sme|Ii vel dieđe gos áigu bargat.|Hun/han vet ikke enda hvor hun/han skal arbeide.}}
====Negative====

* {{test|sme|Máhtte lea boahtán|Máhtte har kommet}}
; expletive/existential (nt, not mf)
* {{test|sme|ii leat boahtán|den har ikke kommet}}

* {{test|sme|Dás čujuhuvvo njuolggadusaide.|Her vises det til regler.}}
: pass→nt
* {{test|sme|báitá|det skinner}}
* {{test|sme|Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin.|Sametinget ser at det kan bli utfordrende.}}

===Verb abessive===
* {{test|sme|Skuvllat ovttasbarget beroškeahttá riikarájáin.|Skolene samarbeider uten å bry seg om riksgrensene.}}

== existential==
* {{test|sme|Guovdageainnus lei dievas soahti mannan vahku.|I Kautokeino var det full krig sist uke.}}
* {{test|sme|Guovdageainnus lea allaskuvla.|I Kautokeino er det høyskole.}}
* {{test|sme|Dat čuohcá sidjiide geain eai leat oahpaheaddjit.|Det berører dem som ikke har lærere.}}
* {{test|sme|Tiimmu ovdal gaskaija leat kulturdoalut Kárášjoga čierastanluohkás.|Timen før midnatt er det kulturarrangement i Karasjoks slalåmbakke.}}
* {{test|sme|Vaikko leat muhtin erohusat, de sáhttá buohtastahttit sin vieruid min vieruiguin.|Selv om det er noen forskjeller, så kan man sammenligne deres skikker med våre skikker.}}
* {{test|sme|Čoahkkimis galgá ráhkaduvvot ođđa plána.|På møtet skal det lages en ny plan.}}
* {{test|sme|Dušše Hámmárfeasttas ii leat njiedjan diimmá rájes.|Bare i Hammerfest er det ikke gått ned siden i fjor.}}

* {{test|sme|arvá |det regner}}

* {{test|sme|Máhppii lea sierra čilgehus.|Til mappa er det en særskilt forklaring.}}
* {{test|sme|Jođiheaddjibargui manná ollu áigi.|Til lederarbeidet går det mye tid.}}
* {{test|sme|Dasa leat vissásit ollu čilgehusat.|Til det er det sikkert mange forklaringer.}}

; man
* {{test|sme|Dasto galgá vuodjat dainna olbmuin.|Så skal man svømme med det mennesket.}}
* {{test|sme|Dál ferte soabadanproseassa álggahit.|Nå må man igangsette forsoningsprosessen.}}

; override with relatives:
* {{test|sme|Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii.|Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.}}
* {{test|sme|Stuorámus dáhpáhus mii goassege lea leamaš.|Den største hendelsen som noensinne har vært.}}

===Don't insert pro===
* {{test|sme|Dan galgá Anne muitalit Sápmái.|Det skal Anne fortelle til Sameland.}}
* {{test|sme|Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái.|Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.}}




===Verb=>adv===
; dáidit => nok
* {{test|sme|Máhtte ii dáidde jienastit Bargiidbellodaga doppe.|Máhtte stemmer nok ikke på Arbeiderpartiet der borte.}}

; soaitit => kanskje
* {{test|sme|Son soaitá boahtit ruoktot.|Han kommer kanskje hjem.}}

; ii => ikke
* {{test|sme|Son ii leat čállán.|Han har ikke skrevet.}}
* {{test|sme|Ii lean čállán.|Hun/han hadde ikke skrevet.}}
* {{test|smeIIi lean čállimin.|Hun/han var ikke i ferd med å skrive.}}
* {{test|sme|Ii lean čállime.|Hun/han var ikke i ferd med å skrive.}}
* {{test|sme|Máhtte lea boahtán.|Máhtte har kommet.}}
* {{test|sme|Ii leat boahtán.| Hun/han har ikke kommet.}}
; capital case

; evt. "han" (but can it ever be "det"?)
* {{test|sme|Máhtte ii leat boahtán|Máhtte har ikke kommet}}
* {{test|sme|Máhtte ii leat boahtán|Máhtte har ikke kommet}}


====V2 (negative, subordination, qst)====
===V2 (negative, subordination, qst, object)===
* {{test|sme|itgo boađáše?|kommer du ikke?}}
* {{test|sme|Itgo boađáše?|Kunne du ikke komme?}}
* {{test|sme|it boađáše|du kommer ikke}}
* {{test|sme|It boađáše.|Du kunne ikke komme.}}
* {{test|sme|go it boađáše|når du ikke kommer}}
* {{test|sme|Máhtte ii boađe.|Máhtte kommer ikke.}}
* {{test|sme|go it boađáše.|når du ikke kunne komme.}}
: når eller at?
: når eller at?
* {{test|sme|Itgo gáfe juga?|Drikker du ikke kaffe?}}
: kaffe.unc


* {{test|sme|Maid áiggot bargat go heaittát barggus?|Hva skal du gjøre når du slutter i jobben?}}
===Derivation===
* {{test|sme|Mii maiddái ássat.|Vi bor også}}
* {{test|sme|Mu bealis dat dušše nannejuvvui.|For meg ble det bare styrket.}}


* {{test|sme|Muhto sámediggepresideantta baicce ii hálit giellaguovddášjođiheaddji cuiggodit dan dihtii go presideanta ii sámástan ođđajagisártnistis.|Men sametingspresidenten derimot vil ikke språksenterlederen kritisere fordi at presidenten ikke snakket samisk i nyttårstalen.}}
* {{test|sme|Muhto sámediggepresideantta ii hálit giellaguovddášjođiheaddji cuiggodit.|Men sametingspresidenten vil ikke språksenterlederen kritisere.}}

* {{test|sme|Mii sávvat sutnje bures boahtin, rektor Gunvor Guttorm cealká.|Vi ønsker henne/han velkommen, sier rektor Gunvor Guttorm.}}

===Not V2===
* {{test|sme|Eiseválddit leat dohkkehan sin rusttega nu movt dat lea dál.|Myndighetene har godkjent deres anlegg slik som det er nå.}}

===FV + IV===
* {{test|sme|Mun ferten viežžat čázi.|Jeg må hente vann.}}

===wh-question===
* {{test|sme|Maid don jugat?|Hva drikker du?}}
* {{test|sme|Leago duohta?|Er det sant?}}

===Present progressive===
* {{test|sme|Máhtte lea čállime.|Máhtte er i ferd med å skrive.}}
: or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
* {{test|sme|ii leat čállimin.|hun/han er ikke i ferd med å skrive.}}
* {{test|sme|ii leat čállime.|hun/han er ikke i ferd med å skrive.}}
* {{test|sme|ii leačča čállimin.|hun/han er så ikke i ferd med å skrive.}}
* {{test|sme|ii leačča čállime.|hun/han er så ikke i ferd med å skrive.}}

===Essive utfyllingspredikat===
; remove case-prep in t2x if following or preceding vcop
* {{test|sme|Son lea taksivuoddjin Oslos.|Hun/han er drosjesjåfør i Oslo.}}
* {{test|sme|Mus lea Ánde mielbargin.|Jeg har Ánde som medarbeider.}}
* {{test|sme|Sin bargun lei.|Deres arbeid var det.}}

===Actio Ess===


===Topic/Focus stuff===
* {{test|sme|Boahtágo áhčči ihttin?|Kommer far i morgen?}}
* {{test|sme|Áhččigo boahtá ihttin?|Er det far som kommer i morgen?}}
: evt. "faren"



===Passive===
* {{test|sme|Go su áhčči jámii de gildui.|Da hennes/hans far døde så ble det forbudt.}}
* {{test|sme|Dađistaga gildui sámegiella.|Etter hvert ble samisk forbudt.}}
* {{test|sme|dan maŋŋá gildui sámegiella.|etter det ble samisk forbudt.}}

===="Passive" single verb => bli + adj====
* {{test|sme|Dál dii fertebehtet geargat.|Nå må dere bli ferdige.}}
: geargat => ferdig.adj/pass__verb

===Setningstilsvar vs advl/obj-setning===
* {{test|sme|Máhtte muitalii ádjá boahtit.|Máhtte fortalte at bestefar kommer.}}
* {{test|sme|Máhtte logai sin vuolgit dál juo.|Máhtte sa at de reiser nå allerede.}}
: is logai completely ambiguous between lese/si? difficult lex.sel...

* {{test|sme|Jáhkken kulturmáhtu leat oktan ággan.|Jeg trodde at kulturkompetansen er et argument.}}

===Negative preterite using PrfPrc form===
* {{test|sme|Mon gullen ahte áddjá ii dovdan dan lottáža.|Jeg hørte at bestefar ikke kjente den småfuglen.}}
* {{test|sme|vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta.|for at flegmatisk okkupasjonsmakt ikke fikk ta dem fast.}}
* {{test|sme|Harald vuortnui ahte ii áigon čuohppat vuovttaid.|Harald sverget at han ikke skulle klippe håret.}}
: TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
* {{test|sme|ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá.|at Norge ikke kunne greie seg mot en flegmatisk krigsmakt.}}

==Derivation==
* {{test|sme|Son lei dalle sullii 60-jahkásaš.|Han var da omtrent 60-åring.}}
* {{test|sme|32-jahkásaš čiekči máhccá fas Romsii.|32-årig fotballspiller drar tilbake igjen til Tromsø.}}
* {{test|sme|5-jahkásaččaid bátnedearvvašvuohta ii leat gal mánáid duohken.|5-åringenes tannhelse er ikke avhengig av barna.}}


===Inchoative===
; Verb / Der3 / goahti
* {{test|sme|boradišgohten|jeg begynte å spise}}
: evt "holde måltid"?
* {{test|sme|lohkagohten|jeg begynte å lese}}
: don't chunk it all, might want to insert adverbs
* {{test|sme|ii lohkagoađe.|hun/han begynner ikke å lese.}}


===Passive===
; Verb / Der2 / Der_PassL
; Verb / Der2 / Der_PassL
* {{test|sme|borrojuvvot|spises}}
* {{test|sme|don borrojuvvot|du spises}}
; insert det , give ind
* {{test|sme|Čoahkkimis galgá ráhkaduvvot plána.|På møtet skal det lages en plan.}}


===Noun phrases===
===Reflexive verb===
; Essive
; Verb
* {{test|sme|mánnán|som barn}}
* {{test|sme|Son basadii.|Hun/han vasket seg.}}
: (bidix-specified lexical reflexive 'basadit')
* {{test|sme|ja de háliidin beassat 20 buoremusa searvái.|og så ville jeg komme meg blant de 20 beste.}}
* {{test|sme|de dusten sávvat beassat 20 buoremusa searvái.|så torde jeg å ønske å komme meg blant de 20 beste.}}


* {{test|sme|Mii leat čoahkkanan digaštallat ášši.|Vi har samlet oss for å debattere saken.| for å}}
===Definiteness===
* {{test|sme|Mánná oađđá|Barnet sover}}


;
===Coordination===
===Causative===
* {{test|sme|Ruoŧas ja Norggas|i Sverige og Norge}}
* {{test|sme|don fertet vuos beatnaga čuogahit.|du må først la hunden drikke.}}


; Verb / Der1 / Der_h
===V2===
* {{test|sme|Son orui Romssas mánnán|Han bodde i Tromsø som barn}}
* {{test|sme|Muhto mánámánnái áiggun goaruhit gávtti.|Men til barnebarnet skal jeg la sy kofte.}}


; Verb / Der2 / Der_ahtti
===Adpositions===
* {{test|sme|Sii leat jorgalahttán gihppaga sámegillii.|De har latt oversette heftet til samisk.}}


==Adj vs Noun==

; Adjective / Der3 / Der_vuohta => N
* {{test|sme|ráhkisvuohta ja geafivuohta ja coagisvuohta.|kjærlighet og fattigdom og det grunne.}}
: last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)

===Noun vs adjective (sámi - samisk)===
* {{test|sme|Sámi mánáidgárdin oaivvilduvvo dat mánáidgárdi mii mearrádusaid bokte lea vuođđudan mánáidgárdedoaimma sámi gillii ja kultuvrii.|Som samisk barnehage menes det den barnehagen som har via bestemmelsene grunnlagt barnehagedriften på samisk språk og kultur.}}
* {{test|sme|Sámi pedagogalaš bargi bargá doppe.|Samisk pedagogisk ansatt arbeider der borte.}}
* {{test|sme|Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis.|Flink samisk pedagogisk ansatt arbeider i barnehagen.}}
* {{test|sme|Sámi gievkkanbargi bargá mánáidgárddis.|Samisk kjøkkenansatt arbeider i barnehagen.}}

===Adjective vs noun (guovdageaidnulaš - kautokeinoværing)===
* {{test|sme|Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu.|I går fikk kautokeinoværing over 1,3 millioner kroner.}}


==Noun phrases==
* {{test|sme|riikka nubbi davvisámegiel namma|landets andre nordsamiske navn}}


=== Essive===
; ^@SPRED v@ADVL
* {{test|sme|Nuorran son orui Romssas.|Som ungdom bodde hun/han i Tromsø.|I ungdommen}}

====NIL====
* {{test|sme|Prográmmaid gohčodit hiljes-TV:n.|Programmene kaller vi sakte-TV.}}


* {{test|dáčča skuvlla kopija|en kopi av den norske skolen}}
* {{test|Guovdageainnu suohkana sátnejođiheaddji|ordfører av Kautokeino kommune}}
; output as two chunks

* {{test|nb|Dronnet Sonja|Dronning Sonja}}
* {{test|nb|Ruvdnaprinsa Harald|Kronprins Harald}}

; adj n.gen n.com
* {{test|sme|Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin.|Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer.}}

; cmp
* {{test|sme|Mii manahit máŋgga vejolaš sámegieloahpaheaddji.|Vi mister mange mulige samisklærere.}}

; cmp.guio
* {{test|sme|Danne heaitá Aslaksen Wikipedia-hoavdan.|Derfor slutter Aslaksen som Wikipedia-sjef.}}

==Definiteness==
; subject (guessing...)
* {{test|sme|Mánná oađđá.|Barnet sover.}}



* {{test|sme|Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui.|Sist vinter reiste ei gruppe til Karasjok og Kautokeino.}}
* {{test|sme|Giella lei stuorámus váttisvuohta.|Språket var det største problemet.}}
* {{test|sme|Mii leat dál gieldda stuorimus mánáidgárdi.|Vi er nå kommunens største barnehage.}}

; mass vs count
* {{test|sme|Máhtte ráhkada biepmu.|Máhtte lager mat.}}
* {{test|sme|Oainnátgo máná?|Ser du barnet?}}

* {{test|sme|Skuvla lea leamaš stuorimus oassi prošeavttas.|Skolen har vært den største delen av prosjektet.}}

==leat => har/er/må==
* {{test|sme|Mis lea cahkkehit dola.|Vi må tenne på bålet.}}

==Coordination==
* {{test|sme|Ruoŧas ja Norggas|I Sverige og Norge}}
* {{test|sme|Stáhta geaidnodoaimmahat lea dál čállán šiehtadusa Ákŋoluovtta muohtačorgenbargguide.|Statens vegvesen har nå skrevet en avtale om Hasviks snøryddingarbeider.}}
* {{test|sme|Ministtar bođii, lohpidii ja manai fas.|Ministeren kom, lovde og gikk igjen.}}

==V2==
* {{test|sme|Son orui Romssas mánnán.|Hun/han bodde i Tromsø som barn.}}

* {{test|sme|Muhto mun orun Kárášjogas.|Men jeg bor i Karasjok.}}

==Adpositions==
* {{test|sme|Mus lea oahpahus gaskkal guovtti ja njealji.|Jeg har undervisning mellom to og fire.}}
; Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
; Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)


* {{test|sme|dálkki geažil| grunn av vær}}
* {{test|sme|Logut leat sturron jagis jahkái.|Tallene har blitt større år for år.}}


* {{test|sme|Giitu skeaŋkkas.|Takk for gaven.}}
* {{test|sme|Giitu skeaŋkka ovddas.|Takk for gaven.}}

* {{test|sme|dálkki geažil|på grunn av været}}
; evt "vær"
* {{test|sme|dan geažil|på grunn av det}}
* {{test|sme|dan geažil|på grunn av det}}
* {{test|sme|dán geažil|på grunn av dette}}
* {{test|sme|dán geažil|på grunn av dette}}
* {{test|sme|munno geažil|på grunn av oss to}}
* {{test|sme|munno geažil|på grunn av oss to}}


* {{test|sme|Son lea bargan journalistan jagi 1983 rájes.|Hun/han har arbeidet som journalist fra 1983.}}
===Miscellaneous===
* {{test|sme|Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen.|Redaktør fra oktober 2015 er Eilif Andreas Aslaksen.}}
* {{test|sme|Anne ráhkada biepmu.|Anne lager mat.}}

==Left-Object+Adv+Main verb==
; move object (dan) after adv (juo) and main verb (oahppan)
* {{test|sme|nuorran son lea dan juo oahppan|som ungdom har han allerede lært det}}
* {{test|sme|nuorran son lea dan oahppan|som ungdom har han lært det}}
; "hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")

; adverbial placement (only adj adverbials move?)
* {{test|sme|Mun láven dávjá lávlut|Jeg pleier ofte å synge}}
*Mun láven árrat lávlut|Jeg pleier synge tidlig
* {{test|sme|Mun láven dávjá goallut|Jeg pleier ofte å fryse}}


==Prepositional choice, mostly caseprep==
* {{test|sme|Mun hálan dálkki birra|Jeg snakker om været}}
* {{test|sme|Mun human fiskes biilla birra|Jeg snakker om en gul bil}}
* {{test|sme|Son lea Norggas|Hun/han er i Norge}}
* {{test|sme|Tine Chris Mathisen lea beassan leat mielde boazobargguin|Tine Chris Mathisen har fått være med på reindriftsarbeidene}}
* {{test|sme|Go gullen sámegiela dien mátkkis|Da jeg hørte samisk på denne reisa}}
: loc has på as default, but gullen selects "fra", should it?
* {{test|sme|Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái.|Jeg gikk barneskolen i Máze fra høsten 1960 inntil sommeren 1966.}}

; (use an np.f first to set the anaphora gender for these tests)
* {{test|sme|Tine lea Norggas eret|Tine er fra Norge}}
* {{test|sme|Son lea Norggas eret|Hun er fra Norge}}
* {{test|sme|Son lea Islandas|Hun er på Island}}
* {{test|sme|Son lea Islandas eret|Hun/han er fra Island}}

* {{test|sme|Märtha Louise oaččui dan 16 jagi áigi.|Märtha Louise fikk det for 16 år siden.}}
* {{test|sme|Märtha Louise oaččui dan 16 jagi dassái.|Märtha Louise fikk det for 16 år siden.}}
* {{test|sme|Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal.|Regjeringene har nedvurdert dette forslaget som ble framført for 11 år siden.}}

* {{test|sme|du idjabeavdeskuffas?|i din nattbordskuff?}}
* {{test|sme|áibmomediagáffe|kringkastingskaffe}}
; yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.




; Der_halla verbs have illative agents
* {{test|sme|Mánná gáskkáhalai beatnagii|Barnet ble bitt av hunden}}
* {{test|sme|Mii fillehalaimet sidjiide|Vi ble narret av dem}}

===Accusative: om - verb and noun based ===
* {{test|sme|Mun bivden veahki.|Jeg bad om hjelp.}}



===Comitative: med ===
* {{test|sme|Rievssatbivdu unnon beliin.|Rypejakta minket med halvparten.}}
* {{test|sme|Boazosápmelaš Jovsset Ánte Sara deaivvadii stáhtain lágamánnerievttis gieskat.|Reindriftssame Jovsset Ánte Sara møtte staten i lagmannsretten nylig.}}

* {{test|sme|Sii deaivvadedje lágamánnerievttis.|De møttes i lagmannsretten.}}

===Illative: på - verb-based===
* {{test|sme|Mun suhtan dutnje|Jeg blir sint på deg}}
* {{test|sme|Mun luohtán dutnje|Jeg stoler på deg}}
* {{test|sme|Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide|Dere to må begynne å tro på slike spøkelseshistorier}}
* {{test|sme|Manne don geahčat munnje?|Hvorfor ser du på meg?}}
* {{test|sme|Mii áigut bidjat kámera láidestanheargái.|Vi skal sette kameraet på lederreinen.}}


===Illative: på - noun/numeral-based===
* {{test|sme|mun dadjen dan sámegillii|jeg sa det på samisk}}
* {{test|sme|Dearvvuođat leat sámegillii.|Hilsningene er på samisk.}}
* {{test|sme|Máhtte báhcá gáddái.|Máhtte blir igjen på stranda.}}
* {{test|sme|Mun ohppen čállit dárogillii.|Jeg lærte å skrive på norsk.}}
* {{test|sme|kánske mun galggan hállat dušše sámegillii.|kanskje skal jeg snakke bare på samisk.}}
* {{test|sme|In oaidnán su logi jahkái.|Jeg så ikke henne/han på ti år.}}
* {{test|sme|Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai.|Her er det sider som kan tolkes på to måter.}}
* {{test|sme|Nu ii leat dáhpáhuvvan 567 jahkái.|Slik har det ikke skjedd på 567 år.}}
* {{test|sme|kánske mun galggan hállat dušše sámegillii dán kanálas.|kanskje skal jeg snakke bare på samisk i denne kanalen.}}

===Illative: med - verb-based===
* {{test|sme|Esther álggii hupmat fuolkkis birra, ja nu oahpásnuvven maiddái sunnje, čilge Skoglund.|Esther begynte å snakke om slektningen, og slik ble jeg kjent også med henne, forklarer Skoglund.|fuolkkis has Px and could be translated to slekningen sin}}

===Illative: for - noun-based===
* {{test|sme|Dál beasat oaidnit Giđđajohtima minuvttas minuktii.|Nå får du se Vårflyttinga minutt for minutt.}}

===Illative: for - verb-based===
* {{test|sme|Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán.|Dette betyr selvfølgelig mye for den personen som har vunnet.}}
* {{test|sme|De livččii Larsenii vejolaš ovdanbuktit ođđajagisártnis sámegillii.|Så hadde det vært for Larsen mulig å framføre nyttårstalen på samisk.}}
* {{test|sme|Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin muhtun suohkaniidda Norggas bálvalit iežas sámegielat álbmoga sámegillii.|Sametinget ser at det kan bli utfordrende for noen kommuner i Norge å betjene sitt samiskspråklige folk på samisk.}}

===Illative: NIL - verb-based===
* {{test|sme|Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui.|Hendelsen berører selvfølgelig det journalistiske arbeidet.}}

===Illative/locative: how many times something happens===
;special rule for these in t1x:
* {{test|sme|Muđui vázzá son beatnagiinnis golbmii beaivái.|Ellers går hun/han med hunden tre ganger om dagen.}}
* {{test|sme|Muđui vázzá son beatnagiinnis golbmii vahkkui.|Ellers går hun/han med hunden tre ganger i uka.}}

;taken care of in nom_out macro, based on previous-nhead:
* {{test|sme|Muđui vázzá son beatnagiinnis golbma diimmu vahkkui.|Ellers går hun/han med hunden tre timer i uka.}}
* {{test|sme|Muđui vázzá son beatnagiinnis golbma diimmu beaivái.|Ellers går hun/han med hunden tre timer om dagen.}}
* {{test|sme|Dát čoahkkimat dollojuvvojit golbma geardde vahkkui.|Disse møtene holdes tre ganger i uka.}}

===locative: fra ===
* {{test|sme|Mun vuolggán Norggas.|Jeg reiser fra Norge.}}

===locative: i ===
* {{test|sme|Mun lean gávppis.|Jeg er i butikken.}}


===locative: etter - noun-based===
* {{test|sme|Mu mielas lea oahpahalliortnet dehálaš.|Etter min oppfatning er lærlingeordning viktig.}}

===locative: om - based on noun to the left===
* {{test|sme|Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas.|I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.}}


* {{test|sme|Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus.|Da det var tale om samebarn som ikke har lært samisk hjemme.}}

===locative: av ===
* {{test|sme|Ii oktage sis hálit kommenteret ášši aviissas.|Ingen av dem vil kommentere saken i avisa.}}
* {{test|sme|Muhto eatnasat sis bissot dálá listtuin.|Men de fleste av dem forblir på nåværende lister.}}
* {{test|sme|Niibbi son lei duddjon stális ja čoarvvis.|Kniven hadde hun/han lagd av stål og horn.}}

===locative: hos - pronoun-based===
* {{test|sme|Mus bođii našunáladovdu.|Hos meg kom en nasjonalfølelse.}}

==Gender, pronouns==
* {{test|sme|Go Tine Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Da Tine Mathisen kom hit nordover så hadde hun allerede lært samisk.}}
* {{test|sme|Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Da Per Mathisen kom hit nordover så hadde han allerede lært samisk.}}

* {{test|sme|Dat lea buot mii mus lea.|Det er alt som jeg har.}}
: (buot is not specified for gender)

==Particles==
* {{test|sme|guhkágo don ledjet doppe?|hvor lenge var du der borte?}}
* {{test|sme|guhká go don ledjet doppe?|hvor lenge var du der borte?}}
: Can we put "guhká go" into the analyser as an mwe?

; Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
* {{test|sme|Baldur go lea boahtán?|er det Baldur som har kommet?}}
* {{test|sme|boađát go dál?|kommer du nå?}}

===Foc===
* {{test|sme|In munge sáhte sárdnut ruoššagillii.|Heller ikke jeg kan tale på russisk.}}
* {{test|sme|Nu jáhkán munge.|Slik tror jeg også.}}

==Numerals==
* {{test|sme|1300-logu|1300-tallet}}

* {{test|sme|113-heahtenummáris|på 113-nødnummeret}}
* {{test|sme|§§ 1-1984.|§§ 1-1984.}}
* {{test|sme|50%|50 %}}
* {{test|sme|50 %|50 %}}
* {{test|sme|50.0 %|50,0 %}}
* {{test|sme|1.1|1.1}}
* {{test|sme|1,1 + 2.13 1,- 10.99|1,1 + 2.13 1,- 10.99}}
* {{test|sme|110f f ja §110a |110f f og §110a}}

* {{test|sme|okta 6 filmmas|en av 6 filmer}}
* {{test|sme|Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá.|Samisk høgskole er en av de høyskolene som fungerer fra høsten.}}


* {{test|sme|gaskal diibmu 17.00 ja 21.00|mellom klokka 17.00 og 21.00}}

* {{test|sme|19 Jovsset|19 Jovsset}}

* {{test|sme|Golmma- njealje|Tre- fire}}
: space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
* {{test|sme|Golmma-njealje|Tre-fire}}



==Collective numbers==
* {{test|sme|artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba.|de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.}}
* {{test|sme|Ođđa vihtaniid čilgehusat nannejit albmáguoktá ášši.|De nye vitnenes forklaringer styrker de to mennenes sak.}}
* {{test|sme|Mun áiggun rehkenastit gallis mii leat dán háve.|Jeg skal regne ut hvor mange vi er denne gang.}}

==Dates==
* {{test|sme|Min ráhkis Ánne deavdá 10 jagi golggotmánu 10. beaivvi.|Vår kjære Ánne fyller 10 år 10. oktober.}}
* {{test|sme|FeFo stivra galgá 24. beaivve dán mánus mearridit maid barget áššiin.|FeFos styre skal bestemme den 24. denne måneden hva de gjør med saken.}}
* {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
* {{test|sme|cuoŋománu 15. b. lea|15. april er det}}
* {{test|sme|Dat dáhpáhuvvá suoidnemánu loahpas.|Det skjer i slutten av juli.}}
* {{test|sme|Festivála lágiduvvo dán jagi suoidnemánu 1. beaivvi, nu go dábálaččat Bieskkenjárggas Kárášjogas.|Festivalen arrangeres dette året 1. juli, slik som vanligvis i Bieskkenjárga i Karasjok.}}
* {{test|sme|Festivála lágiduvvui mannan jagi suoidnemánu 1. beaivvi.|Festivalen ble arrangert siste året 1. juli.}}

==Add infinitive marker==
* {{test|sme|Mun lean heaitán borgguheames.|Jeg har sluttet å røyke.}}
* {{test|sme|Mus lea biergu vuoššat.|Jeg har kjøtt for å koke.}}
: actually "til å koke"
* {{test|sme|Geahččaledje jeđđet min.|De prøvde å trøste oss.}}
* {{test|sme|Mun mannen olggos borgguhit.|Jeg gikk ut for å røyke.}}
* {{test|sme|Mun heiten borgguheames.|Jeg sluttet å røyke.}}
* {{test|sme|Mun lean hárjanan borgguhit.|Jeg har blitt vant til å røyke.}}
* {{test|sme|Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus.|Hun/han kan være med å styrke reindriftas overlevelse i et sårbar område.}}

==MWE verbs==
; all lemq's should be able to move past subjects and adverbs
* {{test|sme|ovddasvástideigga soai|hadde de to ansvar for}}
: or "de to hadde ansvar for"? (fragment...)

; verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
* {{test|sme|Fuomášuhttit máná.|Gjøre barnet oppmerksom på.}}

;from passive to reflexive
* {{test|sme|Čájehuvvui ahte bođii suovva olggos skuvllas.|Det viste seg at det kom røyk ut fra skolen.}}

==Relative clauses==
===Agent construction===
* {{test|sme|du čállin reivve|brev som du har skrevet}}
: was: ''hadde skrevet''. Shall be: ''har skrevet''
* {{test|sme|Nuoraid čállin teavsttat sámegillii.|Tekster som ungdommene har skrevet på samisk.}}
: etc.

==Interjections==
* {{test|sme|Buorre eahket.|God kveld.}}
* {{test|sme|Buorre beaivi.|God dag.}}
* {{test|sme|Bures boahtin.|Velkommen.}}


==Lexical selection==

=== orrut → 0:synes, 1:bo, 2:bli, 3:være ===
* {{test|sme|Doppe son orui vahku.|Der borte bodde hun/han ei uke.}}

=== adjectives ===
* {{test|sme|garra dálkki geažil|på grunn av dårlig vær}}

===adpositions===
* {{test|sme|Min álbmoga boahtteáigi lea ráđđehusa duohken.|Vårt folks framtid er avhengig av regjeringa.}}
* {{test|sme|Noaidi ii lean bovnna duohken.|Sjamanen var ikke bak tua.}}

==Questions==
* {{test|sme|Guldalat go don?|Lytter du?}}

* {{test|sme|In guldal|Jeg lytter ikke}}

==vbser-drop==
* {{test|sme|Vare mun doppe dahje son dáppe.|Gid jeg der borte eller hun/han her.}}
: WORKS – Do we have to insert a verb?

==Setningstilsvar vs advl/obj-setning==


;obj.setn
* {{test|sme|Máhtte muitalii ahte áddjá boahtá.|Máhtte fortalte at bestefar kommer.}}

==leat → 0:være, 1:ha, 2:måtte==
* {{test|sme|Mánát leat boahtán skuvlii.|Barna har kommet til skolen.}}

==Miscellaneous==
* {{test|sme|Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi.| Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida.}}

* {{test|sme|Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui.|Men minst en gang er skolen blitt brukt til det at vi retter på de viltre ungdommene i stedet for å sende dem til skolehjemmet.}}

===Include name to the chunk===
* {{test|sme|Mii váillahit dáidda- ja kulturoasi Hjertespråket guorahallamis.|Vi savner kunst- og kulturelementet i *Hjertespråket utredninga.}}

* {{test|sme|Álbmotskuvlla ja oahpaheaddjiseminára gaskasaš áigi.|Tida mellom folkeskole og lærerseminar.}}


===Unknown===
* {{test|sme|«Prosject» ávvuda vihtta jagi.|«*Prosject» feirer fem år.}}
* {{test|sme|«Prosject Z» ávvuda vihtta jagi.|«*Prosject z» feirer fem år.}}

==Appositions==
* {{test|sme|Eilif Andreas Aslaksen (53) lea bajásšaddan Deanus.|Eilif Andreas Aslaksen (53) har vokst opp i Tana.}}
* {{test|sme|Sámesearvvi jođiheaddji, Mikkel Eskil Mikkelsen, lea hui duhtavaš.|Sameforeningens leder, Mikkel Eskil Mikkelsen, er svært fornøyd.}}

* {{test|sme|Atná sámi árbevieru árvvus.|Hun/han anser samisk tradisjon som verdifull.}}


; vaikko mii osv.
* {{test|sme|Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat.|Det er fredelig og samtidig kan hva som helst skje.}}


; mii→hva som in certain contexts
* {{test|sme|Fuomášedje mii lea dáhpáhuvvamin.|De oppdaget hva som er i ferd med å skje.}}

; mii→som
* {{test|sme|Seammás Bargiidbellodat lea sidjiide áidna bellodat mas lea sosialdemokráhtalaš ideologiija.|Samtidig er Arbeiderpartiet for dem det eneste partiet som har en sosialdemokratisk ideologi.}}



; man→hvor before adj
* {{test|sme|Eadni muitalii man dehálaš dat lei ahte...|Mor fortalte hvor viktig det var at...}}

* {{test|sme|Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan.|Etter at Kunnskapsløftet begynte å fungere, så har dette tilskuddet forsvunnet.}}


* {{test|sme|su iežas|hennes/hans egen}}

; fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors

* {{test|sme|eanan- ja luonddudoahpagiid|landskaps- og naturbegrep}}
* {{test|sme|munno|oss to}}
* {{test|sme|Ruvdnaprinseassa Märtha ja moai letne|Kronprinsesse Märtha og vi to er}}
* {{test|sme|Prinseassa Märtha ja earát|Prinsesse Märtha og andre}}
* {{test|sme|Märtha ja earát|Märtha og andre}}

* {{test|sme|galbmit|fryse til}}
* {{test|sme|Beavdi sirdui nuppi latnjii.|Bordet ble flyttet til det andre rommet.}}


* {{test|sme|Lei okta dehálaš erohus.|Det var en viktig forskjell.}}

* {{test|sme|Ánne ráhkada biepmu.|Ánne lager mat.}}
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}}
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}}
* {{test|sme|22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái.|22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland.}}
* {{test|sme|vuolgit lea suohtas.|å reise er morsomt.}}
* {{test|sme|Go Gonagas Olav buohccái 1990 giđa.|Da Kong Olav ble syk våren 1990.}}


* {{test|sme|juohke lágán geđggiiguin|med alle slags steiner}}

* {{test|sme|Lei unnán mii earuhii nuorra prinssa skuvlavázzima eará skuvlamánáin.|Det var lite som skilte den unge prinsens skolegang fra de andre skolebarnene.}}

;work-in-progress, Pron N chunking:
* {{test|sme|Sámi allaskuvla lea okta dain allaskuvllain.|Samisk høgskole er en av de høyskolene.}}

* (1998-99) Utjamningsmeldinga.|(1998-99) Utjamningsmeldinga.
: right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89

* {{test|sme|Mii vurddiimet dálkki buorránit.|Vi ventet at været skulle bedres.}}

* {{test|sme|Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii.|Kommunen var positiv nettopp så langt som loven pliktet.}}

* {{test|sme|Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja|Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og}}


; MWE nouns
* {{test|sme|go dát ii leat suohkangeaidnu|når dette ikke er kommunal vei}}
: dette/denne should both be ok here

; pro insertion override
* {{test|sme|Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái.|Det er så langt borte at barna ikke lenger når frem til reinen.}}
* {{test|sme|Lea nu guhkkin ahte eai mánát olle bohcco rádjái.|Det er så langt borte at barna ikke når frem til reinen.}}


* {{test|sme|Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe.|Det er så langt borte at barna ikke når frem til reinen der borte.}}



[[Category:Northern Sámi and Norwegian]]
[[Category:Northern Sámi and Norwegian]]

Latest revision as of 11:01, 24 December 2020

Contents

Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Pending tests.

Nouns[edit]

  • (sme) Mus lea biila. → Jeg har en bil.
  • (sme) Mun válden biilla. → Jeg tok bilen.


Accusative
  • (sme) Oainnátgo máná? → Ser du barnet?
Genitive
  • (sme) Mii lea máná namma? → Hva er barnets navn?


num nom.gen => num nom
  • (sme) Máhtte máksá guokte ruvnnu. → Máhtte betaler to kroner.
  • (sme) Girji máksá guokte ruvnnu. → Boka koster to kroner.
num.mod nom => num nom
  • (sme) Guokte ruvnnu leat boahtán. → To kroner har kommet.


det nom.gen nom (det.gender from first nom)
  • (sme) Dán lihtu ulbmil lea addit. → Denne alliansens mål er å gi.

Nouns[edit]

  • (sme) Mii mannat politiijastašuvdnii. → Vi drar til politistasjonen.
  • (sme) Mun bargen sin mielbargin. → Jeg arbeidet som deres medarbeider.
  • (sme) muohtasuddama → snøsmelting
  • (sme) giellarevitaliseren → språkrevitalisering

Proper nouns[edit]

  • (sme) Gonagas Harald → Kong Harald
  • friddja Norgii|til det frie Norge ?
  • (sme) Anne Tornensis Hætta → Anne Tornensis Hætta
  • (sme) Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje. → etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter.

Insert determiner[edit]

  • (sme) Son lea čeahpes bárdni. → Han er en flink gutt.
  • (sme) Son lea čeahpes nieida. → Hun er ei flink jente.
  • (sme) Su namma lea Máret. → Hennes navn er Máret.
  • (sme) Buohtastahte eará gielaiguin. → Sammenlign med andre språk.


or not
  • (sme) Vuosttas instruvssat → De første instruksene
  • (sme) Áviisa almmuhuvvo gitta lávvardahkii. → Avisen publiseres helt til lørdag.
  • (sme) Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin. → Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.
  • (sme) Nuorta-Finnmárkui lea Ukjendord OS hutkame hukset guokte bieggamillopárkka → Til Øst-Finnmark er *Ukjendord AS i ferd med å finne på å bygge to vindmølleparker

Pronouns[edit]

  • (sme) dan → det
  • (sme) Dat leat ártegis olbmot. → De er rare folk.
  • (sme) Dat lea mu beavdi. → Det er mitt bord.
  • (sme) goappat → hver

Reflexive, ieš emphatic[edit]

Nominative => selv
  • (sme) Jus in livčče mun ieš. → Hvis jeg ikke hadde vært meg selv.
  • Máhttu lea ieš namma.|Kunnskapen er selve navnet.
fragment, just to ensure 'selv'

Reflexive pronoun inflected[edit]

Accusative => seg selv
  • (sme) Áhkku geahčai iežas speadjalis. → Bestemor så seg selv i speilet.
  • (sme) Son lábmii iežas. → Hun/han skadet seg selv.


Postposijonskomplement => acc
  • (sme) Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá. → Vibeke Larsen så det som mistillitsuttalelse mot seg.
  • (sme) Mun oidnen dan eahpeluohttámuššan iežan vuostá. → Jeg så det som mistillit mot meg.


Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
  • (sme) Váldde biergasiid iežat fárrui. → Ta tingene med deg.
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela. → Samiske barn behøver støtte for å bevare og utvikle sitt språk. :: for å
  • (sme) Mun ferten čorget iežan lanja. → Jeg må rydde mitt rom.
  • (sme) Son čorgii iežas lanja. → Hun/han ryddet sitt rom.
  • (sme) Mun ohppen čállit sámegiela, iežan eatnigiela. → Jeg lærte å skrive samisk, mitt morsmål.
  • (sme) Moai válde dušše iežame biergasiid mielde. → Vi to tar bare våre ting med.
  • (sme) Doai váldibeahtti dušše iežade biergasiid mielde. → Dere to tar bare deres ting med.
Genitive followed by Pron.Gen => egen
  • (sme) Dat lea mu iežan sivva. → Det er min egen skyld.
Illativ => seg selv
  • (sme) Mánát guvle alcceseaset speadjalis. → Barna kikket på seg selv i speilet.
"på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
Locative => selv
  • (sme) Mis leat alddámet ain šibihat. → Vi har selv enda husdyr.
Comitative => seg selv
  • (sme) Mun jurddašin iežainan. → Jeg tenkte med meg selv.
Essive => på egen hånd
  • (sme) Moai birgejetne iehčaneame. → Vi to greier oss på egen hånd.
iehčanassii_1 => alene (adverb)
  • (sme) Mánát leat iehčanassii ruovttus. → Barna er alene hjemme.


Nonreferential(?) pronouns[edit]

  • (sme) ii mihkkege almenneha birra. → ingenting om allmenningen.
  • (sme) Gávdnetgo maidege? → Fant du noe?
  • (sme) ii mihkkege leat buorre. → ingenting er bra.
  • (sme) ii goabbáge leat buorre. → ingen av dem er bra.
  • (sme) in oastte goappáge. → jeg kjøper ikke noen.

Anaphora resolution[edit]

  • (sme) Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui. → Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.


Adjectives[edit]

  • (sme) Skuvllat ja oahpahusbáikkit leat deháleamos báikkit. → Skolene og undervisningsstedene er de viktigste stedene.
  • (sme) Goabbá lea deháleabbo, boraspire vai olmmoš? → Hvilken av de to er viktigere, rovdyr eller menneske?


  • (sme) almmolaš bálvalusaide → til offentlige tjenester
  • (sme) Mii dárbbašit sámegielat bargi. → Vi behøver samiskspråklig ansatt.
  • (sme) min nuoramus olbmot → våre yngste folk
  • (sme) min nuoramus bárdnái → til vår yngste gutt
  • (sme) Muhtun guovlluin lea oahpahus deháleamos doaibma. → I noen områder er undervisning den viktigste oppgaven.
  • (sme) mu stuora váivái → til mitt store besvær

superlatives[edit]

  • (sme) Máŋga jagi son lea leamaš buoremusaid searvvis. → Mange år har hun/han vært blant de beste.
adj-noun compound vs first cmp part alone
  • (sme) gáiddusoahpahussii → til fjernundervisning
  • (sme) gáiddus → fjerntliggende


  • (sme) smávvaaviisa → småavis


non-synthetic
  • (sme) sávrribut → mer utholdende
Pron.Indef → A.Attr hack
  • (sme) Sámi guovlluid iešguđet gielladilit. → Samiske områders ulike språksituasjoner.


gender
  • (sme) Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái. → Jeg tror at dette har påvirket mer positivt deres identitetsutvikling.

From Prfprc to Adjectives[edit]

  • {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}

Adverbs[edit]

  • (sme) Lea ain deháleabbo ovttasbargat bures. → Det er enda viktigere å samarbeide godt.
  • (sme) Máilbmi lea rievdan das rájes go son lávllui dien šuoŋa. → Verden har forandret seg siden hun/han sang denne melodien.

Move adverb[edit]

  • (sme) Sámediggepresideanta Larsen fas hállá. → Sametingspresident Larsen snakker igjen.

Verbs[edit]

  • (sme) goarun → jeg syr
imp
  • (sme) jeara → spør
  • (sme) Sihko dán. → Stryk dette.


Potensialis[edit]

  • (sme) Máhtte ii leačča čállán. → Máhtte har så ikke skrevet.
  • (sme) Son ii leačča čállán. → Han har så ikke skrevet.
  • (sme) Mot leaččai dasto mánáide dain leairrain? → Hvordan var det så så for barn i de leirene?

Kondisjonalis[edit]

  • (sme) jearašin → jeg kunne spørre
  • (sme) jearašeimmet → vi kunne spørre
  • (sme) Itgo veahkehivčče mu? → Kunne du ikke hjelpe meg?

Kondisjonalis med leat[edit]

  • (sme) Livččii lunddolaš geahčadit dán. → Det hadde vært naturlig å granske dette. :: main verb
  • (sme) Oahpaheaddjit livčče sáhttán gieđahallat ášši buorebut. → Lærerne hadde kunnet behandle saken bedre. :: aux verb

Pro-drop[edit]

  • (sme) dihten → jeg visste
  • (sme) diđiide → dere to visste
  • (sme) diđiimet → vi visste
  • (sme) Ii vel dieđe gos áigu bargat. → Hun/han vet ikke enda hvor hun/han skal arbeide.
expletive/existential (nt, not mf)
  • (sme) Dás čujuhuvvo njuolggadusaide. → Her vises det til regler.
pass→nt
  • (sme) báitá → det skinner
  • (sme) Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin. → Sametinget ser at det kan bli utfordrende.

Verb abessive[edit]

  • (sme) Skuvllat ovttasbarget beroškeahttá riikarájáin. → Skolene samarbeider uten å bry seg om riksgrensene.

existential[edit]

  • (sme) Guovdageainnus lei dievas soahti mannan vahku. → I Kautokeino var det full krig sist uke.
  • (sme) Guovdageainnus lea allaskuvla. → I Kautokeino er det høyskole.
  • (sme) Dat čuohcá sidjiide geain eai leat oahpaheaddjit. → Det berører dem som ikke har lærere.
  • (sme) Tiimmu ovdal gaskaija leat kulturdoalut Kárášjoga čierastanluohkás. → Timen før midnatt er det kulturarrangement i Karasjoks slalåmbakke.
  • (sme) Vaikko leat muhtin erohusat, de sáhttá buohtastahttit sin vieruid min vieruiguin. → Selv om det er noen forskjeller, så kan man sammenligne deres skikker med våre skikker.
  • (sme) Čoahkkimis galgá ráhkaduvvot ođđa plána. → På møtet skal det lages en ny plan.
  • (sme) Dušše Hámmárfeasttas ii leat njiedjan diimmá rájes. → Bare i Hammerfest er det ikke gått ned siden i fjor.
  • (sme) arvá → det regner
  • (sme) Máhppii lea sierra čilgehus. → Til mappa er det en særskilt forklaring.
  • (sme) Jođiheaddjibargui manná ollu áigi. → Til lederarbeidet går det mye tid.
  • (sme) Dasa leat vissásit ollu čilgehusat. → Til det er det sikkert mange forklaringer.
man
  • (sme) Dasto galgá vuodjat dainna olbmuin. → Så skal man svømme med det mennesket.
  • (sme) Dál ferte soabadanproseassa álggahit. → Nå må man igangsette forsoningsprosessen.
override with relatives
  • (sme) Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii. → Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.
  • (sme) Stuorámus dáhpáhus mii goassege lea leamaš. → Den største hendelsen som noensinne har vært.

Don't insert pro[edit]

  • (sme) Dan galgá Anne muitalit Sápmái. → Det skal Anne fortelle til Sameland.
  • (sme) Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái. → Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.



Verb=>adv[edit]

dáidit => nok
  • (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe. → Máhtte stemmer nok ikke på Arbeiderpartiet der borte.
soaitit => kanskje
  • (sme) Son soaitá boahtit ruoktot. → Han kommer kanskje hjem.
ii => ikke
  • (sme) Son ii leat čállán. → Han har ikke skrevet.
  • (sme) Ii lean čállán. → Hun/han hadde ikke skrevet.
  • (smeIIi lean čállimin.) Hun/han var ikke i ferd med å skrive. → {{{3}}}
  • (sme) Ii lean čállime. → Hun/han var ikke i ferd med å skrive.
  • (sme) Máhtte lea boahtán. → Máhtte har kommet.
  • (sme) Ii leat boahtán. → Hun/han har ikke kommet.
capital case
evt. "han" (but can it ever be "det"?)
  • (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet

V2 (negative, subordination, qst, object)[edit]

  • (sme) Itgo boađáše? → Kunne du ikke komme?
  • (sme) It boađáše. → Du kunne ikke komme.
  • (sme) Máhtte ii boađe. → Máhtte kommer ikke.
  • (sme) go it boađáše. → når du ikke kunne komme.
når eller at?
  • (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
kaffe.unc
  • (sme) Maid áiggot bargat go heaittát barggus? → Hva skal du gjøre når du slutter i jobben?
  • (sme) Mii maiddái ássat. → Vi bor også
  • (sme) Mu bealis dat dušše nannejuvvui. → For meg ble det bare styrket.
  • (sme) Muhto sámediggepresideantta baicce ii hálit giellaguovddášjođiheaddji cuiggodit dan dihtii go presideanta ii sámástan ođđajagisártnistis. → Men sametingspresidenten derimot vil ikke språksenterlederen kritisere fordi at presidenten ikke snakket samisk i nyttårstalen.
  • (sme) Muhto sámediggepresideantta ii hálit giellaguovddášjođiheaddji cuiggodit. → Men sametingspresidenten vil ikke språksenterlederen kritisere.
  • (sme) Mii sávvat sutnje bures boahtin, rektor Gunvor Guttorm cealká. → Vi ønsker henne/han velkommen, sier rektor Gunvor Guttorm.

Not V2[edit]

  • (sme) Eiseválddit leat dohkkehan sin rusttega nu movt dat lea dál. → Myndighetene har godkjent deres anlegg slik som det er nå.

FV + IV[edit]

  • (sme) Mun ferten viežžat čázi. → Jeg må hente vann.

wh-question[edit]

  • (sme) Maid don jugat? → Hva drikker du?
  • (sme) Leago duohta? → Er det sant?

Present progressive[edit]

  • (sme) Máhtte lea čállime. → Máhtte er i ferd med å skrive.
or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
  • (sme) ii leat čállimin. → hun/han er ikke i ferd med å skrive.
  • (sme) ii leat čállime. → hun/han er ikke i ferd med å skrive.
  • (sme) ii leačča čállimin. → hun/han er så ikke i ferd med å skrive.
  • (sme) ii leačča čállime. → hun/han er så ikke i ferd med å skrive.

Essive utfyllingspredikat[edit]

remove case-prep in t2x if following or preceding vcop
  • (sme) Son lea taksivuoddjin Oslos. → Hun/han er drosjesjåfør i Oslo.
  • (sme) Mus lea Ánde mielbargin. → Jeg har Ánde som medarbeider.
  • (sme) Sin bargun lei. → Deres arbeid var det.

Actio Ess[edit]

Topic/Focus stuff[edit]

  • (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
  • (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
evt. "faren"


Passive[edit]

  • (sme) Go su áhčči jámii de gildui. → Da hennes/hans far døde så ble det forbudt.
  • (sme) Dađistaga gildui sámegiella. → Etter hvert ble samisk forbudt.
  • (sme) dan maŋŋá gildui sámegiella. → etter det ble samisk forbudt.

"Passive" single verb => bli + adj[edit]

  • (sme) Dál dii fertebehtet geargat. → Nå må dere bli ferdige.
geargat => ferdig.adj/pass__verb

Setningstilsvar vs advl/obj-setning[edit]

  • (sme) Máhtte muitalii ádjá boahtit. → Máhtte fortalte at bestefar kommer.
  • (sme) Máhtte logai sin vuolgit dál juo. → Máhtte sa at de reiser nå allerede.
is logai completely ambiguous between lese/si? difficult lex.sel...
  • (sme) Jáhkken kulturmáhtu leat oktan ággan. → Jeg trodde at kulturkompetansen er et argument.

Negative preterite using PrfPrc form[edit]

  • (sme) Mon gullen ahte áddjá ii dovdan dan lottáža. → Jeg hørte at bestefar ikke kjente den småfuglen.
  • (sme) vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta. → for at flegmatisk okkupasjonsmakt ikke fikk ta dem fast.
  • (sme) Harald vuortnui ahte ii áigon čuohppat vuovttaid. → Harald sverget at han ikke skulle klippe håret.
TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
  • (sme) ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá. → at Norge ikke kunne greie seg mot en flegmatisk krigsmakt.

Derivation[edit]

  • (sme) Son lei dalle sullii 60-jahkásaš. → Han var da omtrent 60-åring.
  • (sme) 32-jahkásaš čiekči máhccá fas Romsii. → 32-årig fotballspiller drar tilbake igjen til Tromsø.
  • (sme) 5-jahkásaččaid bátnedearvvašvuohta ii leat gal mánáid duohken. → 5-åringenes tannhelse er ikke avhengig av barna.


Inchoative[edit]

Verb / Der3 / goahti
  • (sme) boradišgohten → jeg begynte å spise
evt "holde måltid"?
  • (sme) lohkagohten → jeg begynte å lese
don't chunk it all, might want to insert adverbs
  • (sme) ii lohkagoađe. → hun/han begynner ikke å lese.


Passive[edit]

Verb / Der2 / Der_PassL
  • (sme) don borrojuvvot → du spises
insert det , give ind
  • (sme) Čoahkkimis galgá ráhkaduvvot plána. → På møtet skal det lages en plan.

Reflexive verb[edit]

Verb
  • (sme) Son basadii. → Hun/han vasket seg.
(bidix-specified lexical reflexive 'basadit')
  • (sme) ja de háliidin beassat 20 buoremusa searvái. → og så ville jeg komme meg blant de 20 beste.
  • (sme) de dusten sávvat beassat 20 buoremusa searvái. → så torde jeg å ønske å komme meg blant de 20 beste.
  • (sme) Mii leat čoahkkanan digaštallat ášši. → Vi har samlet oss for å debattere saken. :: for å

Causative[edit]

  • (sme) don fertet vuos beatnaga čuogahit. → du må først la hunden drikke.
Verb / Der1 / Der_h
  • (sme) Muhto mánámánnái áiggun goaruhit gávtti. → Men til barnebarnet skal jeg la sy kofte.
Verb / Der2 / Der_ahtti
  • (sme) Sii leat jorgalahttán gihppaga sámegillii. → De har latt oversette heftet til samisk.

Adj vs Noun[edit]

Adjective / Der3 / Der_vuohta => N
  • (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta. → kjærlighet og fattigdom og det grunne.
last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)

Noun vs adjective (sámi - samisk)[edit]

  • (sme) Sámi mánáidgárdin oaivvilduvvo dat mánáidgárdi mii mearrádusaid bokte lea vuođđudan mánáidgárdedoaimma sámi gillii ja kultuvrii. → Som samisk barnehage menes det den barnehagen som har via bestemmelsene grunnlagt barnehagedriften på samisk språk og kultur.
  • (sme) Sámi pedagogalaš bargi bargá doppe. → Samisk pedagogisk ansatt arbeider der borte.
  • (sme) Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis. → Flink samisk pedagogisk ansatt arbeider i barnehagen.
  • (sme) Sámi gievkkanbargi bargá mánáidgárddis. → Samisk kjøkkenansatt arbeider i barnehagen.

Adjective vs noun (guovdageaidnulaš - kautokeinoværing)[edit]

  • (sme) Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu. → I går fikk kautokeinoværing over 1,3 millioner kroner.


Noun phrases[edit]

  • (sme) riikka nubbi davvisámegiel namma → landets andre nordsamiske navn


Essive[edit]

^@SPRED v@ADVL
  • (sme) Nuorran son orui Romssas. → Som ungdom bodde hun/han i Tromsø. :: I ungdommen

NIL[edit]

  • (sme) Prográmmaid gohčodit hiljes-TV:n. → Programmene kaller vi sakte-TV.


  • (dáčča skuvlla kopija) en kopi av den norske skolen → {{{3}}}
  • (Guovdageainnu suohkana sátnejođiheaddji) ordfører av Kautokeino kommune → {{{3}}}
output as two chunks
  • (nb) Dronnet Sonja → Dronning Sonja
  • (nb) Ruvdnaprinsa Harald → Kronprins Harald
adj n.gen n.com
  • (sme) Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin. → Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer.
cmp
  • (sme) Mii manahit máŋgga vejolaš sámegieloahpaheaddji. → Vi mister mange mulige samisklærere.
cmp.guio
  • (sme) Danne heaitá Aslaksen Wikipedia-hoavdan. → Derfor slutter Aslaksen som Wikipedia-sjef.

Definiteness[edit]

subject (guessing...)
  • (sme) Mánná oađđá. → Barnet sover.


  • (sme) Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui. → Sist vinter reiste ei gruppe til Karasjok og Kautokeino.
  • (sme) Giella lei stuorámus váttisvuohta. → Språket var det største problemet.
  • (sme) Mii leat dál gieldda stuorimus mánáidgárdi. → Vi er nå kommunens største barnehage.
mass vs count
  • (sme) Máhtte ráhkada biepmu. → Máhtte lager mat.
  • (sme) Oainnátgo máná? → Ser du barnet?
  • (sme) Skuvla lea leamaš stuorimus oassi prošeavttas. → Skolen har vært den største delen av prosjektet.

leat => har/er/må[edit]

  • (sme) Mis lea cahkkehit dola. → Vi må tenne på bålet.

Coordination[edit]

  • (sme) Ruoŧas ja Norggas → I Sverige og Norge
  • (sme) Stáhta geaidnodoaimmahat lea dál čállán šiehtadusa Ákŋoluovtta muohtačorgenbargguide. → Statens vegvesen har nå skrevet en avtale om Hasviks snøryddingarbeider.
  • (sme) Ministtar bođii, lohpidii ja manai fas. → Ministeren kom, lovde og gikk igjen.

V2[edit]

  • (sme) Son orui Romssas mánnán. → Hun/han bodde i Tromsø som barn.
  • (sme) Muhto mun orun Kárášjogas. → Men jeg bor i Karasjok.

Adpositions[edit]

  • (sme) Mus lea oahpahus gaskkal guovtti ja njealji. → Jeg har undervisning mellom to og fire.
Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
  • (sme) Logut leat sturron jagis jahkái. → Tallene har blitt større år for år.


  • (sme) Giitu skeaŋkkas. → Takk for gaven.
  • (sme) Giitu skeaŋkka ovddas. → Takk for gaven.
  • (sme) dálkki geažil → på grunn av været
evt "vær"
  • (sme) dan geažil → på grunn av det
  • (sme) dán geažil → på grunn av dette
  • (sme) munno geažil → på grunn av oss to
  • (sme) Son lea bargan journalistan jagi 1983 rájes. → Hun/han har arbeidet som journalist fra 1983.
  • (sme) Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen. → Redaktør fra oktober 2015 er Eilif Andreas Aslaksen.

Left-Object+Adv+Main verb[edit]

move object (dan) after adv (juo) and main verb (oahppan)
  • (sme) nuorran son lea dan juo oahppan → som ungdom har han allerede lært det
  • (sme) nuorran son lea dan oahppan → som ungdom har han lært det
"hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
adverbial placement (only adj adverbials move?)
  • (sme) Mun láven dávjá lávlut → Jeg pleier ofte å synge
  • Mun láven árrat lávlut|Jeg pleier synge tidlig
  • (sme) Mun láven dávjá goallut → Jeg pleier ofte å fryse


Prepositional choice, mostly caseprep[edit]

  • (sme) Mun hálan dálkki birra → Jeg snakker om været
  • (sme) Mun human fiskes biilla birra → Jeg snakker om en gul bil
  • (sme) Son lea Norggas → Hun/han er i Norge
  • (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reindriftsarbeidene
  • (sme) Go gullen sámegiela dien mátkkis → Da jeg hørte samisk på denne reisa
loc has på as default, but gullen selects "fra", should it?
  • (sme) Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái. → Jeg gikk barneskolen i Máze fra høsten 1960 inntil sommeren 1966.
(use an np.f first to set the anaphora gender for these tests)
  • (sme) Tine lea Norggas eret → Tine er fra Norge
  • (sme) Son lea Norggas eret → Hun er fra Norge
  • (sme) Son lea Islandas → Hun er på Island
  • (sme) Son lea Islandas eret → Hun/han er fra Island
  • (sme) Märtha Louise oaččui dan 16 jagi áigi. → Märtha Louise fikk det for 16 år siden.
  • (sme) Märtha Louise oaččui dan 16 jagi dassái. → Märtha Louise fikk det for 16 år siden.
  • (sme) Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal. → Regjeringene har nedvurdert dette forslaget som ble framført for 11 år siden.
  • (sme) du idjabeavdeskuffas? → i din nattbordskuff?
  • (sme) áibmomediagáffe → kringkastingskaffe
yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.



Der_halla verbs have illative agents
  • (sme) Mánná gáskkáhalai beatnagii → Barnet ble bitt av hunden
  • (sme) Mii fillehalaimet sidjiide → Vi ble narret av dem

Accusative: om - verb and noun based[edit]

  • (sme) Mun bivden veahki. → Jeg bad om hjelp.


Comitative: med[edit]

  • (sme) Rievssatbivdu unnon beliin. → Rypejakta minket med halvparten.
  • (sme) Boazosápmelaš Jovsset Ánte Sara deaivvadii stáhtain lágamánnerievttis gieskat. → Reindriftssame Jovsset Ánte Sara møtte staten i lagmannsretten nylig.
  • (sme) Sii deaivvadedje lágamánnerievttis. → De møttes i lagmannsretten.

Illative: på - verb-based[edit]

  • (sme) Mun suhtan dutnje → Jeg blir sint på deg
  • (sme) Mun luohtán dutnje → Jeg stoler på deg
  • (sme) Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide → Dere to må begynne å tro på slike spøkelseshistorier
  • (sme) Manne don geahčat munnje? → Hvorfor ser du på meg?
  • (sme) Mii áigut bidjat kámera láidestanheargái. → Vi skal sette kameraet på lederreinen.


Illative: på - noun/numeral-based[edit]

  • (sme) mun dadjen dan sámegillii → jeg sa det på samisk
  • (sme) Dearvvuođat leat sámegillii. → Hilsningene er på samisk.
  • (sme) Máhtte báhcá gáddái. → Máhtte blir igjen på stranda.
  • (sme) Mun ohppen čállit dárogillii. → Jeg lærte å skrive på norsk.
  • (sme) kánske mun galggan hállat dušše sámegillii. → kanskje skal jeg snakke bare på samisk.
  • (sme) In oaidnán su logi jahkái. → Jeg så ikke henne/han på ti år.
  • (sme) Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai. → Her er det sider som kan tolkes på to måter.
  • (sme) Nu ii leat dáhpáhuvvan 567 jahkái. → Slik har det ikke skjedd på 567 år.
  • (sme) kánske mun galggan hállat dušše sámegillii dán kanálas. → kanskje skal jeg snakke bare på samisk i denne kanalen.

Illative: med - verb-based[edit]

  • (sme) Esther álggii hupmat fuolkkis birra, ja nu oahpásnuvven maiddái sunnje, čilge Skoglund. → Esther begynte å snakke om slektningen, og slik ble jeg kjent også med henne, forklarer Skoglund. :: fuolkkis has Px and could be translated to slekningen sin

Illative: for - noun-based[edit]

  • (sme) Dál beasat oaidnit Giđđajohtima minuvttas minuktii. → Nå får du se Vårflyttinga minutt for minutt.

Illative: for - verb-based[edit]

  • (sme) Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán. → Dette betyr selvfølgelig mye for den personen som har vunnet.
  • (sme) De livččii Larsenii vejolaš ovdanbuktit ođđajagisártnis sámegillii. → Så hadde det vært for Larsen mulig å framføre nyttårstalen på samisk.
  • (sme) Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin muhtun suohkaniidda Norggas bálvalit iežas sámegielat álbmoga sámegillii. → Sametinget ser at det kan bli utfordrende for noen kommuner i Norge å betjene sitt samiskspråklige folk på samisk.

Illative: NIL - verb-based[edit]

  • (sme) Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui. → Hendelsen berører selvfølgelig det journalistiske arbeidet.

Illative/locative: how many times something happens[edit]

special rule for these in t1x
  • (sme) Muđui vázzá son beatnagiinnis golbmii beaivái. → Ellers går hun/han med hunden tre ganger om dagen.
  • (sme) Muđui vázzá son beatnagiinnis golbmii vahkkui. → Ellers går hun/han med hunden tre ganger i uka.
taken care of in nom_out macro, based on previous-nhead
  • (sme) Muđui vázzá son beatnagiinnis golbma diimmu vahkkui. → Ellers går hun/han med hunden tre timer i uka.
  • (sme) Muđui vázzá son beatnagiinnis golbma diimmu beaivái. → Ellers går hun/han med hunden tre timer om dagen.
  • (sme) Dát čoahkkimat dollojuvvojit golbma geardde vahkkui. → Disse møtene holdes tre ganger i uka.

locative: fra[edit]

  • (sme) Mun vuolggán Norggas. → Jeg reiser fra Norge.

locative: i[edit]

  • (sme) Mun lean gávppis. → Jeg er i butikken.


locative: etter - noun-based[edit]

  • (sme) Mu mielas lea oahpahalliortnet dehálaš. → Etter min oppfatning er lærlingeordning viktig.

locative: om - based on noun to the left[edit]

  • (sme) Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas. → I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.


  • (sme) Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus. → Da det var tale om samebarn som ikke har lært samisk hjemme.

locative: av[edit]

  • (sme) Ii oktage sis hálit kommenteret ášši aviissas. → Ingen av dem vil kommentere saken i avisa.
  • (sme) Muhto eatnasat sis bissot dálá listtuin. → Men de fleste av dem forblir på nåværende lister.
  • (sme) Niibbi son lei duddjon stális ja čoarvvis. → Kniven hadde hun/han lagd av stål og horn.

locative: hos - pronoun-based[edit]

  • (sme) Mus bođii našunáladovdu. → Hos meg kom en nasjonalfølelse.

Gender, pronouns[edit]

  • (sme) Go Tine Mathisen bođii deike davás de lei son juo oahppan sámegiela. → Da Tine Mathisen kom hit nordover så hadde hun allerede lært samisk.
  • (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela. → Da Per Mathisen kom hit nordover så hadde han allerede lært samisk.
  • (sme) Dat lea buot mii mus lea. → Det er alt som jeg har.
(buot is not specified for gender)

Particles[edit]

  • (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
  • (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
Can we put "guhká go" into the analyser as an mwe?
Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
  • (sme) Baldur go lea boahtán? → er det Baldur som har kommet?
  • (sme) boađát go dál? → kommer du nå?

Foc[edit]

  • (sme) In munge sáhte sárdnut ruoššagillii. → Heller ikke jeg kan tale på russisk.
  • (sme) Nu jáhkán munge. → Slik tror jeg også.

Numerals[edit]

  • (sme) 1300-logu → 1300-tallet
  • (sme) 113-heahtenummáris → på 113-nødnummeret
  • (sme) §§ 1-1984. → §§ 1-1984.
  • (sme) 50% → 50 %
  • (sme) 50 % → 50 %
  • (sme) 50.0 % → 50,0 %
  • (sme) 1.1 → 1.1
  • (sme) 1,1 + 2.13 1,- 10.99 → 1,1 + 2.13 1,- 10.99
  • (sme) 110f f ja §110a → 110f f og §110a
  • (sme) okta 6 filmmas → en av 6 filmer
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá. → Samisk høgskole er en av de høyskolene som fungerer fra høsten.


  • (sme) gaskal diibmu 17.00 ja 21.00 → mellom klokka 17.00 og 21.00
  • (sme) 19 Jovsset → 19 Jovsset
  • (sme) Golmma- njealje → Tre- fire
space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
  • (sme) Golmma-njealje → Tre-fire


Collective numbers[edit]

  • (sme) artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba. → de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.
  • (sme) Ođđa vihtaniid čilgehusat nannejit albmáguoktá ášši. → De nye vitnenes forklaringer styrker de to mennenes sak.
  • (sme) Mun áiggun rehkenastit gallis mii leat dán háve. → Jeg skal regne ut hvor mange vi er denne gang.

Dates[edit]

  • (sme) Min ráhkis Ánne deavdá 10 jagi golggotmánu 10. beaivvi. → Vår kjære Ánne fyller 10 år 10. oktober.
  • (sme) FeFo stivra galgá 24. beaivve dán mánus mearridit maid barget áššiin. → FeFos styre skal bestemme den 24. denne måneden hva de gjør med saken.
  • {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
  • (sme) cuoŋománu 15. b. lea → 15. april er det
  • (sme) Dat dáhpáhuvvá suoidnemánu loahpas. → Det skjer i slutten av juli.
  • (sme) Festivála lágiduvvo dán jagi suoidnemánu 1. beaivvi, nu go dábálaččat Bieskkenjárggas Kárášjogas. → Festivalen arrangeres dette året 1. juli, slik som vanligvis i Bieskkenjárga i Karasjok.
  • (sme) Festivála lágiduvvui mannan jagi suoidnemánu 1. beaivvi. → Festivalen ble arrangert siste året 1. juli.

Add infinitive marker[edit]

  • (sme) Mun lean heaitán borgguheames. → Jeg har sluttet å røyke.
  • (sme) Mus lea biergu vuoššat. → Jeg har kjøtt for å koke.
actually "til å koke"
  • (sme) Geahččaledje jeđđet min. → De prøvde å trøste oss.
  • (sme) Mun mannen olggos borgguhit. → Jeg gikk ut for å røyke.
  • (sme) Mun heiten borgguheames. → Jeg sluttet å røyke.
  • (sme) Mun lean hárjanan borgguhit. → Jeg har blitt vant til å røyke.
  • (sme) Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus. → Hun/han kan være med å styrke reindriftas overlevelse i et sårbar område.

MWE verbs[edit]

all lemq's should be able to move past subjects and adverbs
  • (sme) ovddasvástideigga soai → hadde de to ansvar for
or "de to hadde ansvar for"? (fragment...)
verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
  • (sme) Fuomášuhttit máná. → Gjøre barnet oppmerksom på.
from passive to reflexive
  • (sme) Čájehuvvui ahte bođii suovva olggos skuvllas. → Det viste seg at det kom røyk ut fra skolen.

Relative clauses[edit]

Agent construction[edit]

  • (sme) du čállin reivve → brev som du har skrevet
was: hadde skrevet. Shall be: har skrevet
  • (sme) Nuoraid čállin teavsttat sámegillii. → Tekster som ungdommene har skrevet på samisk.
etc.

Interjections[edit]

  • (sme) Buorre eahket. → God kveld.
  • (sme) Buorre beaivi. → God dag.
  • (sme) Bures boahtin. → Velkommen.


Lexical selection[edit]

orrut → 0:synes, 1:bo, 2:bli, 3:være[edit]

  • (sme) Doppe son orui vahku. → Der borte bodde hun/han ei uke.

adjectives[edit]

  • (sme) garra dálkki geažil → på grunn av dårlig vær

adpositions[edit]

  • (sme) Min álbmoga boahtteáigi lea ráđđehusa duohken. → Vårt folks framtid er avhengig av regjeringa.
  • (sme) Noaidi ii lean bovnna duohken. → Sjamanen var ikke bak tua.

Questions[edit]

  • (sme) Guldalat go don? → Lytter du?
  • (sme) In guldal → Jeg lytter ikke

vbser-drop[edit]

  • (sme) Vare mun doppe dahje son dáppe. → Gid jeg der borte eller hun/han her.
WORKS – Do we have to insert a verb?

Setningstilsvar vs advl/obj-setning[edit]

obj.setn
  • (sme) Máhtte muitalii ahte áddjá boahtá. → Máhtte fortalte at bestefar kommer.

leat → 0:være, 1:ha, 2:måtte[edit]

  • (sme) Mánát leat boahtán skuvlii. → Barna har kommet til skolen.

Miscellaneous[edit]

  • (sme) Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi. → Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida.
  • (sme) Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui. → Men minst en gang er skolen blitt brukt til det at vi retter på de viltre ungdommene i stedet for å sende dem til skolehjemmet.

Include name to the chunk[edit]

  • (sme) Mii váillahit dáidda- ja kulturoasi Hjertespråket guorahallamis. → Vi savner kunst- og kulturelementet i *Hjertespråket utredninga.
  • (sme) Álbmotskuvlla ja oahpaheaddjiseminára gaskasaš áigi. → Tida mellom folkeskole og lærerseminar.


Unknown[edit]

  • (sme) «Prosject» ávvuda vihtta jagi. → «*Prosject» feirer fem år.
  • (sme) «Prosject Z» ávvuda vihtta jagi. → «*Prosject z» feirer fem år.

Appositions[edit]

  • (sme) Eilif Andreas Aslaksen (53) lea bajásšaddan Deanus. → Eilif Andreas Aslaksen (53) har vokst opp i Tana.
  • (sme) Sámesearvvi jođiheaddji, Mikkel Eskil Mikkelsen, lea hui duhtavaš. → Sameforeningens leder, Mikkel Eskil Mikkelsen, er svært fornøyd.
  • (sme) Atná sámi árbevieru árvvus. → Hun/han anser samisk tradisjon som verdifull.


vaikko mii osv.
  • (sme) Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat. → Det er fredelig og samtidig kan hva som helst skje.


mii→hva som in certain contexts
  • (sme) Fuomášedje mii lea dáhpáhuvvamin. → De oppdaget hva som er i ferd med å skje.
mii→som
  • (sme) Seammás Bargiidbellodat lea sidjiide áidna bellodat mas lea sosialdemokráhtalaš ideologiija. → Samtidig er Arbeiderpartiet for dem det eneste partiet som har en sosialdemokratisk ideologi.


man→hvor before adj
  • (sme) Eadni muitalii man dehálaš dat lei ahte... → Mor fortalte hvor viktig det var at...
  • (sme) Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan. → Etter at Kunnskapsløftet begynte å fungere, så har dette tilskuddet forsvunnet.


  • (sme) su iežas → hennes/hans egen
fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
  • (sme) eanan- ja luonddudoahpagiid → landskaps- og naturbegrep
  • (sme) munno → oss to
  • (sme) Ruvdnaprinseassa Märtha ja moai letne → Kronprinsesse Märtha og vi to er
  • (sme) Prinseassa Märtha ja earát → Prinsesse Märtha og andre
  • (sme) Märtha ja earát → Märtha og andre
  • (sme) galbmit → fryse til
  • (sme) Beavdi sirdui nuppi latnjii. → Bordet ble flyttet til det andre rommet.


  • (sme) Lei okta dehálaš erohus. → Det var en viktig forskjell.
  • (sme) Ánne ráhkada biepmu. → Ánne lager mat.
  • (sme) Dat lea sihke buorre ja heittot. → Det er både bra og dårlig.
  • (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái. → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland.
  • (sme) vuolgit lea suohtas. → å reise er morsomt.
  • (sme) Go Gonagas Olav buohccái 1990 giđa. → Da Kong Olav ble syk våren 1990.


  • (sme) juohke lágán geđggiiguin → med alle slags steiner
  • (sme) Lei unnán mii earuhii nuorra prinssa skuvlavázzima eará skuvlamánáin. → Det var lite som skilte den unge prinsens skolegang fra de andre skolebarnene.
work-in-progress, Pron N chunking
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain. → Samisk høgskole er en av de høyskolene.
  • (1998-99) Utjamningsmeldinga.|(1998-99) Utjamningsmeldinga.
right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89
  • (sme) Mii vurddiimet dálkki buorránit. → Vi ventet at været skulle bedres.
  • (sme) Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii. → Kommunen var positiv nettopp så langt som loven pliktet.
  • (sme) Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja → Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og


MWE nouns
  • (sme) go dát ii leat suohkangeaidnu → når dette ikke er kommunal vei
dette/denne should both be ok here
pro insertion override
  • (sme) Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái. → Det er så langt borte at barna ikke lenger når frem til reinen.
  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái. → Det er så langt borte at barna ikke når frem til reinen.


  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe. → Det er så langt borte at barna ikke når frem til reinen der borte.