Difference between revisions of "Northern Sámi and Norwegian/Regression tests"

From Apertium
Jump to navigation Jump to search
 
(633 intermediate revisions by 4 users not shown)
Line 1: Line 1:
 
{{TOCD}}
 
{{TOCD}}
   
  +
Run with <code>t/update-latest</code> and then check <code>svn diff t</code> to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
See also [[../Pending tests|Pending tests]]
 
   
  +
See also [[../Pending tests|Pending tests]].
===Nouns===
 
  +
  +
==Nouns==
  +
  +
* {{test|sme|Mus lea biila.|Jeg har en bil.}}
  +
* {{test|sme|Mun válden biilla.|Jeg tok bilen.}}
   
* {{test|sme|biila|bil}}
 
* {{test|sme|biillat|biler}}
 
   
 
; Accusative
 
; Accusative
Line 14: Line 17:
 
* {{test|sme|Mii lea máná namma?|Hva er barnets navn?}}
 
* {{test|sme|Mii lea máná namma?|Hva er barnets navn?}}
   
; dem_adj_nom
 
* {{test|sme|juohke lágán geđggiiguin|med alle slags steiner}}
 
* {{test|sme|dán jagi válggas|av dette års valg}}
 
   
  +
; num nom.gen => num nom
===Pronouns===
 
* {{test|sme|dan|dets}}
+
* {{test|sme|Máhtte máksá guokte ruvnnu.|Máhtte betaler to kroner.}}
* {{test|sme|Dat lea|Det er}}
+
* {{test|sme|Girji máksá guokte ruvnnu.|Boka koster to kroner.}}
  +
; num.mod nom => num nom
  +
* {{test|sme|Guokte ruvnnu leat boahtán.|To kroner har kommet.}}
   
   
  +
; det nom.gen nom (det.gender from first nom)
  +
* {{test|sme|Dán lihtu ulbmil lea addit.|Denne alliansens mål er å gi.}}
  +
  +
===Nouns===
  +
  +
* {{test|sme|Mii mannat politiijastašuvdnii.|Vi drar til politistasjonen.}}
  +
* {{test|sme|Mun bargen sin mielbargin.|Jeg arbeidet som deres medarbeider.}}
  +
* {{test|sme|muohtasuddama|snøsmelting}}
  +
* {{test|sme|giellarevitaliseren|språkrevitalisering}}
  +
  +
=== Proper nouns===
  +
* {{test|sme|Gonagas Harald|Kong Harald}}
  +
* friddja Norgii|til det frie Norge ?
  +
* {{test|sme|Anne Tornensis Hætta|Anne Tornensis Hætta}}
  +
* {{test|sme|Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje.|etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter.}}
  +
  +
=== Insert determiner===
  +
  +
* {{test|sme|Son lea čeahpes bárdni.|Han er en flink gutt.}}
  +
* {{test|sme|Son lea čeahpes nieida.|Hun er ei flink jente.}}
  +
* {{test|sme|Su namma lea Máret.|Hennes navn er Máret.}}
  +
* {{test|sme|Buohtastahte eará gielaiguin.|Sammenlign med andre språk.}}
  +
  +
  +
; or not:
  +
* {{test|sme|Vuosttas instruvssat|De første instruksene}}
  +
* {{test|sme|Áviisa almmuhuvvo gitta lávvardahkii.|Avisen publiseres helt til lørdag.}}
  +
* {{test|sme|Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin.|Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.}}
  +
* {{test|sme|Nuorta-Finnmárkui lea Ukjendord OS hutkame hukset guokte bieggamillopárkka|Til Øst-Finnmark er *Ukjendord AS i ferd med å finne på å bygge to vindmølleparker}}
  +
  +
==Pronouns==
  +
* {{test|sme|dan|det}}
  +
* {{test|sme|Dat leat ártegis olbmot.|De er rare folk.}}
  +
* {{test|sme|Dat lea mu beavdi.|Det er mitt bord.}}
  +
* {{test|sme|goappat|hver}}
  +
  +
===Reflexive, ieš emphatic===
  +
; Nominative => selv
  +
* {{test|sme|Jus in livčče mun ieš.|Hvis jeg ikke hadde vært meg selv.}}
  +
  +
* Máhttu lea ieš namma.|Kunnskapen er selve navnet.
  +
: fragment, just to ensure 'selv'
  +
  +
===Reflexive pronoun inflected===
  +
; Accusative => seg selv
  +
* {{test|sme|Áhkku geahčai iežas speadjalis.|Bestemor så seg selv i speilet.}}
  +
* {{test|sme|Son lábmii iežas.|Hun/han skadet seg selv.}}
  +
  +
  +
  +
; Postposijonskomplement => acc
  +
  +
* {{test|sme|Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá.|Vibeke Larsen så det som mistillitsuttalelse mot seg.}}
  +
* {{test|sme|Mun oidnen dan eahpeluohttámuššan iežan vuostá.|Jeg så det som mistillit mot meg.}}
  +
  +
  +
; Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
  +
* {{test|sme|Váldde biergasiid iežat fárrui.|Ta tingene med deg.}}
  +
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela.|Samiske barn behøver støtte for å bevare og utvikle sitt språk.| for å}}
  +
* {{test|sme|Mun ferten čorget iežan lanja.|Jeg må rydde mitt rom.}}
  +
* {{test|sme|Son čorgii iežas lanja.|Hun/han ryddet sitt rom.}}
  +
  +
* {{test|sme|Mun ohppen čállit sámegiela, iežan eatnigiela.|Jeg lærte å skrive samisk, mitt morsmål.}}
  +
* {{test|sme|Moai válde dušše iežame biergasiid mielde.|Vi to tar bare våre ting med.}}
  +
* {{test|sme|Doai váldibeahtti dušše iežade biergasiid mielde.|Dere to tar bare deres ting med.}}
  +
  +
; Genitive followed by Pron.Gen => egen
  +
* {{test|sme|Dat lea mu iežan sivva.|Det er min egen skyld.}}
  +
  +
; Illativ => seg selv
  +
  +
* {{test|sme|Mánát guvle alcceseaset speadjalis.|Barna kikket på seg selv i speilet.}}
  +
: "på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
  +
  +
; Locative => selv
  +
* {{test|sme|Mis leat alddámet ain šibihat.|Vi har selv enda husdyr.}}
  +
  +
; Comitative => seg selv
  +
* {{test|sme|Mun jurddašin iežainan.|Jeg tenkte med meg selv.}}
  +
  +
; Essive => på egen hånd
  +
* {{test|sme|Moai birgejetne iehčaneame.|Vi to greier oss på egen hånd.}}
  +
  +
; iehčanassii_1 => alene (adverb)
  +
* {{test|sme|Mánát leat iehčanassii ruovttus.|Barna er alene hjemme.}}
  +
  +
  +
===Nonreferential(?) pronouns===
  +
* {{test|sme|ii mihkkege almenneha birra.|ingenting om allmenningen.}}
  +
* {{test|sme|Gávdnetgo maidege?|Fant du noe?}}
  +
* {{test|sme|ii mihkkege leat buorre.|ingenting er bra.}}
  +
* {{test|sme|ii goabbáge leat buorre.|ingen av dem er bra.}}
  +
* {{test|sme|in oastte goappáge.|jeg kjøper ikke noen.}}
  +
  +
==Anaphora resolution==
  +
  +
* {{test|sme|Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui.|Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.}}
  +
  +
  +
==Adjectives==
  +
* {{test|sme|Skuvllat ja oahpahusbáikkit leat deháleamos báikkit.|Skolene og undervisningsstedene er de viktigste stedene.}}
  +
* {{test|sme|Goabbá lea deháleabbo, boraspire vai olmmoš?|Hvilken av de to er viktigere, rovdyr eller menneske?}}
   
===Adjectives===
 
* {{test|sme|deháleamos|viktigst}}
 
* {{test|sme|dehálaš|viktig}}
 
* {{test|sme|deháleabbo|viktigere}}
 
   
 
* {{test|sme|almmolaš bálvalusaide|til offentlige tjenester}}
 
* {{test|sme|almmolaš bálvalusaide|til offentlige tjenester}}
  +
* {{test|sme|Mii dárbbašit sámegielat bargi.|Vi behøver samiskspråklig ansatt.}}
  +
  +
* {{test|sme|min nuoramus olbmot|våre yngste folk}}
  +
* {{test|sme|min nuoramus bárdnái|til vår yngste gutt}}
  +
* {{test|sme|Muhtun guovlluin lea oahpahus deháleamos doaibma.|I noen områder er undervisning den viktigste oppgaven.}}
  +
* {{test|sme|mu stuora váivái|til mitt store besvær}}
  +
  +
===superlatives===
  +
* {{test|sme|Máŋga jagi son lea leamaš buoremusaid searvvis.|Mange år har hun/han vært blant de beste.}}
  +
  +
;adj-noun compound vs first cmp part alone
  +
* {{test|sme|gáiddusoahpahussii|til fjernundervisning}}
  +
* {{test|sme|gáiddus|fjerntliggende}}
  +
  +
  +
  +
* {{test|sme|smávvaaviisa|småavis}}
  +
  +
  +
;non-synthetic
  +
* {{test|sme|sávrribut|mer utholdende}}
  +
  +
;Pron.Indef → A.Attr hack
  +
* {{test|sme|Sámi guovlluid iešguđet gielladilit.|Samiske områders ulike språksituasjoner.}}
  +
  +
  +
  +
;gender
  +
* {{test|sme|Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái.|Jeg tror at dette har påvirket mer positivt deres identitetsutvikling.}}
  +
  +
===From Prfprc to Adjectives===
  +
* {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}
  +
  +
==Adverbs==
  +
* {{test|sme|Lea ain deháleabbo ovttasbargat bures.|Det er enda viktigere å samarbeide godt.}}
  +
  +
* {{test|sme|Máilbmi lea rievdan das rájes go son lávllui dien šuoŋa.|Verden har forandret seg siden hun/han sang denne melodien.}}
   
  +
===Move adverb===
* {{test|sme|min nuoramus olbmot|våre yngste mennesker}}
 
* {{test|sme|min nuoramus bártni|til vår yngste gutt}}
+
* {{test|sme|Sámediggepresideanta Larsen fas hállá.|Sametingspresident Larsen snakker igjen.}}
* {{test|sme|du deháleamos doaibma|din viktigste oppgave}}
 
* {{test|sme|mu stuora givssi|til min store plage}}
 
* {{test|sme|Mii lea du bávččas mu stuora givssi ektui?|Hva er din smerte mot min store plage?}}
 
   
===Verbs===
+
==Verbs==
 
* {{test|sme|goarun|jeg syr}}
 
* {{test|sme|goarun|jeg syr}}
  +
; imp
* {{test|sme|gorrot|de syr}}
 
  +
* {{test|sme|jeara|spør}}
==== Cond/Pot (currently just adverbs…can we do better?) ====
 
* {{test|sme|jearažan|jeg spør muligens}}
+
* {{test|sme|Sihko dán.|Stryk dette.}}
* {{test|sme|jearašin|jeg spør kanskje}}
 
* {{test|sme|ii leačča čállán|han har muligens ikke skrevet}}
 
* {{test|sme|ii livčče čállán|han har kanskje ikke skrevet}}
 
   
  +
====Pro-drop====
 
  +
===Potensialis===
  +
  +
* {{test|sme|Máhtte ii leačča čállán.|Máhtte har så ikke skrevet.}}
  +
* {{test|sme|Son ii leačča čállán.|Han har så ikke skrevet.}}
  +
* {{test|sme|Mot leaččai dasto mánáide dain leairrain?|Hvordan var det så så for barn i de leirene?}}
  +
  +
===Kondisjonalis===
  +
* {{test|sme|jearašin|jeg kunne spørre}}
  +
* {{test|sme|jearašeimmet|vi kunne spørre}}
  +
* {{test|sme|Itgo veahkehivčče mu?|Kunne du ikke hjelpe meg?}}
  +
  +
===Kondisjonalis med leat===
  +
* {{test|sme|Livččii lunddolaš geahčadit dán.|Det hadde vært naturlig å granske dette.|main verb}}
  +
* {{test|sme|Oahpaheaddjit livčče sáhttán gieđahallat ášši buorebut.|Lærerne hadde kunnet behandle saken bedre.|aux verb}}
  +
  +
===Pro-drop===
 
* {{test|sme|dihten|jeg visste}}
 
* {{test|sme|dihten|jeg visste}}
 
* {{test|sme|diđiide|dere to visste}}
 
* {{test|sme|diđiide|dere to visste}}
 
* {{test|sme|diđiimet|vi visste}}
 
* {{test|sme|diđiimet|vi visste}}
   
  +
* {{test|sme|Ii vel dieđe gos áigu bargat.|Hun/han vet ikke enda hvor hun/han skal arbeide.}}
; expletive (nt, not mf)
 
  +
* {{test|sme|Leago duohta?|Er det sant?}}
 
  +
; expletive/existential (nt, not mf)
  +
  +
* {{test|sme|Dás čujuhuvvo njuolggadusaide.|Her vises det til regler.}}
  +
: pass→nt
 
* {{test|sme|báitá|det skinner}}
 
* {{test|sme|báitá|det skinner}}
  +
* {{test|sme|Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin.|Sametinget ser at det kan bli utfordrende.}}
   
====Negative, verb=>adv====
+
===Verb abessive===
  +
* {{test|sme|Skuvllat ovttasbarget beroškeahttá riikarájáin.|Skolene samarbeider uten å bry seg om riksgrensene.}}
* {{test|sme|ii leat čállán|han har ikke skrevet}}
 
* {{test|sme|Máhtte lea boahtán|Máhtte har kommet}}
 
* {{test|sme|ii leat boahtán|han har ikke kommet}}
 
; evt. "han" (but can it ever be "det"?)
 
* {{test|sme|Máhtte ii leat boahtán|Máhtte har ikke kommet}}
 
   
  +
== existential==
  +
* {{test|sme|Guovdageainnus lei dievas soahti mannan vahku.|I Kautokeino var det full krig sist uke.}}
  +
* {{test|sme|Guovdageainnus lea allaskuvla.|I Kautokeino er det høyskole.}}
  +
* {{test|sme|Dat čuohcá sidjiide geain eai leat oahpaheaddjit.|Det berører dem som ikke har lærere.}}
  +
* {{test|sme|Tiimmu ovdal gaskaija leat kulturdoalut Kárášjoga čierastanluohkás.|Timen før midnatt er det kulturarrangement i Karasjoks slalåmbakke.}}
  +
* {{test|sme|Vaikko leat muhtin erohusat, de sáhttá buohtastahttit sin vieruid min vieruiguin.|Selv om det er noen forskjeller, så kan man sammenligne deres skikker med våre skikker.}}
  +
* {{test|sme|Čoahkkimis galgá ráhkaduvvot ođđa plána.|På møtet skal det lages en ny plan.}}
  +
* {{test|sme|Dušše Hámmárfeasttas ii leat njiedjan diimmá rájes.|Bare i Hammerfest er det ikke gått ned siden i fjor.}}
  +
  +
* {{test|sme|arvá |det regner}}
  +
  +
* {{test|sme|Máhppii lea sierra čilgehus.|Til mappa er det en særskilt forklaring.}}
  +
* {{test|sme|Jođiheaddjibargui manná ollu áigi.|Til lederarbeidet går det mye tid.}}
  +
* {{test|sme|Dasa leat vissásit ollu čilgehusat.|Til det er det sikkert mange forklaringer.}}
  +
  +
; man
  +
* {{test|sme|Dasto galgá vuodjat dainna olbmuin.|Så skal man svømme med det mennesket.}}
  +
* {{test|sme|Dál ferte soabadanproseassa álggahit.|Nå må man igangsette forsoningsprosessen.}}
  +
  +
; override with relatives:
  +
* {{test|sme|Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii.|Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.}}
  +
* {{test|sme|Stuorámus dáhpáhus mii goassege lea leamaš.|Den største hendelsen som noensinne har vært.}}
  +
  +
===Don't insert pro===
  +
* {{test|sme|Dan galgá Anne muitalit Sápmái.|Det skal Anne fortelle til Sameland.}}
  +
* {{test|sme|Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái.|Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.}}
  +
  +
  +
  +
  +
===Verb=>adv===
 
; dáidit => nok
 
; dáidit => nok
* {{test|sme|Son ii dáidde jienastit Bargiidbellodaga|Han stemmer nok ikke Arbeiderpartiet}}
+
* {{test|sme|Máhtte ii dáidde jienastit Bargiidbellodaga doppe.|Máhtte stemmer nok ikke Arbeiderpartiet der borte.}}
   
  +
; soaitit => kanskje
====V2 (negative, subordination, qst, object)====
 
* {{test|sme|itgo boađáše?|kommer du ikke kanskje?}}
+
* {{test|sme|Son soaitá boahtit ruoktot.|Han kommer kanskje hjem.}}
  +
* {{test|sme|it boađáše|du kommer kanskje ikke}}
 
  +
; ii => ikke
* {{test|sme|Máhtte ii boađe|Máhtte kommer ikke}}
 
* {{test|sme|go it boađáše|når du kanskje ikke kommer}}
+
* {{test|sme|Son ii leat čállán.|Han har ikke skrevet.}}
  +
* {{test|sme|Ii lean čállán.|Hun/han hadde ikke skrevet.}}
  +
* {{test|smeIIi lean čállimin.|Hun/han var ikke i ferd med å skrive.}}
  +
* {{test|sme|Ii lean čállime.|Hun/han var ikke i ferd med å skrive.}}
  +
* {{test|sme|Máhtte lea boahtán.|Máhtte har kommet.}}
  +
* {{test|sme|Ii leat boahtán.| Hun/han har ikke kommet.}}
  +
; capital case
  +
  +
; evt. "han" (but can it ever be "det"?)
  +
* {{test|sme|Máhtte ii leat boahtán|Máhtte har ikke kommet}}
  +
  +
===V2 (negative, subordination, qst, object)===
  +
* {{test|sme|Itgo boađáše?|Kunne du ikke komme?}}
  +
* {{test|sme|It boađáše.|Du kunne ikke komme.}}
  +
* {{test|sme|Máhtte ii boađe.|Máhtte kommer ikke.}}
  +
* {{test|sme|go it boađáše.|når du ikke kunne komme.}}
 
: når eller at?
 
: når eller at?
* {{test|sme|itgo gáfe juga?|drikker du ikke kaffen?}}
+
* {{test|sme|Itgo gáfe juga?|Drikker du ikke kaffe?}}
: or, kaffe.ind...
+
: kaffe.unc
  +
  +
* {{test|sme|Maid áiggot bargat go heaittát barggus?|Hva skal du gjøre når du slutter i jobben?}}
  +
* {{test|sme|Mii maiddái ássat.|Vi bor også}}
  +
* {{test|sme|Mu bealis dat dušše nannejuvvui.|For meg ble det bare styrket.}}
  +
  +
* {{test|sme|Muhto sámediggepresideantta baicce ii hálit giellaguovddášjođiheaddji cuiggodit dan dihtii go presideanta ii sámástan ođđajagisártnistis.|Men sametingspresidenten derimot vil ikke språksenterlederen kritisere fordi at presidenten ikke snakket samisk i nyttårstalen.}}
  +
* {{test|sme|Muhto sámediggepresideantta ii hálit giellaguovddášjođiheaddji cuiggodit.|Men sametingspresidenten vil ikke språksenterlederen kritisere.}}
  +
  +
* {{test|sme|Mii sávvat sutnje bures boahtin, rektor Gunvor Guttorm cealká.|Vi ønsker henne/han velkommen, sier rektor Gunvor Guttorm.}}
  +
  +
===Not V2===
  +
* {{test|sme|Eiseválddit leat dohkkehan sin rusttega nu movt dat lea dál.|Myndighetene har godkjent deres anlegg slik som det er nå.}}
  +
  +
===FV + IV===
  +
* {{test|sme|Mun ferten viežžat čázi.|Jeg må hente vann.}}
  +
  +
===wh-question===
  +
* {{test|sme|Maid don jugat?|Hva drikker du?}}
  +
* {{test|sme|Leago duohta?|Er det sant?}}
  +
  +
===Present progressive===
  +
* {{test|sme|Máhtte lea čállime.|Máhtte er i ferd med å skrive.}}
  +
: or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
  +
* {{test|sme|ii leat čállimin.|hun/han er ikke i ferd med å skrive.}}
  +
* {{test|sme|ii leat čállime.|hun/han er ikke i ferd med å skrive.}}
  +
* {{test|sme|ii leačča čállimin.|hun/han er så ikke i ferd med å skrive.}}
  +
* {{test|sme|ii leačča čállime.|hun/han er så ikke i ferd med å skrive.}}
   
  +
===Essive utfyllingspredikat===
* {{test|sme|Mii maiddái ásset|Vi bor også}}
 
  +
; remove case-prep in t2x if following or preceding vcop
  +
* {{test|sme|Son lea taksivuoddjin Oslos.|Hun/han er drosjesjåfør i Oslo.}}
  +
* {{test|sme|Mus lea Ánde mielbargin.|Jeg har Ánde som medarbeider.}}
  +
* {{test|sme|Sin bargun lei.|Deres arbeid var det.}}
   
====FV + IV====
+
===Actio Ess===
* {{test|sme|Mun ferten viežžat čázi|Jeg må hente vann}}
 
   
====Essive spred====
 
* {{test|sme|itgo boađáše munnje veahkkin|kommer du ikke kanskje og hjelper meg}}
 
* {{test|sme|itgo boađáše munnje studeantan|kommer du ikke kanskje til meg som student}}
 
: Yes it's contrived... the point is just to have a fallback if the essive noun has no corresponding bidix verb.
 
   
====Topic/Focus stuff====
+
===Topic/Focus stuff===
 
* {{test|sme|Boahtágo áhčči ihttin?|Kommer far i morgen?}}
 
* {{test|sme|Boahtágo áhčči ihttin?|Kommer far i morgen?}}
 
* {{test|sme|Áhččigo boahtá ihttin?|Er det far som kommer i morgen?}}
 
* {{test|sme|Áhččigo boahtá ihttin?|Er det far som kommer i morgen?}}
 
: evt. "faren"
 
: evt. "faren"
   
===Derivation===
 
   
  +
  +
===Passive===
  +
* {{test|sme|Go su áhčči jámii de gildui.|Da hennes/hans far døde så ble det forbudt.}}
  +
* {{test|sme|Dađistaga gildui sámegiella.|Etter hvert ble samisk forbudt.}}
  +
* {{test|sme|dan maŋŋá gildui sámegiella.|etter det ble samisk forbudt.}}
  +
  +
===="Passive" single verb => bli + adj====
  +
* {{test|sme|Dál dii fertebehtet geargat.|Nå må dere bli ferdige.}}
  +
: geargat => ferdig.adj/pass__verb
  +
  +
===Setningstilsvar vs advl/obj-setning===
  +
* {{test|sme|Máhtte muitalii ádjá boahtit.|Máhtte fortalte at bestefar kommer.}}
  +
* {{test|sme|Máhtte logai sin vuolgit dál juo.|Máhtte sa at de reiser nå allerede.}}
  +
: is logai completely ambiguous between lese/si? difficult lex.sel...
  +
  +
* {{test|sme|Jáhkken kulturmáhtu leat oktan ággan.|Jeg trodde at kulturkompetansen er et argument.}}
  +
  +
===Negative preterite using PrfPrc form===
  +
* {{test|sme|Mon gullen ahte áddjá ii dovdan dan lottáža.|Jeg hørte at bestefar ikke kjente den småfuglen.}}
  +
* {{test|sme|vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta.|for at flegmatisk okkupasjonsmakt ikke fikk ta dem fast.}}
  +
* {{test|sme|Harald vuortnui ahte ii áigon čuohppat vuovttaid.|Harald sverget at han ikke skulle klippe håret.}}
  +
: TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
  +
* {{test|sme|ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá.|at Norge ikke kunne greie seg mot en flegmatisk krigsmakt.}}
  +
  +
==Derivation==
  +
* {{test|sme|Son lei dalle sullii 60-jahkásaš.|Han var da omtrent 60-åring.}}
  +
* {{test|sme|32-jahkásaš čiekči máhccá fas Romsii.|32-årig fotballspiller drar tilbake igjen til Tromsø.}}
  +
* {{test|sme|5-jahkásaččaid bátnedearvvašvuohta ii leat gal mánáid duohken.|5-åringenes tannhelse er ikke avhengig av barna.}}
  +
  +
  +
===Inchoative===
 
; Verb / Der3 / goahti
 
; Verb / Der3 / goahti
; how is this combined with negative? (t2x would add the pronoun, (Jeg) (begynte ikke å lese) but could t2x add "begynne" too? Then "å" would have to be added either by t1x based on the Der3 tag, or in t3x based on tags from the combined chunk)
 
 
* {{test|sme|boradišgohten|jeg begynte å spise}}
 
* {{test|sme|boradišgohten|jeg begynte å spise}}
 
: evt "holde måltid"?
 
: evt "holde måltid"?
 
* {{test|sme|lohkagohten|jeg begynte å lese}}
 
* {{test|sme|lohkagohten|jeg begynte å lese}}
  +
: don't chunk it all, might want to insert adverbs
  +
* {{test|sme|ii lohkagoađe.|hun/han begynner ikke å lese.}}
  +
   
  +
===Passive===
 
; Verb / Der2 / Der_PassL
 
; Verb / Der2 / Der_PassL
 
* {{test|sme|don borrojuvvot|du spises}}
 
* {{test|sme|don borrojuvvot|du spises}}
  +
; insert det , give ind
  +
* {{test|sme|Čoahkkimis galgá ráhkaduvvot plána.|På møtet skal det lages en plan.}}
   
===Noun phrases===
+
===Reflexive verb===
; Essive
+
; Verb
* {{test|sme|olmmožin|som menneske}}
+
* {{test|sme|Son basadii.|Hun/han vasket seg.}}
  +
: (bidix-specified lexical reflexive 'basadit')
* {{test|sme|mánnán son orui Romssas|som barn bodde han i Tromsø}}
 
  +
* {{test|sme|ja de háliidin beassat 20 buoremusa searvái.|og så ville jeg komme meg blant de 20 beste.}}
  +
* {{test|sme|de dusten sávvat beassat 20 buoremusa searvái.|så torde jeg å ønske å komme meg blant de 20 beste.}}
  +
  +
* {{test|sme|Mii leat čoahkkanan digaštallat ášši.|Vi har samlet oss for å debattere saken.| for å}}
  +
  +
;
  +
===Causative===
  +
* {{test|sme|don fertet vuos beatnaga čuogahit.|du må først la hunden drikke.}}
  +
  +
; Verb / Der1 / Der_h
  +
* {{test|sme|Muhto mánámánnái áiggun goaruhit gávtti.|Men til barnebarnet skal jeg la sy kofte.}}
  +
  +
; Verb / Der2 / Der_ahtti
  +
* {{test|sme|Sii leat jorgalahttán gihppaga sámegillii.|De har latt oversette heftet til samisk.}}
  +
  +
==Adj vs Noun==
  +
  +
; Adjective / Der3 / Der_vuohta => N
  +
* {{test|sme|ráhkisvuohta ja geafivuohta ja coagisvuohta.|kjærlighet og fattigdom og det grunne.}}
  +
: last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)
  +
  +
===Noun vs adjective (sámi - samisk)===
  +
* {{test|sme|Sámi mánáidgárdin oaivvilduvvo dat mánáidgárdi mii mearrádusaid bokte lea vuođđudan mánáidgárdedoaimma sámi gillii ja kultuvrii.|Som samisk barnehage menes det den barnehagen som har via bestemmelsene grunnlagt barnehagedriften på samisk språk og kultur.}}
  +
* {{test|sme|Sámi pedagogalaš bargi bargá doppe.|Samisk pedagogisk ansatt arbeider der borte.}}
  +
* {{test|sme|Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis.|Flink samisk pedagogisk ansatt arbeider i barnehagen.}}
  +
* {{test|sme|Sámi gievkkanbargi bargá mánáidgárddis.|Samisk kjøkkenansatt arbeider i barnehagen.}}
  +
  +
===Adjective vs noun (guovdageaidnulaš - kautokeinoværing)===
  +
* {{test|sme|Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu.|I går fikk kautokeinoværing over 1,3 millioner kroner.}}
  +
  +
  +
==Noun phrases==
  +
* {{test|sme|riikka nubbi davvisámegiel namma|landets andre nordsamiske navn}}
  +
  +
  +
=== Essive===
 
; ^@SPRED v@ADVL
 
; ^@SPRED v@ADVL
* {{test|sme|nuorran son orui Romssas|som ungdom bodde han i Tromsø}}
+
* {{test|sme|Nuorran son orui Romssas.|Som ungdom bodde hun/han i Tromsø.|I ungdommen}}
* {{test|sme|mánnán dihten|som barn visste jeg}}
 
   
  +
====NIL====
; accusative object predicative, add "være"
 
* {{test|sme|Dan dieđán váddása|Det vet jeg er vanskelig}}
+
* {{test|sme|Prográmmaid gohčodit hiljes-TV:n.|Programmene kaller vi sakte-TV.}}
* {{test|sme|Dan gal dieđán váddása|Det vet jeg vel er vanskelig}}
 
: gal=>vel?
 
   
  +
===Definiteness===
 
  +
* {{test|dáčča skuvlla kopija|en kopi av den norske skolen}}
  +
* {{test|Guovdageainnu suohkana sátnejođiheaddji|ordfører av Kautokeino kommune}}
  +
; output as two chunks
  +
  +
* {{test|nb|Dronnet Sonja|Dronning Sonja}}
  +
* {{test|nb|Ruvdnaprinsa Harald|Kronprins Harald}}
  +
  +
; adj n.gen n.com
  +
* {{test|sme|Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin.|Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer.}}
  +
  +
; cmp
  +
* {{test|sme|Mii manahit máŋgga vejolaš sámegieloahpaheaddji.|Vi mister mange mulige samisklærere.}}
  +
  +
; cmp.guio
  +
* {{test|sme|Danne heaitá Aslaksen Wikipedia-hoavdan.|Derfor slutter Aslaksen som Wikipedia-sjef.}}
  +
  +
==Definiteness==
 
; subject (guessing...)
 
; subject (guessing...)
* {{test|sme|Mánná oađđá|Barnet sover}}
+
* {{test|sme|Mánná oađđá.|Barnet sover.}}
  +
   
; illative:
 
* {{test|sme|skuvlii|til skolen}}
 
   
  +
* {{test|sme|Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui.|Sist vinter reiste ei gruppe til Karasjok og Kautokeino.}}
  +
* {{test|sme|Giella lei stuorámus váttisvuohta.|Språket var det største problemet.}}
  +
* {{test|sme|Mii leat dál gieldda stuorimus mánáidgárdi.|Vi er nå kommunens største barnehage.}}
   
 
; mass vs count
 
; mass vs count
Line 125: Line 432:
 
* {{test|sme|Oainnátgo máná?|Ser du barnet?}}
 
* {{test|sme|Oainnátgo máná?|Ser du barnet?}}
   
  +
* {{test|sme|Skuvla lea leamaš stuorimus oassi prošeavttas.|Skolen har vært den største delen av prosjektet.}}
===leat => har/er/må===
 
* {{test|sme|Mánát leat boahtán skuvlii.|Barnene har kommet til skolen.}}
 
* {{test|sme|Mis lea cahkkehit dola.|Vi må tenne bålet.}}
 
   
===Coordination===
+
==leat => har/er/må==
* {{test|sme|Ruoŧas ja Norggas|i Sverige og Norge}}
+
* {{test|sme|Mis lea cahkkehit dola.|Vi tenne bålet.}}
   
===V2===
+
==Coordination==
* {{test|sme|Son orui Romssas mánnán|Han bodde i Tromsø som barn}}
+
* {{test|sme|Ruoŧas ja Norggas|I Sverige og Norge}}
  +
* {{test|sme|Stáhta geaidnodoaimmahat lea dál čállán šiehtadusa Ákŋoluovtta muohtačorgenbargguide.|Statens vegvesen har nå skrevet en avtale om Hasviks snøryddingarbeider.}}
  +
* {{test|sme|Ministtar bođii, lohpidii ja manai fas.|Ministeren kom, lovde og gikk igjen.}}
   
===Adpositions===
+
==V2==
  +
* {{test|sme|Son orui Romssas mánnán.|Hun/han bodde i Tromsø som barn.}}
  +
  +
* {{test|sme|Muhto mun orun Kárášjogas.|Men jeg bor i Karasjok.}}
  +
  +
==Adpositions==
 
* {{test|sme|Mus lea oahpahus gaskkal guovtti ja njealji.|Jeg har undervisning mellom to og fire.}}
 
* {{test|sme|Mus lea oahpahus gaskkal guovtti ja njealji.|Jeg har undervisning mellom to og fire.}}
 
; Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
 
; Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
  +
  +
* {{test|sme|Logut leat sturron jagis jahkái.|Tallene har blitt større år for år.}}
  +
  +
  +
* {{test|sme|Giitu skeaŋkkas.|Takk for gaven.}}
  +
* {{test|sme|Giitu skeaŋkka ovddas.|Takk for gaven.}}
   
 
* {{test|sme|dálkki geažil|på grunn av været}}
 
* {{test|sme|dálkki geažil|på grunn av været}}
Line 145: Line 463:
 
* {{test|sme|munno geažil|på grunn av oss to}}
 
* {{test|sme|munno geažil|på grunn av oss to}}
   
  +
* {{test|sme|Son lea bargan journalistan jagi 1983 rájes.|Hun/han har arbeidet som journalist fra 1983.}}
===Left-Object+Adv+Main verb===
 
  +
* {{test|sme|Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen.|Redaktør fra oktober 2015 er Eilif Andreas Aslaksen.}}
  +
  +
==Left-Object+Adv+Main verb==
 
; move object (dan) after adv (juo) and main verb (oahppan)
 
; move object (dan) after adv (juo) and main verb (oahppan)
 
* {{test|sme|nuorran son lea dan juo oahppan|som ungdom har han allerede lært det}}
 
* {{test|sme|nuorran son lea dan juo oahppan|som ungdom har han allerede lært det}}
Line 151: Line 472:
 
; "hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
 
; "hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
   
  +
; adverbial placement (only adj adverbials move?)
===Gender, pronouns===
 
  +
* {{test|sme|Mun láven dávjá lávlut|Jeg pleier ofte å synge}}
* {{test|sme|Go Tine Chris Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Når Tine Chris Mathisen kom hit nordover så hadde hun allerede lært samisken.}}
 
  +
*Mun láven árrat lávlut|Jeg pleier synge tidlig
* {{test|sme|Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Når Per Mathisen kom hit nordover så hadde han allerede lært samisken.}}
 
  +
* {{test|sme|Mun láven dávjá goallut|Jeg pleier ofte å fryse}}
   
  +
===Miscellaneous===
 
  +
==Prepositional choice, mostly caseprep==
* {{test|sme|Anne ráhkada biepmu.|Anne lager mat.}}
 
  +
* {{test|sme|Mun hálan dálkki birra|Jeg snakker om været}}
  +
* {{test|sme|Mun human fiskes biilla birra|Jeg snakker om en gul bil}}
  +
* {{test|sme|Son lea Norggas|Hun/han er i Norge}}
  +
* {{test|sme|Tine Chris Mathisen lea beassan leat mielde boazobargguin|Tine Chris Mathisen har fått være med på reindriftsarbeidene}}
  +
* {{test|sme|Go gullen sámegiela dien mátkkis|Da jeg hørte samisk på denne reisa}}
  +
: loc has på as default, but gullen selects "fra", should it?
  +
* {{test|sme|Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái.|Jeg gikk barneskolen i Máze fra høsten 1960 inntil sommeren 1966.}}
  +
  +
; (use an np.f first to set the anaphora gender for these tests)
  +
* {{test|sme|Tine lea Norggas eret|Tine er fra Norge}}
  +
* {{test|sme|Son lea Norggas eret|Hun er fra Norge}}
  +
* {{test|sme|Son lea Islandas|Hun er på Island}}
  +
* {{test|sme|Son lea Islandas eret|Hun/han er fra Island}}
  +
  +
* {{test|sme|Märtha Louise oaččui dan 16 jagi áigi.|Märtha Louise fikk det for 16 år siden.}}
  +
* {{test|sme|Märtha Louise oaččui dan 16 jagi dassái.|Märtha Louise fikk det for 16 år siden.}}
  +
* {{test|sme|Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal.|Regjeringene har nedvurdert dette forslaget som ble framført for 11 år siden.}}
  +
  +
* {{test|sme|du idjabeavdeskuffas?|i din nattbordskuff?}}
  +
* {{test|sme|áibmomediagáffe|kringkastingskaffe}}
  +
; yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.
  +
  +
  +
  +
  +
; Der_halla verbs have illative agents
  +
* {{test|sme|Mánná gáskkáhalai beatnagii|Barnet ble bitt av hunden}}
  +
* {{test|sme|Mii fillehalaimet sidjiide|Vi ble narret av dem}}
  +
  +
===Accusative: om - verb and noun based ===
  +
* {{test|sme|Mun bivden veahki.|Jeg bad om hjelp.}}
  +
  +
  +
  +
===Comitative: med ===
  +
* {{test|sme|Rievssatbivdu unnon beliin.|Rypejakta minket med halvparten.}}
  +
* {{test|sme|Boazosápmelaš Jovsset Ánte Sara deaivvadii stáhtain lágamánnerievttis gieskat.|Reindriftssame Jovsset Ánte Sara møtte staten i lagmannsretten nylig.}}
  +
  +
* {{test|sme|Sii deaivvadedje lágamánnerievttis.|De møttes i lagmannsretten.}}
  +
  +
===Illative: på - verb-based===
  +
* {{test|sme|Mun suhtan dutnje|Jeg blir sint på deg}}
  +
* {{test|sme|Mun luohtán dutnje|Jeg stoler på deg}}
  +
* {{test|sme|Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide|Dere to må begynne å tro på slike spøkelseshistorier}}
  +
* {{test|sme|Manne don geahčat munnje?|Hvorfor ser du på meg?}}
  +
* {{test|sme|Mii áigut bidjat kámera láidestanheargái.|Vi skal sette kameraet på lederreinen.}}
  +
  +
  +
===Illative: på - noun/numeral-based===
  +
* {{test|sme|mun dadjen dan sámegillii|jeg sa det på samisk}}
  +
* {{test|sme|Dearvvuođat leat sámegillii.|Hilsningene er på samisk.}}
  +
* {{test|sme|Máhtte báhcá gáddái.|Máhtte blir igjen på stranda.}}
  +
* {{test|sme|Mun ohppen čállit dárogillii.|Jeg lærte å skrive på norsk.}}
  +
* {{test|sme|kánske mun galggan hállat dušše sámegillii.|kanskje skal jeg snakke bare på samisk.}}
  +
* {{test|sme|In oaidnán su logi jahkái.|Jeg så ikke henne/han på ti år.}}
  +
* {{test|sme|Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai.|Her er det sider som kan tolkes på to måter.}}
  +
* {{test|sme|Nu ii leat dáhpáhuvvan 567 jahkái.|Slik har det ikke skjedd på 567 år.}}
  +
* {{test|sme|kánske mun galggan hállat dušše sámegillii dán kanálas.|kanskje skal jeg snakke bare på samisk i denne kanalen.}}
  +
  +
===Illative: med - verb-based===
  +
* {{test|sme|Esther álggii hupmat fuolkkis birra, ja nu oahpásnuvven maiddái sunnje, čilge Skoglund.|Esther begynte å snakke om slektningen, og slik ble jeg kjent også med henne, forklarer Skoglund.|fuolkkis has Px and could be translated to slekningen sin}}
  +
  +
===Illative: for - noun-based===
  +
* {{test|sme|Dál beasat oaidnit Giđđajohtima minuvttas minuktii.|Nå får du se Vårflyttinga minutt for minutt.}}
  +
  +
===Illative: for - verb-based===
  +
* {{test|sme|Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán.|Dette betyr selvfølgelig mye for den personen som har vunnet.}}
  +
* {{test|sme|De livččii Larsenii vejolaš ovdanbuktit ođđajagisártnis sámegillii.|Så hadde det vært for Larsen mulig å framføre nyttårstalen på samisk.}}
  +
* {{test|sme|Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin muhtun suohkaniidda Norggas bálvalit iežas sámegielat álbmoga sámegillii.|Sametinget ser at det kan bli utfordrende for noen kommuner i Norge å betjene sitt samiskspråklige folk på samisk.}}
  +
  +
===Illative: NIL - verb-based===
  +
* {{test|sme|Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui.|Hendelsen berører selvfølgelig det journalistiske arbeidet.}}
  +
  +
===Illative/locative: how many times something happens===
  +
;special rule for these in t1x:
  +
* {{test|sme|Muđui vázzá son beatnagiinnis golbmii beaivái.|Ellers går hun/han med hunden tre ganger om dagen.}}
  +
* {{test|sme|Muđui vázzá son beatnagiinnis golbmii vahkkui.|Ellers går hun/han med hunden tre ganger i uka.}}
  +
  +
;taken care of in nom_out macro, based on previous-nhead:
  +
* {{test|sme|Muđui vázzá son beatnagiinnis golbma diimmu vahkkui.|Ellers går hun/han med hunden tre timer i uka.}}
  +
* {{test|sme|Muđui vázzá son beatnagiinnis golbma diimmu beaivái.|Ellers går hun/han med hunden tre timer om dagen.}}
  +
* {{test|sme|Dát čoahkkimat dollojuvvojit golbma geardde vahkkui.|Disse møtene holdes tre ganger i uka.}}
  +
  +
===locative: fra ===
  +
* {{test|sme|Mun vuolggán Norggas.|Jeg reiser fra Norge.}}
  +
  +
===locative: i ===
  +
* {{test|sme|Mun lean gávppis.|Jeg er i butikken.}}
  +
  +
  +
===locative: etter - noun-based===
  +
* {{test|sme|Mu mielas lea oahpahalliortnet dehálaš.|Etter min oppfatning er lærlingeordning viktig.}}
  +
  +
===locative: om - based on noun to the left===
  +
* {{test|sme|Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas.|I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.}}
  +
  +
  +
* {{test|sme|Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus.|Da det var tale om samebarn som ikke har lært samisk hjemme.}}
  +
  +
===locative: av ===
  +
* {{test|sme|Ii oktage sis hálit kommenteret ášši aviissas.|Ingen av dem vil kommentere saken i avisa.}}
  +
* {{test|sme|Muhto eatnasat sis bissot dálá listtuin.|Men de fleste av dem forblir på nåværende lister.}}
  +
* {{test|sme|Niibbi son lei duddjon stális ja čoarvvis.|Kniven hadde hun/han lagd av stål og horn.}}
  +
  +
===locative: hos - pronoun-based===
  +
* {{test|sme|Mus bođii našunáladovdu.|Hos meg kom en nasjonalfølelse.}}
  +
  +
==Gender, pronouns==
  +
* {{test|sme|Go Tine Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Da Tine Mathisen kom hit nordover så hadde hun allerede lært samisk.}}
  +
* {{test|sme|Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela.|Da Per Mathisen kom hit nordover så hadde han allerede lært samisk.}}
  +
  +
* {{test|sme|Dat lea buot mii mus lea.|Det er alt som jeg har.}}
  +
: (buot is not specified for gender)
  +
  +
==Particles==
  +
* {{test|sme|guhkágo don ledjet doppe?|hvor lenge var du der borte?}}
  +
* {{test|sme|guhká go don ledjet doppe?|hvor lenge var du der borte?}}
  +
: Can we put "guhká go" into the analyser as an mwe?
  +
  +
; Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
  +
* {{test|sme|Baldur go lea boahtán?|er det Baldur som har kommet?}}
  +
* {{test|sme|boađát go dál?|kommer du nå?}}
  +
  +
===Foc===
  +
* {{test|sme|In munge sáhte sárdnut ruoššagillii.|Heller ikke jeg kan tale på russisk.}}
  +
* {{test|sme|Nu jáhkán munge.|Slik tror jeg også.}}
  +
  +
==Numerals==
  +
* {{test|sme|1300-logu|1300-tallet}}
  +
  +
* {{test|sme|113-heahtenummáris|på 113-nødnummeret}}
  +
* {{test|sme|§§ 1-1984.|§§ 1-1984.}}
  +
* {{test|sme|50%|50 %}}
  +
* {{test|sme|50 %|50 %}}
  +
* {{test|sme|50.0 %|50,0 %}}
  +
* {{test|sme|1.1|1.1}}
  +
* {{test|sme|1,1 + 2.13 1,- 10.99|1,1 + 2.13 1,- 10.99}}
  +
* {{test|sme|110f f ja §110a |110f f og §110a}}
  +
  +
* {{test|sme|okta 6 filmmas|en av 6 filmer}}
  +
* {{test|sme|Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá.|Samisk høgskole er en av de høyskolene som fungerer fra høsten.}}
  +
  +
  +
* {{test|sme|gaskal diibmu 17.00 ja 21.00|mellom klokka 17.00 og 21.00}}
  +
  +
* {{test|sme|19 Jovsset|19 Jovsset}}
  +
  +
* {{test|sme|Golmma- njealje|Tre- fire}}
  +
: space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
  +
* {{test|sme|Golmma-njealje|Tre-fire}}
  +
  +
  +
  +
==Collective numbers==
  +
* {{test|sme|artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba.|de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.}}
  +
* {{test|sme|Ođđa vihtaniid čilgehusat nannejit albmáguoktá ášši.|De nye vitnenes forklaringer styrker de to mennenes sak.}}
  +
* {{test|sme|Mun áiggun rehkenastit gallis mii leat dán háve.|Jeg skal regne ut hvor mange vi er denne gang.}}
  +
  +
==Dates==
  +
* {{test|sme|Min ráhkis Ánne deavdá 10 jagi golggotmánu 10. beaivvi.|Vår kjære Ánne fyller 10 år 10. oktober.}}
  +
* {{test|sme|FeFo stivra galgá 24. beaivve dán mánus mearridit maid barget áššiin.|FeFos styre skal bestemme den 24. denne måneden hva de gjør med saken.}}
  +
* {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
  +
* {{test|sme|cuoŋománu 15. b. lea|15. april er det}}
  +
* {{test|sme|Dat dáhpáhuvvá suoidnemánu loahpas.|Det skjer i slutten av juli.}}
  +
* {{test|sme|Festivála lágiduvvo dán jagi suoidnemánu 1. beaivvi, nu go dábálaččat Bieskkenjárggas Kárášjogas.|Festivalen arrangeres dette året 1. juli, slik som vanligvis i Bieskkenjárga i Karasjok.}}
  +
* {{test|sme|Festivála lágiduvvui mannan jagi suoidnemánu 1. beaivvi.|Festivalen ble arrangert siste året 1. juli.}}
  +
  +
==Add infinitive marker==
  +
* {{test|sme|Mun lean heaitán borgguheames.|Jeg har sluttet å røyke.}}
  +
* {{test|sme|Mus lea biergu vuoššat.|Jeg har kjøtt for å koke.}}
  +
: actually "til å koke"
  +
* {{test|sme|Geahččaledje jeđđet min.|De prøvde å trøste oss.}}
  +
* {{test|sme|Mun mannen olggos borgguhit.|Jeg gikk ut for å røyke.}}
  +
* {{test|sme|Mun heiten borgguheames.|Jeg sluttet å røyke.}}
  +
* {{test|sme|Mun lean hárjanan borgguhit.|Jeg har blitt vant til å røyke.}}
  +
* {{test|sme|Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus.|Hun/han kan være med å styrke reindriftas overlevelse i et sårbar område.}}
  +
  +
==MWE verbs==
  +
; all lemq's should be able to move past subjects and adverbs
  +
* {{test|sme|ovddasvástideigga soai|hadde de to ansvar for}}
  +
: or "de to hadde ansvar for"? (fragment...)
  +
  +
; verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
  +
* {{test|sme|Fuomášuhttit máná.|Gjøre barnet oppmerksom på.}}
  +
  +
;from passive to reflexive
  +
* {{test|sme|Čájehuvvui ahte bođii suovva olggos skuvllas.|Det viste seg at det kom røyk ut fra skolen.}}
  +
  +
==Relative clauses==
  +
===Agent construction===
  +
* {{test|sme|du čállin reivve|brev som du har skrevet}}
  +
: was: ''hadde skrevet''. Shall be: ''har skrevet''
  +
* {{test|sme|Nuoraid čállin teavsttat sámegillii.|Tekster som ungdommene har skrevet på samisk.}}
  +
: etc.
  +
  +
==Interjections==
  +
* {{test|sme|Buorre eahket.|God kveld.}}
  +
* {{test|sme|Buorre beaivi.|God dag.}}
  +
* {{test|sme|Bures boahtin.|Velkommen.}}
  +
  +
  +
==Lexical selection==
  +
  +
=== orrut → 0:synes, 1:bo, 2:bli, 3:være ===
  +
* {{test|sme|Doppe son orui vahku.|Der borte bodde hun/han ei uke.}}
  +
  +
=== adjectives ===
  +
* {{test|sme|garra dálkki geažil|på grunn av dårlig vær}}
  +
  +
===adpositions===
  +
* {{test|sme|Min álbmoga boahtteáigi lea ráđđehusa duohken.|Vårt folks framtid er avhengig av regjeringa.}}
  +
* {{test|sme|Noaidi ii lean bovnna duohken.|Sjamanen var ikke bak tua.}}
  +
  +
==Questions==
  +
* {{test|sme|Guldalat go don?|Lytter du?}}
  +
  +
* {{test|sme|In guldal|Jeg lytter ikke}}
  +
  +
==vbser-drop==
  +
* {{test|sme|Vare mun doppe dahje son dáppe.|Gid jeg der borte eller hun/han her.}}
  +
: WORKS – Do we have to insert a verb?
  +
  +
==Setningstilsvar vs advl/obj-setning==
  +
  +
  +
;obj.setn
  +
* {{test|sme|Máhtte muitalii ahte áddjá boahtá.|Máhtte fortalte at bestefar kommer.}}
  +
  +
==leat → 0:være, 1:ha, 2:måtte==
  +
* {{test|sme|Mánát leat boahtán skuvlii.|Barna har kommet til skolen.}}
  +
  +
==Miscellaneous==
  +
* {{test|sme|Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi.| Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida.}}
  +
  +
* {{test|sme|Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui.|Men minst en gang er skolen blitt brukt til det at vi retter på de viltre ungdommene i stedet for å sende dem til skolehjemmet.}}
  +
  +
===Include name to the chunk===
  +
* {{test|sme|Mii váillahit dáidda- ja kulturoasi Hjertespråket guorahallamis.|Vi savner kunst- og kulturelementet i *Hjertespråket utredninga.}}
  +
  +
* {{test|sme|Álbmotskuvlla ja oahpaheaddjiseminára gaskasaš áigi.|Tida mellom folkeskole og lærerseminar.}}
  +
  +
  +
===Unknown===
  +
* {{test|sme|«Prosject» ávvuda vihtta jagi.|«*Prosject» feirer fem år.}}
  +
* {{test|sme|«Prosject Z» ávvuda vihtta jagi.|«*Prosject z» feirer fem år.}}
  +
  +
==Appositions==
  +
* {{test|sme|Eilif Andreas Aslaksen (53) lea bajásšaddan Deanus.|Eilif Andreas Aslaksen (53) har vokst opp i Tana.}}
  +
* {{test|sme|Sámesearvvi jođiheaddji, Mikkel Eskil Mikkelsen, lea hui duhtavaš.|Sameforeningens leder, Mikkel Eskil Mikkelsen, er svært fornøyd.}}
  +
  +
* {{test|sme|Atná sámi árbevieru árvvus.|Hun/han anser samisk tradisjon som verdifull.}}
  +
  +
  +
; vaikko mii osv.
  +
* {{test|sme|Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat.|Det er fredelig og samtidig kan hva som helst skje.}}
  +
  +
  +
; mii→hva som in certain contexts
  +
* {{test|sme|Fuomášedje mii lea dáhpáhuvvamin.|De oppdaget hva som er i ferd med å skje.}}
  +
  +
; mii→som
  +
* {{test|sme|Seammás Bargiidbellodat lea sidjiide áidna bellodat mas lea sosialdemokráhtalaš ideologiija.|Samtidig er Arbeiderpartiet for dem det eneste partiet som har en sosialdemokratisk ideologi.}}
  +
  +
  +
  +
; man→hvor before adj
  +
* {{test|sme|Eadni muitalii man dehálaš dat lei ahte...|Mor fortalte hvor viktig det var at...}}
  +
  +
* {{test|sme|Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan.|Etter at Kunnskapsløftet begynte å fungere, så har dette tilskuddet forsvunnet.}}
  +
  +
  +
* {{test|sme|su iežas|hennes/hans egen}}
  +
  +
; fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
  +
  +
* {{test|sme|eanan- ja luonddudoahpagiid|landskaps- og naturbegrep}}
  +
* {{test|sme|munno|oss to}}
  +
* {{test|sme|Ruvdnaprinseassa Märtha ja moai letne|Kronprinsesse Märtha og vi to er}}
  +
* {{test|sme|Prinseassa Märtha ja earát|Prinsesse Märtha og andre}}
  +
* {{test|sme|Märtha ja earát|Märtha og andre}}
  +
  +
* {{test|sme|galbmit|fryse til}}
  +
* {{test|sme|Beavdi sirdui nuppi latnjii.|Bordet ble flyttet til det andre rommet.}}
  +
  +
  +
* {{test|sme|Lei okta dehálaš erohus.|Det var en viktig forskjell.}}
  +
  +
* {{test|sme|Ánne ráhkada biepmu.|Ánne lager mat.}}
 
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}}
 
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}}
  +
* {{test|sme|22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái.|22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland.}}
  +
* {{test|sme|vuolgit lea suohtas.|å reise er morsomt.}}
  +
* {{test|sme|Go Gonagas Olav buohccái 1990 giđa.|Da Kong Olav ble syk våren 1990.}}
  +
  +
  +
* {{test|sme|juohke lágán geđggiiguin|med alle slags steiner}}
  +
  +
* {{test|sme|Lei unnán mii earuhii nuorra prinssa skuvlavázzima eará skuvlamánáin.|Det var lite som skilte den unge prinsens skolegang fra de andre skolebarnene.}}
  +
  +
;work-in-progress, Pron N chunking:
  +
* {{test|sme|Sámi allaskuvla lea okta dain allaskuvllain.|Samisk høgskole er en av de høyskolene.}}
  +
  +
* (1998-99) Utjamningsmeldinga.|(1998-99) Utjamningsmeldinga.
  +
: right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89
  +
  +
* {{test|sme|Mii vurddiimet dálkki buorránit.|Vi ventet at været skulle bedres.}}
  +
  +
* {{test|sme|Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii.|Kommunen var positiv nettopp så langt som loven pliktet.}}
  +
  +
* {{test|sme|Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja|Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og}}
  +
  +
  +
; MWE nouns
  +
* {{test|sme|go dát ii leat suohkangeaidnu|når dette ikke er kommunal vei}}
  +
: dette/denne should both be ok here
  +
  +
; pro insertion override
  +
* {{test|sme|Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái.|Det er så langt borte at barna ikke lenger når frem til reinen.}}
  +
* {{test|sme|Lea nu guhkkin ahte eai mánát olle bohcco rádjái.|Det er så langt borte at barna ikke når frem til reinen.}}
  +
  +
  +
* {{test|sme|Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe.|Det er så langt borte at barna ikke når frem til reinen der borte.}}
  +
   
 
[[Category:Northern Sámi and Norwegian]]
 
[[Category:Northern Sámi and Norwegian]]

Latest revision as of 11:01, 24 December 2020

Contents

Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Pending tests.

Nouns[edit]

  • (sme) Mus lea biila. → Jeg har en bil.
  • (sme) Mun válden biilla. → Jeg tok bilen.


Accusative
  • (sme) Oainnátgo máná? → Ser du barnet?
Genitive
  • (sme) Mii lea máná namma? → Hva er barnets navn?


num nom.gen => num nom
  • (sme) Máhtte máksá guokte ruvnnu. → Máhtte betaler to kroner.
  • (sme) Girji máksá guokte ruvnnu. → Boka koster to kroner.
num.mod nom => num nom
  • (sme) Guokte ruvnnu leat boahtán. → To kroner har kommet.


det nom.gen nom (det.gender from first nom)
  • (sme) Dán lihtu ulbmil lea addit. → Denne alliansens mål er å gi.

Nouns[edit]

  • (sme) Mii mannat politiijastašuvdnii. → Vi drar til politistasjonen.
  • (sme) Mun bargen sin mielbargin. → Jeg arbeidet som deres medarbeider.
  • (sme) muohtasuddama → snøsmelting
  • (sme) giellarevitaliseren → språkrevitalisering

Proper nouns[edit]

  • (sme) Gonagas Harald → Kong Harald
  • friddja Norgii|til det frie Norge ?
  • (sme) Anne Tornensis Hætta → Anne Tornensis Hætta
  • (sme) Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje. → etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter.

Insert determiner[edit]

  • (sme) Son lea čeahpes bárdni. → Han er en flink gutt.
  • (sme) Son lea čeahpes nieida. → Hun er ei flink jente.
  • (sme) Su namma lea Máret. → Hennes navn er Máret.
  • (sme) Buohtastahte eará gielaiguin. → Sammenlign med andre språk.


or not
  • (sme) Vuosttas instruvssat → De første instruksene
  • (sme) Áviisa almmuhuvvo gitta lávvardahkii. → Avisen publiseres helt til lørdag.
  • (sme) Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin. → Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.
  • (sme) Nuorta-Finnmárkui lea Ukjendord OS hutkame hukset guokte bieggamillopárkka → Til Øst-Finnmark er *Ukjendord AS i ferd med å finne på å bygge to vindmølleparker

Pronouns[edit]

  • (sme) dan → det
  • (sme) Dat leat ártegis olbmot. → De er rare folk.
  • (sme) Dat lea mu beavdi. → Det er mitt bord.
  • (sme) goappat → hver

Reflexive, ieš emphatic[edit]

Nominative => selv
  • (sme) Jus in livčče mun ieš. → Hvis jeg ikke hadde vært meg selv.
  • Máhttu lea ieš namma.|Kunnskapen er selve navnet.
fragment, just to ensure 'selv'

Reflexive pronoun inflected[edit]

Accusative => seg selv
  • (sme) Áhkku geahčai iežas speadjalis. → Bestemor så seg selv i speilet.
  • (sme) Son lábmii iežas. → Hun/han skadet seg selv.


Postposijonskomplement => acc
  • (sme) Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá. → Vibeke Larsen så det som mistillitsuttalelse mot seg.
  • (sme) Mun oidnen dan eahpeluohttámuššan iežan vuostá. → Jeg så det som mistillit mot meg.


Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
  • (sme) Váldde biergasiid iežat fárrui. → Ta tingene med deg.
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela. → Samiske barn behøver støtte for å bevare og utvikle sitt språk. :: for å
  • (sme) Mun ferten čorget iežan lanja. → Jeg må rydde mitt rom.
  • (sme) Son čorgii iežas lanja. → Hun/han ryddet sitt rom.
  • (sme) Mun ohppen čállit sámegiela, iežan eatnigiela. → Jeg lærte å skrive samisk, mitt morsmål.
  • (sme) Moai válde dušše iežame biergasiid mielde. → Vi to tar bare våre ting med.
  • (sme) Doai váldibeahtti dušše iežade biergasiid mielde. → Dere to tar bare deres ting med.
Genitive followed by Pron.Gen => egen
  • (sme) Dat lea mu iežan sivva. → Det er min egen skyld.
Illativ => seg selv
  • (sme) Mánát guvle alcceseaset speadjalis. → Barna kikket på seg selv i speilet.
"på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
Locative => selv
  • (sme) Mis leat alddámet ain šibihat. → Vi har selv enda husdyr.
Comitative => seg selv
  • (sme) Mun jurddašin iežainan. → Jeg tenkte med meg selv.
Essive => på egen hånd
  • (sme) Moai birgejetne iehčaneame. → Vi to greier oss på egen hånd.
iehčanassii_1 => alene (adverb)
  • (sme) Mánát leat iehčanassii ruovttus. → Barna er alene hjemme.


Nonreferential(?) pronouns[edit]

  • (sme) ii mihkkege almenneha birra. → ingenting om allmenningen.
  • (sme) Gávdnetgo maidege? → Fant du noe?
  • (sme) ii mihkkege leat buorre. → ingenting er bra.
  • (sme) ii goabbáge leat buorre. → ingen av dem er bra.
  • (sme) in oastte goappáge. → jeg kjøper ikke noen.

Anaphora resolution[edit]

  • (sme) Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui. → Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.


Adjectives[edit]

  • (sme) Skuvllat ja oahpahusbáikkit leat deháleamos báikkit. → Skolene og undervisningsstedene er de viktigste stedene.
  • (sme) Goabbá lea deháleabbo, boraspire vai olmmoš? → Hvilken av de to er viktigere, rovdyr eller menneske?


  • (sme) almmolaš bálvalusaide → til offentlige tjenester
  • (sme) Mii dárbbašit sámegielat bargi. → Vi behøver samiskspråklig ansatt.
  • (sme) min nuoramus olbmot → våre yngste folk
  • (sme) min nuoramus bárdnái → til vår yngste gutt
  • (sme) Muhtun guovlluin lea oahpahus deháleamos doaibma. → I noen områder er undervisning den viktigste oppgaven.
  • (sme) mu stuora váivái → til mitt store besvær

superlatives[edit]

  • (sme) Máŋga jagi son lea leamaš buoremusaid searvvis. → Mange år har hun/han vært blant de beste.
adj-noun compound vs first cmp part alone
  • (sme) gáiddusoahpahussii → til fjernundervisning
  • (sme) gáiddus → fjerntliggende


  • (sme) smávvaaviisa → småavis


non-synthetic
  • (sme) sávrribut → mer utholdende
Pron.Indef → A.Attr hack
  • (sme) Sámi guovlluid iešguđet gielladilit. → Samiske områders ulike språksituasjoner.


gender
  • (sme) Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái. → Jeg tror at dette har påvirket mer positivt deres identitetsutvikling.

From Prfprc to Adjectives[edit]

  • {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}

Adverbs[edit]

  • (sme) Lea ain deháleabbo ovttasbargat bures. → Det er enda viktigere å samarbeide godt.
  • (sme) Máilbmi lea rievdan das rájes go son lávllui dien šuoŋa. → Verden har forandret seg siden hun/han sang denne melodien.

Move adverb[edit]

  • (sme) Sámediggepresideanta Larsen fas hállá. → Sametingspresident Larsen snakker igjen.

Verbs[edit]

  • (sme) goarun → jeg syr
imp
  • (sme) jeara → spør
  • (sme) Sihko dán. → Stryk dette.


Potensialis[edit]

  • (sme) Máhtte ii leačča čállán. → Máhtte har så ikke skrevet.
  • (sme) Son ii leačča čállán. → Han har så ikke skrevet.
  • (sme) Mot leaččai dasto mánáide dain leairrain? → Hvordan var det så så for barn i de leirene?

Kondisjonalis[edit]

  • (sme) jearašin → jeg kunne spørre
  • (sme) jearašeimmet → vi kunne spørre
  • (sme) Itgo veahkehivčče mu? → Kunne du ikke hjelpe meg?

Kondisjonalis med leat[edit]

  • (sme) Livččii lunddolaš geahčadit dán. → Det hadde vært naturlig å granske dette. :: main verb
  • (sme) Oahpaheaddjit livčče sáhttán gieđahallat ášši buorebut. → Lærerne hadde kunnet behandle saken bedre. :: aux verb

Pro-drop[edit]

  • (sme) dihten → jeg visste
  • (sme) diđiide → dere to visste
  • (sme) diđiimet → vi visste
  • (sme) Ii vel dieđe gos áigu bargat. → Hun/han vet ikke enda hvor hun/han skal arbeide.
expletive/existential (nt, not mf)
  • (sme) Dás čujuhuvvo njuolggadusaide. → Her vises det til regler.
pass→nt
  • (sme) báitá → det skinner
  • (sme) Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin. → Sametinget ser at det kan bli utfordrende.

Verb abessive[edit]

  • (sme) Skuvllat ovttasbarget beroškeahttá riikarájáin. → Skolene samarbeider uten å bry seg om riksgrensene.

existential[edit]

  • (sme) Guovdageainnus lei dievas soahti mannan vahku. → I Kautokeino var det full krig sist uke.
  • (sme) Guovdageainnus lea allaskuvla. → I Kautokeino er det høyskole.
  • (sme) Dat čuohcá sidjiide geain eai leat oahpaheaddjit. → Det berører dem som ikke har lærere.
  • (sme) Tiimmu ovdal gaskaija leat kulturdoalut Kárášjoga čierastanluohkás. → Timen før midnatt er det kulturarrangement i Karasjoks slalåmbakke.
  • (sme) Vaikko leat muhtin erohusat, de sáhttá buohtastahttit sin vieruid min vieruiguin. → Selv om det er noen forskjeller, så kan man sammenligne deres skikker med våre skikker.
  • (sme) Čoahkkimis galgá ráhkaduvvot ođđa plána. → På møtet skal det lages en ny plan.
  • (sme) Dušše Hámmárfeasttas ii leat njiedjan diimmá rájes. → Bare i Hammerfest er det ikke gått ned siden i fjor.
  • (sme) arvá → det regner
  • (sme) Máhppii lea sierra čilgehus. → Til mappa er det en særskilt forklaring.
  • (sme) Jođiheaddjibargui manná ollu áigi. → Til lederarbeidet går det mye tid.
  • (sme) Dasa leat vissásit ollu čilgehusat. → Til det er det sikkert mange forklaringer.
man
  • (sme) Dasto galgá vuodjat dainna olbmuin. → Så skal man svømme med det mennesket.
  • (sme) Dál ferte soabadanproseassa álggahit. → Nå må man igangsette forsoningsprosessen.
override with relatives
  • (sme) Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii. → Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.
  • (sme) Stuorámus dáhpáhus mii goassege lea leamaš. → Den største hendelsen som noensinne har vært.

Don't insert pro[edit]

  • (sme) Dan galgá Anne muitalit Sápmái. → Det skal Anne fortelle til Sameland.
  • (sme) Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái. → Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.



Verb=>adv[edit]

dáidit => nok
  • (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe. → Máhtte stemmer nok ikke på Arbeiderpartiet der borte.
soaitit => kanskje
  • (sme) Son soaitá boahtit ruoktot. → Han kommer kanskje hjem.
ii => ikke
  • (sme) Son ii leat čállán. → Han har ikke skrevet.
  • (sme) Ii lean čállán. → Hun/han hadde ikke skrevet.
  • (smeIIi lean čállimin.) Hun/han var ikke i ferd med å skrive. → {{{3}}}
  • (sme) Ii lean čállime. → Hun/han var ikke i ferd med å skrive.
  • (sme) Máhtte lea boahtán. → Máhtte har kommet.
  • (sme) Ii leat boahtán. → Hun/han har ikke kommet.
capital case
evt. "han" (but can it ever be "det"?)
  • (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet

V2 (negative, subordination, qst, object)[edit]

  • (sme) Itgo boađáše? → Kunne du ikke komme?
  • (sme) It boađáše. → Du kunne ikke komme.
  • (sme) Máhtte ii boađe. → Máhtte kommer ikke.
  • (sme) go it boađáše. → når du ikke kunne komme.
når eller at?
  • (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
kaffe.unc
  • (sme) Maid áiggot bargat go heaittát barggus? → Hva skal du gjøre når du slutter i jobben?
  • (sme) Mii maiddái ássat. → Vi bor også
  • (sme) Mu bealis dat dušše nannejuvvui. → For meg ble det bare styrket.
  • (sme) Muhto sámediggepresideantta baicce ii hálit giellaguovddášjođiheaddji cuiggodit dan dihtii go presideanta ii sámástan ođđajagisártnistis. → Men sametingspresidenten derimot vil ikke språksenterlederen kritisere fordi at presidenten ikke snakket samisk i nyttårstalen.
  • (sme) Muhto sámediggepresideantta ii hálit giellaguovddášjođiheaddji cuiggodit. → Men sametingspresidenten vil ikke språksenterlederen kritisere.
  • (sme) Mii sávvat sutnje bures boahtin, rektor Gunvor Guttorm cealká. → Vi ønsker henne/han velkommen, sier rektor Gunvor Guttorm.

Not V2[edit]

  • (sme) Eiseválddit leat dohkkehan sin rusttega nu movt dat lea dál. → Myndighetene har godkjent deres anlegg slik som det er nå.

FV + IV[edit]

  • (sme) Mun ferten viežžat čázi. → Jeg må hente vann.

wh-question[edit]

  • (sme) Maid don jugat? → Hva drikker du?
  • (sme) Leago duohta? → Er det sant?

Present progressive[edit]

  • (sme) Máhtte lea čállime. → Máhtte er i ferd med å skrive.
or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
  • (sme) ii leat čállimin. → hun/han er ikke i ferd med å skrive.
  • (sme) ii leat čállime. → hun/han er ikke i ferd med å skrive.
  • (sme) ii leačča čállimin. → hun/han er så ikke i ferd med å skrive.
  • (sme) ii leačča čállime. → hun/han er så ikke i ferd med å skrive.

Essive utfyllingspredikat[edit]

remove case-prep in t2x if following or preceding vcop
  • (sme) Son lea taksivuoddjin Oslos. → Hun/han er drosjesjåfør i Oslo.
  • (sme) Mus lea Ánde mielbargin. → Jeg har Ánde som medarbeider.
  • (sme) Sin bargun lei. → Deres arbeid var det.

Actio Ess[edit]

Topic/Focus stuff[edit]

  • (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
  • (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
evt. "faren"


Passive[edit]

  • (sme) Go su áhčči jámii de gildui. → Da hennes/hans far døde så ble det forbudt.
  • (sme) Dađistaga gildui sámegiella. → Etter hvert ble samisk forbudt.
  • (sme) dan maŋŋá gildui sámegiella. → etter det ble samisk forbudt.

"Passive" single verb => bli + adj[edit]

  • (sme) Dál dii fertebehtet geargat. → Nå må dere bli ferdige.
geargat => ferdig.adj/pass__verb

Setningstilsvar vs advl/obj-setning[edit]

  • (sme) Máhtte muitalii ádjá boahtit. → Máhtte fortalte at bestefar kommer.
  • (sme) Máhtte logai sin vuolgit dál juo. → Máhtte sa at de reiser nå allerede.
is logai completely ambiguous between lese/si? difficult lex.sel...
  • (sme) Jáhkken kulturmáhtu leat oktan ággan. → Jeg trodde at kulturkompetansen er et argument.

Negative preterite using PrfPrc form[edit]

  • (sme) Mon gullen ahte áddjá ii dovdan dan lottáža. → Jeg hørte at bestefar ikke kjente den småfuglen.
  • (sme) vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta. → for at flegmatisk okkupasjonsmakt ikke fikk ta dem fast.
  • (sme) Harald vuortnui ahte ii áigon čuohppat vuovttaid. → Harald sverget at han ikke skulle klippe håret.
TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
  • (sme) ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá. → at Norge ikke kunne greie seg mot en flegmatisk krigsmakt.

Derivation[edit]

  • (sme) Son lei dalle sullii 60-jahkásaš. → Han var da omtrent 60-åring.
  • (sme) 32-jahkásaš čiekči máhccá fas Romsii. → 32-årig fotballspiller drar tilbake igjen til Tromsø.
  • (sme) 5-jahkásaččaid bátnedearvvašvuohta ii leat gal mánáid duohken. → 5-åringenes tannhelse er ikke avhengig av barna.


Inchoative[edit]

Verb / Der3 / goahti
  • (sme) boradišgohten → jeg begynte å spise
evt "holde måltid"?
  • (sme) lohkagohten → jeg begynte å lese
don't chunk it all, might want to insert adverbs
  • (sme) ii lohkagoađe. → hun/han begynner ikke å lese.


Passive[edit]

Verb / Der2 / Der_PassL
  • (sme) don borrojuvvot → du spises
insert det , give ind
  • (sme) Čoahkkimis galgá ráhkaduvvot plána. → På møtet skal det lages en plan.

Reflexive verb[edit]

Verb
  • (sme) Son basadii. → Hun/han vasket seg.
(bidix-specified lexical reflexive 'basadit')
  • (sme) ja de háliidin beassat 20 buoremusa searvái. → og så ville jeg komme meg blant de 20 beste.
  • (sme) de dusten sávvat beassat 20 buoremusa searvái. → så torde jeg å ønske å komme meg blant de 20 beste.
  • (sme) Mii leat čoahkkanan digaštallat ášši. → Vi har samlet oss for å debattere saken. :: for å

Causative[edit]

  • (sme) don fertet vuos beatnaga čuogahit. → du må først la hunden drikke.
Verb / Der1 / Der_h
  • (sme) Muhto mánámánnái áiggun goaruhit gávtti. → Men til barnebarnet skal jeg la sy kofte.
Verb / Der2 / Der_ahtti
  • (sme) Sii leat jorgalahttán gihppaga sámegillii. → De har latt oversette heftet til samisk.

Adj vs Noun[edit]

Adjective / Der3 / Der_vuohta => N
  • (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta. → kjærlighet og fattigdom og det grunne.
last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)

Noun vs adjective (sámi - samisk)[edit]

  • (sme) Sámi mánáidgárdin oaivvilduvvo dat mánáidgárdi mii mearrádusaid bokte lea vuođđudan mánáidgárdedoaimma sámi gillii ja kultuvrii. → Som samisk barnehage menes det den barnehagen som har via bestemmelsene grunnlagt barnehagedriften på samisk språk og kultur.
  • (sme) Sámi pedagogalaš bargi bargá doppe. → Samisk pedagogisk ansatt arbeider der borte.
  • (sme) Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis. → Flink samisk pedagogisk ansatt arbeider i barnehagen.
  • (sme) Sámi gievkkanbargi bargá mánáidgárddis. → Samisk kjøkkenansatt arbeider i barnehagen.

Adjective vs noun (guovdageaidnulaš - kautokeinoværing)[edit]

  • (sme) Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu. → I går fikk kautokeinoværing over 1,3 millioner kroner.


Noun phrases[edit]

  • (sme) riikka nubbi davvisámegiel namma → landets andre nordsamiske navn


Essive[edit]

^@SPRED v@ADVL
  • (sme) Nuorran son orui Romssas. → Som ungdom bodde hun/han i Tromsø. :: I ungdommen

NIL[edit]

  • (sme) Prográmmaid gohčodit hiljes-TV:n. → Programmene kaller vi sakte-TV.


  • (dáčča skuvlla kopija) en kopi av den norske skolen → {{{3}}}
  • (Guovdageainnu suohkana sátnejođiheaddji) ordfører av Kautokeino kommune → {{{3}}}
output as two chunks
  • (nb) Dronnet Sonja → Dronning Sonja
  • (nb) Ruvdnaprinsa Harald → Kronprins Harald
adj n.gen n.com
  • (sme) Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin. → Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer.
cmp
  • (sme) Mii manahit máŋgga vejolaš sámegieloahpaheaddji. → Vi mister mange mulige samisklærere.
cmp.guio
  • (sme) Danne heaitá Aslaksen Wikipedia-hoavdan. → Derfor slutter Aslaksen som Wikipedia-sjef.

Definiteness[edit]

subject (guessing...)
  • (sme) Mánná oađđá. → Barnet sover.


  • (sme) Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui. → Sist vinter reiste ei gruppe til Karasjok og Kautokeino.
  • (sme) Giella lei stuorámus váttisvuohta. → Språket var det største problemet.
  • (sme) Mii leat dál gieldda stuorimus mánáidgárdi. → Vi er nå kommunens største barnehage.
mass vs count
  • (sme) Máhtte ráhkada biepmu. → Máhtte lager mat.
  • (sme) Oainnátgo máná? → Ser du barnet?
  • (sme) Skuvla lea leamaš stuorimus oassi prošeavttas. → Skolen har vært den største delen av prosjektet.

leat => har/er/må[edit]

  • (sme) Mis lea cahkkehit dola. → Vi må tenne på bålet.

Coordination[edit]

  • (sme) Ruoŧas ja Norggas → I Sverige og Norge
  • (sme) Stáhta geaidnodoaimmahat lea dál čállán šiehtadusa Ákŋoluovtta muohtačorgenbargguide. → Statens vegvesen har nå skrevet en avtale om Hasviks snøryddingarbeider.
  • (sme) Ministtar bođii, lohpidii ja manai fas. → Ministeren kom, lovde og gikk igjen.

V2[edit]

  • (sme) Son orui Romssas mánnán. → Hun/han bodde i Tromsø som barn.
  • (sme) Muhto mun orun Kárášjogas. → Men jeg bor i Karasjok.

Adpositions[edit]

  • (sme) Mus lea oahpahus gaskkal guovtti ja njealji. → Jeg har undervisning mellom to og fire.
Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
  • (sme) Logut leat sturron jagis jahkái. → Tallene har blitt større år for år.


  • (sme) Giitu skeaŋkkas. → Takk for gaven.
  • (sme) Giitu skeaŋkka ovddas. → Takk for gaven.
  • (sme) dálkki geažil → på grunn av været
evt "vær"
  • (sme) dan geažil → på grunn av det
  • (sme) dán geažil → på grunn av dette
  • (sme) munno geažil → på grunn av oss to
  • (sme) Son lea bargan journalistan jagi 1983 rájes. → Hun/han har arbeidet som journalist fra 1983.
  • (sme) Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen. → Redaktør fra oktober 2015 er Eilif Andreas Aslaksen.

Left-Object+Adv+Main verb[edit]

move object (dan) after adv (juo) and main verb (oahppan)
  • (sme) nuorran son lea dan juo oahppan → som ungdom har han allerede lært det
  • (sme) nuorran son lea dan oahppan → som ungdom har han lært det
"hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
adverbial placement (only adj adverbials move?)
  • (sme) Mun láven dávjá lávlut → Jeg pleier ofte å synge
  • Mun láven árrat lávlut|Jeg pleier synge tidlig
  • (sme) Mun láven dávjá goallut → Jeg pleier ofte å fryse


Prepositional choice, mostly caseprep[edit]

  • (sme) Mun hálan dálkki birra → Jeg snakker om været
  • (sme) Mun human fiskes biilla birra → Jeg snakker om en gul bil
  • (sme) Son lea Norggas → Hun/han er i Norge
  • (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reindriftsarbeidene
  • (sme) Go gullen sámegiela dien mátkkis → Da jeg hørte samisk på denne reisa
loc has på as default, but gullen selects "fra", should it?
  • (sme) Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái. → Jeg gikk barneskolen i Máze fra høsten 1960 inntil sommeren 1966.
(use an np.f first to set the anaphora gender for these tests)
  • (sme) Tine lea Norggas eret → Tine er fra Norge
  • (sme) Son lea Norggas eret → Hun er fra Norge
  • (sme) Son lea Islandas → Hun er på Island
  • (sme) Son lea Islandas eret → Hun/han er fra Island
  • (sme) Märtha Louise oaččui dan 16 jagi áigi. → Märtha Louise fikk det for 16 år siden.
  • (sme) Märtha Louise oaččui dan 16 jagi dassái. → Märtha Louise fikk det for 16 år siden.
  • (sme) Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal. → Regjeringene har nedvurdert dette forslaget som ble framført for 11 år siden.
  • (sme) du idjabeavdeskuffas? → i din nattbordskuff?
  • (sme) áibmomediagáffe → kringkastingskaffe
yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.



Der_halla verbs have illative agents
  • (sme) Mánná gáskkáhalai beatnagii → Barnet ble bitt av hunden
  • (sme) Mii fillehalaimet sidjiide → Vi ble narret av dem

Accusative: om - verb and noun based[edit]

  • (sme) Mun bivden veahki. → Jeg bad om hjelp.


Comitative: med[edit]

  • (sme) Rievssatbivdu unnon beliin. → Rypejakta minket med halvparten.
  • (sme) Boazosápmelaš Jovsset Ánte Sara deaivvadii stáhtain lágamánnerievttis gieskat. → Reindriftssame Jovsset Ánte Sara møtte staten i lagmannsretten nylig.
  • (sme) Sii deaivvadedje lágamánnerievttis. → De møttes i lagmannsretten.

Illative: på - verb-based[edit]

  • (sme) Mun suhtan dutnje → Jeg blir sint på deg
  • (sme) Mun luohtán dutnje → Jeg stoler på deg
  • (sme) Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide → Dere to må begynne å tro på slike spøkelseshistorier
  • (sme) Manne don geahčat munnje? → Hvorfor ser du på meg?
  • (sme) Mii áigut bidjat kámera láidestanheargái. → Vi skal sette kameraet på lederreinen.


Illative: på - noun/numeral-based[edit]

  • (sme) mun dadjen dan sámegillii → jeg sa det på samisk
  • (sme) Dearvvuođat leat sámegillii. → Hilsningene er på samisk.
  • (sme) Máhtte báhcá gáddái. → Máhtte blir igjen på stranda.
  • (sme) Mun ohppen čállit dárogillii. → Jeg lærte å skrive på norsk.
  • (sme) kánske mun galggan hállat dušše sámegillii. → kanskje skal jeg snakke bare på samisk.
  • (sme) In oaidnán su logi jahkái. → Jeg så ikke henne/han på ti år.
  • (sme) Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai. → Her er det sider som kan tolkes på to måter.
  • (sme) Nu ii leat dáhpáhuvvan 567 jahkái. → Slik har det ikke skjedd på 567 år.
  • (sme) kánske mun galggan hállat dušše sámegillii dán kanálas. → kanskje skal jeg snakke bare på samisk i denne kanalen.

Illative: med - verb-based[edit]

  • (sme) Esther álggii hupmat fuolkkis birra, ja nu oahpásnuvven maiddái sunnje, čilge Skoglund. → Esther begynte å snakke om slektningen, og slik ble jeg kjent også med henne, forklarer Skoglund. :: fuolkkis has Px and could be translated to slekningen sin

Illative: for - noun-based[edit]

  • (sme) Dál beasat oaidnit Giđđajohtima minuvttas minuktii. → Nå får du se Vårflyttinga minutt for minutt.

Illative: for - verb-based[edit]

  • (sme) Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán. → Dette betyr selvfølgelig mye for den personen som har vunnet.
  • (sme) De livččii Larsenii vejolaš ovdanbuktit ođđajagisártnis sámegillii. → Så hadde det vært for Larsen mulig å framføre nyttårstalen på samisk.
  • (sme) Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin muhtun suohkaniidda Norggas bálvalit iežas sámegielat álbmoga sámegillii. → Sametinget ser at det kan bli utfordrende for noen kommuner i Norge å betjene sitt samiskspråklige folk på samisk.

Illative: NIL - verb-based[edit]

  • (sme) Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui. → Hendelsen berører selvfølgelig det journalistiske arbeidet.

Illative/locative: how many times something happens[edit]

special rule for these in t1x
  • (sme) Muđui vázzá son beatnagiinnis golbmii beaivái. → Ellers går hun/han med hunden tre ganger om dagen.
  • (sme) Muđui vázzá son beatnagiinnis golbmii vahkkui. → Ellers går hun/han med hunden tre ganger i uka.
taken care of in nom_out macro, based on previous-nhead
  • (sme) Muđui vázzá son beatnagiinnis golbma diimmu vahkkui. → Ellers går hun/han med hunden tre timer i uka.
  • (sme) Muđui vázzá son beatnagiinnis golbma diimmu beaivái. → Ellers går hun/han med hunden tre timer om dagen.
  • (sme) Dát čoahkkimat dollojuvvojit golbma geardde vahkkui. → Disse møtene holdes tre ganger i uka.

locative: fra[edit]

  • (sme) Mun vuolggán Norggas. → Jeg reiser fra Norge.

locative: i[edit]

  • (sme) Mun lean gávppis. → Jeg er i butikken.


locative: etter - noun-based[edit]

  • (sme) Mu mielas lea oahpahalliortnet dehálaš. → Etter min oppfatning er lærlingeordning viktig.

locative: om - based on noun to the left[edit]

  • (sme) Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas. → I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.


  • (sme) Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus. → Da det var tale om samebarn som ikke har lært samisk hjemme.

locative: av[edit]

  • (sme) Ii oktage sis hálit kommenteret ášši aviissas. → Ingen av dem vil kommentere saken i avisa.
  • (sme) Muhto eatnasat sis bissot dálá listtuin. → Men de fleste av dem forblir på nåværende lister.
  • (sme) Niibbi son lei duddjon stális ja čoarvvis. → Kniven hadde hun/han lagd av stål og horn.

locative: hos - pronoun-based[edit]

  • (sme) Mus bođii našunáladovdu. → Hos meg kom en nasjonalfølelse.

Gender, pronouns[edit]

  • (sme) Go Tine Mathisen bođii deike davás de lei son juo oahppan sámegiela. → Da Tine Mathisen kom hit nordover så hadde hun allerede lært samisk.
  • (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela. → Da Per Mathisen kom hit nordover så hadde han allerede lært samisk.
  • (sme) Dat lea buot mii mus lea. → Det er alt som jeg har.
(buot is not specified for gender)

Particles[edit]

  • (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
  • (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
Can we put "guhká go" into the analyser as an mwe?
Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
  • (sme) Baldur go lea boahtán? → er det Baldur som har kommet?
  • (sme) boađát go dál? → kommer du nå?

Foc[edit]

  • (sme) In munge sáhte sárdnut ruoššagillii. → Heller ikke jeg kan tale på russisk.
  • (sme) Nu jáhkán munge. → Slik tror jeg også.

Numerals[edit]

  • (sme) 1300-logu → 1300-tallet
  • (sme) 113-heahtenummáris → på 113-nødnummeret
  • (sme) §§ 1-1984. → §§ 1-1984.
  • (sme) 50% → 50 %
  • (sme) 50 % → 50 %
  • (sme) 50.0 % → 50,0 %
  • (sme) 1.1 → 1.1
  • (sme) 1,1 + 2.13 1,- 10.99 → 1,1 + 2.13 1,- 10.99
  • (sme) 110f f ja §110a → 110f f og §110a
  • (sme) okta 6 filmmas → en av 6 filmer
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá. → Samisk høgskole er en av de høyskolene som fungerer fra høsten.


  • (sme) gaskal diibmu 17.00 ja 21.00 → mellom klokka 17.00 og 21.00
  • (sme) 19 Jovsset → 19 Jovsset
  • (sme) Golmma- njealje → Tre- fire
space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
  • (sme) Golmma-njealje → Tre-fire


Collective numbers[edit]

  • (sme) artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba. → de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.
  • (sme) Ođđa vihtaniid čilgehusat nannejit albmáguoktá ášši. → De nye vitnenes forklaringer styrker de to mennenes sak.
  • (sme) Mun áiggun rehkenastit gallis mii leat dán háve. → Jeg skal regne ut hvor mange vi er denne gang.

Dates[edit]

  • (sme) Min ráhkis Ánne deavdá 10 jagi golggotmánu 10. beaivvi. → Vår kjære Ánne fyller 10 år 10. oktober.
  • (sme) FeFo stivra galgá 24. beaivve dán mánus mearridit maid barget áššiin. → FeFos styre skal bestemme den 24. denne måneden hva de gjør med saken.
  • {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
  • (sme) cuoŋománu 15. b. lea → 15. april er det
  • (sme) Dat dáhpáhuvvá suoidnemánu loahpas. → Det skjer i slutten av juli.
  • (sme) Festivála lágiduvvo dán jagi suoidnemánu 1. beaivvi, nu go dábálaččat Bieskkenjárggas Kárášjogas. → Festivalen arrangeres dette året 1. juli, slik som vanligvis i Bieskkenjárga i Karasjok.
  • (sme) Festivála lágiduvvui mannan jagi suoidnemánu 1. beaivvi. → Festivalen ble arrangert siste året 1. juli.

Add infinitive marker[edit]

  • (sme) Mun lean heaitán borgguheames. → Jeg har sluttet å røyke.
  • (sme) Mus lea biergu vuoššat. → Jeg har kjøtt for å koke.
actually "til å koke"
  • (sme) Geahččaledje jeđđet min. → De prøvde å trøste oss.
  • (sme) Mun mannen olggos borgguhit. → Jeg gikk ut for å røyke.
  • (sme) Mun heiten borgguheames. → Jeg sluttet å røyke.
  • (sme) Mun lean hárjanan borgguhit. → Jeg har blitt vant til å røyke.
  • (sme) Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus. → Hun/han kan være med å styrke reindriftas overlevelse i et sårbar område.

MWE verbs[edit]

all lemq's should be able to move past subjects and adverbs
  • (sme) ovddasvástideigga soai → hadde de to ansvar for
or "de to hadde ansvar for"? (fragment...)
verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
  • (sme) Fuomášuhttit máná. → Gjøre barnet oppmerksom på.
from passive to reflexive
  • (sme) Čájehuvvui ahte bođii suovva olggos skuvllas. → Det viste seg at det kom røyk ut fra skolen.

Relative clauses[edit]

Agent construction[edit]

  • (sme) du čállin reivve → brev som du har skrevet
was: hadde skrevet. Shall be: har skrevet
  • (sme) Nuoraid čállin teavsttat sámegillii. → Tekster som ungdommene har skrevet på samisk.
etc.

Interjections[edit]

  • (sme) Buorre eahket. → God kveld.
  • (sme) Buorre beaivi. → God dag.
  • (sme) Bures boahtin. → Velkommen.


Lexical selection[edit]

orrut → 0:synes, 1:bo, 2:bli, 3:være[edit]

  • (sme) Doppe son orui vahku. → Der borte bodde hun/han ei uke.

adjectives[edit]

  • (sme) garra dálkki geažil → på grunn av dårlig vær

adpositions[edit]

  • (sme) Min álbmoga boahtteáigi lea ráđđehusa duohken. → Vårt folks framtid er avhengig av regjeringa.
  • (sme) Noaidi ii lean bovnna duohken. → Sjamanen var ikke bak tua.

Questions[edit]

  • (sme) Guldalat go don? → Lytter du?
  • (sme) In guldal → Jeg lytter ikke

vbser-drop[edit]

  • (sme) Vare mun doppe dahje son dáppe. → Gid jeg der borte eller hun/han her.
WORKS – Do we have to insert a verb?

Setningstilsvar vs advl/obj-setning[edit]

obj.setn
  • (sme) Máhtte muitalii ahte áddjá boahtá. → Máhtte fortalte at bestefar kommer.

leat → 0:være, 1:ha, 2:måtte[edit]

  • (sme) Mánát leat boahtán skuvlii. → Barna har kommet til skolen.

Miscellaneous[edit]

  • (sme) Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi. → Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida.
  • (sme) Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui. → Men minst en gang er skolen blitt brukt til det at vi retter på de viltre ungdommene i stedet for å sende dem til skolehjemmet.

Include name to the chunk[edit]

  • (sme) Mii váillahit dáidda- ja kulturoasi Hjertespråket guorahallamis. → Vi savner kunst- og kulturelementet i *Hjertespråket utredninga.
  • (sme) Álbmotskuvlla ja oahpaheaddjiseminára gaskasaš áigi. → Tida mellom folkeskole og lærerseminar.


Unknown[edit]

  • (sme) «Prosject» ávvuda vihtta jagi. → «*Prosject» feirer fem år.
  • (sme) «Prosject Z» ávvuda vihtta jagi. → «*Prosject z» feirer fem år.

Appositions[edit]

  • (sme) Eilif Andreas Aslaksen (53) lea bajásšaddan Deanus. → Eilif Andreas Aslaksen (53) har vokst opp i Tana.
  • (sme) Sámesearvvi jođiheaddji, Mikkel Eskil Mikkelsen, lea hui duhtavaš. → Sameforeningens leder, Mikkel Eskil Mikkelsen, er svært fornøyd.
  • (sme) Atná sámi árbevieru árvvus. → Hun/han anser samisk tradisjon som verdifull.


vaikko mii osv.
  • (sme) Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat. → Det er fredelig og samtidig kan hva som helst skje.


mii→hva som in certain contexts
  • (sme) Fuomášedje mii lea dáhpáhuvvamin. → De oppdaget hva som er i ferd med å skje.
mii→som
  • (sme) Seammás Bargiidbellodat lea sidjiide áidna bellodat mas lea sosialdemokráhtalaš ideologiija. → Samtidig er Arbeiderpartiet for dem det eneste partiet som har en sosialdemokratisk ideologi.


man→hvor before adj
  • (sme) Eadni muitalii man dehálaš dat lei ahte... → Mor fortalte hvor viktig det var at...
  • (sme) Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan. → Etter at Kunnskapsløftet begynte å fungere, så har dette tilskuddet forsvunnet.


  • (sme) su iežas → hennes/hans egen
fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
  • (sme) eanan- ja luonddudoahpagiid → landskaps- og naturbegrep
  • (sme) munno → oss to
  • (sme) Ruvdnaprinseassa Märtha ja moai letne → Kronprinsesse Märtha og vi to er
  • (sme) Prinseassa Märtha ja earát → Prinsesse Märtha og andre
  • (sme) Märtha ja earát → Märtha og andre
  • (sme) galbmit → fryse til
  • (sme) Beavdi sirdui nuppi latnjii. → Bordet ble flyttet til det andre rommet.


  • (sme) Lei okta dehálaš erohus. → Det var en viktig forskjell.
  • (sme) Ánne ráhkada biepmu. → Ánne lager mat.
  • (sme) Dat lea sihke buorre ja heittot. → Det er både bra og dårlig.
  • (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái. → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland.
  • (sme) vuolgit lea suohtas. → å reise er morsomt.
  • (sme) Go Gonagas Olav buohccái 1990 giđa. → Da Kong Olav ble syk våren 1990.


  • (sme) juohke lágán geđggiiguin → med alle slags steiner
  • (sme) Lei unnán mii earuhii nuorra prinssa skuvlavázzima eará skuvlamánáin. → Det var lite som skilte den unge prinsens skolegang fra de andre skolebarnene.
work-in-progress, Pron N chunking
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain. → Samisk høgskole er en av de høyskolene.
  • (1998-99) Utjamningsmeldinga.|(1998-99) Utjamningsmeldinga.
right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89
  • (sme) Mii vurddiimet dálkki buorránit. → Vi ventet at været skulle bedres.
  • (sme) Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii. → Kommunen var positiv nettopp så langt som loven pliktet.
  • (sme) Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja → Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og


MWE nouns
  • (sme) go dát ii leat suohkangeaidnu → når dette ikke er kommunal vei
dette/denne should both be ok here
pro insertion override
  • (sme) Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái. → Det er så langt borte at barna ikke lenger når frem til reinen.
  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái. → Det er så langt borte at barna ikke når frem til reinen.


  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe. → Det er så langt borte at barna ikke når frem til reinen der borte.