Northern Sámi and Norwegian/Regression tests
Jump to navigation
Jump to search
Run with t/update-latest
and then check svn diff t
to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
See also Pending tests.
Nouns
- (sme) Mus lea biila. → Jeg har en bil.
- (sme) Mun válden biilla. → Jeg tok bilen.
- Accusative
- (sme) Oainnátgo máná? → Ser du barnet?
- Genitive
- (sme) Mii lea máná namma? → Hva er barnets navn?
- num nom.gen => num nom
- (sme) Máhtte máksá guokte ruvnnu → Máhtte betaler to kroner
- (sme) Girji máksá guokte ruvnnu → Boka koster to kroner
- num.mod nom => num nom
- (sme) Guokte ruvnnu lea boahtán → To kroner har kommet
- det nom.gen nom (det.gender from first nom)
- (sme) Dán lihtu ulbmil lea addit → Denne alliansens mål er å gi
Nouns
- (sme) Mii mannat politiijastašuvdnii → Vi drar til politistasjonen
- (sme) Mun bargen sin mielbargin. → Jeg arbeidet som deres medarbeider.
- (sme) muohtasuddama → snøsmelting
- (sme) giellarevitaliseren → språkrevitalisering
Proper nouns
- (sme) Gonagas Harald → Kong Harald
- (sme) friddja Norgii → til det frie Norge
- (sme) Anne Tornensis Hætta → Anne Tornensis Hætta
- (sme) Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje. → Etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter
Insert determiner
- (sme) Son lea čeahpes bárdni. → Han er en flink gutt.
- (sme) Son lea čeahpes nieida. → Hun er ei flink jente.
- (sme) Su namma lea Máret. → Hennes navn er Máret.
- (sme) buohtastahttit eará gielaiguin → sammenlign med de andre språkene
- or not
- (sme) Vuosttas instruvssat → Første instrukser
- (sme) Áviisa almmuhuvvo gitta lávvardahkii → Avisen publiseres helt til lørdag
- (sme) Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin. → Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.
Pronouns
- (sme) dan → det
- (sme) Dat leat ártegis olbmot. → De er rare folk.
- (sme) Dat lea mu beavdi. → Det er mitt bord.
- (sme) goappat → hver
Reflexive, ieš emphatic
- Nominative => selv
- (sme) Jus in livčče mun ieš. → Hvis jeg ikke hadde vært meg selv.
- (sme) Máhttu lea ieš namma → Kunnskapen er selve navnet
- fragment, just to ensure 'selv'
Reflexive pronoun inflected
- Accusative => seg selv
- (sme) Áhkku geahčai iežas speadjalis → Bestemor så seg selv i speilet
- (sme) Son lábmii iežas → H_n skadet seg selv
- Postposijonskomplement => acc
- (sme) Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá. → Vibeke Larsen så det som mistillitsuttalelse mot seg.
- (sme) Mun oidnen dan eahpeluohttámuššan iežan vuostá. → Jeg så det som mistillit mot meg.
- Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
- (sme) Váldde biergasiid iežat fárrui → Ta tingene med deg
- (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela. → Samiske barn behøver støtte til å bevare og fremme sitt språk. :: for å
- (sme) Mun ferten čorget iežan lanja. → Jeg må rydde mitt rom.
- (sme) Son čorgii iežas lanja. → H_n ryddet sitt rom.
- (sme) mun ohppen čállit sámegiela, iežan eatnigiela → jeg lærte å skrive samisk, mitt morsmål
- (sme) Moai válde dušše iežame biergasiid mielde → Vi to tar bare våre ting med
- (sme) Doai váldibeahtti dušše iežade biergasiid mielde → Dere to tar bare deres ting med
- Genitive followed by Pron.Gen => egen
- (sme) Dat lea mu iežan sivva. → Det er min egen skyld.
- Illativ => seg selv
- (sme) Mánát guvle alcceseaset speadjalis → Barna kikket på seg selv i speilet
- "på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
- Locative => selv
- (sme) Mis leat alddámet ain šibihat → Vi har selv enda husdyr
- Comitative => seg selv
- (sme) Mun jurddašin iežainan → Jeg tenkte med meg selv
- Essive => på egen hånd
- (sme) Moai birgejetne iehčaneame → Vi to greier oss på egen hånd.
- iehčanassii_1 => alene (adverb)
- (sme) Mánát leat iehčanassii ruovttus → Barna er alene hjemme
Nonreferential(?) pronouns
- (sme) ii mihkkege almenneha birra → ingenting om allmenningen
- (sme) Gávdnetgo maidege? → Fant du noe?
- (sme) ii mihkkege leat buorre → ingenting er bra
- (sme) ii goabbáge leat buorre → ingen av dem er bra
- (sme) in oastte goappáge → jeg kjøper ikke noen
Anaphora resolution
- (sme) Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui → Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.
Adjectives
- (sme) Skuvllat ja oahpahusbáikkit leat deháleamos báikkit → Skolene og undervisningsstedene er de viktigste stedene
- (sme) Goabbá lea deháleabbo, boraspire vai olmmoš? → Hvilken av de to er viktigere, et rovdyr eller menneske?
- (sme) almmolaš bálvalusaide → til offentlige tjenester
- (sme) Mii dárbbašit sámegielat bargi. → Vi behøver en samiskspråklig ansatt.
- (sme) min nuoramus olbmot → våre yngste folk
- (sme) min nuoramus bárdnái → til vår yngste gutt
- (sme) Muhtun guovlluin lea oahpahus deháleamos doaibma → I noen områder er undervisning den viktigste oppgaven
- (sme) mu stuora váivái → til mitt store besvær
- adj-noun compound vs first cmp part alone
- (sme) gáiddusoahpahussii → til fjernundervisning
- (sme) gáiddus → fjerntliggende
- (sme) smávvaaviisa → småavis
- non-synthetic
- (sme) sávrribut → mer utholdende
- Pron.Indef → A.Attr hack
- (sme) Sámi guovlluid iešguđet gielladilit → Samiske områders ulike språksituasjoner.
- gender
- (sme) Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái → Jeg tror at dette har påvirket mer positivt deres identitetsutvikling
From Prfprc to Adjectives
- {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}
Adverbs
- (sme) Lea ain deháleabbo ovttasbargat bures. → Det er enda viktigere å samarbeide godt.
Move adverb
- (sme) Sámediggepresideanta Larsen fas hállá. → Sametingspresident Larsen snakker igjen.
Keep verb and reflexive together
- (sme) Sámediggepresideanta Larsen fas doapmá. → Sametingspresident Larsen skynder seg igjen.
Verbs
- (sme) goarun → jeg syr
- imp
- (sme) jeara → spør
- (sme) Sihko dán → Stryk dette
Potensialis
- (sme) Máhtte ii leačča čállán → Máhtte har nå ikke skrevet
- (sme) Son ii leačča čállán → H_n har nå ikke skrevet
- (sme) Mot leaččai dasto mánáide dain leairrain? → Hvordan var det nå så for barna i de leirene?
Kondisjonalis
- (sme) jearašin → jeg kunne spørre
- (sme) jearašeimmet → vi kunne spørre
- (sme) Itgo veahkehivčče mu? → Kunne du ikke hjelpe meg?
Kondisjonalis med leat
- (sme) Livččii lunddolaš geahčadit dán. → Det hadde vært naturlig å granske dette. :: main verb
- (sme) Oahpaheaddjit livčče sáhttán gieđahallat ášši buorebut. → Lærerne hadde kunnet behandle saken bedre. :: auč verb
Pro-drop
- (sme) dihten → jeg visste
- (sme) diđiide → dere to visste
- (sme) diđiimet → vi visste
- expletive/existential (nt, not mf)
- (sme) Dás čujuhuvvo njuolggadusaide. → Her vises det til reglene.
- pass→nt
- (sme) báitá → det skinner
existential
- (sme) Guovdageainnus lei dievas soahti mannan vahku. → I Kautokeino var det full krig sist uke.
- (sme) Guovdageainnus lea allaskuvla. → I Kautokeino er det en høyskole.
- (sme) Dat čuohcá sidjiide geain eai leat oahpaheaddjit. → Det rammer dem som de har ikke lærere.
- (sme) Tiimmu ovdal gaskaija leat kulturdoalut Kárášjoga čierastanluohkás. → Timen før midnatt er det kulturarrangement i Karasjoks slalåmbakke.
- (sme) Vaikko leat muhtin erohusat, de sáhttá buohtastahttit sin vieruid min vieruiguin. → Selv om det er noen forskjeller, så kan man sammenligne deres skikker med våre skikker.
- (sme) Čoahkkimis galgá ráhkaduvvot ođđa plána. → På møtet skal det lages en ny plan.
- (sme) arvá → det regner
- (sme) Máhppii lea sierra čilgehus → Til mappa er det en egen forklaring
- (sme) Jođiheaddjibargui manná ollu áigi → Til lederarbeidet går det mye tid
- (sme) Dasa leat vissásit ollu čilgehusat → Til det er det sikkert mange forklaringer
- man
- (sme) Dasto galgá vuodjat dainna olbmuin → Så skal man svømme med det mennesket
- (sme) Dál ferte soabadanproseassa álggahit. → Nå må man starte forliksprosessen.
- override with relatives
- (sme) Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii → Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.
- (sme) Stuorámus dáhpáhus mii goassege lea leamaš. → Den største hendelsen som noensinne har vært.
Don't insert pro
- (sme) Dan galgá Anne muitalit Sápmái. → Det skal Anne fortelle til Sameland.
- (sme) Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái. → Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.
Negative, verb=>adv
- dáidit => nok
- (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe → Máhtte stemmer nok ikke Arbeiderpartiet der borte
- (sme) Son ii leat čállán → H_n har ikke skrevet
- (sme) ii lean čállán. → h_n hadde ikke skrevet.
- (sme) ii lean čállimin. → h_n var ikke i ferd med å skrive.
- (sme) ii lean čállime. → h_n var ikke i ferd med å skrive.
- (sme) Máhtte lea boahtán → Máhtte har kommet
- (sme) ii leat boahtán → h_n har ikke kommet
- capital case
- evt. "han" (but can it ever be "det"?)
- (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet
V2 (negative, subordination, qst, object)
- (sme) itgo boađáše? → kunne du ikke komme?
- (sme) it boađáše → du kunne ikke komme
- (sme) Máhtte ii boađe → Máhtte kommer ikke
- (sme) go it boađáše → når du ikke kunne komme
- når eller at?
- (sme) itgo gáfe juga? → drikker du ikke kaffe?
- kaffe.unc
- (sme) Maid áiggot bargat go heaittát barggus? → Hva skal du arbeide når du slutter i jobben?
- (sme) Mii maiddái ássat → Vi bor også
- (sme) Mu bealis dat dušše nannejuvvui → For meg ble det bare styrket
Not V2
- (sme) Eiseválddit leat dohkkehan sin rusttega nu movt dat lea dál. → Myndighetene har godtatt deres anordning slik som det er nå.
FV + IV
- (sme) Mun ferten viežžat čázi → Jeg må hente vann
wh-question
- (sme) Maid don jugat? → Hva drikker du?
- (sme) Leago duohta? → Er det sant?
Present progressive
- (sme) Máhtte lea čállime → Máhtte er i ferd med å skrive
- or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
- (sme) ii leat čállimin → h_n er ikke i ferd med å skrive
- (sme) ii leat čállime → h_n er ikke i ferd med å skrive
- (sme) ii leačča čállimin → h_n er nå ikke i ferd med å skrive
- (sme) ii leačča čállime → h_n er nå ikke i ferd med å skrive
Essive utfyllingspredikat
- remove case-prep in t2x if following or preceding vcop
- (sme) Son lea taksivuoddjin Oslos → H_n er drosjesjåfør i Oslo
- (sme) Mus lea Ánde mielbargin → Jeg har Ánde som medarbeider
- (sme) Sin bargun lei → Deres arbeid var det
Actio Ess
Topic/Focus stuff
- (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
- (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
- evt. "faren"
Passive
- (sme) Go su áhčči jámii de gildui → Da h_ns far døde så ble det forbudt
- (sme) Dađistaga gildui sámegiella → Etter hvert ble samisk forbudt
- (sme) dan maŋŋá gildui sámegiella → etter det ble samisk forbudt
"Passive" single verb => bli + adj
- (sme) Dál dii fertebehtet geargat → Nå må dere bli ferdige
- geargat => ferdig.adj/pass__verb
Setningstilsvar vs advl/obj-setning
- (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar skulle komme
- (sme) Máhtte logai sin vuolgit dál juo → Máhtte sa at de skulle reise nå allerede
- is logai completely ambiguous between lese/si? difficult lex.sel...
Negative preterite using PrfPrc form
- (sme) Mon gullen ahte áddjá ii dovdan dan lottáža. → Jeg hørte at bestefar ikke kjente den småfuglen.
- (sme) vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta → for at ei flegmatisk okkupasjonsmakt ikke fikk ta dem fast
- (sme) Harald vuortnui ahte ii áigon čuohppat vuovttaid → Harald sverget at han ikke skulle klippe hår
- TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
- (sme) ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá → at Norge ikke kunne greie seg mot en flegmatisk krigsmakt
Derivation
- (sme) Son lei dalle sullii 60-jahkásaš → H_n var da omtrent 60-åring
no double derivs
- (sme) vuovssihahtti → la spy
Inchoative
- Verb / Der3 / goahti
- (sme) boradišgohten → jeg begynte å spise
- evt "holde måltid"?
- (sme) lohkagohten → jeg begynte å lese
- don't chunk it all, might want to insert adverbs
- (sme) ii lohkagoađe → h_n begynner ikke å lese
Passive
- Verb / Der2 / Der_PassL
- (sme) don borrojuvvot → du spises
- insert det , give ind
- (sme) Čoahkkimis galgá ráhkaduvvot plána. → På møtet skal det lages en plan.
Reflexive verb
- Verb / Der1 / Der_d
- (sme) go čukkodit → når vi stikker oss
- (productive reflexive rule čuoggut=>čukkodit)
- (sme) Son basadii → H_n vasket seg
- (bidix-specified lexical reflexive 'basadit')
- (sme) Mii leat čoahkkanan digaštallat ášši. → Vi har samlet oss for å debattere saken. :: for å
- Verb / Der2 / Der_alla
- evt. "at"
- (sme) go fanahallat → når vi tøyer oss
Causative
- (sme) don fertet vuos beatnaga čuogahit → du må først la hunden drikke
- Verb / Der1 / Der_h
- (sme) Muhto mánámánnái áiggun goaruhit gávtti. → Men til barnebarnet skal jeg la sy kofte.
- Verb / Der2 / Der_ahtti
- (sme) Sii leat jorgalahttán gihppaga sámegillii. → De har latt oversette heftet til samisk
Adj vs Noun
- Adjective / Der3 / Der_vuohta => N
- (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta → kjærlighet og fattigdom og det grunne
- last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)
Noun vs adjective (sámi - samisk)
- (sme) Sámi mánáidgárdin oaivvilduvvo ... → Som samisk barnehage menes det ...
- (sme) Sámi pedagogalaš bargi bargá doppe. → En samisk pedagogisk ansatt arbeider der borte.
- (sme) Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis. → En flink samisk pedagogisk ansatt arbeider i barnehagen.
- (sme) Sámi gievkkanbargi bargá mánáidgárddis. → En samisk kjøkkenansatt arbeider i barnehagen.
Adjective vs noun (guovdageaidnulaš - kautokeinoværing)
- (sme) Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu. → I går fikk en kautokeinoværing over 1,3 million kroner.
Noun phrases
- (sme) riikka nubbi davvisámegiel namma → landets andre nordsamiske navn
Essive
- (sme) olmmožin → som menneske
- (sme) mánnán son orui Romssas → som barn bodde h_n i Tromsø
- ^@SPRED v@ADVL
- (sme) nuorran son orui Romssas → som ungdom bodde h_n i Tromsø
- (sme) mánnán dihten → som barn visste jeg
NIL
- (sme) Prográmmaid gohčodit hiljes-TV:n. → Programmene kaller vi sakte-TV.
- (dáčča skuvlla kopija) en kopi av den norske skolen → {{{3}}}
- (Guovdageainnu suohkana sátnejođiheaddji) ordfører av Kautokeino kommune → {{{3}}}
- output as two chunks
- (nb) Dronnet Sonja → Dronning Sonja
- (nb) Ruvdnaprinsa Harald → Kronprins Harald
- adj n.gen n.com
- (sme) Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin → Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer
- cmp
- (sme) Mii manahit máŋgga vejolaš sámegieloahpaheddjiid → Vi mister mange mulige samisklærere
- cmp.guio
- (sme) Danne heaitá Aslaksen Wikipedia-hoavdan → Derfor slutter Aslaksen som Wikipedia-sjef
Definiteness
- subject (guessing...)
- (sme) Mánná oađđá → Barnet sover
- (sme) Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui → Sist vinter reiste gruppa til Karasjok og Kautokeino
- (sme) Giella lei stuorámus váttisvuohta → Språket var det største problemet
- (sme) Mii leat dál gieldda stuorimus mánáidgárdi → Vi er nå kommunens største barnehage
- mass vs count
- (sme) Máhtte ráhkada biepmu → Máhtte lager mat
- (sme) Oainnátgo máná? → Ser du barnet?
- (sme) Skuvla lea leamaš stuorimus oassi prošeavttas → Skolen har vært den største delen av prosjektet
leat => har/er/må
- (sme) Mis lea cahkkehit dola → Vi må tenne bålet
Coordination
- (sme) Ruoŧas ja Norggas → I Sverige og Norge
- (sme) son dahje sii → h_n eller de
V2
- (sme) Son orui Romssas mánnán → H_n bodde i Tromsø som barn
- (sme) Muhto mun orun Kárášjogas → Men jeg bor i Karasjok
Adpositions
- (sme) Mus lea oahpahus gaskkal guovtti ja njealji → Jeg har undervisning mellom to og fire
- Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
- (sme) Logut leat sturron jagis jahkái. → Tallene har blitt større år for år.
- (sme) Giitu skeaŋkkas. → Takk for gaven.
- (sme) Giitu skeaŋkka ovddas. → Takk for gaven.
- (sme) dálkki geažil → på grunn av været
- evt "vær"
- (sme) dan geažil → på grunn av det
- (sme) dán geažil → på grunn av dette
- (sme) munno geažil → på grunn av oss to
- (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji → Allerede 10. april mot natta reiste Harald over grensa
- (sme) Son lea bargan journalistan jagi 1983 rájes. → H_n har arbeidet som journalist fra 1983.
- (sme) Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen. → Som redaktør fra oktober 2015 er Eilif Andreas Aslaksen.
Left-Object+Adv+Main verb
- move object (dan) after adv (juo) and main verb (oahppan)
- (sme) nuorran son lea dan juo oahppan → som ungdom har h_n allerede lært det
- (sme) nuorran son lea dan oahppan → som ungdom har h_n lært det
- "hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
- adverbial placement (only adj adverbials move?)
- (sme) Mun láven dávjá lávlut → Jeg pleier ofte synge
- (sme) Mun láven árrat lávlut → Jeg pleier synge tidlig
- (sme) Mun láven dávjá goallut → Jeg pleier ofte fryse
Prepositional choice
- (sme) Mun hálan dálkki birra → Jeg snakker om været
- (sme) Mun human fiskes biilla birra → Jeg snakker om den gule bilen
- (sme) Son lea Norggas → H_n er i Norge
- (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reindriftsarbeidene
- (sme) Go gullen sámegiela dien mátkkis → Da jeg hørte samisk på denne reisa
- loc has på as default, but gullen selects "fra", should it?
- (sme) Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái. → Jeg gikk barneskolen i Masi fra høsten 1960 inntil sommeren 1966.
- (use an np.f first to set the anaphora gender for these tests)
- (sme) Tine lea Norggas eret → Tine er fra Norge
- (sme) Son lea Norggas eret → H_n er fra Norge
- (sme) Son lea Islandas → H_n er på Island
- (sme) Son lea Islandas eret → H_n er fra Island
- (sme) Märtha Louise oaččui dan 16 jagi áigi. → Märtha Louise fikk det for 16 år siden.
- (sme) Märtha Louise oaččui dan 16 jagi dassái. → Märtha Louise fikk det for 16 år siden.
- (sme) Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal. → Regjeringene har nedvurdert dette forslaget som ble lagt frem for 11 år siden.
- (sme) du idjabeavdeskuffas? → i din nattbordskuff?
- (sme) áibmomediagáffe → kringkastingskaffe
- yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.
- Der_halla verbs have illative agents
- (sme) Mánná gáskkáhalai beatnagii → Barnet ble bitt av hunden
- (sme) Mii fillehalaimet sidjiide → Vi ble narret av dem
comitative: med
- (sme) Rievssatbivdu unnon beliin. → Rypejakta minsket med halvparten.
Illative: på - verb-based
- (sme) Mun suhtan dutnje → Jeg blir sint på deg
- (sme) Mun luohtán dutnje → Jeg stoler på deg
- (sme) Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide → Dere to må begynne å tro på slike spøkelseshistorier
- (sme) Manne don geahčat munnje? → Hvorfor ser du på meg?
- (sme) Mii áigut bidjat kámera láidestanheargái. → Vi skal sette kameraet på lederreinen.
Illative: på - noun/numeral-based
- (sme) mun dadjen dan sámegillii → jeg sa det på samisk
- (sme) Dearvvuođat leat sámegillii. → Hilsningene er på samisk.
- (sme) Máhtte báhcá gáddái → Máhtte blir igjen på stranda
- (sme) Mun ohppen čállit dárogillii → Jeg lærte å skrive på norsk
- (sme) kánske mun galggan hállat dušše sámegillii → kanskje skal jeg snakke bare på samisk
- (sme) In oaidnán su logi jahkái. → Jeg så ikke h_n på ti år.
- (sme) Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai. → Her er sider som kan tolkes på to måter.
- (sme) 567 jahkái → På 567 år
- (sme) kánske mun galggan hállat dušše sámegillii dán kanálas → kanskje skal jeg snakke bare på samisk i denne kanalen
Illative: for - verb-based
- (sme) Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán. → Dette betyr selvfølgelig mye for den personen som har vunnet.
Illative: for - noun-based
- (sme) Dál beasat oaidnit Giđđajohtima minuvttas minuktii. → Nå får du se Vårflyttinga minutt for minutt.
Illative: for - verb-based
- (sme) De livččii Larsenii vejolaš ovdanbuktit ođđajagisártnis sámegillii. → Så hadde det vært for Larsen mulig legge frem nyttårstalen på samisk.
- (sme) Sámediggi oaidná ahte sáhttá šaddat hástaleaddjin muhtun suohkaniidda Norggas bálvalit iežas sámegielat álbmoga sámegillii. → Sametinget ser at kan bli utfordrende for noen kommuner i Norge å betjene sitt samiskspråklige folk på samisk.
Illative: NIL - verb-based
- (sme) Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui. → Hendelsen rammer selvfølgelig det journalistiske arbeidet.
locative: fra
- (sme) Mun vuolggán Norggas. → Jeg reiser fra Norge.
locative: i
- (sme) Mun lean gávppis. → Jeg er i butikken.
locative: etter - noun-based
- (sme) Mu mielas lea oahpahalliortnet dehálaš. → Etter min oppfatning er lærlingeordninga viktig.
locative: om - based on noun to the left
- (sme) Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas. → I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.
- (sme) Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus. → Da det var tale om samebarn som ikke har lært samisk i hjemmet.
locative: av
- (sme) Ii oktage sis hálit kommenteret ášši aviissas. → Ingen av dem vil kommentere saken i avisa.
- (sme) Muhto eatnasat sis bissot dálá listtuin. → Men de fleste av dem blir på nåværende lister.
locative: hos - pronoun-based
- (sme) Mus bođii našunáladovdu. → Hos meg kom nasjonalfølelsen.
Gender, pronouns
- (sme) Go Tine Chris Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Tine Chris Mathisen kom hit nordover så hadde hun allerede lært samisk
- (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Per Mathisen kom hit nordover så hadde han allerede lært samisk
- (sme) Dat lea buot mii mus lea → Det er alt som jeg har
- (buot is not specified for gender)
Particles
- (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
- (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
- Can we put "guhká go" into the analyser as an mwe?
- Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
- (sme) Baldur go lea boahtán? → er det Baldur som har kommet?
- (sme) boađát go dál? → kommer du nå?
Foc
- (sme) In munge sáhte sárdnut ruoššagillii. → Ikke jeg heller kan tale på russisk.
- (sme) Nu jáhkán munge. → Slik tror jeg også.
Numerals
- (sme) 1300-logu → 1300-tallet
- (sme) 113-heahtenummáris → på 113-nødnummeret
- (sme) §§ 1-1984. → §§ 1-1984.
- (sme) –1 → –1
- (sme) 50% → 50%
- (sme) 50 % → 50 %
- (sme) 50.0 % → 50.0 %
- (sme) 1.1 → 1.1
- (sme) 1,1 + 2.13 1,- 10.99 → 1,1 + 2.13 1,- 10.99
- (sme) 110f f ja §110a → 110f f og §110a
- (sme) okta 6 filmmas → en av 6 filmer
- (sme) Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá → Samisk høgskole er en av de høyskolene som fra høsten fungerer
- (sme) gaskal diibmu 17.00 ja 21.00 → mellom klokka 17.00 og 21.00
- (sme) 19 Jovsset → 19 Jovsset
- (sme) Golmma- njealje → Tre- fire
- space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
- (sme) Golmma-njealje → Tre-fire
Collective numbers
- (sme) artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba. → de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.
Add infinitive marker
- (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
- (sme) Mus lea biergu vuoššat → Jeg har kjøtt til å koke
- actually "til å koke"
- (sme) Geahččaledje jeđđet min → De prøvde å trøste oss
- (sme) Mun mannen olggos borgguhit. → Jeg gikk ut for å røyke.
- (sme) Mun heiten borgguheames. → Jeg sluttet å røyke.
- (sme) Mun lean hárjanan borgguhit. → Jeg har blitt vant til å røyke.
- (sme) Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus. → H_n kan være med å styrke reindriftas overlevelse i et sårbar område.
MWE verbs
- all lemq's should be able to move past subjects and adverbs
- (sme) ovddasvástideigga soai → hadde de to ansvar for
- or "de to hadde ansvar for"? (fragment...)
- verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
- (sme) Fuomášuhttit máná → Gjøre barnet oppmerksom på
Relative clauses
Agent construction
- (sme) du čállin reivve → brev som du har skrevet
- was: hadde skrevet. Shall be: har skrevet
- (sme) Nuoraid čállin teavsttat sámegillii → Tekster som ungdommene har skrevet på samisk
- etc.
Interjections
- (sme) Buorre eahket → God kveld
- (sme) Buorre beaivi → God dag
- (sme) Bures boahtin → Velkommen
Lexical selection
orrut → 0:synes, 1:bo, 2:bli, 3:være
- (sme) Doppe son orui vahku → Der borte bodde h_n ei uke
adjectives
- (sme) garra dálkki geažil → på grunn av det dårlige været
adpositions
- (sme) Min álbmoga boahtteáigi lea ráđđehusa duohken → Vårt folks fremtid er avhengig av regjeringa
- (sme) Noaidi ii lean bovnna duohken → Sjamanen var ikke bak tua
Questions
- (sme) Guldalat go don? → Lytter du?
- (sme) In guldal → Jeg lytter ikke
vbser-drop
- (sme) Vare mun doppe dahje son dáppe → Gid jeg der borte eller h_n her
- WORKS – Do we have to insert a verb?
Setningstilsvar vs advl/obj-setning
- obj.setn
- (sme) Máhtte muitalii ahte áddjá boahtá → Máhtte fortalte at bestefar kommer
leat → 0:være, 1:ha, 2:måtte
- (sme) Mánát leat boahtán skuvlii → Barna har kommet til skolen
Miscellaneous
- (sme) Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi → Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida
- (sme) Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui → Men minst en gang er skolen blitt brukt til det at vi retter på viltre ungdommer i stedet for å sende dem til skolehjemmet
- vaikko mii osv.
- (sme) Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat. → Det er fredelig og samtidig kan hva som helst skje.
- mii→hva som in certain contexts
- (sme) Fuomášedje mii lea dáhpáhuvvamin → De oppdaget hva som er i ferd med å skje
- man→hvor before adj
- (sme) Eadni muitalii man dehálaš dat lei ahte → Mor fortalte hvor viktig det var at
- (sme) Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan → Etter at Kunnskapsløftet begynte å fungere, så har denne pengestønaden forsvunnet
- (sme) 1 () 1998-99 Utjamningsmeldinga → 1 () 1998-99 Utjamningsmeldinga
- {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
- (sme) su iežas → h_ns egen
- fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
- (sme) eanan- ja luonddudoahpagiid → jord- og naturbegrep
- (sme) munno → oss to
- (sme) Ruvdnaprinseassa Märtha ja moai letne → Kronprinsesse Märtha og vi to er
- (sme) Prinseassa Märtha ja earát → Prinsesse Märtha og andre
- (sme) Märtha ja earát → Märtha og andre
- (sme) galbmit → fryse til
- (sme) Beavdi sirdui nuppi latnjii → Bordet ble flyttet til det andre rommet
- (sme) Lei okta dehálaš erohus → Det var en viktig forskjell
- (sme) Ánne ráhkada biepmu → Ánne lager mat
- (sme) Dat lea sihke buorre ja heittot → Det er både bra og dårlig
- (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland
- (sme) vuolgit lea suohtas → å reise er morsomt
- (sme) Go Gonagas Olav buohccái 1990 giđa → Da Kong Olav ble syk våren 1990
- (sme) cuoŋománu 15. b. lea → 15. april er det
- (sme) juohke lágán geđggiiguin → med alle slags steiner
- (sme) Lei unnán mii earuhii nuorra Prinssa skuvlavázzima eará skuvlamánáin → Det var lite som skilte den unge Prinsens skolegang fra de andre skolebarnene
- work-in-progress, Pron N chunking
- (sme) Sámi allaskuvla lea okta dain allaskuvllain → Samisk høgskole er en av de høyskolene
- (sme) (1998-99) Utjamningsmeldinga → (1998-99) Utjamningsmeldinga
- right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89
- (sme) Mii vurddiimet dálkki buorránit → Vi ventet at været skulle bedres
- (sme) Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii → Kommunen var positiv nettopp så langt som loven pliktet
- (sme) Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja → Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og
- MWE nouns
- (sme) go dát ii leat suohkangeaidnu → når dette ikke er en kommunal vei
- dette/denne should both be ok here
- pro insertion override
- (sme) Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái → Det er så langt borte at barna ikke lenger når frem til reinen
- (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái → Det er så langt borte at barna ikke når frem til reinen
- (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe → Det er så langt borte at barna ikke når frem til reinen der borte