Difference between revisions of "Northern Sámi and Norwegian/Regression tests"

From Apertium
Jump to navigation Jump to search
Line 82: Line 82:
 
; Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
 
; Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
 
* {{test|sme|Váldde biergasiid iežat fárrui|Ta tingene med deg}}
 
* {{test|sme|Váldde biergasiid iežat fárrui|Ta tingene med deg}}
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela.|Samiske barn behøver støtte for å bevare og fremme sitt språk.| for å}}
+
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela.|Samiske barn behøver støtte til å bevare og fremme sitt språk.| for å}}
 
* {{test|sme|Mun ferten čorget iežan lanja.|Jeg må rydde mitt rom.}}
 
* {{test|sme|Mun ferten čorget iežan lanja.|Jeg må rydde mitt rom.}}
 
* {{test|sme|Son čorgii iežas lanja.|H_n ryddet sitt rom.}}
 
* {{test|sme|Son čorgii iežas lanja.|H_n ryddet sitt rom.}}
Line 466: Line 466:
 
* {{test|sme|Märtha Louise oaččui dan 16 jagi áigi.|Märtha Louise fikk det for 16 år siden.}}
 
* {{test|sme|Märtha Louise oaččui dan 16 jagi áigi.|Märtha Louise fikk det for 16 år siden.}}
 
* {{test|sme|Märtha Louise oaččui dan 16 jagi dassái.|Märtha Louise fikk det for 16 år siden.}}
 
* {{test|sme|Märtha Louise oaččui dan 16 jagi dassái.|Märtha Louise fikk det for 16 år siden.}}
* {{test|sme|Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal.|Regjeringene har oversett dette forslaget som ble lagt frem for 11 år siden.}}
+
* {{test|sme|Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal.|Regjeringene har nedvurdert dette forslaget som ble lagt frem for 11 år siden.}}
   
 
* {{test|sme|du idjabeavdeskuffas?|i din nattbordskuff?}}
 
* {{test|sme|du idjabeavdeskuffas?|i din nattbordskuff?}}
Line 586: Line 586:
 
==Add infinitive marker==
 
==Add infinitive marker==
 
* {{test|sme|Mun lean heaitán borgguheames|Jeg har sluttet å røyke}}
 
* {{test|sme|Mun lean heaitán borgguheames|Jeg har sluttet å røyke}}
* {{test|sme|Mus lea biergu vuoššat|Jeg har kjøtt for å koke}}
+
* {{test|sme|Mus lea biergu vuoššat|Jeg har kjøtt til å koke}}
 
: actually "til å koke"
 
: actually "til å koke"
 
* {{test|sme|Geahččaledje jeđđet min|De prøvde å trøste oss}}
 
* {{test|sme|Geahččaledje jeđđet min|De prøvde å trøste oss}}
Line 592: Line 592:
 
* {{test|sme|Mun heiten borgguheames.|Jeg sluttet å røyke.}}
 
* {{test|sme|Mun heiten borgguheames.|Jeg sluttet å røyke.}}
 
* {{test|sme|Mun lean hárjanan borgguhit.|Jeg har blitt vant til å røyke.}}
 
* {{test|sme|Mun lean hárjanan borgguhit.|Jeg har blitt vant til å røyke.}}
* {{test|sme|Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus.|H_n kan være med å styrke reindriftas #overleving+ing i et sårbar område.}}
+
* {{test|sme|Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus.|H_n kan være med å styrke reindriftas overlevelse i et sårbar område.}}
   
 
==MWE verbs==
 
==MWE verbs==

Revision as of 10:38, 16 February 2017

Contents

Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-regression.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Pending tests.

Nouns

  • (sme) Mus lea biila. → Jeg har en bil.
  • (sme) Mun válden biilla. → Jeg tok bilen.


Accusative
  • (sme) Oainnátgo máná? → Ser du barnet?
Genitive
  • (sme) Mii lea máná namma? → Hva er barnets navn?


num nom.gen => num nom
  • (sme) Máhtte máksá guokte ruvnnu → Máhtte betaler to kroner
  • (sme) Girji máksá guokte ruvnnu → Boka koster to kroner
num.mod nom => num nom
  • (sme) Guokte ruvnnu lea boahtán → To kroner har kommet


det nom.gen nom (det.gender from first nom)
  • (sme) Dán lihtu ulbmil lea addit → Denne alliansens mål er å gi

Nouns

  • (sme) Mii mannat politiijastašuvdnii → Vi drar til politistasjonen
  • (sme) Mun bargen sin mielbargin. → Jeg arbeidet som deres medarbeider.
  • (sme) muohtasuddama → snøsmelting
  • (sme) giellarevitaliseren → språkrevitalisering

Proper nouns

  • (sme) Gonagas Harald → Kong Harald
  • (sme) friddja Norgii → til det frie Norge
  • (sme) Anne Tornensis Hætta → Anne Tornensis Hætta
  • (sme) Christina Henriksena mielas lea gielladigaštallama retorihkka dakkár mii háddje. → Etter Christina Henriksens oppfatning er språkdebattens retorikk slik som splitter

Insert determiner

  • (sme) Son lea čeahpes bárdni. → Han er en flink gutt.
  • (sme) Son lea čeahpes nieida. → Hun er ei flink jente.
  • (sme) Su namma lea Máret. → Hennes navn er Máret.
  • (sme) buohtastahttit eará gielaiguin → sammenlign med de andre språkene


or not
  • (sme) Vuosttas instruvssat → Første instrukser
  • (sme) Áviisa almmuhuvvo gitta lávvardahkii → Avisen publiseres helt til lørdag
  • (sme) Giellabargu mánáidgárddis gáibida ollu barggu sihke bargiin ja vánhemiin. → Språkarbeidet i barnehagen krever mye arbeid både fra ansatte og foreldrene.

Pronouns

  • (sme) dan → det
  • (sme) Dat leat ártegis olbmot. → De er rare folk.
  • (sme) Dat lea mu beavdi. → Det er mitt bord.
  • (sme) goappat → hver

Reflexive, ieš emphatic

Nominative => selv
  • (sme) Jus in livčče mun ieš → Hvis jeg ikke kunne være meg selv
  • (sme) Máhttu lea ieš namma → Kunnskapen er selve navnet
fragment, just to ensure 'selv'

Reflexive pronoun inflected

Accusative => seg selv
  • (sme) Áhkku geahčai iežas speadjalis → Bestemor så seg selv i speilet
  • (sme) Son lábmii iežas → H_n skadet seg selv


Postposijonskomplement => acc
  • (sme) Vibeke Larsen oinnii dan eahpeluohttámušcealkámuššan iežas vuostá. → Vibeke Larsen så det som mistillitsuttalelse mot seg.
  • (sme) Mun oidnen dan eahpeluohttámuššan iežan vuostá. → Jeg så det som mistillit mot meg.


Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
  • (sme) Váldde biergasiid iežat fárrui → Ta tingene med deg
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela. → Samiske barn behøver støtte til å bevare og fremme sitt språk. :: for å
  • (sme) Mun ferten čorget iežan lanja. → Jeg må rydde mitt rom.
  • (sme) Son čorgii iežas lanja. → H_n ryddet sitt rom.
  • (sme) mun ohppen čállit sámegiela, iežan eatnigiela → jeg lærte å skrive samisk, mitt morsmål
  • (sme) Moai válde dušše iežame biergasiid mielde → Vi to tar bare våre ting med
  • (sme) Doai váldibeahtti dušše iežade biergasiid mielde → Dere to tar bare deres ting med
Genitive followed by Pron.Gen => egen
  • (sme) Dat lea mu iežan sivva. → Det er min egen skyld.
Illativ => seg selv
  • (sme) Mánát guvle alcceseaset speadjalis → Barna kikket på seg selv i speilet
"på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
Locative => selv
  • (sme) Mis leat alddámet ain šibihat → Vi har selv enda husdyr
Comitative => seg selv
  • (sme) Mun jurddašin iežainan → Jeg tenkte med meg selv
Essive => på egen hånd
  • (sme) Moai birgejetne iehčaneame → Vi to greier oss på egen hånd.
iehčanassii_1 => alene (adverb)
  • (sme) Mánát leat iehčanassii ruovttus → Barna er alene hjemme


Nonreferential(?) pronouns

  • (sme) ii mihkkege almenneha birra → ingenting om allmenningen
  • (sme) Gávdnetgo maidege? → Fant du noe?
  • (sme) ii mihkkege leat buorre → ingenting er bra
  • (sme) ii goabbáge leat buorre → ingen av dem er bra
  • (sme) in oastte goappáge → jeg kjøper ikke noen

Anaphora resolution

  • (sme) Lei nuorra nieida gii vujii biilla, ja son lea dál sáddejuvvon buohccevissui → Det var ei ung jente som kjørte bilen, og hun er nå blitt sendt til sykehuset.


Adjectives

  • (sme) Skuvllat ja oahpahusbáikkit leat deháleamos báikkit → Skolene og undervisningsstedene er de viktigste stedene
  • (sme) Goabbá lea deháleabbo, boraspire vai olmmoš? → Hvilken av de to er viktigere, et rovdyr eller menneske?


  • (sme) almmolaš bálvalusaide → til offentlige tjenester
  • (sme) Mii dárbbašit sámegielat bargi. → Vi behøver en samisktalende ansatt.
  • (sme) min nuoramus olbmot → våre yngste folk
  • (sme) min nuoramus bárdnái → til vår yngste gutt
  • (sme) Muhtun guovlluin lea oahpahus deháleamos doaibma → I noen områder er undervisning den viktigste oppgaven
  • (sme) mu stuora váivái → til mitt store besvær


adj-noun compound vs first cmp part alone
  • (sme) gáiddusoahpahussii → til fjernundervisning
  • (sme) gáiddus → fjerntliggende


  • (sme) smávvaaviisa → småavis


non-synthetic
  • (sme) sávrribut → mer utholdende
Pron.Indef → A.Attr hack
  • (sme) Sámi guovlluid iešguđet gielladilit → Samiske områders ulike språksituasjoner.


gender
  • (sme) Jáhkán ahte dát lea váikkuhan positiivvalaččat sin identitehtaovdáneapmái → Jeg tror at dette har påvirket mer positivt deres identitetsutvikling

From Prfprc to Adjectives

  • {{test|sme|Bovdejuvvon guossit bohte.|De inviterte gjestene kom.}

Adverbs

  • (sme) Lea ain deháleabbo ovttasbargat bures. → Det er enda viktigere å samarbeide godt.

Move adverb

  • (sme) Sámediggepresideanta Larsen fas hállá. → Sametingspresident Larsen snakker igjen.

Keep verb and reflexive together

  • (sme) Sámediggepresideanta Larsen fas doapmá. → Sametingspresident Larsen skynder seg igjen.

Verbs

  • (sme) goarun → jeg syr
imp
  • (sme) jeara → spør
  • (sme) Sihko dán → Stryk dette


Potensialis

  • (sme) Máhtte ii leačča čállán → Máhtte har nå ikke skrevet
  • (sme) Son ii leačča čállán → H_n har nå ikke skrevet
  • (sme) Mot leaččai dasto mánáide dain leairrain? → Hvordan var det nå så for barna i de leirene?

Kondisjonalis

  • (sme) jearašin → jeg kunne spørre
  • (sme) jearašeimmet → vi kunne spørre
  • (sme) Itgo veahkehivčče mu? → Kunne du ikke hjelpe meg?

Pro-drop

  • (sme) dihten → jeg visste
  • (sme) diđiide → dere to visste
  • (sme) diđiimet → vi visste
expletive/existential (nt, not mf)
  • (sme) Das čujuhuvvo njuolggadusaide. → Her vises det til reglene.
pass→nt
  • (sme) báitá → det skinner

existential

  • (sme) Guovdageainnus lei dievas soahti mannan vahku. → I Kautokeino var det full krig sist uke.
  • (sme) Guovdageainnus lea allaskuvla. → I Kautokeino er det en høyskole.
  • (sme) Dat čuohcá sidjiide geain eai leat oahpaheaddjit. → Det rammer dem som de har ikke lærere.
  • (sme) arvá → det regner
  • (sme) Máhppii lea sierra čilgehus → Til mappa er det en egen forklaring
  • (sme) Jođiheaddjibargui manná ollu áigi → Til lederarbeidet går det mye tid
  • (sme) Dasa leat vissásit ollu čilgehusat → Til det er det sikkert mange forklaringer
man
  • (sme) Dasto galgá vuodjat dainna olbmuin → Så skal man svømme med det mennesket
override with relatives
  • (sme) Ovddasvástádus lei biddjon girkui, ja lei báhppa gii dan čađahii → Ansvaret var blitt satt på kirka, og det var en prest som gjennomførte det.

Don't insert pro

  • (sme) Dan galgá Anne muitalit Sápmái. → Det skal Anne fortelle til Sameland.
  • (sme) Dan galgaba Anne Henriette Hætta Reinås ja Marita Kristin Eilertsen Tøsse muitalit Sápmái. → Det skal Anne Henriette Hætta Reinås og Marita Kristin Eilertsen Tøsse fortelle til Sameland.


Negative, verb=>adv

dáidit => nok
  • (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe → Máhtte stemmer nok ikke Arbeiderpartiet der borte
  • (sme) Son ii leat čállán → H_n har ikke skrevet
  • (sme) ii lean čállán. → h_n hadde ikke skrevet.
  • (sme) ii lean čállimin. → h_n var ikke i ferd med å skrive.
  • (sme) ii lean čállime. → h_n var ikke i ferd med å skrive.
  • (sme) Máhtte lea boahtán → Máhtte har kommet
  • (sme) ii leat boahtán → h_n har ikke kommet
capital case
evt. "han" (but can it ever be "det"?)
  • (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet

V2 (negative, subordination, qst, object)

  • (sme) itgo boađáše? → kunne du ikke komme?
  • (sme) it boađáše → du kunne ikke komme
  • (sme) Máhtte ii boađe → Máhtte kommer ikke
  • (sme) go it boađáše → når du ikke kunne komme
når eller at?
  • (sme) itgo gáfe juga? → drikker du ikke kaffe?
kaffe.unc
  • (sme) Maid áiggot bargat go heaittát barggus? → Hva skal du arbeide når du slutter i jobben?
  • (sme) Mii maiddái ássat → Vi bor også
  • (sme) Mu bealis dat dušše nannejuvvui → For meg ble det bare styrket

FV + IV

  • (sme) Mun ferten viežžat čázi → Jeg må hente vann

wh-question

  • (sme) Maid don jugat? → Hva drikker du?
  • (sme) Leago duohta? → Er det sant?

Present progressive

  • (sme) Máhtte lea čállime → Máhtte er i ferd med å skrive
or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
  • (sme) ii leat čállimin → h_n er ikke i ferd med å skrive
  • (sme) ii leat čállime → h_n er ikke i ferd med å skrive
  • (sme) ii leačča čállimin → h_n er nå ikke i ferd med å skrive
  • (sme) ii leačča čállime → h_n er nå ikke i ferd med å skrive

Essive utfyllingspredikat

remove case-prep in t2x if following or preceding vcop
  • (sme) Son lea taksivuoddjin Oslos → H_n er drosjesjåfør i Oslo
  • (sme) Mus lea Ánde mielbargin → Jeg har Ánde som medarbeider
  • (sme) Sin bargun lei → Deres arbeid var det

Actio Ess

Topic/Focus stuff

  • (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
  • (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
evt. "faren"

Passive

  • (sme) Go su áhčči jámii de gildui → Da h_ns far døde så ble man forbudt
  • (sme) Dađistaga gildui sámegiella → Etter hvert ble samisk forbudt
  • (sme) dan maŋŋá gildui sámegiella → etter det ble samisk forbudt

"Passive" single verb => bli + adj

  • (sme) Dál dii fertebehtet geargat → Nå må dere bli ferdige
geargat => ferdig.adj/pass__verb


Setningstilsvar vs advl/obj-setning

  • (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar skulle komme
  • (sme) Máhtte logai sin vuolgit dál juo → Máhtte sa at de skulle reise nå allerede
is logai completely ambiguous between lese/si? difficult lex.sel...

Negative preterite using PrfPrc form

  • (sme) Mon gullen ahte áddjá ii dovdan dan lottáža. → Jeg hørte at bestefar ikke kjente den småfuglen.
  • (sme) vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta → for at ei flegmatisk okkupasjonsmakt ikke fikk ta dem fast
  • (sme) Harald vuortnui ahte ii áigon čuohppat vuovttaid → Harald sverget at han ikke skulle klippe hår
TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
  • (sme) ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá → at Norge ikke kunne greie seg mot en flegmatisk krigsmakt

Derivation

  • (sme) Son lei dalle sullii 60-jahkásaš → H_n var da omtrent 60-åring

no double derivs

  • (sme) vuovssihahtti → la spy

Inchoative

Verb / Der3 / goahti
  • (sme) boradišgohten → jeg begynte å spise
evt "holde måltid"?
  • (sme) lohkagohten → jeg begynte å lese
don't chunk it all, might want to insert adverbs
  • (sme) ii lohkagoađe → h_n begynner ikke å lese


Passive

Verb / Der2 / Der_PassL
  • (sme) don borrojuvvot → du spises

Reflexive verb

Verb / Der1 / Der_d
  • (sme) go čukkodit → når vi stikker oss
(productive reflexive rule čuoggut=>čukkodit)
  • (sme) Son basadii → H_n vasket seg
(bidix-specified lexical reflexive 'basadit')
  • (sme) Mii leat čoahkkanan digaštallat ášši. → Vi har samlet oss for å debattere saken. :: for å
Verb / Der2 / Der_alla
evt. "at"
  • (sme) go fanahallat → når vi tøyer oss

Causative

  • (sme) don fertet vuos beatnaga čuogahit → du må først la hunden drikke
Verb / Der1 / Der_h
  • (sme) Muhto mánámánnái áiggun goaruhit gávtti. → Men til barnebarnet skal jeg la sy kofte.
Verb / Der2 / Der_ahtti
  • (sme) Sii leat jorgalahttán gihppaga sámegillii. → De har latt oversette heftet til samisk

Adj vs Noun

Adjective / Der3 / Der_vuohta => N
  • (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta → kjærlighet og fattigdom og det grunne
last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)

Noun vs adjective (sámi - samisk)

  • (sme) Sámi mánáidgárdin oaivvilduvvo ... → Som samisk barnehage menes det ...
  • (sme) Sámi pedagogalaš bargi bargá doppe. → En samisk pedagogisk ansatt arbeider der borte.
  • (sme) Čeahpes sámi pedagogalaš bargi bargá mánáidgárddis. → En flink samisk pedagogisk ansatt arbeider i barnehagen.
  • (sme) Sámi gievkkanbargi bargá mánáidgárddis. → En samisk kjøkkenansatt arbeider i barnehagen.

Adjective vs noun (guovdageaidnulaš - kautokeinoværing)

  • (sme) Ikte oaččui guovdageaidnulaš badjel 1,3 miljovnna ruvnnu. → I går fikk en kautokeinoværing over 1,3 million kroner.


Noun phrases

  • (sme) riikka nubbi davvisámegiel namma → landets andre nordsamiske navn


Essive

  • (sme) olmmožin → som menneske
  • (sme) mánnán son orui Romssas → som barn bodde h_n i Tromsø
^@SPRED v@ADVL
  • (sme) nuorran son orui Romssas → som ungdom bodde h_n i Tromsø
  • (sme) mánnán dihten → som barn visste jeg

NIL

  • (sme) Prográmmaid gohčodit hiljes-TV:n. → Programmene kaller vi sakte-TV.


  • (dáčča skuvlla kopija) en kopi av den norske skolen → {{{3}}}
  • (Guovdageainnu suohkana sátnejođiheaddji) ordfører av Kautokeino kommune → {{{3}}}
output as two chunks
  • (nb) Dronnet Sonja → Dronning Sonja
  • (nb) Ruvdnaprinsa Harald → Kronprins Harald
adj n.gen n.com
  • (sme) Nu ahte seaŋggat ledje durdon guččain ja aktonas mánáid gatnjaliiguin → Slik at sengene hadde blitt tilsølt med urin og ensomme barns tårer
cmp
  • (sme) Mii manahit máŋgga vejolaš sámegieloahpaheddjiid → Vi mister mange mulige samisklærere
cmp.guio
  • (sme) Danne heaitá Aslaksen Wikipedia-hoavdan → Derfor slutter Aslaksen som Wikipedia-sjef

Definiteness

subject (guessing...)
  • (sme) Mánná oađđá → Barnet sover


  • (sme) Mannan dálvvi mátkkoštii joavku Kárášjohkii ja Guovdageidnui → Sist vinter reiste gruppa til Karasjok og Kautokeino
  • (sme) Giella lei stuorámus váttisvuohta → Språket var det største problemet
  • (sme) Mii leat dál gieldda stuorimus mánáidgárdi → Vi er nå kommunens største barnehage
mass vs count
  • (sme) Máhtte ráhkada biepmu → Máhtte lager mat
  • (sme) Oainnátgo máná? → Ser du barnet?
  • (sme) Skuvla lea leamaš stuorimus oassi prošeavttas → Skolen har vært den største delen av prosjektet

leat => har/er/må

  • (sme) Mis lea cahkkehit dola → Vi må tenne bålet

Coordination

  • (sme) Ruoŧas ja Norggas → I Sverige og Norge
  • (sme) son dahje sii → h_n eller de

V2

  • (sme) Son orui Romssas mánnán → H_n bodde i Tromsø som barn
  • (sme) Muhto mun orun Kárášjogas → Men jeg bor i Karasjok

Adpositions

  • (sme) Mus lea oahpahus gaskkal guovtti ja njealji → Jeg har undervisning mellom to og fire
Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
  • (sme) Logut leat sturron jagis jahkái. → Tallene har blitt større år for år.


  • (sme) Giitu skeaŋkkas. → Takk for gaven.
  • (sme) Giitu skeaŋkka ovddas. → Takk for gaven.
  • (sme) dálkki geažil → på grunn av været
evt "vær"
  • (sme) dan geažil → på grunn av det
  • (sme) dán geažil → på grunn av dette
  • (sme) munno geažil → på grunn av oss to
  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji → Allerede 10. april mot natta reiste Harald over grensa
  • (sme) Son lea bargan journalistan jagi 1983 rájes. → H_n har arbeidet som journalist fra 1983.
  • (sme) Váldodoaimmaheaddjin jagi 2015 golggotmánu rájes lea Eilif Andreas Aslaksen. → Som redaktør fra oktober 2015 er Eilif Andreas Aslaksen.

Left-Object+Adv+Main verb

move object (dan) after adv (juo) and main verb (oahppan)
  • (sme) nuorran son lea dan juo oahppan → som ungdom har h_n allerede lært det
  • (sme) nuorran son lea dan oahppan → som ungdom har h_n lært det
"hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
adverbial placement (only adj adverbials move?)
  • (sme) Mun láven dávjá lávlut → Jeg pleier ofte synge
  • (sme) Mun láven árrat lávlut → Jeg pleier synge tidlig
  • (sme) Mun láven dávjá goallut → Jeg pleier ofte fryse


Prepositional choice

  • (sme) Mun hálan dálkki birra → Jeg snakker om været
  • (sme) Mun human fiskes biilla birra → Jeg snakker om den gule bilen
  • (sme) Son lea Norggas → H_n er i Norge
  • (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reindriftsarbeidene
  • (sme) Go gullen sámegiela dien mátkkis → Da jeg hørte samisk på denne reisa
loc has på as default, but gullen selects "fra", should it?
  • (sme) Vázzen mánáidskuvlla Mázes 1960 čavčča rájes gitta 1966 geassái. → Jeg gikk barneskolen i Masi fra høsten 1960 inntil sommeren 1966.
(use an np.f first to set the anaphora gender for these tests)
  • (sme) Tine lea Norggas eret → Tine er fra Norge
  • (sme) Son lea Norggas eret → H_n er fra Norge
  • (sme) Son lea Islandas → H_n er på Island
  • (sme) Son lea Islandas eret → H_n er fra Island
  • (sme) Märtha Louise oaččui dan 16 jagi áigi. → Märtha Louise fikk det for 16 år siden.
  • (sme) Märtha Louise oaččui dan 16 jagi dassái. → Märtha Louise fikk det for 16 år siden.
  • (sme) Ráđđehusat leat badjelgeahččan dán árvalusa mii ovdanbuktojuvvui 11 jagi dás ovdal. → Regjeringene har nedvurdert dette forslaget som ble lagt frem for 11 år siden.
  • (sme) du idjabeavdeskuffas? → i din nattbordskuff?
  • (sme) áibmomediagáffe → kringkastingskaffe
yes, this is a word that's unlikely to be in the corpus. The point is to test dynamic compounding.



Der_halla verbs have illative agents
  • (sme) Mánná gáskkáhalai beatnagii → Barnet ble bitt av hunden
  • (sme) Mii fillehalaimet sidjiide → Vi ble narret av dem



Illative: på - verb-based

  • (sme) Mun suhtan dutnje → Jeg blir sint på deg
  • (sme) Mun luohtán dutnje → Jeg stoler på deg
  • (sme) Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide → Dere to må begynne å tro på slike spøkelseshistorier
  • (sme) Manne don geahčat munnje? → Hvorfor ser du på meg?
  • (sme) Mii áigut bidjat kámera láidestanheargái. → Vi skal sette kameraet på lederreinen.


Illative: på - noun/numeral-based

  • (sme) mun dadjen dan sámegillii → jeg sa det på samisk
  • (sme) Dearvvuođat leat sámegillii. → Hilsningene er på samisk.
  • (sme) Máhtte báhcá gáddái → Máhtte blir igjen på stranda
  • (sme) Mun ohppen čállit dárogillii → Jeg lærte å skrive på norsk
  • (sme) kánske mun galggan hállat dušše sámegillii → kanskje skal jeg snakke bare på samisk
  • (sme) In oaidnán su logi jahkái. → Jeg så ikke h_n på ti år.
  • (sme) Dás leat bealit mat sáhttet dulkojuvvot guovtte láhkai. → Her er sider som kan tolkes på to måter.
  • (sme) 567 jahkái → På 567 år
  • (sme) kánske mun galggan hállat dušše sámegillii dán kanálas → kanskje skal jeg snakke bare på samisk i denne kanalen


Illative: for - verb-based

  • (sme) Dát dieđusge mearkkaša ollu dan olbmui gii lea vuoitán. → Dette betyr selvfølgelig mye for den personen som har vunnet.

Illative: for - noun-based

  • (sme) Dál beasat oaidnit Giđđajohtima minuvttas minuktii. → Nå får du se Vårflyttinga minutt for minutt.

Illative: for - verb-based

  • (sme) De livččii Larsenii vejolaš sámegillii ovdanbuktit ođđajagisártnis sámegillii. → Så kunne det være for Larsen mulig på samisk legge frem nyttårstalen på samisk.

Illative: NIL - verb-based

  • (sme) Dáhpáhus diehttelasat čuohcá dan journalisttalaš bargui. → Hendelsen rammer selvfølgelig det journalistiske arbeidet.


locative: fra

  • (sme) Mun vuolggán Norggas. → Jeg reiser fra Norge.

locative: i

  • (sme) Mun lean gávppis. → Jeg er i butikken.


locative: etter - noun-based

  • (sme) Mu mielas lea oahpahalliortnet dehálaš. → Etter min oppfatning er lærlingeordninga viktig.

locative: om - based on noun to the left

  • (sme) Norggas lea 2005 rájes leamaš soahpamuš ráđđádallamiin stáhta eiseválddiid ja Sámedikki gaskkas. → I Norge har det fra 2005 vært en avtale om konsultasjonene mellom statens myndigheter og Sametinget.


  • (sme) Go lei sáhka sámemánát geat eai leat oahppan sámegiela ruovttus. → Da det var tale om samebarn som ikke har lært samisk i hjemmet.


locative: hos - pronoun-based

  • (sme) Mus bođii našunáladovdu. → Hos meg kom nasjonalfølelsen.


Gender, pronouns

  • (sme) Go Tine Chris Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Tine Chris Mathisen kom hit nordover så hadde hun allerede lært samisk
  • (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Per Mathisen kom hit nordover så hadde han allerede lært samisk
  • (sme) Dat lea buot mii mus lea → Det er alt som jeg har
(buot is not specified for gender)

Particles

  • (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
  • (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
Can we put "guhká go" into the analyser as an mwe?
Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
  • (sme) Baldur go lea boahtán? → er det Baldur som har kommet?
  • (sme) boađát go dál? → kommer du nå?

Numerals

  • (sme) 1300-logu → 1300-tallet
  • (sme) 113-heahtenummáris → på 113-nødnummeret
  • (sme) §§ 1-1984. → §§ 1-1984.
  • (sme) –1 → –1
  • (sme) 50% → 50%
  • (sme) 50 % → 50 %
  • (sme) 50.0 % → 50.0 %
  • (sme) 1.1 → 1.1
  • (sme) 1,1 + 2.13 1,- 10.99 → 1,1 + 2.13 1,- 10.99
  • (sme) 110f f ja §110a → 110f f og §110a
  • (sme) okta 6 filmmas → en av 6 filmer
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá → Samisk høgskole er en av de høyskolene som fra høsten fungerer


  • (sme) gaskal diibmu 17.00 ja 21.00 → mellom klokka 17.00 og 21.00
  • (sme) 19 Jovsset → 19 Jovsset
  • (sme) Golmma- njealje → Tre- fire
space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
  • (sme) Golmma-njealje → Tre-fire


Collective numbers

  • (sme) artistta guovttos Amund Johnskareng ja Per Tor Turi lávluba ja čuojaheaba. → de to artistene Amund Johnskareng og Per Tor Turi synger og spiller.


Add infinitive marker

  • (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
  • (sme) Mus lea biergu vuoššat → Jeg har kjøtt til å koke
actually "til å koke"
  • (sme) Geahččaledje jeđđet min → De prøvde å trøste oss
  • (sme) Mun mannen olggos borgguhit. → Jeg gikk ut for å røyke.
  • (sme) Mun heiten borgguheames. → Jeg sluttet å røyke.
  • (sme) Mun lean hárjanan borgguhit. → Jeg har blitt vant til å røyke.
  • (sme) Sáhttá leat mielde nannemin boazodoalu ceavzima rašes guovllus. → H_n kan være med å styrke reindriftas overlevelse i et sårbar område.

MWE verbs

all lemq's should be able to move past subjects and adverbs
  • (sme) ovddasvástideigga soai → hadde de to ansvar for
or "de to hadde ansvar for"? (fragment...)
verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
  • (sme) Fuomášuhttit máná → Gjøre barnet oppmerksom på

Relative clauses

Agent construction

  • (sme) du čállin reivve → brev som du har skrevet
was: hadde skrevet. Shall be: har skrevet
  • (sme) Nuoraid čállin teavsttat sámegillii → Tekster som ungdommene har skrevet på samisk
etc.

Interjections

  • (sme) Buorre eahket → God kveld
  • (sme) Buorre beaivi → God dag
  • (sme) Bures boahtin → Velkommen


Lexical selection

orrut → 0:synes, 1:bo, 2:bli, 3:være

  • (sme) Doppe son orui vahku → Der borte bodde h_n ei uke

adjectives

  • (sme) garra dálkki geažil → på grunn av det dårlige været

adpositions

  • (sme) Min álbmoga boahtteáigi lea ráđđehusa duohken → Vårt folks fremtid er avhengig av regjeringa
  • (sme) Noaidi ii lean bovnna duohken → Sjamanen var ikke bak tua

Questions

  • (sme) Guldalat go don? → Lytter du?
  • (sme) In guldal → Jeg lytter ikke

vbser-drop

  • (sme) Vare mun doppe dahje son dáppe → Gid jeg der borte eller h_n her
WORKS – Do we have to insert a verb?

Setningstilsvar vs advl/obj-setning

obj.setn
  • (sme) Máhtte muitalii ahte áddjá boahtá → Máhtte fortalte at bestefar kommer

leat → 0:være, 1:ha, 2:måtte

  • (sme) Mánát leat boahtán skuvlii → Barna har kommet til skolen

Miscellaneous

  • (sme) Leimmet nu boaittobealde ahte eat dárbbašan evakueret 1944 čakčat ja oruimet doppe olles áiggi → Vi var så avsides at vi ikke behøvde å evakuere høsten 1944 og vi bodde der borte hele tida
  • (sme) Muhto unnimusat okte lea skuvla geavahuvvon dasa ahte njulget hilbes nuoraid dan sadjái go sáddet sin skuvlaruktui → Men minst en gang er skolen blitt brukt til det at vi retter på viltre ungdommer i stedet for å sende dem til skolehjemmet


vaikko mii osv.
  • (sme) Lea ráfálaš ja seammás sáhttá vaikko mii dáhpáhuvvat. → Det er fredelig og samtidig kan hva som helst skje.


mii→hva som in certain contexts
  • (sme) Fuomášedje mii lea dáhpáhuvvamin → De oppdaget hva som er i ferd med å skje
man→hvor before adj
  • (sme) Eadni muitalii man dehálaš dat lei ahte → Mor fortalte hvor viktig det var at
  • (sme) Maŋŋá go Máhttolokten doaibmagođii, de lea dát ruhtadoarjja jávkan → Etter at Kunnskapsløftet begynte å fungere, så har denne pengestønaden forsvunnet
  • (sme) 1 () 1998-99 Utjamningsmeldinga → 1 () 1998-99 Utjamningsmeldinga
  • {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
  • (sme) su iežas → h_ns egen
fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
  • (sme) eanan- ja luonddudoahpagiid → jord- og naturbegrep
  • (sme) munno → oss to
  • (sme) Ruvdnaprinseassa Märtha ja moai letne → Kronprinsesse Märtha og vi to er
  • (sme) Prinseassa Märtha ja earát → Prinsesse Märtha og andre
  • (sme) Märtha ja earát → Märtha og andre
  • (sme) galbmit → fryse til
  • (sme) Beavdi sirdui nuppi latnjii → Bordet ble flyttet til det andre rommet


  • (sme) Lei okta dehálaš erohus → Det var en viktig forskjell
  • (sme) Ánne ráhkada biepmu → Ánne lager mat
  • (sme) Dat lea sihke buorre ja heittot → Det er både bra og dårlig
  • (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland
  • (sme) vuolgit lea suohtas → å reise er morsomt
  • (sme) Go Gonagas Olav buohccái 1990 giđa → Da Kong Olav ble syk våren 1990
  • (sme) cuoŋománu 15. b. lea → 15. april er det
  • (sme) juohke lágán geđggiiguin → med alle slags steiner
  • (sme) Lei unnán mii earuhii nuorra Prinssa skuvlavázzima eará skuvlamánáin → Det var lite som skilte den unge Prinsens skolegang fra de andre skolebarnene
work-in-progress, Pron N chunking
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain → Samisk høgskole er en av de høyskolene
  • (sme) (1998-99) Utjamningsmeldinga → (1998-99) Utjamningsmeldinga
right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89
  • (sme) Mii vurddiimet dálkki buorránit → Vi ventet at været skulle bedres
  • (sme) Suohkan lei positiiva juste nu guhkás go láhka geatnegahtii → Kommunen var positiv nettopp så langt som loven pliktet
  • (sme) Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951. Ja → Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951. Og


MWE nouns
  • (sme) go dát ii leat suohkangeaidnu → når dette ikke er en kommunal vei
dette/denne should both be ok here
pro insertion override
  • (sme) Lea nu guhkkin ahte eai mánát šat olle bohcco rádjái → Det er så langt borte at barna ikke lenger når frem til reinen
  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái → Det er så langt borte at barna ikke når frem til reinen


  • (sme) Lea nu guhkkin ahte eai mánát olle bohcco rádjái doppe → Det er så langt borte at barna ikke når frem til reinen der borte