Northern Sámi and Norwegian/Regression tests

From Apertium
Jump to navigation Jump to search

Run with sh wiki-tests.sh Regression sme nob update (or just sh regression-tests.sh). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Pending tests.

Nouns

  • (sme) biila → en bil
  • (sme) biillat → biler
Accusative
  • (sme) Oainnátgo máná? → Ser du barnet?
Genitive
  • (sme) Mii lea máná namma? → Hva er barnets navn?
dem_adj_nom
  • (sme) dán jagi válggas → på dette årets valg
num nom.gen => num nom
  • (sme) Máhtte máksá guokte ruvnnu → Máhtte betaler to kroner
  • (sme) Girji máksá guokte ruvnnu → Boken koster to kroner
num.mod nom => num nom
  • (sme) Guokte ruvnnu lea boahtán → To kroner har kommet


det nom.gen nom (det.gender from first nom)
  • (sme) Dán lihtu ulbmil lea addit → Denne alliansens mål er å gi

Compounds

  • (sme) politiijastašuvdnii → til politistasjonen
  • (sme) mielbargin → som medarbeider
  • (sme) allaskuvla → en høyskole
had to add the +Cmpnd tag to LEXICON ATTR (was missing in gtsvn)
N.Cmp + V.Der_n
  • (sme) muohtasuddama → snøsmelting
  • (sme) giellarevitaliseren → språkrevitalisering

Proper nouns

  • (sme) Gonagas Harald → Kong Harald
  • (sme) friddja Norgii → til det frie Norge
  • (sme) El → El
N.Prop.Attr

Insert determiner

  • (sme) Son lea čeahpes bárdni → Han er en flink gutt

Pronouns

  • (sme) dan → det
  • (sme) Dat lea → Det er
  • (sme) goappat → hvert

Reflexive, ieš

Nominative => selv
  • (sme) Jus in livčče mun ieš → Hvis jeg ikke kan være meg selv
  • (sme) Máhttu lea ieš namma → Kunnskapen er selv et navn
fragment, just to ensure 'selv'
Accusative => seg selv
  • (sme) Áhkku geahčai iežas speadjalis → Bestemor så seg selv i speilet
  • (sme) Son lábmii iežas → Hun skadet seg selv
  • (sme) Ale rábmo iežat → Ikke skryt av deg selv
needs to move lemq after adv..not done in transfer yet..
Accusative @-FSUBJ => [at] prpers [skulle]
  • (sme) Elle muitalii iežas vuolgime → Elle fortalte at hun skal reise
Genitive => sin (ieš, explicitly in bidix since we map 'PxSg1' to 'jeg', etc.), back to prpers when gen is chosen by adposition
  • (sme) Váldde biergasiid iežat fárrui → Ta tingene med deg
  • (sme) Mun ferten čorget iežan lanja → Jeg må rydde mitt eget rom
  • (sme) mun ohppen čállit sámegiela, iežan eatnigiela → jeg lærte å skrive samisk, mitt eget morsmål
  • (sme) Moai válde dušše iežame biergasiid mielde → Vi to tar bare våre egne ting med
  • (sme) Doai váldibeahtti dušše iežade biergasiid mielde → Dere to tar bare deres egne ting med
Genitive followed by Pron.Gen => egen
  • (sme) mu iežan girji → min egen bok
Illativ => seg selv
  • (sme) Nieida duddjui alccesis ođđa gielkká → Jenta laget en ny kjelke til seg selv
  • (sme) Mánát guvle alcceseaset speadjalis → Barna kikket på seg selv i speilet
"på" pga. "guovlat" står i lista ill-på-verbs i t1x, "i" pga. "speil" står i "loc-på" i t1x
Locative => selv
  • (sme) Mis leat alddámet ain šibihat → Vi har selv enda husdyr
Comitative => seg selv
  • (sme) Mun jurddašin iežainan → Jeg tenkte med meg selv
Essive => på egen hånd
  • (sme) iehčaneame → på egen hånd
iehčanassii_1 => alene (adverb)
  • (sme) Mánát leat iehčanassii ruovttus → Barna er alene hjemme
Unsure of
  • (sme) ieža moai dáppe váccašetne → vi to spaserer her
correct translation? (not "vi to bare spaserer her"?) TODO

Nonreferential(?) pronouns

  • (sme) mihkkege almenneha birra → noe om allmenningen
  • (sme) Gávdnetgo maidege? → Finner de noe?

Adjectives

  • (sme) deháleamos → viktigst
  • (sme) dehálaš → viktig
  • (sme) deháleabbo → viktigere
  • (sme) almmolaš bálvalusaide → til de offentlige tjenestene
  • (sme) min nuoramus olbmot → våre yngste folk
  • (sme) min nuoramus bárdnái → til vår yngste gutt
  • (sme) du deháleamos doaibma → din viktigste oppgave
  • (sme) mu stuora váivái → til mitt store besvær
  • (sme) Mii lea du bávččas mu stuora givssi ektui? → Hva er din smerte mot min store plage?
adj-noun compound vs first cmp part alone
  • (sme) gáiddusoahpahussii → til fjernundervisning
  • (sme) gáiddus → fjerntliggende


non-synthetic
  • (sme) sávrribut → mer utholdende
Pron.Indef → A.Attr hack
  • (sme) iešguđet → forskjellige
  • (sme) iešguđetge → forskjellige

Verbs

  • (sme) goarun → jeg syr
imp
  • (sme) jeara → spør

Conditional

  • (sme) jearašin → jeg kunne spørre
  • (sme) ii livčče čállán → hun ville ikke ha skrevet
TODO!! is this the correct meaning? (or is it "han kan ha ikke skrevet"?)

Potensialis

  • (sme) jearažan → jeg spør da
  • (sme) Máhtte ii leačča čállán → Máhtte har da ikke skrevet
  • (sme) ii leačča čállán → han har da ikke skrevet

Pro-drop

  • (sme) dihten → jeg visste
  • (sme) diđiide → dere to visste
  • (sme) diđiimet → vi visste
expletive (nt, not mf)
  • (sme) Leago leamaš bátnevárka ráiggi geažil? → Har det vært tannverk på grunn av hullet?
  • (sme) báitá → det skinner


  • (sme) arvá → det regner

Negative, verb=>adv

dáidit => nok
  • (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe → Máhtte stemmer nok ikke Arbeiderpartiet der borte
  • (sme) ii leat čállán → han har ikke skrevet
  • (sme) Máhtte lea boahtán → Máhtte har kommet
  • (sme) ii leat boahtán → han har ikke kommet
capital case
  • (sme) Ii leat čállán → Han har ikke skrevet
evt. "han" (but can it ever be "det"?)
  • (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet

V2 (negative, subordination, qst, object)

  • (sme) itgo boađáše? → kan du ikke komme?
  • (sme) it boađáše → du kan ikke komme
  • (sme) Máhtte ii boađe → Máhtte kommer ikke
  • (sme) go it boađáše → når du ikke kan komme
når eller at?
  • (sme) itgo gáfe juga? → drikker du ikke kaffen?
should be kaffe (indefinite)
  • (sme) Mii maiddái ássat → Vi bor også

FV + IV

  • (sme) Mun ferten viežžat čázi → Jeg må hente vann
  • (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
  • (sme) Mus lea biergu vuoššat → Jeg har kjøtt å koke

Present progressive

  • (sme) Máhtte lea čállime → Máhtte er i gang med å skrive
or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
  • (sme) ii leat čállimin → han er ikke i gang med å skrive
  • (sme) ii leat čállime → han er ikke i gang med å skrive
  • (sme) ii leačča čállimin → han er da ikke i gang med å skrive
  • (sme) ii leačča čállime → han er da ikke i gang med å skrive

Essive utfyllingspredikat

remove case-prep in t2x if following or preceding vcop
  • (sme) Son lea taksivuoddjin Oslos → Han er drosjesjåfør i Oslo
  • (sme) Mus lea Ánde mielbargin → Jeg har Ánde som medarbeider
  • (sme) Sin bargun lei → Deres arbeid var det

Actio Ess

  • (sme) De son gullá beatnaga ciellame → Så hører han at hunden gjør
  • (sme) mun dieđán Máreha čállime dál → jeg vet at Máret skriver nå

Topic/Focus stuff

  • (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
  • (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
evt. "faren"

Passive

  • (sme) Go su áhčči jámii de gildui → Da hans far døde så ble det forbudt
  • (sme) gildui → det ble forbudt
  • (sme) gildui sámegiella → samisk ble forbudt
  • (sme) Dađistaga gildui sámegiella → Etter hvert ble samisk forbudt
  • (sme) dan maŋŋá gildui sámegiella → etter det ble samisk forbudt

"Passive"

single verb => bli + adj
  • (sme) Dál dii fertebehtet geargat → Nå må dere bli ferdige
geargat => ferdig.adj/pass__verb

Setningstilsvar vs advl/obj-setning

  • (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar skulle komme
  • (sme) Máhtte logai sin vuolgit dál juo → Máhtte sa at de skulle reise nå allerede
is logai completely ambiguous between lese/si? difficult lex.sel...

Negative preterite using PrfPrc form

  • (sme) Mon gullen ahte áddjá ii dovdan dan lottáža. → Jeg hørte at bestefar ikke kjente den fuglen.
  • (sme) vai flegmáhtalaš okkupašuvdnafápmu ii beassan sin váldit gitta → for at den flegmatiske okkupasjonsmakten ikke fikk ta dem fast
  • (sme) Harald vuortnui ahte ii áigon čuohppat vuovttaid → Harald sverget at han ikke skulle klippe hår
TODO is 'čuohppat vuovttaid' an mwe for 'klippe seg'? (why the plural?)
  • (sme) ahte Norga ii sáhttán birget flegmáhtalaš soahtefámu vuostá → at Norge ikke kunne greie seg mot den flegmatiske krigsmakten

Derivation

Inchoative

Verb / Der3 / goahti
  • (sme) boradišgohten → jeg begynte å spise
evt "holde måltid"?
  • (sme) lohkagohten → jeg begynte å lese
don't chunk it all, might want to insert adverbs
  • (sme) ii lohkagoađe → han begynner ikke å lese

Passive

Verb / Der2 / Der_PassL
  • (sme) don borrojuvvot → du spises

Reflexive

Verb / Der1 / Der_d
  • (sme) go čukkodit → når de stikker seg
(productive reflexive rule čuoggut=>čukkodit)
  • (sme) Son basadii → Han vasket seg
(bidix-specified lexical reflexive 'basadit')
  • (sme) Son lábmii iežas → Han skadet seg selv
(regular explicit reflexive)
Verb / Der2 / Der_alla
evt. "at"
  • (sme) go fanahallat → når vi tøyer oss

Causative

  • (sme) don fertet vuos beatnaga čuogahit → du må først la hunden drikke
Verb / Der1 / Der_h
  • (sme) goaruhit → de lar sy
Verb / Der2 / Der_ahtti
  • (sme) muitalahtten → jeg lot fortelle

Adj->Noun

Adjective / Der3 / Der_vuohta => N
  • (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta → kjærlighet og fattigdom og det grunne
last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)

Noun phrases

  • (sme) riikka nubbi davvisámegiel namma → rikets andre nordsamiske navn
  • (sme) seammá sámiid → de samme samene
  • (nb) Dronnet Sonja → Dronning Sonja
  • (nb) Ruvdnaprinsa Harald → Kronprins Harald
Essive
  • (sme) olmmožin → som menneske
  • (sme) mánnán son orui Romssas → som barn bodde han i Tromsø
^@SPRED v@ADVL
  • (sme) nuorran son orui Romssas → som ungdom bodde han i Tromsø
  • (sme) mánnán dihten → som barn visste jeg
accusative object predicative, add "være"
  • (sme) Dan gal dieđán váddása, ja → Det vet jeg vel er vanskelig, og
gal=>vel?


noun is <sp>, determiner has no <sp> form, change determiner to <sg><m>
  • (sme) dákkár heahtegádjumiid → slik nødverge

Definiteness

subject (guessing...)
  • (sme) Mánná oađđá → Barnet sover
illative
  • (sme) skuvlii → til skolen


mass vs count
  • (sme) Máhtte ráhkada biepmu → Máhtte lager mat
  • (sme) Oainnátgo máná? → Ser du barnet?

leat => har/er/må

  • (sme) Mis lea cahkkehit dola → Vi må tenne bålet

Coordination

  • (sme) Ruoŧas ja Norggas → i Sverige og Norge
  • (sme) son dahje sii → han eller de
  • (sme) Harald liiko návddašit luonddu, dan dahká son go sihkkelastá → Harald liker å nyte naturen, det gjør han når han sykler

V2

  • (sme) Son orui Romssas mánnán → Han bodde i Tromsø som barn
  • (sme) Hearggit ruhttet dego livčče → Kjørereinene løper som de kan være
siste ordet fungerte ikkje =P ("som om" heller?)
  • (sme) Muhto mun orun Kárášjogas → Men jeg bor i Karasjok

Adpositions

  • (sme) Mus lea oahpahus gaskkal guovtti ja njealji → Jeg har undervisning mellom to og fire
Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
  • (sme) dálkki geažil → på grunn av været
evt "vær"
  • (sme) dan geažil → på grunn av det
  • (sme) dán geažil → på grunn av dette
  • (sme) munno geažil → på grunn av oss to
  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji → Allerede 10. april mot natten reiste Harald over grensen

Left-Object+Adv+Main verb

move object (dan) after adv (juo) and main verb (oahppan)
  • (sme) nuorran son lea dan juo oahppan → som ungdom har han allerede lært det
  • (sme) nuorran son lea dan oahppan → som ungdom har han lært det
"hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
adverbial placement (only adj adverbials move?)
  • (sme) Mun láven dávjá lávlut → Jeg pleier ofte synge
  • (sme) Mun láven árrat lávlut → Jeg pleier synge tidlig
  • (sme) Mun láven dávjá goallut → Jeg pleier ofte fryse
  • (sme) Mun láven árrat goallut → Jeg pleier fryse tidlig

Prepositional choice

  • (sme) Mun hálan dálkki birra → Jeg snakker om været
  • (sme) Son lea Norggas → Han er i Norge
  • (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reindriftsarbeidene
  • (sme) Go gullen sámegiela dien mátkkis → Da jeg hørte samisk på denne reisen
loc has på as default, but gullen selects "fra", should it?


  • (sme) Mun suhtan dutnje. → Jeg blir sint på deg.
  • (sme) Mun liikon dutnje. → Jeg liker deg.
  • (sme) Son lea Norggas eret → Hun er fra Norge
  • (sme) Son lea Islandas → Hun er på Island
  • (sme) Son lea Islandas eret → Hun er fra Island


  • (sme) du idjabeavdeskuffas? → i din nattbordskuff?


Der_halla verbs have illative agents
  • (sme) Mánná gáskkáhalai beatnagii → Barnet ble bitt av hunden
  • (sme) Mii fillehalaimet sidjiide → Vi ble narret av dem
other verb-based prepositional choices
  • (sme) Manne don geahčat munnje? → Hvorfor ser du på meg?
  • (sme) Fertebeahtti jáhkkigoahtit dakkár balddonasmuitalusaide → Dere to må begynne å tro på slike spøkelseshistorier
  • (sme) Máhtte báhcá gáddái → Máhtte blir igjen på stranden
  • (sme) Mun ohppen čállit dárogillii → Jeg lærte å skrive på norsk
  • (sme) kánske mun galggan hállat dušše sámegillii → kanskje skal jeg snakke bare på samisk
  • (sme) mun dadjen dan sámegillii → jeg sa det på samisk
  • (sme) Mun suhtan dutnje → Jeg blir sint på deg
  • (sme) Mun luohtán dutnje → Jeg stoler på deg
  • (sme) dikki mielas livččii dehálaš oččodit olbmuide diđolašvuođa ja ipmárdusa ahte sin giella lea áitojuvvon → i rettens oppfatning kan det være viktig å prøve å gi folk bevisstheten og forståelsen at deres språk er truet

Gender, pronouns

  • (sme) Go Tine Chris Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Tine Chris Mathisen kom hit nordover så hadde hun allerede lært samisk
  • (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela → Da Per Mathisen kom hit nordover så hadde han allerede lært samisk
  • (sme) Dat lea buot mii mus lea → Det er alt som jeg har
(buot is not specified for gender)

Particles

  • (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
  • (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
Can we put "guhká go" into the analyser as an mwe?
Removing 'go.Qst.Pcle' in t2x (and tagging the preceding word with Qst)
  • (sme) it go boađáše? → kan du ikke komme?
  • (sme) Baldur go lea boahtán? → er det Baldur som har kommet?
  • (sme) boađát go dál? → kommer du nå?

Numerals

  • (sme) 1982:s 1982's 1982-s 1982% → 1982 1982 1982 1982%
  • (sme) 1300-logu → 1300-tallet
  • (sme) 113-heahtenummáris → på 113-nødnummeret
  • (sme) §§ 1-1984. → §§ 1-1984.
  • (sme) –1 → –1
  • (sme) 50% → 50%
  • (sme) 50 % → 50 %
  • (sme) 50.0 % → 50.0 %
  • (sme) 1.1 → 1.1
  • (sme) 1,1 + 2.13 1,- 10.99 → 1,1 + 2.13 1,- 10.99
  • (sme) 110f f ja §110a → 110f f og §110a


  • (sme) 19 Jovsset → 19 Jovsset
  • (sme) Golmma- njealje → Tre- fire
space shouldn't be in input, but handle it correctly when it is (e.g. a line-break)
logi-jagáš|tiåret -- this rule to be removed.

Add infinitive marker

  • (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
  • (sme) Mus lea biergu vuoššat → Jeg har kjøtt å koke
actually "til å koke"
  • (sme) Geahččaledje jeđđet min → De prøvde å trøste oss

MWE verbs

all lemq's should be able to move past subjects and adverbs
  • (sme) ovddasvástideigga soai → hadde de to ansvar for
or "de to hadde ansvar for"? (fragment...)
verbs with the pardef lemq-obj__verb in bidix should also be able to move past obj
  • (sme) Fuomášuhttit máná → Gjøre barnet oppmerksom på

Relative clauses

Agent construction

  • (sme) du čállin reivve → brev som du har skrevet
was: hadde skrevet. Shall be: har skrevet
  • (sme) gumppe čállin reivve → brev som ulven har skrevet
etc.

Interjections

  • (sme) Buorre eahket → God kveld
  • (sme) Buorre beaivi → God dag
  • (sme) Bures boahtin → Velkommen

Questions

  • (sme) Guldalat go don? → Lytter du?

Miscellaneous

  • (sme) Gonagas Harald liiko návddašit luonddu, dan dahká son go bivdá → Kong Harald liker å nyte naturen, det gjør han når han jakter
  • (sme) 1 () 1998-99 Utjamningsmeldinga sátni → 1 () 1998-99 Utjamningsmeldingas ord
  • (sme) u-vearba Burton-upon-Trent → et u-verb Burton-upon-Trent
  • {{test|sme|čakčamánu 7.b. 1854|7. september 1854}
  • (sme) su iežas → hans egen
fragments and such, many are probably wrong, just here to make sure it goes through without # or @ errors
  • (sme) eanan- → en jord-
  • (sme) eanan- ja luonddudoahpagiid → jord- og naturbegrepene
  • (sme) munno → oss to
  • (sme) Ruvdnaprinseassa Märtha ja moai letne → Kronprinsesse Märtha og vi to er
  • (sme) Prinseassa Märtha ja earát → Prinsesse Märtha og andre
  • (sme) Märtha ja earát → Märtha og andre
ja eanet ovddastanbargguid|og det mer forestå arbeidene
This one is wrong. ovddastanbargguid - represenrasjonsarbeid
  • (sme) galbmit → fryse til
  • (sme) sirdui → han ble flyttet
daid sáhte suddjet|kan dem beskytte
Here, we miis a negation verb
  • (sme) lei okta dehálaš erohus → det var en viktig forskjell
  • (sme) Anne ráhkada biepmu → Anne lager mat
  • (sme) Dat lea sihke buorre ja heittot → Det er både bra og dårlig
  • (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sameland
  • (sme) vuolgit lea suohtas → å reise er morsomt
  • (sme) Go Gonagas Olav buohccái 1990 giđa → Da Kong Olav ble syk våren 1990
  • (sme) cuoŋománu 15. b. lea → 15. april er det


  • (sme) málet olbmuid earenoamáš dáhpáhusaid oktavuođas → male folk i forbindelse med de spesielle hendelsene


  • (sme) Geassemánu 30. beaivvi 1944 nammadii Ráđđehus Londonis Ruvdnaprinssa Olav suodjalushoavdan → 30. juni 1944 oppnevnte Regjeringen i London Kronprins Olav som forsvarssjef
work-in-progress, Pron N chunking
  • (sme) Sámi allaskuvla lea okta dain allaskuvllain → Samisk høgskole er en av de høyskolene
  • (sme) Dat lei nuppiin sániin → Det var med det andre ordet
  • (sme) (1998-99) Utjamningsmeldinga → (1998-99) Utjamningsmeldinga
right-parens gets removed, fixed by patch http://bugs.apertium.org/cgi-bin/bugzilla/show_bug.cgi?id=89


  • (sme) Od.prp. nr. 41 1949 ja Od.prp. nr. 9 1951 → Ot.prp. nr. 41 1949 og Ot.prp. nr. 9 1951