Difference between revisions of "Northern Sámi and Norwegian/Regression tests"
Jump to navigation
Jump to search
Line 33: | Line 33: | ||
* {{test|sme|allaskuvla|en høyskole}} |
* {{test|sme|allaskuvla|en høyskole}} |
||
: had to add the +Cmpnd tag to LEXICON ATTR (was missing in gtsvn) |
: had to add the +Cmpnd tag to LEXICON ATTR (was missing in gtsvn) |
||
* {{test|sme|skuvlavázzima|skolegående}} |
|||
: todo override with derverbal__n to 'skolegang' |
|||
* {{test|sme|giellarevitaliseren|språkrevitaliserende}} |
|||
=== Proper nouns=== |
=== Proper nouns=== |
Revision as of 09:21, 25 June 2010
Run with sh wiki-tests.sh Regression sme nob update
(or just sh regression-tests.sh
). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
See also Pending tests.
Nouns
- (sme) biila → en bil
- (sme) biillat → biler
- Accusative
- (sme) Oainnátgo máná? → Ser du barnet?
- Genitive
- (sme) Mii lea máná namma? → Hva er barnets navn?
- dem_adj_nom
- (sme) juohke lágán geđggiiguin → med alle slags steiner
- (sme) dán jagi válggas → på dette årets valg
- num nom_gen => num_nom
- (sme) Máhtte máksá guokte ruvnnu → Máhtte betaler to kroner
- (sme) Girji máksá guokte ruvnnu → Boken koster to kroner
- num_mod nom => num_nom
- (sme) Guokte ruvnnu lea boahtán → To kroner har kommet
Compounds
- (sme) politiijastašuvdnii → til politistasjonen
- (sme) mielbargin → som medarbeider
- (sme) allaskuvla → en høyskole
- had to add the +Cmpnd tag to LEXICON ATTR (was missing in gtsvn)
- (sme) skuvlavázzima → skolegående
- todo override with derverbal__n to 'skolegang'
- (sme) giellarevitaliseren → språkrevitaliserende
Proper nouns
- (sme) Gonagas Harald → Kong Harald
- (sme) friddja Norgii → til det frie Norge
Insert determiner
- (sme) Doppe son orui vahku → Der borte bodde han en uke
- (sme) Son lea čeahpes bárdni → Han er en flink gutt
Pronouns
- (sme) dan → dets
- (sme) Dat lea → Det er
Reflexive, ieš
- (sme) Váldde biergasiid iežat fárrui → Ta sakene med deg
- (sme) ieža moai dáppe váccašetne → vi to bare spaserer her
- (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
- (sme) Son lábmii iežas → Han skadet seg
- (sme) Váldde biergasiid iežat fárrui → Ta sakene med deg
- (sme) Jus in livčče mun ieš → Hvis jeg kanskje ikke er meg selv
- eh.."kanskje" :/
- (sme) Mun jurddašin iežainan → Jeg tenkte med meg selv
- (sme) Máhttu lea ieš namma strategiijas → Kvalifikasjonen er selv et navn på strategien
- correct translation?
Adjectives
- (sme) deháleamos → viktigst
- (sme) dehálaš → viktig
- (sme) deháleabbo → viktigere
- (sme) almmolaš bálvalusaide → til de offentlige tjenestene
- (sme) min nuoramus olbmot → våre yngste mennesker
- (sme) min nuoramus bárdnái → til vår yngste gutt
- (sme) du deháleamos doaibma → din viktigste oppgave
- (sme) mu stuora giksái → til min store plage
- (sme) Mii lea du bávččas mu stuora givssi ektui? → Hva er din smerte mot min store plage?
- adj-noun compound vs first cmp part alone
- (sme) gáiddusoahpahussii → til fjernundervisning
- (sme) gáiddus → fjerntliggende
Verbs
- (sme) goarun → jeg syr
- imp
- (sme) jeara → spør
Cond/Pot (currently just adverbs…can we do better?)
- (sme) jearažan → jeg spør muligens
- (sme) jearašin → jeg spør kanskje
- (sme) Máhtte ii leačča čállán → Máhtte har muligens ikke skrevet
- (sme) ii leačča čállán → han har muligens ikke skrevet
- (sme) ii livčče čállán → han har kanskje ikke skrevet
Pro-drop
- (sme) dihten → jeg visste
- (sme) diđiide → dere to visste
- (sme) diđiimet → vi visste
- expletive (nt, not mf)
- (sme) Leago duohta? → Er det sant?
- (sme) Leago leamaš bátnevárka ráiggi geažil? → Har det vært tannverk på grunn av hullet?
- (sme) báitá → det skinner
- (sme) arvá → det regner
Negative, verb=>adv
- dáidit => nok
- (sme) Máhtte ii dáidde jienastit Bargiidbellodaga doppe → Máhtte stemmer nok ikke Arbeiderpartiet der borte
- (sme) ii leat čállán → han har ikke skrevet
- (sme) Máhtte lea boahtán → Máhtte har kommet
- (sme) ii leat boahtán → han har ikke kommet
- capital case
- (sme) Ii leat čállán → Han har ikke skrevet
- evt. "han" (but can it ever be "det"?)
- (sme) Máhtte ii leat boahtán → Máhtte har ikke kommet
V2 (negative, subordination, qst, object)
- (sme) itgo boađáše? → kommer du ikke kanskje?
- (sme) it boađáše → du kommer kanskje ikke
- (sme) Máhtte ii boađe → Máhtte kommer ikke
- (sme) go it boađáše → når du kanskje ikke kommer
- når eller at?
- (sme) itgo gáfe juga? → drikker du ikke kaffen?
- should be kaffe (indefinite)
- (sme) Mii maiddái ásset → Vi bor også
FV + IV
- (sme) Mun ferten viežžat čázi → Jeg må hente vann
- (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
Present progressive
- (sme) Máhtte lea čállime → Máhtte er i gang med å skrive
- or "holder på å", but then we have to exchange "er" for "holde" in lex-sel and insert "på å" based on "leat->holde"
- (sme) ii leat čállimin → han er ikke i gang med å skrive
- (sme) ii leat čállime → han er ikke i gang med å skrive
- (sme) ii leačča čállimin → han er muligens ikke i gang med å skrive
- (sme) ii leačča čállime → han er muligens ikke i gang med å skrive
Essive spred
- (sme) itgo boađáše munnje veahkkin → kommer du ikke kanskje og hjelper meg
- (sme) itgo boađáše munnje studeantan → kommer du ikke kanskje til meg som student
- Yes it's contrived... the point is just to have a fallback if the essive noun has no corresponding bidix verb.
Actio Ess
- (sme) De son gullá beatnaga ciellame → Så hører han at hunden gjør
- (sme) mun dieđán Máreha čállime dál → jeg vet at Máret skriver nå
Topic/Focus stuff
- (sme) Boahtágo áhčči ihttin? → Kommer far i morgen?
- (sme) Áhččigo boahtá ihttin? → Er det far som kommer i morgen?
- evt. "faren"
Inserting adverbs for pot/cond
- (sme) ii leačča čállán → han har muligens ikke skrevet
- (sme) ii livčče čállán → han har kanskje ikke skrevet
Passive
- (sme) Go su áhčči jámii de gildui → Når hans far døde så ble han forbudt
- or "så ble det forbudt"? (see Pending tests for full sentence)
- (sme) gildui → han ble forbudt
- (sme) gildui sámegiella → samisk ble forbudt
- (sme) Dađistaga gildui sámegiella → Etter hvert ble samisk forbudt
- (sme) dan maŋŋá gildui sámegiella → etter det ble samisk forbudt
"Passive"
- single verb => bli + adj
- (sme) Dál dii fertebehtet geargat → Nå må dere bli ferdige
- geargat => ferdig.adj/pass__verb
Setningstilsvar vs advl/obj-setning
- (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar skulle komme
- (sme) Máhtte logai sin vuolgit dál juo → Máhtte sa at de skulle reise nå allerede
- (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
- (sme) Mii vurddiimet dálkki buorránit → Vi ventet at været skulle bedres
Derivation
Inchoative
- Verb / Der3 / goahti
- (sme) boradišgohten → jeg begynte å spise
- evt "holde måltid"?
- (sme) lohkagohten → jeg begynte å si
- don't chunk it all, might want to insert adverbs
- (sme) ii lohkagoađe → han begynner ikke å si
Passive
- Verb / Der2 / Der_PassL
- (sme) don borrojuvvot → du spises
Reflexive
- Verb / Der1 / Der_d
- (sme) go čukkodit → når de stikker seg
- (productive reflexive rule čuoggut=>čukkodit)
- (sme) Son basadii → Han vasket seg
- (bidix-specified lexical reflexive 'basadit')
- (sme) Son lábmii iežas → Han skadet seg
- (regular explicit reflexive)
- Verb / Der2 / Der_alla
- evt. "at"
- (sme) go fanahallat → når vi tøyer oss
Causative
- (sme) don fertet vuos beatnaga čuogahit → du må først la hunden drikke
- Verb / Der1 / Der_h
- (sme) goaruhit → de lar sy
- Verb / Der2 / Der_ahtti
- (sme) muitalahtten → jeg lot fortelle
Adj->Noun
- Adjective / Der3 / Der_vuohta => N
- (sme) ráhkisvuohta ja geafivuohta ja coagisvuohta → kjærlighet og fattigdom og det grunne
- last one is not in analyser nor bidix, handled by simply outputting a definite adjective (which w/o further context gets a determiner prepended)
V->N
- V / Der2 / Actor => N
- (sme) muitaleaddji lea doppe → den som forteller er der borte
- TODO indefinite (en som forteller)
- (sme) stuora muitaleaddji lea doppe → den store som forteller er der borte
Noun phrases
- Essive
- (sme) olmmožin → som menneske
- (sme) mánnán son orui Romssas → som barn bodde han i Tromsø
- ^@SPRED v@ADVL
- (sme) nuorran son orui Romssas → som ungdom bodde han i Tromsø
- (sme) mánnán dihten → som barn visste jeg
- accusative object predicative, add "være"
- (sme) Dan dieđán váddása → Det vet jeg er vanskelig
- (sme) Dan gal dieđán váddása → Det vet jeg vel er vanskelig
- gal=>vel?
Definiteness
- subject (guessing...)
- (sme) Mánná oađđá → Barnet sover
- illative
- (sme) skuvlii → til skolen
- mass vs count
- (sme) Máhtte ráhkada biepmu → Máhtte lager mat
- (sme) Oainnátgo máná? → Ser du barnet?
leat => har/er/må
- (sme) Mánát leat boahtán skuvlii → Barnene har kommet til skolen
- (sme) Mis lea cahkkehit dola → Vi må tenne bålet
Coordination
- (sme) Ruoŧas ja Norggas → i Sverige og Norge
- (sme) Harald liiko návddašit luonddu, dan dahká son go sihkkelastá → Harald liker å nyte naturen, det gjør han når han sykler
V2
- (sme) Son orui Romssas mánnán → Han bodde i Tromsø som barn
- (sme) Hearggit ruhttet dego livčče → Kjørereinene løper som de kanskje er
- siste ordet fungerte ikkje =P ("som om" heller?)
- (sme) Muhto mun orun Kárášjogas → Men jeg bor i Karasjok
Adpositions
- (sme) Mus lea oahpahus gaskkal guovtti ja njealji → Jeg har undervisning mellom to og fire
- Post-positions → Prepositions... move "på grunn av" first, remove case from possessed object (or put accusative if pronoun)
- (sme) dálkki geažil → på grunn av været
- evt "vær"
- (sme) dan geažil → på grunn av det
- (sme) dán geažil → på grunn av dette
- (sme) munno geažil → på grunn av oss to
- (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji → Allerede 10. april mot natten reiste Harald over grensen
Left-Object+Adv+Main verb
- move object (dan) after adv (juo) and main verb (oahppan)
- (sme) nuorran son lea dan juo oahppan → som ungdom har han allerede lært det
- (sme) nuorran son lea dan oahppan → som ungdom har han lært det
- "hadde" instead of "har"? (Nickel gives "Han har lært det alt i ung alder")
- adverbial placement (only adj adverbials move?)
- (sme) Mun láven dávjá lávlut → Jeg pleier ofte synge
- (sme) Mun láven árrat lávlut → Jeg pleier synge tidlig
- (sme) Mun láven dávjá goallut → Jeg pleier ofte fryse
- (sme) Mun láven árrat goallut → Jeg pleier fryse tidlig
Prepositional choice
- (sme) Mun hálan dálkki birra → Jeg snakker om været
- (sme) Son lea Norggas → Han er i Norge
- (sme) Tine Chris Mathisen lea beassan leat mielde boazobargguin → Tine Chris Mathisen har fått være med på reinarbeidene
- (sme) Go gullen sámegiela dien mátkkis → Når jeg hørte samisk på denne reisen
- (sme) Son lea Norggas eret → Hun er fra Norge
- (sme) Son lea Islandas → Hun er på Island
- (sme) Son lea Islandas eret → Hun er fra Island
Gender, pronouns
- (sme) Go Tine Chris Mathisen bođii deike davás de lei son juo oahppan sámegiela → Når Tine Chris Mathisen kom hit nordover så hadde hun allerede lært samisk
- (sme) Go Per Mathisen bođii deike davás de lei son juo oahppan sámegiela → Når Per Mathisen kom hit nordover så hadde han allerede lært samisk
- (sme) Dat lea buot mii mus lea → Det er alt som jeg har
- (buot is not specified for gender)
Particles
- (sme) guhkágo don ledjet doppe? → hvor lenge var du der borte?
- (sme) guhká go don ledjet doppe? → hvor lenge var du der borte?
- Can we put "guhká go" into the analyser as an mwe?
- (sme) musnai ledje → jeg hadde også
- remove double space todo..
Add infinitive marker
- (sme) Mun lean heaitán borgguheames → Jeg har sluttet å røyke
- (sme) Mus lea biergu vuoššat → Jeg har kjøtt å koke
- actually "til å koke"
- (sme) Geahččaledje jeđđet min → De prøvde å trøste oss
Miscellaneous
- (sme) Anne ráhkada biepmu → Anne lager mat
- (sme) Dat lea sihke buorre ja heittot → Det er både bra og dårlig
- (sme) 22 jahkásaš Tine Chris Mathisen fárrii áibbas okto máddin Sápmái → 22 år gamle Tine Chris Mathisen flyttet helt alene sørfra til Sápmi
- (sme) vuolgit lea suohtas → å reise er morsomt
- (sme) Go Gonagas Olav buohccái 1990 giđa → Når Kong Olav ble syk våren 1990
- (sme) cuoŋománu 15. b. lea → 15. april er det
- (sme) Son lea taksivuoddjin Oslos → Han er taxisjåfør i Oslo