Difference between revisions of "Northern Sámi and Norwegian/Pending tests"
Jump to navigation
Jump to search
Line 340: | Line 340: | ||
===leat → 0:være, 1:ha, 2:måtte=== |
===leat → 0:være, 1:ha, 2:måtte=== |
||
* {{test|sme|Mánát leat boahtán skuvlii|Barnene har kommet til skolen}} |
* {{test|sme|Mánát leat boahtán skuvlii|Barnene har kommet til skolen}} |
||
: WORKS |
|||
=== go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi === |
=== go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi === |
||
* {{test|sme|Buoret lea johtit go orrut|Det er bedre å bevege seg enn å bli}} |
* {{test|sme|Buoret lea johtit go orrut|Det er bedre å bevege seg enn å bli}} |
Revision as of 22:45, 24 April 2014
Run with sh wiki-tests.sh Pending sme nob update
(or just sh pending-tests.sh
). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
See also Regression tests.
Nouns
- (sme) biilla → bil
- (sme) biilii → inn i bilen
- (sme) Politiijastašuvnna → Politistasjon
- (sme) Oahpponeavvu → Læremiddel
- (sme) Várrepresideanta → Visepresident
- Compounds
- (sme) Girjedoalut → Bokarrangement
- Diminutive
- (sme) lottážii → til den lille fuglen
- (how should we treat it?)
Adjectives
Verbs
- (sme) goarrut → å sy
- Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
- what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?
- Nektende perfektum
- (sme) ii lean čállit → han ville ikke ha skrevet
- ^^^ mistagged (or Nickel's wrong)
- (sme) allos leage čállán → la ham ikke ha skrevet
- Nektende progressiv presens
- (sme) ii livčče čállimin → han ville ikke ha holdt på å skrive
- (sme) ii livčče čállime → han ville ikke ha holdt på å skrive
- now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
- (sme) allos leage čállimin → la ham ikke holde på å skrive
- (sme) allos leage čállime → la ham ikke holde på å skrive
- Nektende pluskvamperfektum
- (sme) ii lean čállán → han hadde ikke skrevet
- (sme) ii lean čállimin → han holdt ikke på å skrive
- (sme) ii lean čállime → han holdt ikke på å skrive
- Potensialis presens
- (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas → Samiske barn behøver støtte for å forvare og å fremme eget språk og kultur hvor de nå bor i landet
- (sme) Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis → Vi vil vite om hender noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.
- Insert 'nå' or 'så'?
- Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
- (sme) In dieđe leaččai go duohta → Jeg vet ikke om det nå var sant
- (sme) Mot leaččai dasto mánáide dain leairrain? → Hvordan var det nå så for barna i de leirene?
- Insert 'nå' or 'så'?
- Kondisjonalis
- (sme) jearašin → jeg kunne spørre
- (sme) jearašeimmet → vi kunne spørre
- (sme) Itgo veahkehivčče mu? → Kunne du ikke hjelpe meg?
- (sme) Hearggit ruhttet dego livčče ballame. → Kjørereinene løper som om de skulle være redde.
- (sme) Mun mávssášin, jos don siđašit. → Jeg kunne betale, om du ønsket det.
- Jeg hadde betalt, om du ønsket det?
Passive preterite
- (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hans far døde så ble det forbudt å snakke samisk i telefonen
- insert 'å'
vbser-drop
- (sme) Vare mun doppe dahje son dáppe → Gid jeg der borte eller han her
- WORKS – Do we have to insert a verb?
V2
- (sme) It boađáše → Du kommer ikke
- (sme) Maid don jugat? → Hva drikker du?
- no go.qst, but pron.interr ought to be just as unambiguous
Negative, verb=>adv
- (sme) Gummá go ii boahtán. → Rart at han ikke kom.
- (sme) Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit. → Noe som man ikke utstår, ikke tør å se på eller å berøre.
- dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
- (sme) Buoremus dáidá muitalit buot → Det er nok best å fortelle alt
- Present progressive indicative negative (actio ess)
- (sme) Ii leat čállimin → Han holder ikke på å skrive
- actio ess
- (sme) Son lea njuohtamin. → Han holder på å male.
FV + FV
- pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
- (sme) geahččat gaivát → å glane
- (sme) juhkat reavžut → å slurke
Causative
- (sme) divuhit → få reparert
- 1) causative + illiative agent adverbial => å la ADVL MAINV
- (sme) galggat gásttašahttit mánát báhppii → du skal la barnet døpes av presten
- or
- (sme) galggat gásttašahttit mánát báhppii → du skal la presten døpe barnet
- (sme) geasa don geahčahat bohccuidat? → hvem lar du passe reinene?
- 2) transitive causative + accusative object => å få OBJ til å MAINV
- (sme) Mu vuovssihii → Det fikk meg til å bli kvalm
- (sme) don fertet vuos beatnaga čuogahit → du må først få hunden til å drikke
- or "gi hunden drikke"??
Setningstilsvar vs advl/obj-setning
- obj.setn
- (sme) Máhtte muitalii ahte áddjá boahtá → Máhtte fortalte at bestefar kommer
- (sme) Máhtte muitalii ádjá boahtit → Máhtte fortalte at bestefar kommer
- WORKS
- CG mistaggings
- (sme) Mun dihten heastta sus leamaš → Jeg visste at han har hatt hest
- (sme) Mun dieđán ruđaid leamaš áhkus. → Jeg vet at bestemor har hatt penger.
- pp, insert "er"
- (sme) Son osku iežas bestojuvvon. → Han tror han er frelst.
- adverbialsetning
- (sme) Albmi lei ruoksat, go beaivi luoitádii → Himmelen var rød, da sola gikk ned
- setn.tilsvar m/gerundium som verbal
- (sme) Albmi lei ruoksat beaivvi luoitádettiin → Himmelen var rød da sola gikk ned
Object/adverbial placement
- (sme) sádde áinnas midjiide e-poasta → send gjerne e-post til oss
- "send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker
- (sme) Go lásiin bargá, de dat lea dego báhkka honnet → Når han arbeider med glass, så er det som varm honning
Pronouns
- genitive/det.poss
- (sme) Du dálkasis → I din medisin
Reflexive, ieš
- (sme) ieš dat muitalii → han selv fortalte det
- (sme) ieš mun dájun → jeg bare tøver
- (sme) Mun ceggen vaikke ieš filbmafestivála → Jeg setter om så selv opp filmfestival
- ceggen => particle verb
Derivation
- Verb / Der2 / Actor / N
- (sme) Geavaheaddjiid → Brukerne
- (sme) geavaheaddjiid almmolaš bálvalusaide → for/til offentlige tjenester for brukere
- Verb / Der1 / Der_h / Der2 / Der_eapmi (all of them?)
- (sme) ođđa áššiid dieđiheapmi → kunngjøring av nye saker
- Verb / Der3 / Der_n / N
- (sme) dánsunkurssa → dansekurs
- (sme) oažžun → å få
- Verb / Der1 / Der_st / V
- (sme) báinnestit → de påvirker litt
- better adverb?
- N / Der1 / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
- (sme) Ekonomalaš doarjagat → Økonomisk støtte
- Is there any good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
- I see no possible paraphrase
Noun phrases
- accusative object predicative, add "være"
- (sme) Gáhkuid son ráhkada buriid → Kakene han lager er gode
- (sme) Gáhkuid son ráhkada hui buriid → Kakene han lager er svært gode
- Illative
- (sme) Atte mánnái biepmu → Gi mat til barnet
- misc
- (sme) Guovddáš gulaskuddan → Sentral høring
- (sme) dán jagi válggas → i dette årets valg
Odd number phrases
- does this generalise?
- (sme) 1814 Vuođđolága → Grunnloven av 1814
- (sme) 567 jahkái → på 567 år
- "vuosttaš norggasriegádan prinsa 567 jahkái."
- (sme) okta 6 filmmas → en av 6 filmer
- WORKS
Definiteness
- (also er/har)
- (sme) Mus lea biepmu → Jeg har mat
- (sme) Biepmu lea mus → Maten er hos meg
- (sme) Du dálkasis sáhtii leamaš ávki → Din medisin kan ha vært til nytte
- (sme) Dá livččii skeaŋka din čeahpes bárdnái → Her er en gave til deres flinke sønn.
Adpositions
- Post-positions → Prepositions... move "på grunn av" first
- (sme) garra dálkki geažil → på grunn av dårlig vær
Coordination
Questions
- (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
- (sme) It go boađáše munnje veahkkin? → Kan du komme og hjelpe meg?
- essive predicative, difficult..."kommer du ikke til meg som hjelp?"
- (sme) De guldalan → Jeg lytter
- eller, "Ja, jeg lytter"?
- (sme) In guldal → Jeg lytter ikke
- eller, "Nei, jeg lytter ikke"?
Subordinatied questions
- (sme) Son diehtá bohtet go ruoktot → Han vet om de kommer hjem.
- insert 'om'
- (sme) Son háliidii iskat ásse go olbmot doppe → Han ville undersøke om det bodde folk der borte.
- insert 'om' and 'det' (existential)
- pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst
Prepositional choice
- (sme) kánske mun galggan hállat dušše sámegillii dán kanálas → kanskje skal jeg snakke bare på samisk i denne kanalen
- (sme) Mun vuolggán Norggas → Jeg reiser fra Norge
- (sme) Mun lean gávppis. → Jeg er i butikken.
- med, not på
- (sme) Jos válddát 60 poeaŋgga sámegielas → Hvis du tar 60 poeng i samisk
- delete til
- (sme) de sáhttá dat addit dutnje 60 000 ruvnnu → så kan det gi deg 60 000 kroner
- delete som, "del av", not "del på"
- (sme) Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot → Reindriftssakene kunne bli en del av hele saksmengden som skal behandles
- also bearbeides=>behandles (lex.sel), kan=>vil (why?)
- oassin is essive, but still we (might) want 'en del', not just 'del'
Miscellaneous
- (sme) Lohke iežaset juhkan ollu alkohola → De sa de hadde drukket mye alkohol
- something up with ollu→mange/mye here (turns into 'flest')
- (sme) juohke lágán geđggiiguin → med alle slags steiner
- WORKS
- (sme) Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide. → Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.
- (sme) Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas. → Samer eller samer bor i Russland, Finland, Sverige og Norge.
- -ge particle, and an adjective adverbial
- (sme) Leago dát duođasge Sáme Radio oaivil? → Er dette altså virkelig Same Radioens mening?
- Headline, 3sg->man, no finite verb in main clause
- (sme) Heahpat hállat go gillá → Skam å snakke når man lider
- (sme) Jus in livčče mun ieš → Hvis det ikke hadde vært meg selv
- (sme) Lehkos beaivi buorre → Ha en god dag
- (sme) Lei unnán mii earuhii nuorra Prinssa skuvlavázzima eará skuvlamánáin → Det var lite som skilte den unge Prinsens skolegang fra de andre skolebarnene
- (sme) musnai ledje → jeg hadde også
- (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin → Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn
- CG fixed; but bracketing trouble for "over grensen til Sverige"
- (sme) Leago duohta? → Er det sant?
- gets "er det sann?"
- (sme) ollen deid juohke sajis → jeg når dem på hvert sted
- is this more or less correct?
V->N (removed for now, might be able to do in postchunk)
- V / Der2 / Actor => N
- (sme) dadjaleaddji lea doppe → den som repliserer er der borte
- TODO indefinite (en som repliserer)
- (sme) stuora dadjaleaddji lea doppe → den store som repliserer er der borte
- (sme) Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin → Etter døden ble Kong Olav forhøyet til hellig
- hmm
CG Disambiguation problems
- (sme) Dan gal dieđán váddása → Det vet jeg vel er vanskelig
- CG solved
- (sme) Barggan ruovttus lunša rádjai → Jeg arbeider hjemme til lunsj
- CG solved
- (sme) Sámediggi Gironis koordinere ođđa prográmma. → Sametinget i Kiruna koordinerer et nytt program.
- CG solved
- (sme) Maŋŋá go parlamentarisma ásahuvvui → Etter at parlamentarismen ble grunnlagt
- CG solved
- (sme) Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka. → Kong Haakon kom den 7. juni, på dagen fem år etter at Kongen hadde måttet forlate landet.
- CG solved
- (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
- (sme) Mii vurddiimet dálkki buorránit → Vi ventet at været skulle bedres
- CG solved WORKS
- (sme) de jullot čoalkalit uksii vuos → så får de banke på døren først
- CG solved
- (sme) Sihko dán → Stryk dette
- CG solved
- (sme) Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon → Karen Ellen Marie Siri Utsi viser hvor hunden hadde sunket
- CG solved
- (sme) Sámi allaskuvla lea okta dain allaskuvllain mii čavčča rájes doaibmá → Samelands høyskole er en av de høyskolene som fra høsten fungerer
- CG solved
- (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hans far døde så ble det forbudt å snakke samisk i telefonen
- CG solved
gen vs acc
- (sme) Dan dieđán váddása → Det vet jeg er vanskelig
- CG solved
@HAB
- (sme) Dál leat sus 137 gáicca → Nå har han 137 geiter
- CG solved
CG lexical selection
leat → 0:være, 1:ha, 2:måtte
- (sme) Mánát leat boahtán skuvlii → Barnene har kommet til skolen
- WORKS
go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi
- (sme) Buoret lea johtit go orrut → Det er bedre å bevege seg enn å bli
orrut → 0:synes, 1:bo, 2:bli, 3:være
- (sme) Doppe son orui vahku → Der borte bodde han en uke
- also insert determiner