Difference between revisions of "Northern Sámi and Norwegian/Pending tests"

From Apertium
Jump to navigation Jump to search
 
(340 intermediate revisions by 3 users not shown)
Line 1: Line 1:
{{TOCD}}
{{TOCD}}


===Nouns===


Run with <code>t/update-latest</code> and then check <code>svn diff t</code> to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
* {{test|sme|biila|bil}}
* {{test|sme|biillat|biler}}
* {{test|sme|biilla|bilens}}
* {{test|sme|biilii|inn i bilen}}


See also [[../Regression tests|Regression tests]].


==Reported bad translations==
===Adjectives===
Write a full North Saami sentence, and the correct Norwegian translation in this format:
*{{test|sme|Guovddáš gulaskuddan|Sentral høring}}


==Nouns==
* {{test|sme|dehálaš|viktig}}
* {{test|sme|deháleabbo|viktigere}}
* {{test|sme|deháleamos|viktigst}}


==Adjectives==
* {{test|sme|deháleamos doaibma|viktigste oppgave}}
* {{test|sme|almmolaš bálvalusaide|offentlige tjenester}}


===Verbs===
* {{test|sme|goarrut|å sy}}
* {{test|sme|goarun|jeg syr}}
* {{test|sme|gorrot|de syr}}


;Negative


==Verbs==
* {{test|sme|Gummá go ii boahtán.|Merkelig at han ikke kom.}}
* {{test|sme|Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit.|Noe som man ikke hæres, ikke tør å se på eller å berøre.}}
;with pro-drop:
* {{test|sme|Ii leat čállán|Han har ikke skrevet}}
* {{test|sme|Máhtte ii leat boahtán|Máhtte er ikke kommet}}
* {{test|sme|Máhtte lea boahtán|Máhtte er kommet}}


;Present progressive indicative negative


; Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
* {{test|sme|Ii leat čállimin|Han holder ikke på å skrive}}
; what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?


; Nektende perfektum
===Pronouns===
* {{test|sme|Son ii lean čállán.|Hun/han hadde ikke skrevet}}
; ^^^ mistagged (or Nickel's wrong)
* {{test|sme|allos leage čállán|la ham ikke ha skrevet}}
; Nektende progressiv presens
* {{test|sme|ii livčče čállimin|hun/han hadde ikke vært i ferd med å skrive}}
* {{test|sme|ii livčče čállime|hun/han hadde ikke vært i ferd med å skrive}}
: now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
* {{test|sme|allos leage čállimin|la ham ikke være i ferd å skrive}}
* {{test|sme|allos leage čállime|la ham ikke være i ferd å skrive}}


; Potensialis presens
* {{test|sme|Dat lea|Det er}}
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas.|Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.}}
* {{test|sme|Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis|Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.}}
: Insert 'nå' or 'så'?
; Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
* {{test|sme|In dieđe leaččai go duohta|Jeg vet ikke om det nå var sant}}


; Kondisjonalis
===Derivation===
* {{test|sme|Hearggit ruhttet dego livčče ballame.|Kjørereinene løper som om de skulle være redde.}}
* {{test|sme|Mun mávssášin, jos don siđašit.|Jeg kunne betale, hvis du ønsket det.}}
; Jeg hadde betalt, om du ønsket det?
===Passive preterite===
* {{test|sme|Go su áhčči jámii de gildui sámegiela hállat telefuvnnas|Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen}}
: insert 'å'


===V2===
; Verb / Der2 / Actor
* {{test|sme|Geavaheaddjiid|Brukere}}
* {{test|sme|It boađáše|Du kunne ikke komme}}
* {{test|sme|Geavaheaddjiid almmolaš bálvalusaide|For/til offentlige tjenester for brukere}}


; Verb / Der3 / goahti
; how is this combined with negative? (t2x would add the pronoun, (Jeg) (begynte ikke å lese) but could t2x add "begynne" too? Then "å" would have to be added either by t1x based on the Der3 tag, or in t3x based on tags from the combined chunk)
* {{test|sme|Boradišgohten|Jeg begynte å holde måltid}}
* {{test|sme|Lohkagohten|Jeg begynte å lese}}


===Negative, verb=>adv ===
; Verb / Der1 / Der:h / Der2 / Der:eapmi (all of them?)
* {{test|sme|Ođđa áššiid dieđiheapmi|Kunngjøring av nye saker}}


* {{test|sme|Gummá go ii boahtán.|Rart at hun/han ikke kom.|Gummá is adjective, we can add it as adverb if it is documented}}
===Noun phrases===
* {{test|sme|Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit.|Noe som man ikke utstår, ikke tør å se på eller å berøre.}}
; Essive

* {{test|sme|mánnán|som barn}}
; dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
* {{test|sme|Buoremus dáidá muitalit buot|Det kan være best å fortelle alt}}


===FV + FV===
; pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
* geahččat gaivát|å glane
* juhkat reavžut|å slurke

===FV + IV pro gender===
* {{test|sme|Ja de álggii muohttit|Og så begynte det å snø}}
* {{test|sme|Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat|Og så begynte det å snø og det ble så kjølig at hennes/hans klesplagg frøs}}

===Causative===
* {{test|sme|divuhit|la reparere}}

; 1) causative + illiative agent adverbial => å la ADVL MAINV
* {{test|sme|galggat gásttašahttit mánát báhppii|du skal la barnet døpes av presten}}
: or
* {{test|sme|galggat gásttašahttit mánát báhppii|du skal la presten døpe barnet}}
* {{test|sme|geasa don geahčahat bohccuidat?|hvem lar du passe reinene?}}
; 2) transitive causative + accusative object => å få OBJ til å MAINV
* {{test|sme|Mu vuovssihii|Det fikk meg til å bli kvalm}}
:


; CG mistaggings:
* {{test|sme|Mun dihten heastta sus leamaš|Jeg visste at hun/han har hatt hest}}
* {{test|sme|Mun dieđán ruđaid leamaš áhkus.|Jeg vet at bestemor har hatt penger.}}

; pp, insert "er"
* {{test|sme|Son osku iežas bestojuvvon.|Hun/han tror hun/han er frelst.}}

;adverbialsetning
* {{test|sme|Albmi lei ruoksat, go beaivi luoitádii|Himmelen var rød, da sola gikk ned}}
;setn.tilsvar m/gerundium som verbal
* {{test|sme|Albmi lei ruoksat beaivvi luoitádettiin|Himmelen var rød mens sola gikk ned}}

==Object/adverbial placement==
* {{test|sme|Sádde áinnas midjiide e-poasta.|Send gjerne en e-post til oss.}}
: "send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker

* {{test|sme|Go lásiin bargá, de dat lea dego báhkka honnet|Når hun/han arbeider med glass, så er det som varm honning}}

* {{test|sme|Larsen fas doapmá.|Larsen skynder seg igjen.}}
* {{test|sme|Larsen fas čállá reivve.|Larsen skriver brev igjen.}}

* {{test|sme|Larsen dieđusge doapmá.|Larsen skynder seg selvfølgelig.}}
* {{test|sme|Larsen dieđusge čállá reivve.|Larsen skriver selvfølgelig brev.}}

==Pronouns==

; genitive/det.poss
* {{test|sme|Du dálkasis|I din medisin}}

===Reflexive, ieš===
* {{test|sme|ieš dat muitalii|hun/han selv fortalte det}}
* {{test|sme|ieš mun dájun|jeg bare tøver}}
* {{test|sme|Mun ceggen vaikke ieš filbmafestivála|Jeg setter om så selv opp filmfestival}}
: ceggen => particle verb

==Anaphora resolution==
; t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x
; (ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x)

* {{test|sme|Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret|Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.}}
: um what is that ending?

==Derivation==


; Verb / Actor / N
* {{test|sme|geavaheaddjiid almmolaš bálvalusaide|for/til offentlige tjenester for brukere}}

; Verb / Der_h / Der_eapmi (all of them?)
* {{test|sme|ođđa áššiid dieđiheapmi|kunngjøring av nye saker}}

; Verb / Der_n / N
* {{test|sme|dánsunkurssa|dansekurs}}
* {{test|sme|oažžun|å få}}

; Verb / Der_st / V
* {{test|sme|báinnestit|de påvirker litt}}
: better adverb?

; N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
* {{test|sme|Ekonomalaš doarjagat|Økonomisk støtte}}
: Is there ''any'' good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
: I see no possible paraphrase

==Noun phrases==
; accusative object predicative, add "være"
* {{test|sme|Gáhkuid son ráhkada buriid|Kakene hun/han lager er gode}}
* {{test|sme|Gáhkuid son ráhkada hui buriid|Kakene hun/han lager er svært gode}}

; Illative
* {{test|sme|Atte mánnái biepmu|Gi mat til barnet}}


* {{test|sme|dán jagi válggas|i dette årets valg}}

===Genitives===

; Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds:
* {{test|sme|Dál son lea Badjemánáid beaiveruovttu hoavda|Nå er hun/han sjef for Reindriftsbarnenes daghjem}}
* {{test|sme|Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui|Foreldrene drømte om å få bruk av et eget hus for barnehagen}}
: for/som/til?
* {{test|sme|Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii|Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage}}
* {{test|sme|10-jagi vuođđoskuvlla sámi oahppoplánat|samisk studieplan for den 10-årige grunnskolen}}
* {{test|sme|sámi árvvuid oahpaheami vuođđu|grunnlag for opplæring i samiske verdier}}
; near-impossible, head moves in front of the whole coordination
* {{test|sme|skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu|grunnlaget for skolens samiskundervisning og undervisning i samiske verdier}}


; place names → i
* {{test|sme|oahpaheddjiid Davvi-Norgga skuvllaide|lærerne ved skolene i Nord-Norge}}
* {{test|sme|Finnmárkku áviissaid čállosiin|I tekster i Finnmarks aviser}}
* {{test|sme|Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin|årsmøte i foreningen for Vest-Finnmarks lærere}}
* {{test|sme|Loabága sámegieloahpahusa árvvoštallan|Vurdering av samiskopplæringa i Lavangen}}
; even some non-doubles:
* {{test|sme|Dalle ledjen juo barggus Romssa Sámeskuvllas|Da var jeg allerede i arbeid ved Sameskolen i Troms}}

; for language names, we would prefer gen→adj …
* {{test|sme| Gáivuona sámi giellaguovddáš|Kåfjord samiske språksenter}}
* {{test|sme|Sámegiela vuođđofága lea eatnigielfága|Samisk grunnfag er morsmålsfag}}
* {{test|sme|Oahpaheaddjin sámi vuođđoskuvllas|Som lærer i den samiske grunnskolen}}


; some genitives sound better as compounds:
* {{test|sme|Son lea kulturbargi, geas lea boazodoalloduogáš.|Hun/han er en kulturarbeider, som har reindriftsbakgrunn.}}

===Odd number phrases===
; does this generalise?
* {{test|sme|1814 Vuođđolága|Grunnloven av 1814}}




* {{test|sme|Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus|Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke}}

* {{test|sme|Dohko bođii almmái gii lei njealjátlohkái.|Dit kom en mann som var i trettiårene.}}
* {{test|sme|Čihččetlohkái nisu navdo goddon.|Kvinne i sekstiårene antaes blitt drept.}}

==Definiteness==
; (also er/har)
* {{test|sme|Mus lea biepmu|Jeg har mat}}
* {{test|sme|Biepmu lea mus|Maten er hos meg}}

* {{test|sme|Du dálkasis sáhtii leamaš ávki|Din medisin kan ha vært til nytte}}

* {{test|sme|Dá livččii skeaŋka din čeahpes bárdnái|Dette hadde vært en gave til deres flinke sønn.}}

==Adpositions==


===Adpositions===


* {{test|sme|Mus lea oahpahus gaskkal guovtti ja njealji.|Jeg har undervisning mellom to og fire.}}


; Post-positions → Prepositions... move "på grunn av" first
; Post-positions → Prepositions... move "på grunn av" first


* {{test|sme|garra dálkki geažil|på grunn av dårlig vær}}
* {{test|sme|garra dálkki geažil|på grunn av det dårlige været}}

* {{test|sme|Stáhta geaidnodoaimmahat lea dál čállán šiehtadusaid Guovdageainnu, Álttá, Láhpi ja Ákŋoluovtta muohtačorgenbargguide.|Statens vegvesen har nå skrevet avtalene for Kautokeinos, Altas, Loppas og Hasviks snøryddingarbeider.}}

==Coordination==


==Questions==
* {{test|sme|Itgo gáfe juga?|Drikker du ikke kaffe?}}
* {{test|sme|It go boađáše munnje veahkkin?|Kan du komme og hjelpe meg?}}
: essive predicative, difficult..."kommer du ikke til meg som hjelp?"


* {{test|sme|De guldalan|Jeg lytter}}
: eller, "Ja, jeg lytter"?


==Subordinatied questions==
* {{test|sme|Son diehtá bohtet go ruoktot|Hun/han vet om de kommer hjem.}}
: insert 'om'
* {{test|sme|Son háliidii iskat ásse go olbmot doppe|Hun/han ville undersøke om det bodde folk der borte.}}
: insert 'om' and 'det' (existential)
: pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst

==Prepositional choice==

; numbers, places.illative
* {{test|sme|1964:s bođii Ráisii dálueamitskuvla|I 1964 kom det husmorskole til Nordreisa}}
: or "kom det"?
* {{test|sme|1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla|I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole}}

;gen vs "av":
* {{test|sme|Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija|Skolen var for det meste bare en kopi av den vanlige norske skolen}}



; med, not på
* {{test|sme|Jos válddát 60 poeaŋgga sámegielas|Hvis du tar 60 poeng i samisk}}

; delete til
* {{test|sme|de sáhttá dat addit dutnje 60 000 ruvnnu|så kan det gi deg 60 000 kroner}}


; delete som, "del ''av''", not "del ''på''"
* {{test|sme|Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot|Reindriftssakene kunne bli en del av den saksmengden som skal behandles}}
: also bearbeides=>behandles (lex.sel), kan=>vil (why?)
: oassin is essive, but still we (might) want 'en del', not just 'del'


; das → av det, some times
* {{test|sme|ahte ipmirdin maidege das mii daddjui|at jeg forsto noe av det som ble sagt}}

; previous n-head overrides
* {{test|sme|Muittán ahte lei álo veahá ballu das|Jeg husker at det var alltid litt frykt for det}}

==Miscellaneous==
;Ordstilling
* {{test|sme|Gal moai birgejetne iehčaneame|Vi to greier oss på egen hånd.}}


* {{test|sme| Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát.| De små vedkassene var benk og i tillegg våre egne matkister,}}
* {{test|sme|Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii.|Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.}}

* {{test|sme|Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus|Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet}}
* {{test|sme|1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána |I 1997 fikk vi studieplan for 10-årig grunnskole}}

* {{test|sme|Lohke iežaset juhkan ollu alkohola |De sa at de hadde drukket mye alkohol}}
: something up with ollu→mange/mye here (turns into 'flest')

* {{test|sme|Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide.|Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.}}
* {{test|sme|Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas.|Samene eller samene bor i Russland, Finland, Sverige og Norge.}}

; -ge particle, and an adjective adverbial:
* {{test|sme|Leago dát duođasge Sámi Radio oaivil?|Er dette altså virkelig Sameradioens mening?}}

; Headline, 3sg->man, no finite verb in main clause
* {{test|sme|Heahpat hállat go gillá|Skam å snakke når man lider}}



* {{test|sme|Lehkos beaivi buorre|Ha en god dag}}

* {{test|sme|musnai leat muosáhusat namuhuvvon ministeriijas|jeg også har erfaringer fra nevnte ministerium}}


* {{test|sme|Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin|Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn}}
: CG fixed; but bracketing trouble for "over grensen til Sverige"


* {{test|sme|ollen deid juohke sajis|jeg når dem på hvert sted}}
: is this more or less correct?


* {{test|sme|okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča|en i februar, en i april, en om sommeren og en på seinhøsten}}

===V->N (removed for now, might be able to do in postchunk)===
; V / Der2 / Actor => N
* {{test|sme|dadjaleaddji lea doppe|replisereren er der borte}}
: TODO indefinite (en som repliserer)
* {{test|sme|stuora dadjaleaddji lea doppe|den store replisereren er der borte}}

* {{test|sme|Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin|Etter døden ble Kong Olav forhøyd som hellig}}
: hmm

==CG Disambiguation problems==

* {{test|sme|Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat.|Forklaringene fantes ikke, bare kopier av samiske manus.}}
: dušše gets the verb reading

* {{test|sme|Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii|Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk}}
: CG solved

* {{test|sme|Dan gal dieđán váddása|Det vet jeg er vanskelig}}
: CG solved

* {{test|sme|Barggan ruovttus lunšša rádjai|Jeg arbeider hjemme til lunsj}}
: CG solved

* {{test|sme|Sámediggi Gironis koordinere ođđa prográmma.|Sametinget i Kiruna koordinerer det nye programmet.}}
: CG solved
* {{test|sme|Maŋŋá go parlamentarisma ásahuvvui|Etter at parlamentarismen ble etablert}}
: CG solved
* {{test|sme|Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka.|Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.}}
: CG solved


* {{test|sme|Máhtte rábmui iežas vuoitit dan gilvvu|Máhtte skrøt at han skulle vinne den konkurransen}}

* {{test|sme|de jullot čoalkalit uksii vuos|så får de banke på døren først}}
: CG solved



* {{test|sme|Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon|Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt}}
: CG solved


* {{test|sme|Go su áhčči jámii de gildui sámegiela hállat telefuvnnas|Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen}}
: CG solved

===gen vs acc===
* {{test|sme|Dan dieđán váddása|Det vet jeg er vanskelig}}
: CG solved

===@HAB===
* {{test|sme|Dál leat sus 137 gáicca|Nå har hun/han 137 geiter}}
: CG solved

===genitiver===
* {{test|sme|Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji.|Allerede 10. april mot natta reiste Harald over grensa.}}
: Her er problemet at beaivvi som er genitiv ikke skal modifisere ija, man ha @ADVL-tagg.

==CG lexical selection==

=== go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi ===
* {{test|sme|Buoret lea johtit go orrut|Det er bedre å bevege seg enn å bli}}




===Miscellaneous===


* {{test|sme|Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide.|Norge.no's viktigste oppgave er å veivise brukere til offentlige tjenester.}}
* {{test|sme|Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas.|Samer eller samer bor i Russland, Finland, Sverige og Norge.}}
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}}
* {{test|sme|Anne ráhkada biepmu.|Anne lager mat.}}
; har/er:
* {{test|sme|Mánát leat boahtán skuvlii.|Barnene har kommet til skolen.}}





Latest revision as of 17:00, 4 December 2018


Run with t/update-latest and then check svn diff t to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.

See also Regression tests.

Reported bad translations[edit]

Write a full North Saami sentence, and the correct Norwegian translation in this format:

  • (sme) Guovddáš gulaskuddan → Sentral høring

Nouns[edit]

Adjectives[edit]

Verbs[edit]

Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?
Nektende perfektum
  • (sme) Son ii lean čállán. → Hun/han hadde ikke skrevet
^^^ mistagged (or Nickel's wrong)
  • (sme) allos leage čállán → la ham ikke ha skrevet
Nektende progressiv presens
  • (sme) ii livčče čállimin → hun/han hadde ikke vært i ferd med å skrive
  • (sme) ii livčče čállime → hun/han hadde ikke vært i ferd med å skrive
now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
  • (sme) allos leage čállimin → la ham ikke være i ferd å skrive
  • (sme) allos leage čállime → la ham ikke være i ferd å skrive
Potensialis presens
  • (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas. → Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.
  • (sme) Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis → Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.
Insert 'nå' or 'så'?
Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
  • (sme) In dieđe leaččai go duohta → Jeg vet ikke om det nå var sant
Kondisjonalis
  • (sme) Hearggit ruhttet dego livčče ballame. → Kjørereinene løper som om de skulle være redde.
  • (sme) Mun mávssášin, jos don siđašit. → Jeg kunne betale, hvis du ønsket det.
Jeg hadde betalt, om du ønsket det?

Passive preterite[edit]

  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
insert 'å'

V2[edit]

  • (sme) It boađáše → Du kunne ikke komme


Negative, verb=>adv[edit]

  • (sme) Gummá go ii boahtán. → Rart at hun/han ikke kom. :: Gummá is adjective, we can add it as adverb if it is documented
  • (sme) Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit. → Noe som man ikke utstår, ikke tør å se på eller å berøre.
dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
  • (sme) Buoremus dáidá muitalit buot → Det kan være best å fortelle alt


FV + FV[edit]

pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
  • geahččat gaivát|å glane
  • juhkat reavžut|å slurke

FV + IV pro gender[edit]

  • (sme) Ja de álggii muohttit → Og så begynte det å snø
  • (sme) Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat → Og så begynte det å snø og det ble så kjølig at hennes/hans klesplagg frøs

Causative[edit]

  • (sme) divuhit → la reparere
1) causative + illiative agent adverbial => å la ADVL MAINV
  • (sme) galggat gásttašahttit mánát báhppii → du skal la barnet døpes av presten
or
  • (sme) galggat gásttašahttit mánát báhppii → du skal la presten døpe barnet
  • (sme) geasa don geahčahat bohccuidat? → hvem lar du passe reinene?
2) transitive causative + accusative object => å få OBJ til å MAINV
  • (sme) Mu vuovssihii → Det fikk meg til å bli kvalm


CG mistaggings
  • (sme) Mun dihten heastta sus leamaš → Jeg visste at hun/han har hatt hest
  • (sme) Mun dieđán ruđaid leamaš áhkus. → Jeg vet at bestemor har hatt penger.
pp, insert "er"
  • (sme) Son osku iežas bestojuvvon. → Hun/han tror hun/han er frelst.
adverbialsetning
  • (sme) Albmi lei ruoksat, go beaivi luoitádii → Himmelen var rød, da sola gikk ned
setn.tilsvar m/gerundium som verbal
  • (sme) Albmi lei ruoksat beaivvi luoitádettiin → Himmelen var rød mens sola gikk ned

Object/adverbial placement[edit]

  • (sme) Sádde áinnas midjiide e-poasta. → Send gjerne en e-post til oss.
"send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker
  • (sme) Go lásiin bargá, de dat lea dego báhkka honnet → Når hun/han arbeider med glass, så er det som varm honning
  • (sme) Larsen fas doapmá. → Larsen skynder seg igjen.
  • (sme) Larsen fas čállá reivve. → Larsen skriver brev igjen.
  • (sme) Larsen dieđusge doapmá. → Larsen skynder seg selvfølgelig.
  • (sme) Larsen dieđusge čállá reivve. → Larsen skriver selvfølgelig brev.

Pronouns[edit]

genitive/det.poss
  • (sme) Du dálkasis → I din medisin

Reflexive, ieš[edit]

  • (sme) ieš dat muitalii → hun/han selv fortalte det
  • (sme) ieš mun dájun → jeg bare tøver
  • (sme) Mun ceggen vaikke ieš filbmafestivála → Jeg setter om så selv opp filmfestival
ceggen => particle verb

Anaphora resolution[edit]

t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x
(ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x)
  • (sme) Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret → Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.
um what is that ending?

Derivation[edit]

Verb / Actor / N
  • (sme) geavaheaddjiid almmolaš bálvalusaide → for/til offentlige tjenester for brukere
Verb / Der_h / Der_eapmi (all of them?)
  • (sme) ođđa áššiid dieđiheapmi → kunngjøring av nye saker
Verb / Der_n / N
  • (sme) dánsunkurssa → dansekurs
  • (sme) oažžun → å få
Verb / Der_st / V
  • (sme) báinnestit → de påvirker litt
better adverb?
N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
  • (sme) Ekonomalaš doarjagat → Økonomisk støtte
Is there any good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
I see no possible paraphrase

Noun phrases[edit]

accusative object predicative, add "være"
  • (sme) Gáhkuid son ráhkada buriid → Kakene hun/han lager er gode
  • (sme) Gáhkuid son ráhkada hui buriid → Kakene hun/han lager er svært gode
Illative
  • (sme) Atte mánnái biepmu → Gi mat til barnet


  • (sme) dán jagi válggas → i dette årets valg

Genitives[edit]

Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds
  • (sme) Dál son lea Badjemánáid beaiveruovttu hoavda → Nå er hun/han sjef for Reindriftsbarnenes daghjem
  • (sme) Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui → Foreldrene drømte om å få bruk av et eget hus for barnehagen
for/som/til?
  • (sme) Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii → Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage
  • (sme) 10-jagi vuođđoskuvlla sámi oahppoplánat → samisk studieplan for den 10-årige grunnskolen
  • (sme) sámi árvvuid oahpaheami vuođđu → grunnlag for opplæring i samiske verdier
near-impossible, head moves in front of the whole coordination
  • (sme) skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu → grunnlaget for skolens samiskundervisning og undervisning i samiske verdier


place names → i
  • (sme) oahpaheddjiid Davvi-Norgga skuvllaide → lærerne ved skolene i Nord-Norge
  • (sme) Finnmárkku áviissaid čállosiin → I tekster i Finnmarks aviser
  • (sme) Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin → årsmøte i foreningen for Vest-Finnmarks lærere
  • (sme) Loabága sámegieloahpahusa árvvoštallan → Vurdering av samiskopplæringa i Lavangen
even some non-doubles
  • (sme) Dalle ledjen juo barggus Romssa Sámeskuvllas → Da var jeg allerede i arbeid ved Sameskolen i Troms
for language names, we would prefer gen→adj …
  • (sme) Gáivuona sámi giellaguovddáš → Kåfjord samiske språksenter
  • (sme) Sámegiela vuođđofága lea eatnigielfága → Samisk grunnfag er morsmålsfag
  • (sme) Oahpaheaddjin sámi vuođđoskuvllas → Som lærer i den samiske grunnskolen


some genitives sound better as compounds
  • (sme) Son lea kulturbargi, geas lea boazodoalloduogáš. → Hun/han er en kulturarbeider, som har reindriftsbakgrunn.

Odd number phrases[edit]

does this generalise?
  • (sme) 1814 Vuođđolága → Grunnloven av 1814



  • (sme) Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus → Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke
  • (sme) Dohko bođii almmái gii lei njealjátlohkái. → Dit kom en mann som var i trettiårene.
  • (sme) Čihččetlohkái nisu navdo goddon. → Kvinne i sekstiårene antaes blitt drept.

Definiteness[edit]

(also er/har)
  • (sme) Mus lea biepmu → Jeg har mat
  • (sme) Biepmu lea mus → Maten er hos meg
  • (sme) Du dálkasis sáhtii leamaš ávki → Din medisin kan ha vært til nytte
  • (sme) Dá livččii skeaŋka din čeahpes bárdnái → Dette hadde vært en gave til deres flinke sønn.

Adpositions[edit]

Post-positions → Prepositions... move "på grunn av" first
  • (sme) garra dálkki geažil → på grunn av det dårlige været
  • (sme) Stáhta geaidnodoaimmahat lea dál čállán šiehtadusaid Guovdageainnu, Álttá, Láhpi ja Ákŋoluovtta muohtačorgenbargguide. → Statens vegvesen har nå skrevet avtalene for Kautokeinos, Altas, Loppas og Hasviks snøryddingarbeider.

Coordination[edit]

Questions[edit]

  • (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
  • (sme) It go boađáše munnje veahkkin? → Kan du komme og hjelpe meg?
essive predicative, difficult..."kommer du ikke til meg som hjelp?"


  • (sme) De guldalan → Jeg lytter
eller, "Ja, jeg lytter"?


Subordinatied questions[edit]

  • (sme) Son diehtá bohtet go ruoktot → Hun/han vet om de kommer hjem.
insert 'om'
  • (sme) Son háliidii iskat ásse go olbmot doppe → Hun/han ville undersøke om det bodde folk der borte.
insert 'om' and 'det' (existential)
pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst

Prepositional choice[edit]

numbers, places.illative
  • (sme) 1964:s bođii Ráisii dálueamitskuvla → I 1964 kom det husmorskole til Nordreisa
or "kom det"?
  • (sme) 1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla → I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole
gen vs "av"
  • (sme) Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija → Skolen var for det meste bare en kopi av den vanlige norske skolen


med, not på
  • (sme) Jos válddát 60 poeaŋgga sámegielas → Hvis du tar 60 poeng i samisk
delete til
  • (sme) de sáhttá dat addit dutnje 60 000 ruvnnu → så kan det gi deg 60 000 kroner


delete som, "del av", not "del "
  • (sme) Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot → Reindriftssakene kunne bli en del av den saksmengden som skal behandles
also bearbeides=>behandles (lex.sel), kan=>vil (why?)
oassin is essive, but still we (might) want 'en del', not just 'del'


das → av det, some times
  • (sme) ahte ipmirdin maidege das mii daddjui → at jeg forsto noe av det som ble sagt
previous n-head overrides
  • (sme) Muittán ahte lei álo veahá ballu das → Jeg husker at det var alltid litt frykt for det

Miscellaneous[edit]

Ordstilling
  • (sme) Gal moai birgejetne iehčaneame → Vi to greier oss på egen hånd.


  • (sme) Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát. → De små vedkassene var benk og i tillegg våre egne matkister,
  • (sme) Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii. → Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.
  • (sme) Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus → Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet
  • (sme) 1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána → I 1997 fikk vi studieplan for 10-årig grunnskole
  • (sme) Lohke iežaset juhkan ollu alkohola → De sa at de hadde drukket mye alkohol
something up with ollu→mange/mye here (turns into 'flest')
  • (sme) Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide. → Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.
  • (sme) Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas. → Samene eller samene bor i Russland, Finland, Sverige og Norge.
-ge particle, and an adjective adverbial
  • (sme) Leago dát duođasge Sámi Radio oaivil? → Er dette altså virkelig Sameradioens mening?
Headline, 3sg->man, no finite verb in main clause
  • (sme) Heahpat hállat go gillá → Skam å snakke når man lider


  • (sme) Lehkos beaivi buorre → Ha en god dag
  • (sme) musnai leat muosáhusat namuhuvvon ministeriijas → jeg også har erfaringer fra nevnte ministerium


  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin → Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn
CG fixed; but bracketing trouble for "over grensen til Sverige"


  • (sme) ollen deid juohke sajis → jeg når dem på hvert sted
is this more or less correct?


  • (sme) okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča → en i februar, en i april, en om sommeren og en på seinhøsten

V->N (removed for now, might be able to do in postchunk)[edit]

V / Der2 / Actor => N
  • (sme) dadjaleaddji lea doppe → replisereren er der borte
TODO indefinite (en som repliserer)
  • (sme) stuora dadjaleaddji lea doppe → den store replisereren er der borte
  • (sme) Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin → Etter døden ble Kong Olav forhøyd som hellig
hmm

CG Disambiguation problems[edit]

  • (sme) Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat. → Forklaringene fantes ikke, bare kopier av samiske manus.
dušše gets the verb reading
  • (sme) Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii → Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk
CG solved
  • (sme) Dan gal dieđán váddása → Det vet jeg er vanskelig
CG solved
  • (sme) Barggan ruovttus lunšša rádjai → Jeg arbeider hjemme til lunsj
CG solved
  • (sme) Sámediggi Gironis koordinere ođđa prográmma. → Sametinget i Kiruna koordinerer det nye programmet.
CG solved
  • (sme) Maŋŋá go parlamentarisma ásahuvvui → Etter at parlamentarismen ble etablert
CG solved
  • (sme) Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka. → Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.
CG solved


  • (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
  • (sme) de jullot čoalkalit uksii vuos → så får de banke på døren først
CG solved


  • (sme) Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon → Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt
CG solved


  • (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
CG solved

gen vs acc[edit]

  • (sme) Dan dieđán váddása → Det vet jeg er vanskelig
CG solved

@HAB[edit]

  • (sme) Dál leat sus 137 gáicca → Nå har hun/han 137 geiter
CG solved

genitiver[edit]

  • (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji. → Allerede 10. april mot natta reiste Harald over grensa.
Her er problemet at beaivvi som er genitiv ikke skal modifisere ija, man ha @ADVL-tagg.

CG lexical selection[edit]

go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi[edit]

  • (sme) Buoret lea johtit go orrut → Det er bedre å bevege seg enn å bli