Difference between revisions of "Northern Sámi and Norwegian/Pending tests"
Jump to navigation
Jump to search
(371 intermediate revisions by 5 users not shown) | |||
Line 1: | Line 1: | ||
{{TOCD}} |
{{TOCD}} |
||
===Nouns=== |
|||
Run with <code>t/update-latest</code> and then check <code>svn diff t</code> to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation. |
|||
* {{test|sme|biila|bil}} |
|||
* {{test|sme|biillat|biler}} |
|||
* {{test|sme|biilla|bilens}} |
|||
* {{test|sme|biilii|inn i bilen}} |
|||
See also [[../Regression tests|Regression tests]]. |
|||
===Verbs=== |
|||
* {{test|sme|goarrut|å sy}} |
|||
==Reported bad translations== |
|||
* {{test|sme|goarun|jeg syr}} |
|||
Write a full North Saami sentence, and the correct Norwegian translation in this format: |
|||
* {{test|sme|gorrot|de syr}} |
|||
*{{test|sme|Guovddáš gulaskuddan|Sentral høring}} |
|||
==Nouns== |
|||
==Adjectives== |
|||
==Verbs== |
|||
; Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset |
|||
; what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"? |
|||
; Nektende perfektum |
|||
* {{test|sme|Son ii lean čállán.|Hun/han hadde ikke skrevet}} |
|||
; ^^^ mistagged (or Nickel's wrong) |
|||
* {{test|sme|allos leage čállán|la ham ikke ha skrevet}} |
|||
; Nektende progressiv presens |
|||
* {{test|sme|ii livčče čállimin|hun/han hadde ikke vært i ferd med å skrive}} |
|||
* {{test|sme|ii livčče čállime|hun/han hadde ikke vært i ferd med å skrive}} |
|||
: now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better? |
|||
* {{test|sme|allos leage čállimin|la ham ikke være i ferd å skrive}} |
|||
* {{test|sme|allos leage čállime|la ham ikke være i ferd å skrive}} |
|||
; Potensialis presens |
|||
* {{test|sme|Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas.|Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.}} |
|||
* {{test|sme|Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis|Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.}} |
|||
: Insert 'nå' or 'så'? |
|||
; Potensialis preteritum (berre visse verb, i korp finner vi bare for leat) |
|||
* {{test|sme|In dieđe leaččai go duohta|Jeg vet ikke om det nå var sant}} |
|||
; Kondisjonalis |
|||
* {{test|sme|Hearggit ruhttet dego livčče ballame.|Kjørereinene løper som om de skulle være redde.}} |
|||
* {{test|sme|Mun mávssášin, jos don siđašit.|Jeg kunne betale, hvis du ønsket det.}} |
|||
; Jeg hadde betalt, om du ønsket det? |
|||
===Passive preterite=== |
|||
* {{test|sme|Go su áhčči jámii de gildui sámegiela hállat telefuvnnas|Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen}} |
|||
: insert 'å' |
|||
===V2=== |
|||
* {{test|sme|It boađáše|Du kunne ikke komme}} |
|||
===Negative, verb=>adv === |
|||
* {{test|sme|Gummá go ii boahtán.|Rart at hun/han ikke kom.|Gummá is adjective, we can add it as adverb if it is documented}} |
|||
* {{test|sme|Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit.|Noe som man ikke utstår, ikke tør å se på eller å berøre.}} |
|||
; dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt" |
|||
* {{test|sme|Buoremus dáidá muitalit buot|Det kan være best å fortelle alt}} |
|||
===FV + FV=== |
|||
; pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"? |
|||
* geahččat gaivát|å glane |
|||
* juhkat reavžut|å slurke |
|||
===FV + IV pro gender=== |
|||
* {{test|sme|Ja de álggii muohttit|Og så begynte det å snø}} |
|||
* {{test|sme|Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat|Og så begynte det å snø og det ble så kjølig at hennes/hans klesplagg frøs}} |
|||
===Causative=== |
|||
* {{test|sme|divuhit|la reparere}} |
|||
; 1) causative + illiative agent adverbial => å la ADVL MAINV |
|||
* {{test|sme|galggat gásttašahttit mánát báhppii|du skal la barnet døpes av presten}} |
|||
: or |
|||
* {{test|sme|galggat gásttašahttit mánát báhppii|du skal la presten døpe barnet}} |
|||
* {{test|sme|geasa don geahčahat bohccuidat?|hvem lar du passe reinene?}} |
|||
; 2) transitive causative + accusative object => å få OBJ til å MAINV |
|||
* {{test|sme|Mu vuovssihii|Det fikk meg til å bli kvalm}} |
|||
: |
|||
; CG mistaggings: |
|||
* {{test|sme|Mun dihten heastta sus leamaš|Jeg visste at hun/han har hatt hest}} |
|||
* {{test|sme|Mun dieđán ruđaid leamaš áhkus.|Jeg vet at bestemor har hatt penger.}} |
|||
; pp, insert "er" |
|||
* {{test|sme|Son osku iežas bestojuvvon.|Hun/han tror hun/han er frelst.}} |
|||
;adverbialsetning |
|||
* {{test|sme|Albmi lei ruoksat, go beaivi luoitádii|Himmelen var rød, da sola gikk ned}} |
|||
;setn.tilsvar m/gerundium som verbal |
|||
* {{test|sme|Albmi lei ruoksat beaivvi luoitádettiin|Himmelen var rød mens sola gikk ned}} |
|||
==Object/adverbial placement== |
|||
* {{test|sme|Sádde áinnas midjiide e-poasta.|Send gjerne en e-post til oss.}} |
|||
: "send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker |
|||
* {{test|sme|Go lásiin bargá, de dat lea dego báhkka honnet|Når hun/han arbeider med glass, så er det som varm honning}} |
|||
* {{test|sme|Larsen fas doapmá.|Larsen skynder seg igjen.}} |
|||
* {{test|sme|Larsen fas čállá reivve.|Larsen skriver brev igjen.}} |
|||
* {{test|sme|Larsen dieđusge doapmá.|Larsen skynder seg selvfølgelig.}} |
|||
* {{test|sme|Larsen dieđusge čállá reivve.|Larsen skriver selvfølgelig brev.}} |
|||
==Pronouns== |
|||
; genitive/det.poss |
|||
* {{test|sme|Du dálkasis|I din medisin}} |
|||
===Reflexive, ieš=== |
|||
* {{test|sme|ieš dat muitalii|hun/han selv fortalte det}} |
|||
* {{test|sme|ieš mun dájun|jeg bare tøver}} |
|||
* {{test|sme|Mun ceggen vaikke ieš filbmafestivála|Jeg setter om så selv opp filmfestival}} |
|||
: ceggen => particle verb |
|||
==Anaphora resolution== |
|||
; t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x |
|||
; (ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x) |
|||
* {{test|sme|Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret|Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.}} |
|||
: um what is that ending? |
|||
==Derivation== |
|||
; Verb / Actor / N |
|||
* {{test|sme|geavaheaddjiid almmolaš bálvalusaide|for/til offentlige tjenester for brukere}} |
|||
; Verb / Der_h / Der_eapmi (all of them?) |
|||
* {{test|sme|ođđa áššiid dieđiheapmi|kunngjøring av nye saker}} |
|||
; Verb / Der_n / N |
|||
* {{test|sme|dánsunkurssa|dansekurs}} |
|||
* {{test|sme|oažžun|å få}} |
|||
; Verb / Der_st / V |
|||
* {{test|sme|báinnestit|de påvirker litt}} |
|||
: better adverb? |
|||
; N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk) |
|||
* {{test|sme|Ekonomalaš doarjagat|Økonomisk støtte}} |
|||
: Is there ''any'' good way to translate both našuvnnalaš, dábálaš and ekonomalaš? |
|||
: I see no possible paraphrase |
|||
==Noun phrases== |
|||
; accusative object predicative, add "være" |
|||
* {{test|sme|Gáhkuid son ráhkada buriid|Kakene hun/han lager er gode}} |
|||
* {{test|sme|Gáhkuid son ráhkada hui buriid|Kakene hun/han lager er svært gode}} |
|||
; Illative |
|||
* {{test|sme|Atte mánnái biepmu|Gi mat til barnet}} |
|||
* {{test|sme|dán jagi válggas|i dette årets valg}} |
|||
===Genitives=== |
|||
; Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds: |
|||
* {{test|sme|Dál son lea Badjemánáid beaiveruovttu hoavda|Nå er hun/han sjef for Reindriftsbarnenes daghjem}} |
|||
* {{test|sme|Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui|Foreldrene drømte om å få bruk av et eget hus for barnehagen}} |
|||
: for/som/til? |
|||
* {{test|sme|Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii|Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage}} |
|||
* {{test|sme|10-jagi vuođđoskuvlla sámi oahppoplánat|samisk studieplan for den 10-årige grunnskolen}} |
|||
* {{test|sme|sámi árvvuid oahpaheami vuođđu|grunnlag for opplæring i samiske verdier}} |
|||
; near-impossible, head moves in front of the whole coordination |
|||
* {{test|sme|skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu|grunnlaget for skolens samiskundervisning og undervisning i samiske verdier}} |
|||
; place names → i |
|||
* {{test|sme|oahpaheddjiid Davvi-Norgga skuvllaide|lærerne ved skolene i Nord-Norge}} |
|||
* {{test|sme|Finnmárkku áviissaid čállosiin|I tekster i Finnmarks aviser}} |
|||
* {{test|sme|Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin|årsmøte i foreningen for Vest-Finnmarks lærere}} |
|||
* {{test|sme|Loabága sámegieloahpahusa árvvoštallan|Vurdering av samiskopplæringa i Lavangen}} |
|||
; even some non-doubles: |
|||
* {{test|sme|Dalle ledjen juo barggus Romssa Sámeskuvllas|Da var jeg allerede i arbeid ved Sameskolen i Troms}} |
|||
; for language names, we would prefer gen→adj … |
|||
* {{test|sme| Gáivuona sámi giellaguovddáš|Kåfjord samiske språksenter}} |
|||
* {{test|sme|Sámegiela vuođđofága lea eatnigielfága|Samisk grunnfag er morsmålsfag}} |
|||
* {{test|sme|Oahpaheaddjin sámi vuođđoskuvllas|Som lærer i den samiske grunnskolen}} |
|||
; some genitives sound better as compounds: |
|||
* {{test|sme|Son lea kulturbargi, geas lea boazodoalloduogáš.|Hun/han er en kulturarbeider, som har reindriftsbakgrunn.}} |
|||
===Odd number phrases=== |
|||
; does this generalise? |
|||
* {{test|sme|1814 Vuođđolága|Grunnloven av 1814}} |
|||
* {{test|sme|Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus|Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke}} |
|||
* {{test|sme|Dohko bođii almmái gii lei njealjátlohkái.|Dit kom en mann som var i trettiårene.}} |
|||
* {{test|sme|Čihččetlohkái nisu navdo goddon.|Kvinne i sekstiårene antaes blitt drept.}} |
|||
==Definiteness== |
|||
; (also er/har) |
|||
* {{test|sme|Mus lea biepmu|Jeg har mat}} |
|||
* {{test|sme|Biepmu lea mus|Maten er hos meg}} |
|||
* {{test|sme|Du dálkasis sáhtii leamaš ávki|Din medisin kan ha vært til nytte}} |
|||
* {{test|sme|Dá livččii skeaŋka din čeahpes bárdnái|Dette hadde vært en gave til deres flinke sønn.}} |
|||
==Adpositions== |
|||
; Post-positions → Prepositions... move "på grunn av" first |
|||
* {{test|sme|garra dálkki geažil|på grunn av det dårlige været}} |
|||
* {{test|sme|Stáhta geaidnodoaimmahat lea dál čállán šiehtadusaid Guovdageainnu, Álttá, Láhpi ja Ákŋoluovtta muohtačorgenbargguide.|Statens vegvesen har nå skrevet avtalene for Kautokeinos, Altas, Loppas og Hasviks snøryddingarbeider.}} |
|||
==Coordination== |
|||
==Questions== |
|||
* {{test|sme|Itgo gáfe juga?|Drikker du ikke kaffe?}} |
|||
* {{test|sme|It go boađáše munnje veahkkin?|Kan du komme og hjelpe meg?}} |
|||
: essive predicative, difficult..."kommer du ikke til meg som hjelp?" |
|||
* {{test|sme|De guldalan|Jeg lytter}} |
|||
: eller, "Ja, jeg lytter"? |
|||
==Subordinatied questions== |
|||
* {{test|sme|Son diehtá bohtet go ruoktot|Hun/han vet om de kommer hjem.}} |
|||
: insert 'om' |
|||
* {{test|sme|Son háliidii iskat ásse go olbmot doppe|Hun/han ville undersøke om det bodde folk der borte.}} |
|||
: insert 'om' and 'det' (existential) |
|||
: pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst |
|||
==Prepositional choice== |
|||
; numbers, places.illative |
|||
* {{test|sme|1964:s bođii Ráisii dálueamitskuvla|I 1964 kom det husmorskole til Nordreisa}} |
|||
: or "kom det"? |
|||
* {{test|sme|1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla|I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole}} |
|||
;gen vs "av": |
|||
* {{test|sme|Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija|Skolen var for det meste bare en kopi av den vanlige norske skolen}} |
|||
; med, not på |
|||
* {{test|sme|Jos válddát 60 poeaŋgga sámegielas|Hvis du tar 60 poeng i samisk}} |
|||
; delete til |
|||
* {{test|sme|de sáhttá dat addit dutnje 60 000 ruvnnu|så kan det gi deg 60 000 kroner}} |
|||
; delete som, "del ''av''", not "del ''på''" |
|||
* {{test|sme|Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot|Reindriftssakene kunne bli en del av den saksmengden som skal behandles}} |
|||
: also bearbeides=>behandles (lex.sel), kan=>vil (why?) |
|||
: oassin is essive, but still we (might) want 'en del', not just 'del' |
|||
; das → av det, some times |
|||
* {{test|sme|ahte ipmirdin maidege das mii daddjui|at jeg forsto noe av det som ble sagt}} |
|||
; previous n-head overrides |
|||
* {{test|sme|Muittán ahte lei álo veahá ballu das|Jeg husker at det var alltid litt frykt for det}} |
|||
==Miscellaneous== |
|||
;Ordstilling |
|||
* {{test|sme|Gal moai birgejetne iehčaneame|Vi to greier oss på egen hånd.}} |
|||
* {{test|sme| Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát.| De små vedkassene var benk og i tillegg våre egne matkister,}} |
|||
* {{test|sme|Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii.|Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.}} |
|||
* {{test|sme|Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus|Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet}} |
|||
* {{test|sme|1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána |I 1997 fikk vi studieplan for 10-årig grunnskole}} |
|||
* {{test|sme|Lohke iežaset juhkan ollu alkohola |De sa at de hadde drukket mye alkohol}} |
|||
: something up with ollu→mange/mye here (turns into 'flest') |
|||
* {{test|sme|Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide.|Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.}} |
|||
* {{test|sme|Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas.|Samene eller samene bor i Russland, Finland, Sverige og Norge.}} |
|||
; -ge particle, and an adjective adverbial: |
|||
* {{test|sme|Leago dát duođasge Sámi Radio oaivil?|Er dette altså virkelig Sameradioens mening?}} |
|||
; Headline, 3sg->man, no finite verb in main clause |
|||
* {{test|sme|Heahpat hállat go gillá|Skam å snakke når man lider}} |
|||
* {{test|sme|Lehkos beaivi buorre|Ha en god dag}} |
|||
* {{test|sme|musnai leat muosáhusat namuhuvvon ministeriijas|jeg også har erfaringer fra nevnte ministerium}} |
|||
* {{test|sme|Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin|Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn}} |
|||
: CG fixed; but bracketing trouble for "over grensen til Sverige" |
|||
* {{test|sme|ollen deid juohke sajis|jeg når dem på hvert sted}} |
|||
: is this more or less correct? |
|||
* {{test|sme|okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča|en i februar, en i april, en om sommeren og en på seinhøsten}} |
|||
===V->N (removed for now, might be able to do in postchunk)=== |
|||
; V / Der2 / Actor => N |
|||
* {{test|sme|dadjaleaddji lea doppe|replisereren er der borte}} |
|||
: TODO indefinite (en som repliserer) |
|||
* {{test|sme|stuora dadjaleaddji lea doppe|den store replisereren er der borte}} |
|||
* {{test|sme|Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin|Etter døden ble Kong Olav forhøyd som hellig}} |
|||
: hmm |
|||
==CG Disambiguation problems== |
|||
* {{test|sme|Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat.|Forklaringene fantes ikke, bare kopier av samiske manus.}} |
|||
: dušše gets the verb reading |
|||
* {{test|sme|Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii|Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk}} |
|||
: CG solved |
|||
* {{test|sme|Dan gal dieđán váddása|Det vet jeg er vanskelig}} |
|||
: CG solved |
|||
* {{test|sme|Barggan ruovttus lunšša rádjai|Jeg arbeider hjemme til lunsj}} |
|||
: CG solved |
|||
* {{test|sme|Sámediggi Gironis koordinere ođđa prográmma.|Sametinget i Kiruna koordinerer det nye programmet.}} |
|||
: CG solved |
|||
* {{test|sme|Maŋŋá go parlamentarisma ásahuvvui|Etter at parlamentarismen ble etablert}} |
|||
: CG solved |
|||
* {{test|sme|Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka.|Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.}} |
|||
: CG solved |
|||
* {{test|sme|Máhtte rábmui iežas vuoitit dan gilvvu|Máhtte skrøt at han skulle vinne den konkurransen}} |
|||
* {{test|sme|de jullot čoalkalit uksii vuos|så får de banke på døren først}} |
|||
: CG solved |
|||
* {{test|sme|Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon|Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt}} |
|||
: CG solved |
|||
* {{test|sme|Go su áhčči jámii de gildui sámegiela hállat telefuvnnas|Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen}} |
|||
: CG solved |
|||
===gen vs acc=== |
|||
* {{test|sme|Dan dieđán váddása|Det vet jeg er vanskelig}} |
|||
: CG solved |
|||
===@HAB=== |
|||
* {{test|sme|Dál leat sus 137 gáicca|Nå har hun/han 137 geiter}} |
|||
: CG solved |
|||
===genitiver=== |
|||
* {{test|sme|Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji.|Allerede 10. april mot natta reiste Harald over grensa.}} |
|||
: Her er problemet at beaivvi som er genitiv ikke skal modifisere ija, man ha @ADVL-tagg. |
|||
==CG lexical selection== |
|||
=== go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi === |
|||
* {{test|sme|Buoret lea johtit go orrut|Det er bedre å bevege seg enn å bli}} |
|||
===Pronouns=== |
|||
* {{test|sme|Dat lea|Det er}} |
|||
===Noun phrases=== |
|||
; essive |
|||
* {{test|sme|mánnán|som barn}} |
|||
===Miscellaneous=== |
|||
* {{test|sme|Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide.|Den viktigaste oppgåva for Noreg.no er å vere ein vegvisar for brukarar av offentlege tjenester.}} |
|||
* {{test|sme|Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas.|Samer eller samer bor i Russland, Finland, Sverige og Norge.}} |
|||
* {{test|sme|Dat lea sihke buorre ja heittot.|Det er både bra og dårlig.}} |
|||
* {{test|sme|Anne ráhkada biepmu.|Anne lager mat.}} |
|||
; har/er: |
|||
* {{test|sme|Mánát leat boahtán skuvlii.|Barnene har kommet til skolen.}} |
|||
[[Category:Northern Sámi and Norwegian]] |
[[Category:Northern Sámi and Norwegian]] |
Latest revision as of 17:00, 4 December 2018
Run with t/update-latest
and then check svn diff t
to compare against previous test results (or read t/latest-pending.results). Note that the script adds a period to the end of all lines that are not terminated by punctuation.
See also Regression tests.
Reported bad translations[edit]
Write a full North Saami sentence, and the correct Norwegian translation in this format:
- (sme) Guovddáš gulaskuddan → Sentral høring
Nouns[edit]
Adjectives[edit]
Verbs[edit]
- Imperativ, jerron jeara jerros jearru jearri jerroska jerrot jearrut jerret jearrit jerroset
- what should we do with all the forms? "jeg/du/han/vi/dere/de må spørre"?
- Nektende perfektum
- (sme) Son ii lean čállán. → Hun/han hadde ikke skrevet
- ^^^ mistagged (or Nickel's wrong)
- (sme) allos leage čállán → la ham ikke ha skrevet
- Nektende progressiv presens
- (sme) ii livčče čállimin → hun/han hadde ikke vært i ferd med å skrive
- (sme) ii livčče čállime → hun/han hadde ikke vært i ferd med å skrive
- now we get "han er kanskje ikke i gang med å skrive" -- is "would" or "maybe" better?
- (sme) allos leage čállimin → la ham ikke være i ferd å skrive
- (sme) allos leage čállime → la ham ikke være i ferd å skrive
- Potensialis presens
- (sme) Sámi mánát dárbbašit doarjaga seailluhit ja ovddidit iežaset giela ja kultuvrra gos dal de orožit riikkas. → Samiske barn behøver støtte for å bevare og utvikle sitt språk og kultur hvor nå så de bo nå i landet.
- (sme) Mii háliidit diehtit dáhpáhuvvá go mihkkege, ja jos nu dagaš, makkár áigemeriid siste dán áššis → Vi vil vite om skjer noe, og hvis det nå gjør, innen hvilke tidsfrister i denne saken.
- Insert 'nå' or 'så'?
- Potensialis preteritum (berre visse verb, i korp finner vi bare for leat)
- (sme) In dieđe leaččai go duohta → Jeg vet ikke om det nå var sant
- Kondisjonalis
- (sme) Hearggit ruhttet dego livčče ballame. → Kjørereinene løper som om de skulle være redde.
- (sme) Mun mávssášin, jos don siđašit. → Jeg kunne betale, hvis du ønsket det.
- Jeg hadde betalt, om du ønsket det?
Passive preterite[edit]
- (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
- insert 'å'
V2[edit]
- (sme) It boađáše → Du kunne ikke komme
Negative, verb=>adv[edit]
- (sme) Gummá go ii boahtán. → Rart at hun/han ikke kom. :: Gummá is adjective, we can add it as adverb if it is documented
- (sme) Juoga maid ii storrá, ii duostta geahččat dahje guoskkahit. → Noe som man ikke utstår, ikke tør å se på eller å berøre.
- dáidit => det er nok. Note the @←SUBJ on muitalit, thus we avoid "(best) det forteller nok alt"
- (sme) Buoremus dáidá muitalit buot → Det kan være best å fortelle alt
FV + FV[edit]
- pair verbs, treat as one lexical unit? or pprs the last one, eg. "å se glanende", "å drikke slurkende"?
- geahččat gaivát|å glane
- juhkat reavžut|å slurke
FV + IV pro gender[edit]
- (sme) Ja de álggii muohttit → Og så begynte det å snø
- (sme) Ja de álggii muohttit ja šattai nu čoaskkis ahte galbmoje su biktasat → Og så begynte det å snø og det ble så kjølig at hennes/hans klesplagg frøs
Causative[edit]
- (sme) divuhit → la reparere
- 1) causative + illiative agent adverbial => å la ADVL MAINV
- (sme) galggat gásttašahttit mánát báhppii → du skal la barnet døpes av presten
- or
- (sme) galggat gásttašahttit mánát báhppii → du skal la presten døpe barnet
- (sme) geasa don geahčahat bohccuidat? → hvem lar du passe reinene?
- 2) transitive causative + accusative object => å få OBJ til å MAINV
- (sme) Mu vuovssihii → Det fikk meg til å bli kvalm
- CG mistaggings
- (sme) Mun dihten heastta sus leamaš → Jeg visste at hun/han har hatt hest
- (sme) Mun dieđán ruđaid leamaš áhkus. → Jeg vet at bestemor har hatt penger.
- pp, insert "er"
- (sme) Son osku iežas bestojuvvon. → Hun/han tror hun/han er frelst.
- adverbialsetning
- (sme) Albmi lei ruoksat, go beaivi luoitádii → Himmelen var rød, da sola gikk ned
- setn.tilsvar m/gerundium som verbal
- (sme) Albmi lei ruoksat beaivvi luoitádettiin → Himmelen var rød mens sola gikk ned
Object/adverbial placement[edit]
- (sme) Sádde áinnas midjiide e-poasta. → Send gjerne en e-post til oss.
- "send oss gjerne e-post" would be great, but then we need to mark verbs with that possibility in the chunker
- (sme) Go lásiin bargá, de dat lea dego báhkka honnet → Når hun/han arbeider med glass, så er det som varm honning
- (sme) Larsen fas doapmá. → Larsen skynder seg igjen.
- (sme) Larsen fas čállá reivve. → Larsen skriver brev igjen.
- (sme) Larsen dieđusge doapmá. → Larsen skynder seg selvfølgelig.
- (sme) Larsen dieđusge čállá reivve. → Larsen skriver selvfølgelig brev.
Pronouns[edit]
- genitive/det.poss
- (sme) Du dálkasis → I din medisin
Reflexive, ieš[edit]
- (sme) ieš dat muitalii → hun/han selv fortalte det
- (sme) ieš mun dájun → jeg bare tøver
- (sme) Mun ceggen vaikke ieš filbmafestivála → Jeg setter om så selv opp filmfestival
- ceggen => particle verb
Anaphora resolution[edit]
- t1x puts pers/impers tags on chunks, t2x copies into variables which are spread onto verbs, t3x uses for pro-insertion in t3x
- (ana_m_f_pers contains m/f from pers-tagged NP's; pers-tagged verbs may receive those m/f tags in t2x)
- (sme) Deatnulaš Hilde Porsangeris livčče hállu máhccat ruoktot Deanu gildii, muhto váilevaš láigoviesut gielddas dagaha ahte šattašii álgovuorus áhččis lusa fárret → Tanaværing Hilde Porsanger kan hadde hatt lyst til å dra tilbake hjem til Tana kommune, men manglende leiehus i kommunen forårsaker at hun kan bli i utgangspunktet å flytte til far.
- um what is that ending?
Derivation[edit]
- Verb / Actor / N
- (sme) geavaheaddjiid almmolaš bálvalusaide → for/til offentlige tjenester for brukere
- Verb / Der_h / Der_eapmi (all of them?)
- (sme) ođđa áššiid dieđiheapmi → kunngjøring av nye saker
- Verb / Der_n / N
- (sme) dánsunkurssa → dansekurs
- (sme) oažžun → å få
- Verb / Der_st / V
- (sme) báinnestit → de påvirker litt
- better adverb?
- N / Der_laš / A (nasjon+al, skikk->vanlig, økonom+isk)
- (sme) Ekonomalaš doarjagat → Økonomisk støtte
- Is there any good way to translate both našuvnnalaš, dábálaš and ekonomalaš?
- I see no possible paraphrase
Noun phrases[edit]
- accusative object predicative, add "være"
- (sme) Gáhkuid son ráhkada buriid → Kakene hun/han lager er gode
- (sme) Gáhkuid son ráhkada hui buriid → Kakene hun/han lager er svært gode
- Illative
- (sme) Atte mánnái biepmu → Gi mat til barnet
- (sme) dán jagi válggas → i dette årets valg
Genitives[edit]
- Double genitives typically end up after the head, but with lots of minor exceptions and/or turning into compounds
- (sme) Dál son lea Badjemánáid beaiveruovttu hoavda → Nå er hun/han sjef for Reindriftsbarnenes daghjem
- (sme) Váhnemat niegadedje oažžut sierra dálu mánáidgárddi atnui → Foreldrene drømte om å få bruk av et eget hus for barnehagen
- for/som/til?
- (sme) Badjenissonat eai duhtan gieldda mánáidgárddi fálaldahkii → Reindriftskvinnene var ikke fornøyde med tilbudet i kommunens barnehage
- (sme) 10-jagi vuođđoskuvlla sámi oahppoplánat → samisk studieplan for den 10-årige grunnskolen
- (sme) sámi árvvuid oahpaheami vuođđu → grunnlag for opplæring i samiske verdier
- near-impossible, head moves in front of the whole coordination
- (sme) skuvlla sámegiela oahpaheami ja sámi árvvuid oahpaheami vuođđu → grunnlaget for skolens samiskundervisning og undervisning i samiske verdier
- place names → i
- (sme) oahpaheddjiid Davvi-Norgga skuvllaide → lærerne ved skolene i Nord-Norge
- (sme) Finnmárkku áviissaid čállosiin → I tekster i Finnmarks aviser
- (sme) Oarje-Finnmárkku oahpaheddjiid searvvi jahkečoahkkin → årsmøte i foreningen for Vest-Finnmarks lærere
- (sme) Loabága sámegieloahpahusa árvvoštallan → Vurdering av samiskopplæringa i Lavangen
- even some non-doubles
- (sme) Dalle ledjen juo barggus Romssa Sámeskuvllas → Da var jeg allerede i arbeid ved Sameskolen i Troms
- for language names, we would prefer gen→adj …
- (sme) Gáivuona sámi giellaguovddáš → Kåfjord samiske språksenter
- (sme) Sámegiela vuođđofága lea eatnigielfága → Samisk grunnfag er morsmålsfag
- (sme) Oahpaheaddjin sámi vuođđoskuvllas → Som lærer i den samiske grunnskolen
- some genitives sound better as compounds
- (sme) Son lea kulturbargi, geas lea boazodoalloduogáš. → Hun/han er en kulturarbeider, som har reindriftsbakgrunn.
Odd number phrases[edit]
- does this generalise?
- (sme) 1814 Vuođđolága → Grunnloven av 1814
- (sme) Juohke jagi konfirmerejuvvojit sullii 40 000 nuora Norgga girkus → Hvert år konfirmeres det omtrent 40 000 ungdommer i Den norske kirke
- (sme) Dohko bođii almmái gii lei njealjátlohkái. → Dit kom en mann som var i trettiårene.
- (sme) Čihččetlohkái nisu navdo goddon. → Kvinne i sekstiårene antaes blitt drept.
Definiteness[edit]
- (also er/har)
- (sme) Mus lea biepmu → Jeg har mat
- (sme) Biepmu lea mus → Maten er hos meg
- (sme) Du dálkasis sáhtii leamaš ávki → Din medisin kan ha vært til nytte
- (sme) Dá livččii skeaŋka din čeahpes bárdnái → Dette hadde vært en gave til deres flinke sønn.
Adpositions[edit]
- Post-positions → Prepositions... move "på grunn av" first
- (sme) garra dálkki geažil → på grunn av det dårlige været
- (sme) Stáhta geaidnodoaimmahat lea dál čállán šiehtadusaid Guovdageainnu, Álttá, Láhpi ja Ákŋoluovtta muohtačorgenbargguide. → Statens vegvesen har nå skrevet avtalene for Kautokeinos, Altas, Loppas og Hasviks snøryddingarbeider.
Coordination[edit]
Questions[edit]
- (sme) Itgo gáfe juga? → Drikker du ikke kaffe?
- (sme) It go boađáše munnje veahkkin? → Kan du komme og hjelpe meg?
- essive predicative, difficult..."kommer du ikke til meg som hjelp?"
- (sme) De guldalan → Jeg lytter
- eller, "Ja, jeg lytter"?
Subordinatied questions[edit]
- (sme) Son diehtá bohtet go ruoktot → Hun/han vet om de kommer hjem.
- insert 'om'
- (sme) Son háliidii iskat ásse go olbmot doppe → Hun/han ville undersøke om det bodde folk der borte.
- insert 'om' and 'det' (existential)
- pattern is @+FMAIN 'om' @+FMAIN Qst eller @-FMAIN 'om' @+FMAIN Qst
Prepositional choice[edit]
- numbers, places.illative
- (sme) 1964:s bođii Ráisii dálueamitskuvla → I 1964 kom det husmorskole til Nordreisa
- or "kom det"?
- (sme) 1971:s ásahuvvui Ráisii gymnásaluohkká ja gávpeskuvla → I 1971 ble det opprettet i Nordreisa gymnasklasse og handelsskole
- gen vs "av"
- (sme) Skuvla eanas leai duššefal dábálaš dáčča skuvlla kopiija → Skolen var for det meste bare en kopi av den vanlige norske skolen
- med, not på
- (sme) Jos válddát 60 poeaŋgga sámegielas → Hvis du tar 60 poeng i samisk
- delete til
- (sme) de sáhttá dat addit dutnje 60 000 ruvnnu → så kan det gi deg 60 000 kroner
- delete som, "del av", not "del på"
- (sme) Boazodoalloáššit šattaše oassin dan áššehivvodagas mii galgá gieđahallojuvvot → Reindriftssakene kunne bli en del av den saksmengden som skal behandles
- also bearbeides=>behandles (lex.sel), kan=>vil (why?)
- oassin is essive, but still we (might) want 'en del', not just 'del'
- das → av det, some times
- (sme) ahte ipmirdin maidege das mii daddjui → at jeg forsto noe av det som ble sagt
- previous n-head overrides
- (sme) Muittán ahte lei álo veahá ballu das → Jeg husker at det var alltid litt frykt for det
Miscellaneous[edit]
- Ordstilling
- (sme) Gal moai birgejetne iehčaneame → Vi to greier oss på egen hånd.
- (sme) Smávva muorrakássat ledje beaŋkan ja dasa vel lássin min iežamet niestebumbbát. → De små vedkassene var benk og i tillegg våre egne matkister,
- (sme) Leimmet muhtun oahppásat hálešteamen gaskaneamet oasi sámegillii oasi dárogillii. → Vi var noen kjenninger i ferd med å prate sammen delvis på samisk og delvis på norsk.
- (sme) Lea namuhuvvon ahte ruoŧŧelaččat vigge Finnmárkku váldit 1600-logus → Det er blitt nevnt at svenskene prøvde å ta Finnmark på 1600-tallet
- (sme) 1997:s oaččuimet 10-jagi vuođđoskuvlla oahppoplána → I 1997 fikk vi studieplan for 10-årig grunnskole
- (sme) Lohke iežaset juhkan ollu alkohola → De sa at de hadde drukket mye alkohol
- something up with ollu→mange/mye here (turns into 'flest')
- (sme) Norga.no deháleamos doaibma lea ofelastit geavaheaddjiid almmolaš bálvalusaide. → Norge.no's viktigste oppgave er å rettlede brukere til offentlige tjenester.
- (sme) Sámit dahjege sápmelaččat ásset Ruoššas, Suomas, Ruoŧas ja Norggas. → Samene eller samene bor i Russland, Finland, Sverige og Norge.
- -ge particle, and an adjective adverbial
- (sme) Leago dát duođasge Sámi Radio oaivil? → Er dette altså virkelig Sameradioens mening?
- Headline, 3sg->man, no finite verb in main clause
- (sme) Heahpat hállat go gillá → Skam å snakke når man lider
- (sme) Lehkos beaivi buorre → Ha en god dag
- (sme) musnai leat muosáhusat namuhuvvon ministeriijas → jeg også har erfaringer fra nevnte ministerium
- (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Ruvdnaprinseassa Märtha badjel ráji Ruŧŧii oktan Ruvdnaprinsabára golmmain mánáin → Allerede 10. april mot natten reiste Kronprinsesse Märtha over grensen til Sverige sammen med Kronprinsparets tre barn
- CG fixed; but bracketing trouble for "over grensen til Sverige"
- (sme) ollen deid juohke sajis → jeg når dem på hvert sted
- is this more or less correct?
- (sme) okta guovvamánus, okta cuoŋománus, okta geasset ja okta maŋeščavčča → en i februar, en i april, en om sommeren og en på seinhøsten
V->N (removed for now, might be able to do in postchunk)[edit]
- V / Der2 / Actor => N
- (sme) dadjaleaddji lea doppe → replisereren er der borte
- TODO indefinite (en som repliserer)
- (sme) stuora dadjaleaddji lea doppe → den store replisereren er der borte
- (sme) Maŋŋá jápmimis de aliduvvui Gonagas Olav bassin → Etter døden ble Kong Olav forhøyd som hellig
- hmm
CG Disambiguation problems[edit]
- (sme) Čilgehusat eai gávdnon, dušše sámegiel giehtačállosiid kopiijat. → Forklaringene fantes ikke, bare kopier av samiske manus.
- dušše gets the verb reading
- (sme) Lei nuorra nieida gii vujii biilla ja son lea dál sáddejuvvon doavtteriskosii → Det var ei ung jente som kjørte bilen og hun er nå blitt sendt til legesjekk
- CG solved
- (sme) Dan gal dieđán váddása → Det vet jeg er vanskelig
- CG solved
- (sme) Barggan ruovttus lunšša rádjai → Jeg arbeider hjemme til lunsj
- CG solved
- (sme) Sámediggi Gironis koordinere ođđa prográmma. → Sametinget i Kiruna koordinerer det nye programmet.
- CG solved
- (sme) Maŋŋá go parlamentarisma ásahuvvui → Etter at parlamentarismen ble etablert
- CG solved
- (sme) Gonagas Haakon bođii geassemánu 7. beaivvi, beaivvát ala vihtta jagi maŋŋá go Gonagas lei šaddan guođđit riikka. → Kong Haakon kom 7. juni, på dagen fem år etter at Kongen hadde blitt å forlate landet.
- CG solved
- (sme) Máhtte rábmui iežas vuoitit dan gilvvu → Máhtte skrøt at han skulle vinne den konkurransen
- (sme) de jullot čoalkalit uksii vuos → så får de banke på døren først
- CG solved
- (sme) Karen Ellen Marie Siri Utsi čájeha gokko beana lei vuddjon → Karen Ellen Marie Siri Utsi viser hvor hunden var blitt påkjørt
- CG solved
- (sme) Go su áhčči jámii de gildui sámegiela hállat telefuvnnas → Da hennes/hans far døde så ble det forbudt å snakke samisk i telefonen
- CG solved
gen vs acc[edit]
- (sme) Dan dieđán váddása → Det vet jeg er vanskelig
- CG solved
@HAB[edit]
- (sme) Dál leat sus 137 gáicca → Nå har hun/han 137 geiter
- CG solved
genitiver[edit]
- (sme) Juo cuoŋománu 10. beaivvi ija vuostá mátkkoštii Harald badjel ráji. → Allerede 10. april mot natta reiste Harald over grensa.
- Her er problemet at beaivvi som er genitiv ikke skal modifisere ija, man ha @ADVL-tagg.
CG lexical selection[edit]
go → 0:når, 1:at, 2:enn, 3:som, 4:da, 5: fordi[edit]
- (sme) Buoret lea johtit go orrut → Det er bedre å bevege seg enn å bli