Difference between revisions of "Linguistic issues for North Saami to Inari Saami machine translation"

From Apertium
Jump to navigation Jump to search
 
(10 intermediate revisions by 3 users not shown)
Line 4: Line 4:
 
=== [[Errors in the Inari Saami transducer|Feaillat smn-morfologiijas]] ===
 
=== [[Errors in the Inari Saami transducer|Feaillat smn-morfologiijas]] ===
   
Merkkii teehi anarâškiel saanijd, moh sojeh puástud. Tágárijd feeilâid ferttee tivvoođ analysaattorân. OVDÂMERKKÂ:
+
Merkkii teehi anarâškiel saanijd, moh sojeh puástud. Puástusuujâtmist puáhtá om. váiluđ vookaal teikâ leđe lijgevookaal. Tágárijd feeilâid ferttee tivvoođ analysaattorân. OVDÂMERKKÂ:
 
MT suujât puástud: ''táájumân''
 
MT suujât puástud: ''táájumân''
Olmânáál: ''tájumân''
+
Olmânáál: ''tájumân''.
  +
[[Errors in the Inari Saami transducer|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
 
Jos jorgaluvvon teavsttas lea anársámegiela sátni, mii lea sojahuvvon boastut (ii nu, ahte sátni lea genetiivvas partitiivva sajis, muhto nu, ahte genitiiva lea boastu hámis, omd. váilu vokála), de ferte divvut anársámegiela analysáhtora. [[Errors in the Inari Saami transducer|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
 
   
 
=== [[Errors in the North Saami disambiguator|Feaila davvisámegiela syntávssalaš analysas (sme dis error)]] ===
 
=== [[Errors in the North Saami disambiguator|Feaila davvisámegiela syntávssalaš analysas (sme dis error)]] ===
   
Merkkii teehin tábáhtusâid, kost MT-jurgâlus addel puástuhäämi, mon jiev byerdi eidu taan ohtâvuođâst. OVDÂMERKKÂ: MT addel ''leđe'', veikâ tun vuárdáččih ''lep'' teikâ ''láá''.
+
Merkkii teehin tábáhtusâid, kost MT-jurgâlus addel puástuhäämi, mon jieh vyerdi eidu taan ohtâvuođâst. OVDÂMERKKÂ: MT addel ''leđe'', veikâ tun vuárdáččih ''lep'' teikâ ''láá''.
   
 
Jos MT-prográmma ii máhte analyseret davvisámegiela (omd. boađus lea infinitiiva go galgá leat máŋggaidlogu vuosttaš persovdna), de mii fertet divvut davvisámegiela syntávssa. [[Errors in the North Saami disambiguator|Čále ovdamearkka deike (dedde)]] dahje váldde oktavuođa Trondii.
 
Jos MT-prográmma ii máhte analyseret davvisámegiela (omd. boađus lea infinitiiva go galgá leat máŋggaidlogu vuosttaš persovdna), de mii fertet divvut davvisámegiela syntávssa. [[Errors in the North Saami disambiguator|Čále ovdamearkka deike (dedde)]] dahje váldde oktavuođa Trondii.
Line 21: Line 20:
 
SE: Seaidnegurrii leat čohkkestuvvon oađđadagat.
 
SE: Seaidnegurrii leat čohkkestuvvon oađđadagat.
 
MT: Seaidnegurrii láá čokkiistum oađđadagat.
 
MT: Seaidnegurrii láá čokkiistum oađđadagat.
Kalga leđe: Seinikuorân láá čokkiistum uáđáduvah.
+
KALGA LEÐE: Seinikuorân láá čokkiistum uáđáduvah.
 
 
 
Dat máksá, ahte sátni váilu jorgalanprográmma sátnegirjjis, ja dan ferte lasihit. [[Missing entries in the North Saami - Inari Saami bilingual dictionary|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
 
Dat máksá, ahte sátni váilu jorgalanprográmma sátnegirjjis, ja dan ferte lasihit. [[Missing entries in the North Saami - Inari Saami bilingual dictionary|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
   
Line 29: Line 26:
   
 
Anarâškiel MT-vaastâ lii lingvistlávt olmânáál, mut taat sääni ij soovâ konteekstân. OVDÂMERKKÂ:
 
Anarâškiel MT-vaastâ lii lingvistlávt olmânáál, mut taat sääni ij soovâ konteekstân. OVDÂMERKKÂ:
 
 
TS: Beaivi loktanii.
 
TS: Beaivi loktanii.
 
MT: Peivi ''luptânij''.
 
MT: Peivi ''luptânij''.
 
Olmânáál: ''Peivi pajanij''.
 
Olmânáál: ''Peivi pajanij''.
 
 
Iiskâ čielgiđ, jis máátáh, maggaar ohtâvuotân säänih ''luptâniđ'' já ''pajaniđ'' puátih.
 
Iiskâ čielgiđ, jis máátáh, maggaar ohtâvuotân säänih ''luptâniđ'' já ''pajaniđ'' puátih.
   
 
Sátnevástta lea lingvisttalaččat riekta muhto mášenjorgalusas geavahuvvo boasttosátni, mii ii heive dán kontekstii. Čilge, makkár sáni galgá geavahit dan sajis ja makkár konteavsttas. Jos sáni jorgalus lea muđui OK muhto ii heive justa dán konteavsttas, de ferte čilget makkár sáni háliida, ja makkár konteavsttas. [[sme-smn sátneválljen|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
 
Sátnevástta lea lingvisttalaččat riekta muhto mášenjorgalusas geavahuvvo boasttosátni, mii ii heive dán kontekstii. Čilge, makkár sáni galgá geavahit dan sajis ja makkár konteavsttas.
 
 
Jos sáni jorgalus lea muđui OK muhto ii heive justa dán konteavsttas, de ferte čilget makkár sáni háliida, ja makkár konteavsttas. [[sme-smn sátneválljen|Čále ovdamearkka deike]] dahje váldde oktavuođa Marja-Liisai.
 
   
 
=== [[Errors in the North Saami transfer component|Transfer]] ===
 
=== [[Errors in the North Saami transfer component|Transfer]] ===
   
Anársámegiela jorgaluvvon teavsttas lea giellaoahpalaš feaila teikâ jis kielâopâliih ráhtuseh kielâi kooskâst láá ereslágáneh. [[Errors in the North Saami transfer component|Čále ovdamearkka deike]] dahje váldde oktavuođa Trondii.
+
Anarâškielân jurgâlum teevstâst lii kielâopâlâš feilâ, eromâšávt togo, kogo kielâi kooskâst láá ráhtusiäruh. [[Errors in the North Saami transfer component|Čále ovdamearkka deike]] dahje váldde oktavuođa Trondii.
   
  +
Ovdamearkkat:
TS: Mun human dán ášši birra.
 
MT: Mun sáárnum taan ääši pirrâ.
+
TS: Mun human ''dán ášši birra''.
Olmânáál: Mun sáárnum taan ääšist.
+
MT: Mun sáárnum ''taan ääši pirrâ''.
  +
Olmânáál: Mun sáárnum ''taan ääšist'.
   
TS: Mun oasttán gávcci čuovžža.
+
TS: Mun oasttán ''gávcci čuovžža''.
MT: Mun uástám käävci šaapsâ.
+
MT: Mun uástám ''käävci šaapsâ''.
Olmânáál: Mun uástám käävci šapšâd.
+
Olmânáál: Mun uástám ''käävci šapšâd''.
   
   

Latest revision as of 12:11, 31 March 2017

Lingvisttalaš áššit leat ordnejuvvon viđa tiipii, prioritehta mielde.

Feaillat smn-morfologiijas[edit]

Merkkii teehi anarâškiel saanijd, moh sojeh puástud. Puástusuujâtmist puáhtá om. váiluđ vookaal teikâ leđe lijgevookaal. Tágárijd feeilâid ferttee tivvoođ analysaattorân. OVDÂMERKKÂ: MT suujât puástud: táájumân Olmânáál: tájumân. Čále ovdamearkka deike dahje váldde oktavuođa Marja-Liisai.

Feaila davvisámegiela syntávssalaš analysas (sme dis error)[edit]

Merkkii teehin tábáhtusâid, kost MT-jurgâlus addel puástuhäämi, mon jieh vyerdi eidu taan ohtâvuođâst. OVDÂMERKKÂ: MT addel leđe, veikâ tun vuárdáččih lep teikâ láá.

Jos MT-prográmma ii máhte analyseret davvisámegiela (omd. boađus lea infinitiiva go galgá leat máŋggaidlogu vuosttaš persovdna), de mii fertet divvut davvisámegiela syntávssa. Čále ovdamearkka deike (dedde) dahje váldde oktavuođa Trondii.

Anársámegiela jorgaluvvon teavsttas lea davvisámegiela sátni (Bidix)[edit]

Merkkii teehin tagarijd tábáhtusâid, kost pajekiel sääni ij jurgâluu anarâškielân. OVDÂMERKKÂ: pajekielâ säänih seaidnegurriioađđadagat láá uáinusist anarâškiel MT-jurgâlusâst: SE: Seaidnegurrii leat čohkkestuvvon oađđadagat. MT: Seaidnegurrii láá čokkiistum oađđadagat. KALGA LEÐE: Seinikuorân láá čokkiistum uáđáduvah. Dat máksá, ahte sátni váilu jorgalanprográmma sátnegirjjis, ja dan ferte lasihit. Čále ovdamearkka deike dahje váldde oktavuođa Marja-Liisai.

Sátneválljen (Lexical selection)[edit]

Anarâškiel MT-vaastâ lii lingvistlávt olmânáál, mut taat sääni ij soovâ konteekstân. OVDÂMERKKÂ: TS: Beaivi loktanii. MT: Peivi luptânij. Olmânáál: Peivi pajanij. Iiskâ čielgiđ, jis máátáh, maggaar ohtâvuotân säänih luptâniđpajaniđ puátih.

Sátnevástta lea lingvisttalaččat riekta muhto mášenjorgalusas geavahuvvo boasttosátni, mii ii heive dán kontekstii. Čilge, makkár sáni galgá geavahit dan sajis ja makkár konteavsttas. Jos sáni jorgalus lea muđui OK muhto ii heive justa dán konteavsttas, de ferte čilget makkár sáni háliida, ja makkár konteavsttas. Čále ovdamearkka deike dahje váldde oktavuođa Marja-Liisai.

Transfer[edit]

Anarâškielân jurgâlum teevstâst lii kielâopâlâš feilâ, eromâšávt togo, kogo kielâi kooskâst láá ráhtusiäruh. Čále ovdamearkka deike dahje váldde oktavuođa Trondii.

Ovdamearkkat:

TS: Mun human dán ášši birra. 
MT: Mun sáárnum taan ääši pirrâ. 
Olmânáál: Mun sáárnum taan ääšist'.
TS: Mun oasttán gávcci čuovžža.
MT: Mun uástám käävci šaapsâ. 
Olmânáál: Mun uástám käävci šapšâd. 


Other transfer issues:


Min ovdamearkka-siidu lea pedagogalaš stohkama dihte.