Norwegian Nynorsk and Norwegian Bokmål
Dette er ei side med praktisk informasjon for alle som vil bidra til maskinomsetjingsprosjekta til og frå norsk.
For å kunne delta må du ha ein konto på SourceForge, og du må sjekke ut kjeldekoden via SVN.
Desse er dei viktige filene for prosjektet for maskinomsetjing mellom nynorsk og bokmål.
apertium-nn-nb.nb.dix apertium-nn-nb.nn-nb.dix apertium-nn-nb.nn.dix
Filene apertium-nn-nb.nb.dix
og apertium-nn-nb.nn.dix
inneheld dei morfologiske parsarane.
Fila apertium-nn-nb.nn-nb.dix
er transferleksikonet.
Merk at oppslaga (<e>
) kan vere merka med ein restriksjon,, <e r="LR">
, som viser at oppslaget vil bli analyser, men ikkje generert.
SVN
Sjekk ut kjeldekoden med denne kommandoen:
svn co https://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-nn-nb
Til dei som ikkje har vore borti svn: For å gje denne kommandoen slik må du ha Linux eller Mac, svn installert, og kommandoen skal skrivast i terminal-programmet. Windowsbrukarar må laste ned programmet tortoisesvn (jf. denne svn-innføringssida.
Decisions to make, variants
In the long run, we'd like something like this, which Apertium supports through variants on transfer rules and lexical entries, but until then, there are some decisions to make.
Garpegenitiv
Idea: Possibly there could be a transfer rule variant on whether or not to keep the "garpegenitiv"/his-genitive across translations since it's a bit... disputed. --Unhammer
bli/vart/vorte?
- bli -r, blei, blitt ?
- bli -r, vart, vorte ?
- verte, vert, vart, vorte ?
(Go for frequency? In nn.dix I chose to put LR on 'litle', 'vetle' & 'lisle' since 'vesle' had the highest frequency in [avis.uib.no]; nb of course has LR on 'vesle'.)
samsvarsbøying for partisippar
Eit raskt søk i Oslo-korpuset av tagga nynorsktekster tyder på at dette rett og slett ikkje skjer, sjekk t.d. «levd/levt» fulgt av substantiv, sjølv om no.wikipedia seier at det skal bøyast. Erik frå i18n-no vil «avgrense bruken» men nemner at «køyrd - køyrt - køyrde og dømd - dømt - dømde» er obligatorisk. Sånn implementeringsmessig er det kanskje like lett å innføre det for alle formar då?
Relevante lenkjer
- /Regression tests
- /Pending tests
- Using SVN
- Create an account on SourceForge
- Norsk ordbank
- North Germanic languages
- Oslo-Bergen-taggeren CG-reglar (bokmål, nynorsk) + leksikon (binærfil)