North Germanic languages

From Apertium
Revision as of 10:52, 24 March 2012 by Bech (talk | contribs) (Category:Documentation in English)
Jump to navigation Jump to search

The North Germanic languages include Danish (da), Faroese (fo), Icelandic (is), Norwegian (Nynorsk, nn and Bokmål, nb) and Swedish (sv). The languages are related with varying levels of mutual intelligibility. This group would make a nice group for Apertium systems.

Status

Text in italic denotes an unreleased pair.

Template:North Germanic language translations

Existing

Dictionaries
See also: List of dictionaries
Language File Paradigms Lemmata
Norwegian Nynorsk apertium-nn-nb.nn.dix 770 83,584
Norwegian Bokmål apertium-nn-nb.nb.dix 705 119,567
Swedish apertium-sv-da.sv.dix 277 5,177
Danish apertium-sv-da.da.dix 341 10,709
Faroese apertium-fo-is.fo.dix 113 1,864
Icelandic apertium-is-en.is.dix 1,881 9,134

Resources

Resources listed below will be useful in building machine translation systems for these languages.

Monolingual
Language Resource Description See also
Norwegian Norsk ordbank Large >100,000 lemma morphological dictionary of both Nynorsk and Bokmål, GPL. Norsk ordbank, Norwegian
Norwegian Oslo-Bergen tagger Constraint grammar tagger for Norwegian, GPL. (converted for CG-3) Norwegian
Swedish Talbanken A 300,000-word tree-bank: it is in XML, all words are nicely tagged with PAROLE-style tags.
Swedish SALDO Swedish inflectional lexicon, LGPL
Danish Danish Dependency Treebank Danish tree bank, 100,000-word, XML, PAROLE tagged, under the GPL.
Danish DanNet Danish WordNet (~32,000 words), MIT licensed.
Icelandic Icelandic and English
Faroese apertium-fo-is.fo.rlx A constraint grammar for morphological disambiguation with ~120 rules
Bilingual
Language pair Resource Description See also
Icelandic—Danish Apertium bidix with ~960 entries
Icelandic—Faroese Apertium bidix with ~30 entries
Norwegian (Nynorsk)—Norwegian (Bokmål) Apertium bidix with ~36,000 entries Norwegian
Swedish—Danish Apertium bidix with ~2,000 entries Swedish and Danish

Funding possibilities

Samples

Language Text
Danish Alle mennesker er født frie og lige i værdighed og rettigheder. De er udstyret med fornuft og samvittighed, og de bør handle mod hverandre i en broderskabets ånd.
Norwegian (Bokmål) Alle mennesker er født frie og med samme menneskeverd og menneskerettigheter. De er utstyrt med fornuft og samvittighet og bør handle mot hverandre i brorskapets ånd.
Norwegian (Nynorsk) Alle menneske er fødde til fridom og med same menneskeverd og menneskerettar. Dei har fått fornuft og samvit og skal leve med kvarandre som brør.
Swedish Alla människor är födda fria och lika i värde och rättigheter. De har utrustats med förnuft och samvete och bör handla gentemot varandra i en anda av gemenskap.
Faroese Øll menniskju eru fødd fræls og jøvn til virðingar og mannarættindi. Tey hava skil og samvitsku og eiga at fara hvørt um annað í bróðuranda.
Icelandic Hver maður er borinn frjáls og jafn öðrum að virðingu og réttindum. Menn eru gæddir vitsmunum og samvizku, og ber þeim að breyta bróðurlega hverjum við annan.