Difference between revisions of "North Germanic languages"
Jump to navigation
Jump to search
Line 42: | Line 42: | ||
| Icelandic || || || [[Icelandic and English]] |
| Icelandic || || || [[Icelandic and English]] |
||
|- |
|- |
||
| Faroese || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/incubator/apertium-fo-is.fo. |
| Faroese || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/incubator/apertium-fo-is.fo.rlx apertium-fo-is.fo.rlx] || A [[constraint grammar]] for morphological disambiguation with ~120 rules || |
||
|- |
|- |
||
|} |
|} |
Revision as of 10:17, 25 February 2009
The North Germanic languages include Danish (da
), Faroese (fo
), Icelandic (is
), Norwegian (Nynorsk, nn
and Bokmål, nb
) and Swedish (sv
). The languages are related with varying levels of mutual intelligibility. This group would make a nice group for Apertium systems.
Existing
- Dictionaries
- See also: List of dictionaries
Language | File | Paradigms | Lemmata |
---|---|---|---|
Norwegian Nynorsk | apertium-nn-nb.nn.dix | 770 | 83,584 |
Norwegian Bokmål | apertium-nn-nb.nb.dix | 705 | 119,567 |
Swedish | apertium-sv-da.sv.dix | 227 | 8,729 |
Danish | apertium-sv-da.da.dix | 409 | 1,359 |
Faroese | apertium-fo-is.fo.dix | 113 | 1,864 |
Icelandic | apertium-fo-is.is.dix | 1,209 | 4,962 |
Resources
Resources listed below will be useful in building machine translation systems for these languages.
- Monolingual
Language | Resource | Description | See also |
---|---|---|---|
Norwegian | Norsk ordbank | Large >100,000 lemma morphological dictionary of both Nynorsk and Bokmål, GPL. | Norsk ordbank, Norwegian |
Norwegian | Oslo-Bergen tagger | Constraint grammar tagger for Norwegian, GPL. | Norwegian |
Swedish | Talbanken | A 300,000-word tree-bank: it is in XML, all words are nicely tagged with PAROLE-style tags. | |
Danish | Danish Dependency Treebank | Danish tree bank, 100,000-word, XML, PAROLE tagged, under the GPL. | |
Icelandic | Icelandic and English | ||
Faroese | apertium-fo-is.fo.rlx | A constraint grammar for morphological disambiguation with ~120 rules |
- Bilingual
Language pair | Resource | Description | See also |
---|---|---|---|
Icelandic—Danish | Apertium bidix with ~960 entries | ||
Icelandic—Faroese | Apertium bidix with ~30 entries | ||
Norwegian (Nynorsk)—Norwegian (Bokmål) | Apertium bidix with ~36,000 entries |
Funding possibilities
Samples
Language | Text |
---|---|
Danish | Alle mennesker er født frie og lige i værdighed og rettigheder. De er udstyret med fornuft og samvittighed, og de bør handle mod hverandre i en broderskabets ånd. |
Norwegian (Bokmål) | Alle mennesker er født frie og med samme menneskeverd og menneskerettigheter. De er utstyrt med fornuft og samvittighet og bør handle mot hverandre i brorskapets ånd. |
Norwegian (Nynorsk) | Alle menneske er fødde til fridom og med same menneskeverd og menneskerettar. Dei har fått fornuft og samvit og skal leve med kvarandre som brør. |
Swedish | Alla människor är födda fria och lika i värde och rättigheter. De har utrustats med förnuft och samvete och bör handla gentemot varandra i en anda av gemenskap. |
Faroese | Øll menniskju eru fødd fræls og jøvn til virðingar og mannarættindi. Tey hava skil og samvitsku og eiga at fara hvørt um annað í bróðuranda. |
Icelandic | Hver maður er borinn frjáls og jafn öðrum að virðingu og réttindum. Menn eru gæddir vitsmunum og samvizku, og ber þeim að breyta bróðurlega hverjum við annan. |