Difference between revisions of "North Germanic languages"
Jump to navigation
Jump to search
(Undo revision 22334 by Francis Tyers (Talk)) |
(Undo revision 22464 by 195.167.240.247 (Talk)) |
||
Line 1: | Line 1: | ||
{{TOCD}} |
|||
h2THbt <a href="http://secocjzxszjq.com/">secocjzxszjq</a>, [url=http://oghtbcfizhox.com/]oghtbcfizhox[/url], [link=http://qpqctgdrnxpy.com/]qpqctgdrnxpy[/link], http://rafwjhpofzcp.com/ |
|||
The '''North Germanic languages''' include Danish (<code>da</code>), Faroese (<code>fo</code>), Icelandic (<code>is</code>), Norwegian (Nynorsk, <code>nn</code> and Bokmål, <code>nb</code>) and Swedish (<code>sv</code>). The languages are related with varying levels of mutual intelligibility. This group would make a nice group for Apertium systems. |
|||
==Status== |
|||
Text in ''italic'' denotes an unreleased pair. |
|||
{| style="text-align: center;" class="wikitable" |
|||
|- style="background: #ececec" |
|||
! !! da !! fo !! is !! nb !! nn !! sv |
|||
|- |
|||
| '''da''' || — || || || || || [[da-sv]] |
|||
|- |
|||
| '''fo''' || || — || ''[[fo-is]]'' || || || |
|||
|- |
|||
| '''is''' || || ''[[fo-is]]'' || — || || || |
|||
|- |
|||
| '''nb''' || || || || — || [[nn-nb]] || |
|||
|- |
|||
| '''nn''' || || || || [[nn-nb]] || — || |
|||
|- |
|||
| '''sv''' || [[da-sv]] || || || || || — |
|||
|- |
|||
|} |
|||
==Existing== |
|||
;Dictionaries |
|||
{{see-also|List of dictionaries}} |
|||
{|class="wikitable sortable" |
|||
! Language !! File !! Paradigms !! Lemmata |
|||
|- |
|||
| Norwegian Nynorsk || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-nn-nb/apertium-nn-nb.nn.dix apertium-nn-nb.nn.dix] || 770 || 83,584 |
|||
|- |
|||
| Norwegian Bokmål || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-nn-nb/apertium-nn-nb.nb.dix apertium-nn-nb.nb.dix] || 705 || 119,567 |
|||
|- |
|||
| Swedish || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-sv-da/apertium-sv-da.sv.dix apertium-sv-da.sv.dix] || 277 || 5,177 |
|||
|- |
|||
| Danish || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-sv-da/apertium-sv-da.da.dix apertium-sv-da.da.dix] || 341 || 10,709 |
|||
|- |
|||
| Faroese || [http://apertium.svn.sourceforge.net/svnroot/apertium/incubator/apertium-fo-is.fo.dix apertium-fo-is.fo.dix] || 113 || 1,864 |
|||
|- |
|||
| Icelandic || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/apertium-is-en/apertium-is-en.is.dix apertium-is-en.is.dix] || 1,881 || 9,134 |
|||
|- |
|||
|} |
|||
==Resources== |
|||
Resources listed below will be useful in building machine translation systems for these languages. |
|||
;Monolingual |
|||
{|class=wikitable |
|||
! Language !! Resource !! Description !! See also |
|||
|- |
|||
| Norwegian || [http://www.edd.uio.no/prosjekt/ordbanken/ Norsk ordbank] || Large >100,000 lemma morphological dictionary of both Nynorsk and Bokmål, GPL. || [[Norsk ordbank]], [[Norwegian]] |
|||
|- |
|||
| Norwegian || [http://maximos.aksis.uib.no/Aksis-wiki/Oslo-Bergen_Tagger Oslo-Bergen tagger] || Constraint grammar tagger for Norwegian, GPL. (converted for CG-3) || [[Norwegian]] |
|||
|- |
|||
| Swedish || [http://w3.msi.vxu.se/~nivre/research/Talbanken05.html Talbanken] || A 300,000-word tree-bank: it is in XML, all words are nicely tagged with PAROLE-style tags. || |
|||
|- |
|||
| Swedish || [http://spraakbanken.gu.se/sal/eng/ SALDO] || Swedish inflectional lexicon, LGPL || |
|||
|- |
|||
| Danish || [http://www.isv.cbs.dk/~mbk/treebank/ Danish Dependency Treebank] || Danish tree bank, 100,000-word, XML, PAROLE tagged, under the GPL. || |
|||
|- |
|||
| Danish || [http://wordnet.dk/dannet/menu?item=0&lang=1 DanNet] || Danish WordNet (~32,000 words), MIT licensed. |
|||
|- |
|||
| Icelandic || || || [[Icelandic and English]] |
|||
|- |
|||
| Faroese || [http://apertium.svn.sourceforge.net/svnroot/apertium/trunk/incubator/apertium-fo-is.fo.rlx apertium-fo-is.fo.rlx] || A [[constraint grammar]] for morphological disambiguation with ~120 rules || |
|||
|- |
|||
|} |
|||
;Bilingual |
|||
{|class=wikitable |
|||
! Language pair !! Resource !! Description !! See also |
|||
|- |
|||
|Icelandic—Danish || Apertium bidix with ~960 entries || || |
|||
|- |
|||
|Icelandic—Faroese || Apertium bidix with ~30 entries || || |
|||
|- |
|||
|Norwegian (Nynorsk)—Norwegian (Bokmål) || Apertium bidix with ~36,000 entries || || [[Norwegian]] |
|||
|- |
|||
|Swedish—Danish || Apertium bidix with ~2,000 entries || || [[Swedish and Danish]] |
|||
|} |
|||
==Funding possibilities== |
|||
* [http://www.norden.org/start/start.asp Nordic Council] |
|||
==Samples== |
|||
{|class=wikitable |
|||
! Language !! Text |
|||
|- |
|||
| Danish || Alle mennesker er født frie og lige i værdighed og rettigheder. De er udstyret med fornuft og samvittighed, og de bør handle mod hverandre i en broderskabets ånd. |
|||
|- |
|||
| Norwegian (Bokmål) || Alle mennesker er født frie og med samme menneskeverd og menneskerettigheter. De er utstyrt med fornuft og samvittighet og bør handle mot hverandre i brorskapets ånd. |
|||
|- |
|||
| Norwegian (Nynorsk) || Alle menneske er fødde til fridom og med same menneskeverd og menneskerettar. Dei har fått fornuft og samvit og skal leve med kvarandre som brør. |
|||
|- |
|||
| Swedish || Alla människor är födda fria och lika i värde och rättigheter. De har utrustats med förnuft och samvete och bör handla gentemot varandra i en anda av gemenskap. |
|||
|- |
|||
| Faroese || Øll menniskju eru fødd fræls og jøvn til virðingar og mannarættindi. Tey hava skil og samvitsku og eiga at fara hvørt um annað í bróðuranda. |
|||
|- |
|||
| Icelandic || Hver maður er borinn frjáls og jafn öðrum að virðingu og réttindum. Menn eru gæddir vitsmunum og samvizku, og ber þeim að breyta bróðurlega hverjum við annan. |
|||
|- |
|||
|} |
|||
[[Category:Languages]] |
|||
[[Category:North Germanic languages]] |
Revision as of 12:45, 17 November 2010
The North Germanic languages include Danish (da
), Faroese (fo
), Icelandic (is
), Norwegian (Nynorsk, nn
and Bokmål, nb
) and Swedish (sv
). The languages are related with varying levels of mutual intelligibility. This group would make a nice group for Apertium systems.
Status
Text in italic denotes an unreleased pair.
da | fo | is | nb | nn | sv | |
---|---|---|---|---|---|---|
da | — | da-sv | ||||
fo | — | fo-is | ||||
is | fo-is | — | ||||
nb | — | nn-nb | ||||
nn | nn-nb | — | ||||
sv | da-sv | — |
Existing
- Dictionaries
- See also: List of dictionaries
Language | File | Paradigms | Lemmata |
---|---|---|---|
Norwegian Nynorsk | apertium-nn-nb.nn.dix | 770 | 83,584 |
Norwegian Bokmål | apertium-nn-nb.nb.dix | 705 | 119,567 |
Swedish | apertium-sv-da.sv.dix | 277 | 5,177 |
Danish | apertium-sv-da.da.dix | 341 | 10,709 |
Faroese | apertium-fo-is.fo.dix | 113 | 1,864 |
Icelandic | apertium-is-en.is.dix | 1,881 | 9,134 |
Resources
Resources listed below will be useful in building machine translation systems for these languages.
- Monolingual
Language | Resource | Description | See also |
---|---|---|---|
Norwegian | Norsk ordbank | Large >100,000 lemma morphological dictionary of both Nynorsk and Bokmål, GPL. | Norsk ordbank, Norwegian |
Norwegian | Oslo-Bergen tagger | Constraint grammar tagger for Norwegian, GPL. (converted for CG-3) | Norwegian |
Swedish | Talbanken | A 300,000-word tree-bank: it is in XML, all words are nicely tagged with PAROLE-style tags. | |
Swedish | SALDO | Swedish inflectional lexicon, LGPL | |
Danish | Danish Dependency Treebank | Danish tree bank, 100,000-word, XML, PAROLE tagged, under the GPL. | |
Danish | DanNet | Danish WordNet (~32,000 words), MIT licensed. | |
Icelandic | Icelandic and English | ||
Faroese | apertium-fo-is.fo.rlx | A constraint grammar for morphological disambiguation with ~120 rules |
- Bilingual
Language pair | Resource | Description | See also |
---|---|---|---|
Icelandic—Danish | Apertium bidix with ~960 entries | ||
Icelandic—Faroese | Apertium bidix with ~30 entries | ||
Norwegian (Nynorsk)—Norwegian (Bokmål) | Apertium bidix with ~36,000 entries | Norwegian | |
Swedish—Danish | Apertium bidix with ~2,000 entries | Swedish and Danish |
Funding possibilities
Samples
Language | Text |
---|---|
Danish | Alle mennesker er født frie og lige i værdighed og rettigheder. De er udstyret med fornuft og samvittighed, og de bør handle mod hverandre i en broderskabets ånd. |
Norwegian (Bokmål) | Alle mennesker er født frie og med samme menneskeverd og menneskerettigheter. De er utstyrt med fornuft og samvittighet og bør handle mot hverandre i brorskapets ånd. |
Norwegian (Nynorsk) | Alle menneske er fødde til fridom og med same menneskeverd og menneskerettar. Dei har fått fornuft og samvit og skal leve med kvarandre som brør. |
Swedish | Alla människor är födda fria och lika i värde och rättigheter. De har utrustats med förnuft och samvete och bör handla gentemot varandra i en anda av gemenskap. |
Faroese | Øll menniskju eru fødd fræls og jøvn til virðingar og mannarættindi. Tey hava skil og samvitsku og eiga at fara hvørt um annað í bróðuranda. |
Icelandic | Hver maður er borinn frjáls og jafn öðrum að virðingu og réttindum. Menn eru gæddir vitsmunum og samvizku, og ber þeim að breyta bróðurlega hverjum við annan. |