Difference between revisions of "Apertium Nieuw talenpaar HOWTO"

From Apertium
Jump to navigation Jump to search
Line 9: Line 9:
 
=== Programma's ===
 
=== Programma's ===
 
Om apertium te laten werken heb je de volgende programma's nodig:
 
Om apertium te laten werken heb je de volgende programma's nodig:
*[lttoolbox](>= 3.0.0)<br />
+
*[[lttoolbox]](>= 3.0.0)<br />
 
*libxml utils (xmllint etc.)<br />
 
*libxml utils (xmllint etc.)<br />
 
*apertium (>= 3.0.0) <br />
 
*apertium (>= 3.0.0) <br />

Revision as of 17:12, 30 November 2011

Apertium Nieuw talenpaar HOWTO
Dit HOWTO document zal beschrijven hoe je vanaf het begin een nieuw talenpaar moet starten voor het Apertium computervertalingssysteem.
Het is niet nodig om iets van de taal of van het vertalingssysteem te kennen, maar het is wel belangrijk dat je het onderscheid tussen een naamwoord,adjectief... kan maken.

Inleiding

Apertium is, zoals je waarschijnlijk al had begrepen, een automatisch computervertalingssysteem. Dit klopt niet helemaal, het is een computervertalingsplatform. Apertium voorziet een "motor" en een "TOOLBOX" zodat je zelf je eigen computervertalingssystemen kan maken. Het enige wat je zelf moet doen, is de data schrijven. De data bestaat uit 3 belangrijke delen, de woordenboeken, en enkele regels (woordvolgorde en andere grammatica).
Als je meer info wilt over het Apertiumproject kan je hier eens kijken: http://wiki.apertium.org/wiki/Publications

Programma's

Om apertium te laten werken heb je de volgende programma's nodig:

  • lttoolbox(>= 3.0.0)
  • libxml utils (xmllint etc.)
  • apertium (>= 3.0.0)
  • Tekstverwerker (of een XML-verwerker)

Waaruit bestaat een talenpaar?

Apertium is een oppervlakkig computervertalingssysteem. Dit is omdat het enkel via woordenboeken en enkele oppervlakkige regels kan vertalen. Het verschil met grondige vertalingen is dat Apertium niet aan syntactische zinsontleding kan doen. De regels die Apertium gebruikt zijn gebaseerd op typische overeenkomsten in lexicale groepen, eerder dan "de bewerkingen op de parsetree". Op het basisniveau zijn er 3 belangrijke woordenboeken: