Difference between revisions of "Omorfi"

From Apertium
Jump to navigation Jump to search
Line 37: Line 37:


<pre>
<pre>
$ echo "kaikki ihmiset syntyvät vapaina ja tasavertaisina arvoltaan ja oikeuksiltaan." | fst-proc omorfi/src/omorfi.sfstc


$ echo "kaikki ihmiset syntyvät vapaina ja tasavertaisina arvoltaan ja oikeuksiltaan ." | sed 's/ /\n/g' | hfst-lookup src/mor-omorfi.hwfst
^kaikki/kaikki<noun><7><a><sg><nom>$ ^ihmiset/ihminen<noun><38><pl><acc>/ihminen<noun><38><pl><nom>$

^syntyvät/syntyä<verb><52><j><act><pcpva><pl><acc>/syntyä<verb><52><j><act><pcpva><pl><nom>/syntyä<verb><52><j><act><indv><pres><pl3>$
kaikki [##]kaikki[POS=PRONOUN][NUM=SG][CASE=NOM][##]
^vapaina/vapaa<noun><17><pl><ess>$ ^ja/*ja$ ^tasavertaisina/*tasavertaisina$ ^arvoltaan/arvo<noun><1><sg><abl><pl3>/arvo<noun><1><sg><abl><sg3>$ ^ja/*ja$

^oikeuksiltaan/oikeus<noun><40><pl><abl><pl3>/oikeus<noun><40><pl><abl><sg3>$.
ihmiset [##]ihminen[POS=NOUN][KTN=38][NUM=PL][CASE=NOM,ACC][##]

syntyvät [##]syntyä[POS=VERB][KTN=52][KAV=J][GEN=ACT][MOOD=INDV][TENSE=PRES][PRS=PL3][##]
syntyvät [##]syntyä[POS=VERB][KTN=52][KAV=J][GEN=ACT][PCP=VA][CMP=POS][NUM=PL][CASE=NOM,ACC][##]

vapaina [##]vapaa[POS=ADJECTIVE][KTN=17][CMP=POS][NUM=PL][CASE=ESS][##]

ja [##]ja[POS=PARTICLE][##]
ja [##]ja[POS=CONJUNCTION][##]

tasavertaisina [##]tasavertainen[POS=ADJECTIVE][KTN=38][CMP=POS][NUM=PL][CASE=ESS][##]
tasavertaisina [##]tasa[POS=NOUN][KTN=9][NUM=SG][CASE=NOM][#][?]vertainen[POS=ADJECTIVE][KTN=38][CMP=POS][NUM=PL][CASE=ESS][##]

arvoltaan [##]arvo[POS=NOUN][KTN=1][NUM=SG][CASE=ABL][POSS=SG3,PL3][##]

ja [##]ja[POS=PARTICLE][##]
ja [##]ja[POS=CONJUNCTION][##]

oikeuksiltaan [##]oikeus[POS=NOUN][KTN=40][NUM=PL][CASE=ABL][POSS=SG3,PL3][##]

. [##].[POS=PUNCTUATION][##]

</pre>
</pre>



Revision as of 17:06, 5 December 2009

OMorFi (Open Morphology of Finnish) is a computational morphology of Finnish written using HFST.

Requirements

You will need HFST installed, you can follow the instructions on the HFST page.

Download

The following commands will download and prepare the build for OMorFi.

$ svn co http://svn.gna.org/svn/omorfi/trunk omorfi
$ cd omorfi/
$ autoreconf -i 
$ ./configure --prefix=/home/fran/local
$ cd src/

Compilation

$ make

This will compile everything. If your machine has less than 2Gb RAM you might want to just compile the analyser:

$ make mor-omorfi.hwfst

This could take 10--30 minutes.

Usage

After compiling, you can test it with the hfst-lookup program.


$ echo "kaikki ihmiset syntyvät vapaina ja tasavertaisina arvoltaan ja oikeuksiltaan ." | sed 's/ /\n/g' | hfst-lookup src/mor-omorfi.hwfst

kaikki	[##]kaikki[POS=PRONOUN][NUM=SG][CASE=NOM][##]

ihmiset	[##]ihminen[POS=NOUN][KTN=38][NUM=PL][CASE=NOM,ACC][##]

syntyvät	[##]syntyä[POS=VERB][KTN=52][KAV=J][GEN=ACT][MOOD=INDV][TENSE=PRES][PRS=PL3][##]
syntyvät	[##]syntyä[POS=VERB][KTN=52][KAV=J][GEN=ACT][PCP=VA][CMP=POS][NUM=PL][CASE=NOM,ACC][##]

vapaina	[##]vapaa[POS=ADJECTIVE][KTN=17][CMP=POS][NUM=PL][CASE=ESS][##]

ja	[##]ja[POS=PARTICLE][##]
ja	[##]ja[POS=CONJUNCTION][##]

tasavertaisina	[##]tasavertainen[POS=ADJECTIVE][KTN=38][CMP=POS][NUM=PL][CASE=ESS][##]
tasavertaisina	[##]tasa[POS=NOUN][KTN=9][NUM=SG][CASE=NOM][#][?]vertainen[POS=ADJECTIVE][KTN=38][CMP=POS][NUM=PL][CASE=ESS][##]

arvoltaan	[##]arvo[POS=NOUN][KTN=1][NUM=SG][CASE=ABL][POSS=SG3,PL3][##]

ja	[##]ja[POS=PARTICLE][##]
ja	[##]ja[POS=CONJUNCTION][##]

oikeuksiltaan	[##]oikeus[POS=NOUN][KTN=40][NUM=PL][CASE=ABL][POSS=SG3,PL3][##]

.	[##].[POS=PUNCTUATION][##]

See also

External links