Difference between revisions of "User:Jimregan/Misc"
Jump to navigation
Jump to search
(Start of a monodix for Russian) |
m (Oops. I have a more recent version than that) |
||
Line 116: | Line 116: | ||
<p> |
<p> |
||
<l>а</l> |
<l>а</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="nom"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 122: | Line 122: | ||
<p> |
<p> |
||
<l>у</l> |
<l>у</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="acc"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 128: | Line 128: | ||
<p> |
<p> |
||
<l>ы</l> |
<l>ы</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="gen"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 134: | Line 134: | ||
<p> |
<p> |
||
<l>е</l> |
<l>е</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="dat"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 140: | Line 140: | ||
<p> |
<p> |
||
<l>е</l> |
<l>е</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="prep"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 146: | Line 146: | ||
<p> |
<p> |
||
<l>ой</l> |
<l>ой</l> |
||
<r>а<s n="n"/><s n=" |
<r>а<s n="n"/><s n="f"/><s n="sg"/><s n="inst"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 154: | Line 154: | ||
<p> |
<p> |
||
<l>ь</l> |
<l>ь</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="nom"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 160: | Line 160: | ||
<p> |
<p> |
||
<l>ь</l> |
<l>ь</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="acc"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 166: | Line 166: | ||
<p> |
<p> |
||
<l>ери</l> |
<l>ери</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="gen"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 172: | Line 172: | ||
<p> |
<p> |
||
<l>ери</l> |
<l>ери</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="dat"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 178: | Line 178: | ||
<p> |
<p> |
||
<l>ери</l> |
<l>ери</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="prep"/></r> |
||
</p> |
</p> |
||
</e> |
</e> |
||
Line 184: | Line 184: | ||
<p> |
<p> |
||
<l>ерью</l> |
<l>ерью</l> |
||
<r>ь<s n="n"/><s n=" |
<r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="inst"/></r> |
||
</p> |
|||
</e> |
|||
</pardef> |
|||
<pardef n="бо/г__n"> |
|||
<e> |
|||
<p> |
|||
<l>г</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="nom"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>га</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="gen"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гу</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="dat"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>га</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="acc"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гом</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="inst"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>ге</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="loc"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>же</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="voc"/><s n="sg"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>ги</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="nom"/><s n="pl"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гов</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="gen"/><s n="pl"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гом</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="dat"/><s n="pl"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гов</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="acc"/><s n="pl"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гами</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="inst"/><s n="pl"/></r> |
|||
</p> |
|||
</e> |
|||
<e> |
|||
<p> |
|||
<l>гах</l> |
|||
<r>г<s n="n"/><s n="m1"/><s n="loc"/><s n="pl"/></r> |
|||
</p> |
</p> |
||
</e> |
</e> |
Revision as of 16:10, 11 October 2007
stem-splitter.pl
#!/usr/bin/perl use warnings; use strict; use String::Diff qw/diff_fully/; while(<>) { s/,\W+$//; my $endings = $_; my @a = split/, /; my $stem = find_stem(@a); $endings =~ s/$stem//g; print $stem; if ($endings =~ /owie/) {print ":n.m1:";} else {print ":n.??:";} print join(',', sort split/, /, $endings), "\n"; } sub find_stem() { my @in = @_; my ($r, $l, $cur, $last); my $i=0; while ($i<($#in)) { ($r, $l) = diff_fully($in[$i], $in[$i+1]); $cur = $r->[0]->[1]; $last = $cur if (!$last); if ($cur ne $last) { ($r, $l) = diff_fully($last, $cur); $last = $r->[0]->[1]; } $i++; } return $last; }
This is a list of patterns that should be generated by the Polish monodix.
hotel, hoteli, hotelowi, hotelem, hotelu, hotelach, hotelami, hotelom, hotelów, hotele, pies, psa, psie, psem, psu, psy, psach, psami, psom, psów, stół, stole, stołowi, stołem, stołu, stoły, stołach, stołami, stołom, stołów, gołąb, gołębie, gołębiach, gołębi, gołębiami, gołębiom, gołębia, gołębiem, gołębiowi, gołębiu, kot, kota, kocie, kotowi, kotem, kotach, kotami, kotom, kotów, koty, dzień, dnia, dniowi, dniem, dniu, dniach, dniami, dni, dniom, dnie, tydzień, tygodni, tygodnia, tygodniach, tygodniami, tygodnie, tygodniem, tygodniom, tygodniowi, tygodniu, miesiąc, miesiąca, miesiącowi, miesiącem, miesiącu, miesiącach, miesiącami, miesiącom, miesięcy, miesiące, student, studenta, studencie, studentowi, studentem, studenci, studentach, studentami, studentom, studenty, studentów, brat, braci, braty, bracia, braciach, bracie, braciom, braćmi, brata, bratem, bratu, przyjaciel, przyjaciela, przyjacielowi, przyjacielem, przyjacielu, przyjaciele, przyjaciołach, przyjaciołom, przyjaciół, przyjaciółmi, syn, synach, synami, synom, synów, synowie, syny, syna, synem, synowi, synu, lekarz, lekarza, lekarzowi, lekarzem, lekarzu, lekarze, lekarzy, lekarzach, lekarzami, lekarzom, mąż, męża, mężowi, mężem, mężu, mężach, mężami, mężom, mężów, mężowie, męże, ojciec, ojca, ojcem, ojcu, ojcach, ojcami, ojcom, ojców, ojcowie, ojce, ojcze, kobieta, kobiecie, kobieto, kobiety, kobietą, kobietę, kobietach, kobietami, kobietom, kobiet, ulica, ulice, ulico, ulicy, ulicą, ulicę, ulicach, ulicami, ulicom, ulic, noga, nodze, nogi, nogo, nogą, nogę, nogach, nogami, nogom, nóg, ręka, ręku, rękoma, rąk, ręce, ręki, ręko, ręką, rękę, rękach, rękami, rękom, rzeka, rzece, rzeki, rzeko, rzeką, rzekę, rzek, rzekach, rzekami, rzekom, noc, noce, nocy, nocą, nocach, nocami, nocom, gospodyni, gospodynie, gospodynią, gospodynię, gospodyń, gospodyniach, gospodyniami, gospodyniom, gwiazda, gwieździe, gwiazdo, gwiazdy, gwiazdą, gwiazdę, gwiazdach, gwiazdami, gwiazdom, gwiazd, teściowa, teściowe, teściowych, teściowymi, teściowej, teściowym, teściową, teściowo, miasto, miasta, mieście, miastem, miastu, miastach, miastami, miastom, miast, zdanie, zdania, zdaniem, zdaniu, zdaniach, zdaniami, zdaniom, zdań, oko, oka, okiem, oku, oczach, oczami, oczom, oczów, oczu, oczy, oczyma, ócz, ucho, ucha, uchem, uchu, uszach, uszami, uszom, uszów, uszu, uszy, uszyma, dziecko, dziecka, dzieckiem, dziecku, dziecku, dzieci, dzieciach, dzieciom, dziećmi, zwierzę, zwierzęcia, zwierzęciem, zwierzęciu, zwierzęta, zwierzętach, zwierzętami, zwierzętom, zwierząt, imię, imienia, imieniem, imieniu, imiona, imionach, imionami, imionom, imion, jabłko, jabłka, jabłkiem, jabłku, jabłku, jabłkach, jabłkami, jabłek, jabłkom, okno, okna, oknie, oknem, oknu, oknach, oknami, oknom, okien, dach, dachowi, dachem, dachu, dachy, dachach, dachami, dachom, dachów, królowa, królowe, królowych, królowymi, królowej, królowym, królową, królowo, źródło, źródła, źródle, źródłem, źródłu, źródłach, źródłami, źródłom, źródeł, sklep, sklepie, sklepowi, sklepem, sklepu, sklepy, sklepach, sklepami, sklepom, sklepów, muzeum, muzea, muzeach, muzeami, muzeom, muzeów, światło, światła, świetle, światłem, światłu, światłach, światłami, światłom, świateł, matka, matek, matce, matki, matko, matką, matkę, matkach, matkami, matkom, kość, kości, kością, kościach, kościom, kośćmi, kościami, miłość, miłości, miłością, miłościach, miłościami, miłościom, mama, mamie, mamo, mamy, mamą, mamę, mamach, mamami, mamom, mam, broń, bronie, broni, bronią, broniach, broniami, broniom, profanacja, profanacje, profanacyj, profanacji, profanacjo, profanacją, profanację, profanacjach, profanacjami, profanacjom, Francja, Francji, Francjo, Francją, Francję, Werona, Weronie, Werono, Werony, Weroną, Weronę, Czechy, Czechach, Czechami, Czechom, Czech, Urugwaj, Urugwajowi, Urugwajem, Urugwaju, Włochy, Włoch, Włochami, Włochom, Włoszech, Węgry, Węgier, Węgrach, Węgrami, Węgrzech, Niemcy, Niemczech, Niemcami, Niemcom, Niemiec, Watykan, Watykanie, Watykanowi, Watykanem, Watykanu, Wiedeń, Wiednia, Wiedniem, Wiedniu, Wiedniowi, Wersal, Wersalowi, Wersalem, Wersalu,
Start of a monodix for Russian:
<?xml version="1.0" encoding="UTF-8"?> <dictionary> <alphabet>АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдеёжзийклмнопрстуфхцчшщъыьэюя</alphabet> <!-- include sdefs from elsewhere --> <pardefs> <pardef n="собак/а__n"> <e> <p> <l>а</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="nom"/></r> </p> </e> <e> <p> <l>у</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="acc"/></r> </p> </e> <e> <p> <l>ы</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="gen"/></r> </p> </e> <e> <p> <l>е</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="dat"/></r> </p> </e> <e> <p> <l>е</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="prep"/></r> </p> </e> <e> <p> <l>ой</l> <r>а<s n="n"/><s n="f"/><s n="sg"/><s n="inst"/></r> </p> </e> </pardef> <pardef n="мат/ь__n"> <e> <p> <l>ь</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="nom"/></r> </p> </e> <e> <p> <l>ь</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="acc"/></r> </p> </e> <e> <p> <l>ери</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="gen"/></r> </p> </e> <e> <p> <l>ери</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="dat"/></r> </p> </e> <e> <p> <l>ери</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="prep"/></r> </p> </e> <e> <p> <l>ерью</l> <r>ь<s n="n"/><s n="f"/><s n="sg"/><s n="inst"/></r> </p> </e> </pardef> <pardef n="бо/г__n"> <e> <p> <l>г</l> <r>г<s n="n"/><s n="m1"/><s n="nom"/><s n="sg"/></r> </p> </e> <e> <p> <l>га</l> <r>г<s n="n"/><s n="m1"/><s n="gen"/><s n="sg"/></r> </p> </e> <e> <p> <l>гу</l> <r>г<s n="n"/><s n="m1"/><s n="dat"/><s n="sg"/></r> </p> </e> <e> <p> <l>га</l> <r>г<s n="n"/><s n="m1"/><s n="acc"/><s n="sg"/></r> </p> </e> <e> <p> <l>гом</l> <r>г<s n="n"/><s n="m1"/><s n="inst"/><s n="sg"/></r> </p> </e> <e> <p> <l>ге</l> <r>г<s n="n"/><s n="m1"/><s n="loc"/><s n="sg"/></r> </p> </e> <e> <p> <l>же</l> <r>г<s n="n"/><s n="m1"/><s n="voc"/><s n="sg"/></r> </p> </e> <e> <p> <l>ги</l> <r>г<s n="n"/><s n="m1"/><s n="nom"/><s n="pl"/></r> </p> </e> <e> <p> <l>гов</l> <r>г<s n="n"/><s n="m1"/><s n="gen"/><s n="pl"/></r> </p> </e> <e> <p> <l>гом</l> <r>г<s n="n"/><s n="m1"/><s n="dat"/><s n="pl"/></r> </p> </e> <e> <p> <l>гов</l> <r>г<s n="n"/><s n="m1"/><s n="acc"/><s n="pl"/></r> </p> </e> <e> <p> <l>гами</l> <r>г<s n="n"/><s n="m1"/><s n="inst"/><s n="pl"/></r> </p> </e> <e> <p> <l>гах</l> <r>г<s n="n"/><s n="m1"/><s n="loc"/><s n="pl"/></r> </p> </e> </pardef> </pardefs> <section id="main" type="standard"> <e lm="собака"><i>собак</i><par n="собак/а__n"/></e> <e lm="мать"><i>мат</i><par n="мат/ь__n"/></e> <e lm="бог"><i>бо</i><par n="бо/г__n"/></e> </section> </dictionary>