Difference between revisions of "One-liners"

Revision as of 15:34, 13 June 2010

Perl regular-expression for removing all tags after the initial: perl -pe 's/(\^[^<]+<[^>]+>)(<\w+>)*\$/\1\$/g;'

^Lemma<V><Pres><Sg>$ -> ^Lemma<V>$

Get unknown words from chunked text and sort by frequency: sed 's/\$\W*\^/$\n^/g' | grep '@' | sed 's/><.*/>$/g' | sort -f | uniq -ci | sort -gr

Revision as of 15:34, 13 June 2010 (edit) Pyry (talk \| contribs) ← Older edit		Revision as of 15:34, 13 June 2010 (edit) (undo) Pyry (talk \| contribs) Newer edit →
Line 8:		Line 8:

	* Get unknown words from chunked text and sort by frequency: sed 's/\$\W\^/$\n^/g' \| grep '@' \| sed 's/><./>$/g' \| sort -f \| uniq -ci \| sort -gr		* Get unknown words from chunked text and sort by frequency: sed 's/\$\W\^/$\n^/g' \| grep '@' \| sed 's/><./>$/g' \| sort -f \| uniq -ci \| sort -gr

			* Strip newlines: sed ':a;N;$!ba;s/\n//g'