Corpus of 21st Century Scots Texts - Levenshtein

A Corpus of 21st Century Scots Texts

Intro a b c d e f g h i j k l m n o p q r s t u v w x y z Texts Writers Statistics Top200 Search Compare

Levenshtein Distance

- basic concord - pre-sorted concord - post-sorted concord - map and chronology - chronogrid - fine-grain concord -

Similar words to proven in Corpus

Levenshtein	Double Levenshtein	SoundEx	MetaPhone	Manually curated
proven (0) - 12 freq proved (1) - 30 freq provin (1) - 3 freq prove (1) - 64 freq provan (1) - 2 freq proves (1) - 14 freq prooven (1) - 1 freq frozen (2) - 69 freq praver (2) - 1 freq coven (2) - 4 freq droves (2) - 10 freq oven (2) - 51 freq pruved (2) - 1 freq provence (2) - 1 freq proces (2) - 1 freq protein (2) - 8 freq rovin (2) - 6 freq protek (2) - 3 freq rouen (2) - 2 freq powen (2) - 8 freq dreven (2) - 1 freq proving (2) - 3 freq grovel (2) - 3 freq provie (2) - 2 freq groves (2) - 2 freq	proven (0) - 12 freq provan (1) - 2 freq provin (1) - 3 freq prooven (1) - 1 freq prevene (2) - 1 freq pruiven (2) - 4 freq prove (2) - 64 freq proves (2) - 14 freq proved (2) - 30 freq pervin (3) - 1 freq riven (3) - 15 freq rovan (3) - 1 freq prevent (3) - 14 freq provit (3) - 1 freq preen (3) - 44 freq probin (3) - 3 freq privet (3) - 9 freq preten (3) - 2 freq drovin (3) - 3 freq pruves (3) - 1 freq pruve (3) - 8 freq pooren (3) - 2 freq paven (3) - 1 freq graven (3) - 1 freq progeny (3) - 3 freq	SoundEx code - P615 profundity - 2 freq perfume - 32 freq provan - 2 freq probin - 3 freq prevented - 2 freq prevention - 1 freq ppropone - 1 freq profoundly - 2 freq perfumin - 3 freq propone - 14 freq parfume - 5 freq profanity - 2 freq prippin - 1 freq provenance - 4 freq province - 13 freq profondo - 2 freq parfumed - 2 freq parfumes - 1 freq paraffin - 28 freq parrifen - 1 freq perfume's - 1 freq prevent - 14 freq provin - 3 freq pervin - 1 freq preppin - 1 freq profound - 6 freq prooven - 1 freq paraffins - 1 freq perfumed - 1 freq pruifin - 3 freq proponed - 31 freq pruivin - 5 freq previntative - 1 freq proven - 12 freq propones - 14 freq purpones - 3 freq preponderence - 2 freq purpone - 2 freq propont - 1 freq provençal - 3 freq proponin - 3 freq profoond - 2 freq poreapene - 1 freq propping - 1 freq perfumit - 3 freq perfumes - 1 freq proponit - 5 freq profoun - 2 freq provianter - 1 freq 'provincial - 1 freq parrafin - 1 freq provinces - 1 freq prevene - 1 freq pruiven - 4 freq preventin - 4 freq parafin - 1 freq proving - 3 freq ��prophaine - 1 freq proponing - 1 freq proppin - 2 freq peruvian - 1 freq purifýin - 1 freq provence - 1 freq powerpoint - 2 freq pre-opened - 1 freq propensity - 2 freq provonance - 1 freq perfunctory - 1 freq preventit - 2 freq prepone - 1 freq perfomed - 1 freq prevents - 1 freq propine - 1 freq powerpynt - 1 freq pravince - 1 freq 'propone' - 1 freq pre-pandemic - 1 freq previewin - 1 freq prepping - 1 freq	MetaPhone code - PRFN provan - 2 freq paraffin - 28 freq parrifen - 1 freq provin - 3 freq pervin - 1 freq prooven - 1 freq pruifin - 3 freq pruivin - 5 freq proven - 12 freq profoun - 2 freq parrafin - 1 freq prevene - 1 freq pruiven - 4 freq parafin - 1 freq ��prophaine - 1 freq peruvian - 1 freq purifýin - 1 freq	PROVEN
Time to execute Levenshtein function - 0.355934 milliseconds The Levenshtein distance is the number of characters you have to replace, insert or delete to transform one word into another, its useful for detecting typos and alternative spellings	Time to execute Double Levenshtein function - 0.798563 milliseconds In a stroke of genius, this runs the Levenshtein function twice, once without vowels and adds the distance together, giving double weight to consonants.	Time to execute SoundEx function - 0.034876 milliseconds Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling.	Time to execute MetaPhone function - 0.095505 milliseconds Metaphone is a phonetic algorithm, published by Lawrence Philips in 1990, for indexing words by their English pronunciation.[1] It fundamentally improves on the Soundex algorithm by using information about variations and inconsistencies in English spelling and pronunciation to produce a more accurate encoding, which does a better job of matching words and names which sound similar.	Time to execute Manually curated function - 0.001756 milliseconds Manual Curation uses a lookup table / lexicon which has been created by hand which links words to their lemmas, and includes obvious typos and spelling variations. Not all words are covered.

Web Analytics