Corpus of 21st Century Scots Texts - Levenshtein

A Corpus of 21st Century Scots Texts

Intro a b c d e f g h i j k l m n o p q r s t u v w x y z Texts Writers Statistics Top200 Search Compare

Levenshtein Distance

- basic concord - pre-sorted concord - post-sorted concord - map and chronology - chronogrid - fine-grain concord -

Similar words to adn in Corpus

Levenshtein	Double Levenshtein	SoundEx	MetaPhone	Manually curated
adn (0) - 1 freq ady (1) - 2 freq ain (1) - 2864 freq adz (1) - 1 freq hadn (1) - 2 freq gdn (1) - 1 freq amn (1) - 3 freq aen (1) - 10 freq aan (1) - 30 freq ado (1) - 4 freq ad (1) - 126 freq aon (1) - 4 freq ahn (1) - 1 freq ada (1) - 4 freq add (1) - 133 freq ann (1) - 105 freq abdn (1) - 6 freq asn (1) - 1 freq aden (1) - 2 freq ayn (1) - 3 freq adna (1) - 1 freq ade (1) - 3 freq ads (1) - 9 freq pdn (1) - 1 freq adj (1) - 1 freq	adn (0) - 1 freq aden (1) - 2 freq adna (1) - 1 freq dain (2) - 144 freq eden (2) - 36 freq iden (2) - 2 freq odin (2) - 43 freq mdn (2) - 1 freq an (2) - 76376 freq awn (2) - 118 freq udny (2) - 9 freq aidin (2) - 1 freq din (2) - 74 freq adoun (2) - 2 freq don (2) - 256 freq daun (2) - 1 freq dun (2) - 36 freq daen (2) - 223 freq edin (2) - 4 freq adj (2) - 1 freq dan (2) - 472 freq aidan (2) - 5 freq den (2) - 103 freq dna (2) - 16 freq aln (2) - 1 freq	SoundEx code - A350 atween - 1047 freq awthin - 133 freq aathin - 203 freq ae-time - 5 freq addin - 37 freq autumn - 60 freq adoun - 2 freq athin - 226 freq adam - 189 freq aetin - 27 freq ae-them - 1 freq aeten - 7 freq atwein - 45 freq atein - 4 freq a-team - 2 freq aiten - 4 freq 'adam - 2 freq auduma - 2 freq athein - 1 freq awthein - 9 freq adden - 1 freq aitten - 2 freq awthin' - 7 freq 'atween - 1 freq awaitin - 6 freq admm - 1 freq atoun - 1 freq aidin - 1 freq ah-thin - 3 freq aetan - 3 freq atone - 2 freq aitin - 21 freq atwain - 2 freq atom - 5 freq addin' - 1 freq a-daein - 1 freq 'aathin - 1 freq 'awthin - 4 freq aeteen - 1 freq aden - 2 freq atin - 3 freq at'm - 1 freq adom - 1 freq atwen - 1 freq aatin - 1 freq aatheen - 1 freq aw-time - 1 freq adem - 1 freq a'dyn - 1 freq atwien - 2 freq a'diein - 1 freq ahtween - 2 freq addan - 3 freq aten - 2 freq attain - 2 freq aatum - 1 freq aiteen - 1 freq aa-deen - 2 freq 'aa-deen - 1 freq 'aa-deen' - 1 freq athena - 26 freq 'autumn - 1 freq a'thin - 2 freq atomie - 3 freq autmn - 1 freq atten - 2 freq aittin - 1 freq adomnán - 2 freq Éadaoin - 1 freq ��aathin - 1 freq aidam - 1 freq athene - 1 freq aidan - 5 freq ��aathin - 1 freq aidom - 1 freq atheen - 1 freq atween - 1 freq a'tween - 1 freq aathin' - 1 freq atmo - 1 freq adna - 1 freq add-on - 1 freq ahthin' - 1 freq aidanmo - 5 freq atm - 3 freq adn - 1 freq	MetaPhone code - ATN addin - 37 freq adoun - 2 freq atein - 4 freq aiten - 4 freq adden - 1 freq aitten - 2 freq atoun - 1 freq aidin - 1 freq atone - 2 freq aitin - 21 freq addin' - 1 freq a-daein - 1 freq aden - 2 freq atin - 3 freq aatin - 1 freq a'dyn - 1 freq a'diein - 1 freq addan - 3 freq aten - 2 freq attain - 2 freq aiteen - 1 freq aa-deen - 2 freq 'aa-deen - 1 freq 'aa-deen' - 1 freq atten - 2 freq aittin - 1 freq Éadaoin - 1 freq aidan - 5 freq adna - 1 freq add-on - 1 freq adn - 1 freq	ADN
Time to execute Levenshtein function - 0.201306 milliseconds The Levenshtein distance is the number of characters you have to replace, insert or delete to transform one word into another, its useful for detecting typos and alternative spellings	Time to execute Double Levenshtein function - 0.365770 milliseconds In a stroke of genius, this runs the Levenshtein function twice, once without vowels and adds the distance together, giving double weight to consonants.	Time to execute SoundEx function - 0.028129 milliseconds Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling.	Time to execute MetaPhone function - 0.036696 milliseconds Metaphone is a phonetic algorithm, published by Lawrence Philips in 1990, for indexing words by their English pronunciation.[1] It fundamentally improves on the Soundex algorithm by using information about variations and inconsistencies in English spelling and pronunciation to produce a more accurate encoding, which does a better job of matching words and names which sound similar.	Time to execute Manually curated function - 0.000748 milliseconds Manual Curation uses a lookup table / lexicon which has been created by hand which links words to their lemmas, and includes obvious typos and spelling variations. Not all words are covered.

Web Analytics