Corpus of 21st Century Scots Texts - Levenshtein

A Corpus of 21st Century Scots Texts

Intro a b c d e f g h i j k l m n o p q r s t u v w x y z Texts Writers Statistics Top200 Search Compare

Levenshtein Distance

- basic concord - pre-sorted concord - post-sorted concord - map and chronology - chronogrid - fine-grain concord -

Similar words to golden in Corpus

Levenshtein	Double Levenshtein	SoundEx	MetaPhone	Manually curated
golden (0) - 87 freq 'golden (1) - 1 freq gosden (1) - 1 freq goldin (1) - 1 freq gowlden (1) - 1 freq gowden (1) - 233 freq olden (1) - 1 freq goolden (1) - 10 freq holden (1) - 2 freq golder (1) - 1 freq goulden (1) - 2 freq gulder (2) - 24 freq golfin (2) - 2 freq goldoni (2) - 8 freq golders (2) - 3 freq foldin (2) - 8 freq glen (2) - 162 freq gilded (2) - 3 freq godes (2) - 2 freq goldie (2) - 3 freq aulden (2) - 15 freq dolder (2) - 1 freq sodden (2) - 11 freq gowdens (2) - 1 freq holder (2) - 2 freq	golden (0) - 87 freq goolden (1) - 10 freq goldin (1) - 1 freq goulden (1) - 2 freq 'golden (2) - 1 freq gowlden (2) - 1 freq goldoni (2) - 8 freq geldin (2) - 1 freq guilden (2) - 1 freq golder (2) - 1 freq gowden (2) - 233 freq olden (2) - 1 freq gosden (2) - 1 freq holden (2) - 2 freq glydan (3) - 1 freq glidin (3) - 7 freq goldson (3) - 1 freq garden (3) - 67 freq gerden (3) - 4 freq boldin (3) - 1 freq gold (3) - 107 freq galeen (3) - 1 freq gordin (3) - 2 freq goldies (3) - 1 freq gordon (3) - 123 freq	SoundEx code - G435 golden - 87 freq giltin - 2 freq gladness - 1 freq glidin - 7 freq gledness - 5 freq goulden - 2 freq gloatin - 5 freq goolden - 10 freq guilden - 1 freq gleddened - 2 freq gliding - 1 freq guillotined - 1 freq gelatine - 2 freq glutton - 5 freq guilt-tinged - 1 freq glidan - 1 freq glydan - 1 freq gowlden - 1 freq glettan - 1 freq gleetin - 2 freq glaidden - 1 freq goldeneye - 2 freq goldoni - 8 freq gluttony - 3 freq gaeldom - 1 freq golding's - 1 freq gledden - 1 freq gleddens - 1 freq gluten - 1 freq ��gillyteen - 1 freq gleddent - 1 freq gluttons - 1 freq guillotine - 3 freq geldin - 1 freq goldness - 1 freq 'golden - 1 freq goldin - 1 freq	MetaPhone code - KLTN couldna - 414 freq golden - 87 freq couldnae - 609 freq couldnue - 1 freq cleidin - 3 freq collidin - 1 freq clootin - 2 freq clautin - 1 freq caledonia' - 1 freq glidin - 7 freq culloden - 13 freq goulden - 2 freq culdna - 34 freq gloatin - 5 freq could'na - 1 freq goolden - 10 freq cloodin - 3 freq clattin - 1 freq guilden - 1 freq couldny - 13 freq cloddin - 8 freq calton - 10 freq could'no - 1 freq couldno - 5 freq glutton - 5 freq caledonia - 16 freq glidan - 1 freq claddeen - 1 freq glydan - 1 freq gowlden - 1 freq glettan - 1 freq gleetin - 2 freq glaidden - 1 freq cooldna - 1 freq claddin - 1 freq goldoni - 8 freq gluttony - 3 freq culdnae - 2 freq gledden - 1 freq calidon - 1 freq gluten - 1 freq coouldn - 1 freq cuildna - 1 freq couldn - 3 freq ��couldni - 1 freq couldni - 7 freq couldni' - 1 freq ��culloden - 1 freq cleedin - 1 freq ��caledonia - 1 freq ��couldn - 1 freq cloutin - 1 freq cuildnae - 1 freq guillotine - 3 freq quiltin - 1 freq couldnay - 1 freq quiltin - 1 freq 'golden - 1 freq goldin - 1 freq	GOLDEN
Time to execute Levenshtein function - 0.245539 milliseconds The Levenshtein distance is the number of characters you have to replace, insert or delete to transform one word into another, its useful for detecting typos and alternative spellings	Time to execute Double Levenshtein function - 0.387161 milliseconds In a stroke of genius, this runs the Levenshtein function twice, once without vowels and adds the distance together, giving double weight to consonants.	Time to execute SoundEx function - 0.026963 milliseconds Soundex is a phonetic algorithm for indexing names by sound, as pronounced in English. The goal is for homophones to be encoded to the same representation so that they can be matched despite minor differences in spelling.	Time to execute MetaPhone function - 0.036912 milliseconds Metaphone is a phonetic algorithm, published by Lawrence Philips in 1990, for indexing words by their English pronunciation.[1] It fundamentally improves on the Soundex algorithm by using information about variations and inconsistencies in English spelling and pronunciation to produce a more accurate encoding, which does a better job of matching words and names which sound similar.	Time to execute Manually curated function - 0.000854 milliseconds Manual Curation uses a lookup table / lexicon which has been created by hand which links words to their lemmas, and includes obvious typos and spelling variations. Not all words are covered.

Web Analytics