Алгоритм расчёта расстояния между строками По работе стояла задача оптимизации поиска по адресам (улицы, дома…
Алгоритм расчёта расстояния между строками По работе стояла задача оптимизации поиска по адресам (улицы, дома и объекты). Главный критерий - нахождение адреса, если написано с ошибками или не дописан он в полной мере. Bert’ы, косинусные расстояния эмбеддингов и т.д. не подходили, так как они заточены под смысловой поиск, а в адресах смысла нет. TF-IDF c лемматизацией тоже не очень подходил для этой задачи, результаты были плохие.Для реализ... https://clck.ru/39vUv2
Автор: Habr все новости об IT