Великий и могучий: как мы учим нашу систему находить нецензурную лексику в ФИО Привет, Хабр! Меня зовут Макс …
Великий и могучий: как мы учим нашу систему находить нецензурную лексику в ФИО Привет, Хабр! Меня зовут Макс Траулько, я занимаюсь анализом данных и проработкой новый фичей в команде RnD в HFLabs. Прямо сейчас я работаю над нетривиальной задачей — учу наши алгоритмы распознавать в именах и фамилиях русский мат и прочие ругательства.Как появилась эта задача? В одной крупной компании клиенты могут оставить обращения во фронт-системе. И иногда пишут в полях ФИО, прямо скажем, ч... https://clck.ru/3KLXzw
Автор: Habr все новости об IT