Feature engineering и кластерный анализ клиентов на PySpark Привет, Хабр!Сегодня с вами Смолюк А…
Feature engineering и кластерный анализ клиентов на PySpark Привет, Хабр!Сегодня с вами Смолюк Анастасия и Путилова Елена, участницы профессионального сообщества NTA.BigData плотно входит в нашу жизнь, датасеты растут и постоянно изменяются, что усложняет задачу кластеризации клиентов. Обычно для задач кластеризации используется библиотека Sklearn, но с большим объёмом данных её использовать не получиться. Spark позволяет... https://clck.ru/35xBAC
Автор: Habr все новости об IT