Маркетплейсы и большие данные в ритейле
Большие данные – неиссякаемый источник инсайтов, с помощью которых бизнесу удается оставаться конкурентоспособными и развиваться. Подробнее о пользе и проблемах Big Data для российских и зарубежных маркетплейсов рассказывает Константин Попандопуло, технический директор Umbrella IT.
Зачем маркетплейсам большие данные?
Маркетплейсы непрерывно собирают информацию о продажах, продавцах и пользователях. Раньше анализом десятков тысяч запросов могли заниматься сотни сотрудников. Они искали причины событий, ограничиваясь проверкой гипотез, сформулированных до сбора данных.
Теперь, когда человечество накопило зеттабайты информации, бизнес, в том числе в сфере B2B-маркетплейсов, перешел к анализу корреляций, поиску фактов и прогнозу событий благодаря Big Data.
Big Data – массивы разнородной информации, ежедневно поступающие в объеме от 150 Гб.
VK Cloud совместно с Arenadata провели исследование и узнали, что 62% российских компаний вовсю работают с Big Data, 34% из них – дольше 3 лет.
Одна из характеристик Big Data – их невозможно обработать в Excel, к ним сложно писать SQL-запросы. Для работы с ними бизнес зачастую выбирает автомасштабируемые сервисы, например, MCS (Mail.ru) и Yandex Data Proc со специальными инструментами Spark и Hadoop. Анализ больших данных заметно упрощает ИИ – в реальном времени выявляет сложные закономерности, вычленяя из потока нужные сведения.
Компании, внедрившие технологию, подняли выручку на 8%. Не менее 50% с ней преобразовали подход к маркетингу и продажам.
Данные – ключ к эффективному принятию решений. Так, крупнейший российский ритейлер внедрил 150 дашбордов для отслеживания огромного количества метрик – построил инфраструктуру глубокой аналитики сайта. С полученными цифрами для анализа конверсии и пользовательского пути ритейлер в два раза увеличил число регистраций на сайте, средний чек на 41%, а долю повторных покупателей на 60%.
Большие данные помогают решать другие задачи бизнеса. Американская розничная сеть Macy’s (800 магазинов, 73 млн единиц товара) внедрила систему с Big Data, чтобы в 22 раза ускорить пересмотр цен во всем каталоге. Ранее этот процесс занимал не менее 4 часов в день, а результат требовал постоянных корректировок.
Другой ритейлер H&M кратно замедлил падение продаж за счет анализа Big Data искусственным интеллектом: выяснил востребованный ассортимент для 4288 магазинов и точечно наполнил каждый.
Преимущества больших данных для развития маркетплейсов
Big Data меняют подход к маркетингу, продажам, менеджменту в e-commerce.
-
Доработка ИТ-продукта. Аналитики извлекают из массивов информации о трафике и технических ошибках значимые сведения, помогающие улучшить контент, продукты, услуги. Amazon алгоритмами ML (машинного обучения) выявляет в Big Data паттерны поведения пользователей и технические проблемы для дальнейшей доработки интерфейса и функциональности маркетплейса. Все это в итоге положительно отражается на доходе организации.
-
Прогнозирование спроса. Маркетплейсы могут строить цепочки потребления для каждой позиции по «следу» клиента. По ним рассчитывается вероятность покупки. Аналитики выделяют в Big Data временные ряды, затем размечают отрезки бизнес-факторов: листинг, изменение цен, сезонные колебания. А алгоритмы ML находят ассоциации между объектами – зависимости, которые можно использовать для составления прогноза событий. Точность алгоритмов может достигать от 75 до 90% – этого достаточно, чтобы делиться объемом закупок с поставщиками и проводить регулярное планирование операций на малых страховых запасах.
-
Персонализация коммуникации. Amazon генерирует 35% продаж за счет рекомендательной системы. Alibaba – китайский гигант с 65 млн пользователей из 240 стран и регионов – широко использует глубокую аналитику Big Data на базе ML для прогнозирования покупательских тенденций и создания виртуальных витрин. Система берет в расчет поведение других пользователей, предыдущие покупки, сезон. Так площадке удается наращивать потенциал продаж.
-
Оптимизация цен. JD.com применяет аналитику миллионов наборов данных о зарезервированных товарах, активности покупок для установления более точных интервалов цен под различные группы аудитории с учетом их предпочтений.
-
Предотвращение мошенничества. Убытки покупателя могут привести к судебным тяжбам и финансовым издержкам, не говоря уже о репутационном ущербе. Маркетплейсы собирают сведения о каждом заказе, а алгоритмы машинного обучения обнаруживают и блокируют подозрительные транзакции. Big Data применяют и для борьбы с контрафактом. За один год Alibaba удалось выявить 46 точек поддельной продукции на сумму 125 млн долл. США.
-
Улучшение маркетинга. Технология позволяет проводить более качественные исследования, точнее настраивать целевые аудитории и, как следствие, повышать эффективность таргетированной рекламы и email-рассылки. Немецкая B2B-площадка Mercateo использует Big Data для улучшения триггерной коммуникации и развития предиктивного маркетинга. Предугадывает потребности клиентов и подстраивает рекламную активность под эти предсказания.
Подводные камни при внедрении Big Data
Несмотря на все перспективы, в работе с большими данными есть определенные риски.
-
Высокая стоимость. По исследованию IDC, бизнес за рубежом каждый год инвестирует в среднем 19 млн долл. США в Big Data и аналитику. Стоимость одного дата-проекта может достигать 7,5 млн долл. США. В целом она зависит от объема данных, методов сбора и хранения, инфраструктуры для обработки. Для реализации потребуются серверы или даже дата-центры. Компании все чаще предпочитают покупке физического оборудования облачные сервисы – это не всегда дешевле, но удобнее: хранилище можно расширять по мере необходимости в любой момент.
-
Нехватка квалифицированных специалистов. 67% компаний нанимают интеграторов и вендоров для разработки дата-решений. Лишь у 10% есть собственный штат таких специалистов. Реализации подобных проектов мешает дефицит кадров. Но правительство работает над его устранением. Ежегодно в вузах растет число бюджетных мест на ИТ-специальности, открываются «цифровые кафедры» по программе «Приоритет-2030», студенты которых могут получить дополнительную квалификацию в ИТ. К 2024-му ожидается рост количества выпускников до 400 тысяч.
Big Data – «черный ящик». ИИ анализирует данные и выдает результат, который не перепроверить. Неверная интерпретация информации может вылиться в ошибочные выводы, способные навредить бизнесу. Именно поэтому критично важна квалификация специалистов, работающих с данными.
- Трудности с обеспечением безопасности. Пользователей становится все больше, как и информации, которую они генерируют. Тем сложнее обеспечить ее защиту. По подсчетам Kaspersky Digital FootprintIntelligence, за первые 5 месяцев 2023-го в сеть попало на 33% больше публикаций баз данных, чем в 2022-м. К ритейлерам злоумышленники проявляют усиленный интерес. Для предотвращения несанкционированного доступа и утечек требуются более мощные, продвинутые механизмы хранения и надежные протоколы защиты – Secure Sockets Layer (SSL) или Transport Layer Security (TLS).
Стандарты безопасности персональных данных повышаются и «сверху». По обновленному от 2023-го российскому закону «О персональных данных» продвижение товаров и услуг при помощи хранилищ другого лица и привлечение к обработке данных внештатного сотрудника считаются нарушениями. Однако штрафы за утечку остаются на уровне от 1 до 3%. В Европе действует регламент GDPR (General Data Protection Regulation) по которому компания, допустившая такое, может потерять миллионы от выручки.
- Сложность обработки и анализа. Традиционные хранилища ориентированы на конкретные типы аналитических инструментов и имеют жесткую схему, что ограничивает структуру сохраняемых данных. Нужна их предварительная подготовка перед загрузкой. Очистка, фильтрация и преобразование занимают много времени, при этом часть информации, потенциально полезной в будущем, может теряться. Решить проблему можно с системами NoSQL или репозиториями Data Lake («озерами данных») – они хранят всевозможные неочищенные Big Data из разрозненных источников без необходимости их структурировать. В таком изобилии аналитики находят самые неожиданные закономерности и извлекают из них ценные бизнес-инсайты.
- Неоднородность распределения. Компании могут сосредоточиться на обработке определенных типов данных или источников, игнорируя другие. Допустим, маркетплейс анализирует продажи популярных позиций, упуская из вида отзывы покупателей или региональные различия в спросе. Тогда принятие решений в области управления ассортиментом и рекомендациями может быть неточным. Новые продавцы на платформе не смогут развиваться, что ограничит рост самого маркетплейса.
- Конфликт технологий. Инструменты для обработки могут отличаться поддержкой разных форматов, языками программирования, требованиями к инфраструктуре: ОС, оборудованию, сетевым протоколам. Допустим, одна система хранит данные в CSV (Comma-Separated Values), а другая – в Parquet. При несовместимости придется преобразовывать формат. Схожая трудность возникнет, если одна система использует протокол коммуникации REST API, а другая – AMQP (Advanced Message Queuing Protocol). Тогда понадобится разработка преобразователя или промежуточного компонента, который поддерживают оба протокола.
Маркетплейсы, большие и маленькие: как российские площадки используют Big Data
Wildberries – оборот 1,669 трлн руб., количество заказов 1,5 млрд (2022). Лидер среди e-commerce маркетплейсов в России. Использует Big Data и искусственный интеллект для повышения продаж.
С большими данными Wildberries формирует более полное представление о потребителе, поэтому знает, кому, где и когда предложить тот или иной продукт. А также уменьшает отток клиентов – предлагает альтернативу, когда пользователь не находит то, что искал.
Технология Big Data с инструментами предиктивной аналитики увеличила open rate email-рассылки Wildberries на 100% – теперь он равен 30%.
Ozon – старейший маркетплейс, второй по обороту продаж в РФ (832,2 млрд руб.) с 35,2 млн пользователей. Собирает Big Data на сайте и в мобильном приложении для повышения эффективности таргетированной рекламы и рекомендательной системы. На основе статистики просмотров и кликов прогнозирует предпочтения, а в рекламе показывает релевантные товары. Так результаты для каждого сегмента аудитории улучшаются.
Big Data и ML решают и иные задачи. Например, с ними Ozon ускорил модерацию карточек товаров в 10 раз, сократив время ожидания размещения до 3 минут.
AliExpress Россия – площадка с более 139,2 млн товарных единиц и посещаемостью 8,8 млн покупателей в день.
AliExpress стремится завоевать первенство среди российских площадок. Для этого использует Big Data, ИИ и облачные вычисления – анализирует сведения о покупках и поведении клиентов, предлагает персонализированные рекомендации, улучшает доставку и обслуживание.
В рамках масштабной акции «Хочу!» компания собрала большие данные об аудитории. В результате повысила конверсию продаж до 6,85%. Эта рекламная кампания к тому же стала источником инсайтов. Например, выяснилось, что 3% пользователей, охваченных рекламой, оплачивали покупки картами.
Яндекс.Маркет – маркетплейс с более чем 14 млн покупателей, товарооборот – 308 млрд руб. Компания накопила несчетное количество данных и пришла к выводу: обработать их традиционными способами не получится. Пришлось масштабировать системы на тысячи серверов и задействовать Big Data. В Яндекс.Маркете на базе этой технологии работают персональные рекомендации.
Экосистема Яндекса накапливала информацию из всех своих сервисов: карты, погода, поисковые запросы. И теперь использует их для подбора ассортимента, проведения промо и построения прогнозов о том, когда закончатся товары.
СберМаркет – площадка с оборотом 103,5 млрд руб, 58 тыс. корпоративных заказчиков, посещаемость в среднем – 7 млн человек в месяц.
Трафик СберМаркета растет, продажи тоже: в 2022-м их стало в 1,9 раза больше, чем в 2021-м. Это стало возможным с Big Data и машинным обучением. Площадка непрерывно собирает информацию о локации, откликах на акции, истории заказов. Реклама и виртуальные полки «умнеют» – помогают клиентам находить то, что они ищут, повышают LTV и интерес к платформе.
Традиционные смарт-плейсменты и подсветка товаров в каталоге приносили производителям возврат рекламных инвестиций ROMI на уровне 8–122%. После внедрения инноваций, в их числе Big Data, – до 1200%.
Стрекоза – маркетплейс грузоперевозок, объединяющий 10 тыс. компаний и предпринимателей.
Компания задействует CRM и другие инструменты, чтобы собирать массивы данных о клиентах: средний чек, сроки заказа и др. Использует их для внутренней аналитики и рекламы, чтобы развивать площадку.
Благодаря качественной аналитике данных маркетплейсу удалось привлечь 5 тыс. пользователей за два месяца.
Выводы
Рынок Big Data неслучайно растет с 2015 года на 12% ежегодно. Сегодня все крупные организации используют эту технологию из-за преимуществ, которые она дает для развития бизнеса.
Маркетплейсы нащупали потенциал Big Data, раскрыли его в комбинации с ИИ и ML и продолжают поиск новых прикладных решений. Формируют максимально персонализированные предложения, совершенствуют рекомендательные алгоритмы и рекламные платформы – повышают лояльность покупателей и продавцов. В совокупности с улучшением сервиса и развитием омниканальности технологии позволяют наращивать прибыль даже в нестабильные времена.