Аналитика больших данных.
Взгляд ОФД «Такском»
Взгляд ОФД «Такском»
Полтора года назад, когда компании начали массово переходить на онлайн-кассы, стало понятно, что на серверах ОФД скапливается огромное количество информации с кассовых чеков. И данные будут интересны как самим владельцам касс, так и многим другим участникам рынка. 54-ФЗ позволяет операторам использовать фискальные данные по своему усмотрению при условии их обезличенности. Какую аналитику можно построить на основе такой информации, кому она может быть интересна и какие тенденции существуют на рынке ОФД и больших данных, рассказывает Александр Тупицын, технический директор ОФД «Такском».
Александр Тупицын
технический директор
ОФД «Такском»
ОФД «Такском»
До появления операторов фискальных данных материалы для аналитических исследований преимущественно собирались вручную. Посещать торговые точки, проводить опросы и фотографировать чеки – долгий и трудоемкий процесс. Такие исследования стоят дорого. Но с приходом на рынок операторов фискальных данных все изменилось. Данные с чеков попадают в ОФД через секунду после оформления покупки и сразу становятся доступными для анализа. Это огромное количество оперативной информации. К примеру, только через ОФД «Такском» в Федеральную налоговую службу отправляется более 20 млн чеков в день.
Кому нужна аналитика фискальных данных?
Весь последний год мы доводили до идеала процесс обработки поступающих в ОФД данных. Пробовали разные подходы, искали подходящих специалистов, работали над увеличением скорости и точностью выдаваемой информации. Мы научились правильно работать с адресами, конкретизировать торговые точки, определять категории товаров, бренды и конкретные единицы. В результате все наши исследования вылились в несколько направлений работы.
Кому нужна аналитика фискальных данных?
Весь последний год мы доводили до идеала процесс обработки поступающих в ОФД данных. Пробовали разные подходы, искали подходящих специалистов, работали над увеличением скорости и точностью выдаваемой информации. Мы научились правильно работать с адресами, конкретизировать торговые точки, определять категории товаров, бренды и конкретные единицы. В результате все наши исследования вылились в несколько направлений работы.
Отчет о работе кассиров поможет проанализировать личную эффективность продавцов, а уведомление о подозрительных транзакциях – предотвратить возможное мошенничество
Первое – это аналитика для самого владельца кассы. В личном кабинете «Такском-Касса» для всех абонентов доступна консолидированная информация по сменам, выручке, среднему чеку, наиболее продаваемым товарам. Это та информация, которую раньше мелкому и среднему бизнесу взять было негде. ABC-XYZ-анализ позволяет разобраться с ассортиментом, понять, какие товары покупаются чаще всего и приносят прибыль, а каких стоит закупать меньше. Отчет о работе кассиров поможет проанализировать личную эффективность продавцов, а уведомление о подозрительных транзакциях – предотвратить возможное мошенничество. И вся эта аналитика доступна в личном кабинете совершенно бесплатно.
Второе направление – это предоставление информации для третьих лиц. Например, во многих торговых центрах стоимость аренды напрямую зависит от выручки магазина. Это прописано в договоре. При согласии владельцев касс мы готовы предоставлять данные о выручке администрации ТЦ, чтобы те, в свою очередь, на основе нашего анализа могли строить честные финансовые отношения с арендаторами. В этом случае ОФД выступает в качестве посредника между несколькими компаниями, официального поставщика информации, не заинтересованного в искажении данных.
Третье направление пока только развивается. Это сравнительная аналитика понимания своего места на конкурентном рынке. По заданным параметрам можно будет узнать, как обстоят дела в магазине похожего размера и с похожей выручкой. Подобный функционал уже есть в личном кабинете, где любой абонент может сравнить свои показатели с показателями подобных торговых точек в своем регионе. Но мы собираемся развивать это направление, нам кажется, оно будет интересно пользователям. К примеру, можно будет анализировать ассортимент похожих магазинов, чтобы понять, стоит ли добавить какой-то товар, если у соседа он хорошо продается.
При этом мы соблюдаем полную конфиденциальность и работаем только с обезличенной информацией. Вся наша работа с данными направлена на исключение ситуаций, когда можно точно понять, по какому магазину или какой сети собрана статистика. Мы убираем данные о владельце и внимательно смотрим на топографию. Если запрос идет в разрезе какого-то небольшого населенного пункта, где, допустим, всего несколько магазинов и сразу становится понятно, о ком идет речь, мы автоматически увеличиваем территориальный охват и сводим на нет возможность узнавания.
При этом мы соблюдаем полную конфиденциальность и работаем только с обезличенной информацией. Вся наша работа с данными направлена на исключение ситуаций, когда можно точно понять, по какому магазину или какой сети собрана статистика. Мы убираем данные о владельце и внимательно смотрим на топографию. Если запрос идет в разрезе какого-то небольшого населенного пункта, где, допустим, всего несколько магазинов и сразу становится понятно, о ком идет речь, мы автоматически увеличиваем территориальный охват и сводим на нет возможность узнавания.
Четвертое направление – это аналитика продаж конкретных товаров. И это самая популярная тема запросов от клиентов. Товары могут быть уровня брендов, подбрендов и конкретных единиц. Например, iPhone – это бренд, iPhone конкретной модели – это подбренд, а iPhone конкретной модели определенного цвета и с определенной памятью – это единица товара.
Заказчиками таких исследований, как правило, являются крупные производители товаров, дистрибьюторы, ритейлеры. Им интересны агрегированные данные по продажам конкретных товаров за нужный период времени по разным типам магазинов и в определенном географическом разрезе. Такую информацию ОФД может легко предоставить. Адекватные расценки на подобные исследования делают их доступными для средних и мелких производителей, небольших сетей и дистрибьюторов. Одним словом, для всех, кто раньше не мог позволить себе большую аналитику. Изучив и протестировав рынок, мы оформили такого рода исследования в отдельный продукт, который позволяет отправлять в ОФД «Такском» запросы на интересующие товары, заказывать разовые отчеты или оформлять подписку на периодические.
Заказчиками таких исследований, как правило, являются крупные производители товаров, дистрибьюторы, ритейлеры. Им интересны агрегированные данные по продажам конкретных товаров за нужный период времени по разным типам магазинов и в определенном географическом разрезе. Такую информацию ОФД может легко предоставить. Адекватные расценки на подобные исследования делают их доступными для средних и мелких производителей, небольших сетей и дистрибьюторов. Одним словом, для всех, кто раньше не мог позволить себе большую аналитику. Изучив и протестировав рынок, мы оформили такого рода исследования в отдельный продукт, который позволяет отправлять в ОФД «Такском» запросы на интересующие товары, заказывать разовые отчеты или оформлять подписку на периодические.
Научить машину мыслить
Если вам кажется, что вычислить количество проданных конкретных товаров просто, то это не так. Законом строго регламентированы все реквизиты чека, кроме самого важного с точки зрения аналитики — наименования товара или услуги. Чтобы понять проблематику, мы как-то поставили эксперимент. Взяли такой простой и понятный всем продукт – Coca-Cola 0,5 л. Как вы думаете, сколько может быть способов написания этого товара в чеке? Мы насчитали более 2 тыс. вариантов! Если посадить за компьютер человека, то он, скорее всего, легко определит, что за всеми этими двумя тысячами названий скрывается один и тот же продукт, а вот машину этому нужно специально учить. По сути, вся работа с большими данными как раз и заключается в том, чтобы повторить механизм мышления человека, просто в других, гораздо больших, масштабах.
Для этого существует множество методов машинного обучения, которые мы успешно применяем. Это на первый взгляд незаметная, но очень важная часть нашей работы, направленная на повышение качества готового продукта.
Все наши методики уже разработаны и апробированы на первых клиентах. По каждому направлению у нас уже имеются надежные отработанные решения, которые позволяют размещать у нас заказы и получать разовые или периодические отчеты в разумные сроки.
Если вам кажется, что вычислить количество проданных конкретных товаров просто, то это не так. Законом строго регламентированы все реквизиты чека, кроме самого важного с точки зрения аналитики — наименования товара или услуги. Чтобы понять проблематику, мы как-то поставили эксперимент. Взяли такой простой и понятный всем продукт – Coca-Cola 0,5 л. Как вы думаете, сколько может быть способов написания этого товара в чеке? Мы насчитали более 2 тыс. вариантов! Если посадить за компьютер человека, то он, скорее всего, легко определит, что за всеми этими двумя тысячами названий скрывается один и тот же продукт, а вот машину этому нужно специально учить. По сути, вся работа с большими данными как раз и заключается в том, чтобы повторить механизм мышления человека, просто в других, гораздо больших, масштабах.
Для этого существует множество методов машинного обучения, которые мы успешно применяем. Это на первый взгляд незаметная, но очень важная часть нашей работы, направленная на повышение качества готового продукта.
Все наши методики уже разработаны и апробированы на первых клиентах. По каждому направлению у нас уже имеются надежные отработанные решения, которые позволяют размещать у нас заказы и получать разовые или периодические отчеты в разумные сроки.
ОФД «Такском» полностью готов принимать заказы на исследования в рамках собственных компетенций
А что будет завтра?
Рынок ОФД конкурентен. Ни один, даже самый топовый, оператор не сможет дать вам абсолютно полную информацию по продажам, поскольку распоряжается только своей частью данных. Для решения большинства бизнес-задач этого достаточно. Но для получения статистики высокой точности в масштабах города, региона, страны и отслеживания ее динамики операторам придется не только объединяться, но и разрабатывать единые алгоритмы получения и обработки данных. Поиск партнеров, умение договариваться и создание общих стандартов обработки информации – это и будет следующим этапом развития аналитики больших данных.
Рынок ОФД конкурентен. Ни один, даже самый топовый, оператор не сможет дать вам абсолютно полную информацию по продажам, поскольку распоряжается только своей частью данных. Для решения большинства бизнес-задач этого достаточно. Но для получения статистики высокой точности в масштабах города, региона, страны и отслеживания ее динамики операторам придется не только объединяться, но и разрабатывать единые алгоритмы получения и обработки данных. Поиск партнеров, умение договариваться и создание общих стандартов обработки информации – это и будет следующим этапом развития аналитики больших данных.
Мы видим очень широкое поле применения разработанных нами методик анализа, от запуска на рынок новых продуктов до разработки программ по городскому благоустройству, ведь везде, где необходимо принимать аргументированные решения, нужен серьезный анализ данных
На данный момент ОФД «Такском» полностью готов принимать заказы на исследования в рамках собственных компетенций. Для этого у нас есть достаточно большая доля рынка, необходимая технологическая база, специалисты и готовые сценарии работы. Фискальные данные содержат колоссальный объем полезной для бизнеса информации, вопрос только в том, каким образом ее лучше структурировать для решения конкретных задач. И в этом мы всегда готовы помочь нашим клиентам. Подсказать и привести примеры, предложить различные методики, работать индивидуально. Нам интересно развивать это направление. Мы видим очень широкое поле применения разработанных нами методик анализа, от запуска на рынок новых продуктов до разработки программ по городскому благоустройству. Везде, где необходимо принимать аргументированные решения, нужен серьезный анализ данных. И мы готовы взять это на себя.
Задать вопрос компании