22.08.2019,
12:28
Что такое прогнозная аналитика и как ее применять в ритейле
Об особенностях работы систем статистического прогнозирования в розничной индустрии и преимуществах использования предиктивной аналитики для оптимизации продаж рассказывают Дмитрий Ларин, руководитель направления Retail & CPG, SAS NEMEA, и Валентина Ларина, руководитель бизнес-практики направления Retail&CPG, SAS NEMEA.
Дмитрий Ларин
руководитель направления Retail & CPG,
SAS NEMEA
|
Об особенностях работы систем статистического прогнозирования в розничной индустрии и преимуществах использования предиктивной аналитики для оптимизации продаж рассказывают Дмитрий Ларин, руководитель направления Retail & CPG, SAS NEMEA, и Валентина Ларина, руководитель бизнес-практики направления Retail&CPG, SAS NEMEA.
R&L: Что представляет собой система статистического прогнозирования?
Валентина Ларина
руководитель бизнес-практики направления Retail&CPG, SAS NEMEA |
В. Ларина: Это приложение, которое позволяет бизнес-пользователю получать прогнозы и принимать на их основе решения, важные для дальнейшей работы. В основе такого приложения лежат аналитические инструменты. Результаты работы аналитики, обработки данных и выводы система позволяет представить в виде, понятном бизнес-пользователю, чтобы он использовал их для принятия решения.
Д. Ларин: Когда мы говорим о статистическом прогнозировании, по факту мы говорим о прогнозной аналитике, о том, что мы делаем некоторый прогноз на базе статистического анализа. Статистика предполагает, что у нас есть много наблюдений, много факторов, много данных в истории. И нам действительно нужно проанализировать эти данные, найти статистически значимые корреляции, паттерны, шаблоны покупательского поведения, чтобы понять, какие факторы влияют на наши продажи. А потом, уже понимая статистически значимые факторы, мы можем точнее прогнозировать эти продажи. И система статистического прогнозирования позволяет пользователям получать выводы быстро в автоматическом режиме и поставить этот процесс на поток.
R&L: Какие задачи розничной индустрии она решает?
Д. Ларин: У ритейла всегда было много данных. Когда стали агрегировать данные из интернета и соцсетей, то их стало еще больше. Прогнозировать на их основе можно что угодно, но имеет смысл сосредоточиться именно на том, что актуально и что имеет значение для бизнеса. И в первую очередь это прогноз продаж: сколько товаров в каждом магазине в каждый день, а иногда и с разбивкой по часам, будет продано в будущем периоде. Круг решаемых с помощью такого прогноза задач зависит от того, какой период мы берем. Если это прогноз продаж на неделю, например, то решаем задачу пополнения товарных запасов, чтобы не было пустых полок. Если мы строим прогноз продаж на более дальний горизонт – скажем, на полгода-год, – то здесь речь идет уже о задачах ассортиментного планирования. Понимая, как в динамике меняются потребности покупателей и спрос в разных магазинах, мы можем менять ассортимент, чтобы он был эффективным для каждого конкретного магазина.
Ну и большой третий раздел задач для товарной аналитики – это, конечно же, управление ценообразованием и промо. Если мы понимаем, что влияет на формирование цены и на что влияет сама цена, то с помощью системы статистического прогнозирования мы можем принимать взвешенные решения о том, какую цену установить на товар в тот или иной период в зависимости от цели – больше продать в штуках, добиться максимальной маржинальности или распродать товар, что, например, актуально в fashion-индустрии, когда меняется коллекция.
И еще одна большая область задач розничной индустрии связана с аналитическим CRM – управление программами лояльности, целевыми маркетинговыми кампаниями. Здесь мы проверяем, как мы можем побудить покупателя приходить чаще, купить больше, приобрести что-то новое, что-то более дорогое. Соответственно, решая, запускать или не запускать маркетинговую кампанию, мы сравниваем прогнозы отклика на кампанию и финансовые затраты на ее проведение.
R&L: Каковы наиболее часто используемые методы предиктивной аналитики?
В. Ларина: Я бы назвала методы временных рядов. Их чаще всего используют по одной простой причине – они проще в применении, нужно меньше данных, и временные ряды понятны конечным бизнес-пользователям, их легко интерпретировать. Но сейчас все чаще начинают использоваться методы интеллектуального анализа данных – data mining, machine learning, deep learning. Все эти хайповые слова на самом деле существуют несколько десятилетий – очень давно, просто сейчас эти методы действительно начали получать широкое применение, главным образом благодаря развитию технологий. Но сказать, что индустрия откажется от методов временных рядов, тоже нельзя, у них есть преимущества в виде интерпретируемости и простоты в использовании.
Результаты – это не только улучшение бизнес-показателей |
R&L: Как добиться повышения эффективности прогнозирования продаж на основе анализа данных?
Д. Ларин: Нужно сначала определиться, что мы в данном случае подразумеваем под эффективностью. Чаще всего это точность прогноза, но далеко не всегда эффективность определяется именно точностью. Например, если мы прогнозируем с целью оптимизации цен, то нужна не точность. Необходимо выявить тот экстремум, при котором выгода от продаж максимальна.
В. Ларина: А дальше нужно сделать так, чтобы это было еще и быстро, потому что всегда в реальных задачах есть ограничения, связанные со временем. Например, у ритейла для того, чтобы, например, перестроить прогноз под пополнение, есть ночь, и то очень часто это время может сократиться с ночи до нескольких часов, потому что нужно еще подгрузить данные. Если же это крупный ритейлер, то тогда его магазины находятся в разных часовых поясах, и ему нужно успеть загрузить данные и просчитать прогноз за короткий промежуток времени между закрытием магазинов в западных поясах и открытием в восточных.
Д. Ларин: Качество прогноза зависит от трех основополагающих вещей. Во-первых, качество данных. Это самый действенный инструмент для повышения эффективности. Есть много методик по их очистке и подготовке, и в большинстве своем они основаны на методах статистики. Данные бывают «грязные», потому что люди что-то недовнесли, внесли некорректно, создали дубли, внесли товар под разными наименованиями и так далее. И здесь вопрос действительно о том, что, проанализировав огромное множество этих вариаций и применив в том числе методики текстовой аналитики, мы можем вычистить данные, привести их к стандартизированному виду.
Во-вторых, это непосредственно сами модели. Валентина уже упоминала, что существует множество методов для прогнозирования продаж – от классических алгоритмов временных рядов до наиболее современных XGBoost-ов, нейронных сетей, deep learning и так далее. Но на самом деле важен именно первичный анализ данных: из чего они состоят, насколько они разветвленные, сколько их у нас есть, какого они качества. Такой анализ позволит понять, какая модель наилучшим образом подойдет. Потому что, казалось бы, можно было бы просто взять и перебрать все модели и посмотреть, какая лучше сработает. Но в действительности для каждой модели нужно по-особенному готовить данные и учитывать особые факторы. Именно в этом и заключается работа аналитика при построении эффективного прогноза продаж.
И в-третьих, это понимание конечной задачи – для чего мы строим этот прогноз продаж, каким будет бизнес-применение этого прогноза. А дальше уже определяем, какие элементы прогноза для нас наиболее важны – точность или часть, связанная с трендом, с сезонностью, или вообще понимание весомости факторов, влияющих на наш прогноз.
В. Ларина: Еще стоит задаться вопросом, что такое повышение эффективности, потому что очень часто люди забывают выстроить правильный процесс сравнения моделей. Они считают так: ну вот, мы померили в январе, а теперь мы посмотрим, что у нас получилось в июне. И они видят, что точность упала, а на самом деле не упала, просто данные другие, всегда нужно сравнивать подходы в одинаковых ситуациях, и, к сожалению, далеко не все это делают правильно.
R&L: Какой способ прогнозирования движения товаров наиболее эффективен?
В. Ларина: Смотря что, опять-таки, подразумевать под способом. Способ – это не только модель, это весь процесс, начиная с подготовки данных и заканчивая применением выводов. Есть методология, как получить некоторый базовый уровень. Для этого подойдут вообще абсолютно наивные подходы к прогнозированию, вплоть до предположений, что завтра будет так же, как вчера. Это же тоже подход к прогнозированию, и он дает некоторый уровень качества прогнозов. А дальше, отталкиваясь от этого уровня точности прогноза, нужно пробовать новые методы, сравнивать с предыдущими и смотреть, стало ли лучше, если не стало, то почему, разбирать как раз те самые ошибки с данными, смотреть, почему алгоритм не справляется с теми данными, которые ему предоставили, и постепенно двигаться в сторону улучшений. Но изначальный уровень, от которого можно отталкиваться, должен быть, чтобы можно было сравнивать и понимать, стало ли лучше или хуже и почему.
Первичный переход на аналитические методы дает качественный скачок, а дальше показатели начинают улучшаться уже маленькими шагами год за годом |
R&L: Какие розничные компании успешно используют предиктивный анализ и каковы результаты?
В. Ларина: Таких компаний очень много. Например, на недавнем SAS Forum Russia 2019 выступали «Эркафарм», Nestle, «Утконос». Они достаточно подробно рассказывали, как они уже применяют новейшие подходы – не просто временные ряды, а в том числе скомбинированные с data mining.
Д. Ларин: Те компании, которые только начинают свой путь от условного Excel к предиктивному анализу, к каким-то более сложным моделям, получают резкий скачок эффективности – улучшение точности прогнозирования на 10–15 и более процентов. Если мы говорим про выручку или маржинальность, то это рост вплоть до 5–10%, как это получилось у «Эркафарм». Именно первичный переход на аналитические методы дает качественный скачок, а дальше показатели начинают улучшаться уже маленькими шагами год за годом. У гигантов индустрии, которые давно используют аналитику (как, например, Walmart), таких цифр уже увидеть нельзя, потому что у них идет эволюция систем, а не революционный прорыв. Скажем, Carrefour ставит себе в качестве KPI улучшение точности прогнозирования на 5% в течение ближайших пяти лет.
В. Ларина: И на самом деле это очень масштабная цель. Ведь результаты – это не только улучшение бизнес-показателей. Если это предиктивная аналитика, которая встраивается в бизнес-процессы, то она позволяет улучшать в том числе сам процесс, полностью его отладить, повысить эффективность. В результате люди, которые занимались до этого какой-то рутинной работой, сами экспертно определяли, сколько будет продаваться того или иного товара, могут переключиться на что-то более интересное или полезное, могут смотреть, что повлияло на продажи того или иного товара, как им развивать в дальнейшем свой рынок и свой товар. То есть это в том числе повышение эффективности с точки зрения человеческих ресурсов и реализации способностей людей.