Меня часто забавляет, что в эпоху ChatGPT (и несмотря на бесчисленные книги в моей библиотеке по AI/ML) я никогда не использовал какую-либо модель глубокого обучения ни для одного из моих клиентских взаимодействий или предшествующей расширенной аналитики. лидерские роли.

Для 99,95% проблем с данными в традиционных (нетехнических) компаниях глубокое обучение (и любые его производные, такие как LSTM, GAN, CNN и т. д.) в лучшем случае является излишним и пустой тратой времени ( или неприменимо) в худшем случае.

В разделе "Аналитика роста доходов" мы помогаем ответить на следующие типы вопросов, чтобы увеличить продажи, прибыль или и то, и другое:

  1. Каковы мои оптимальные цены и каков компромисс цены и качества для моих продуктов?
  2. На какие новые рынки/сегменты клиентов мы должны выйти?
  3. Какие существуют пробелы в продукте, основанные на подробном анализе рынка?
  4. Как мы можем улучшить чистую выручку и валовую прибыль за счет управления ассортиментом клиентов и продуктов?
  5. Каковы мои самые важные возможности удержания клиентов, дополнительных и перекрестных продаж для увеличения объема?
  6. Какова окупаемость моих расходов на маркетинг и как я могу оптимизировать свой маркетинговый комплекс, чтобы увеличить продажи и прибыль?
  7. Какие потенциальные клиенты имеют наибольшую склонность к достижению высокой потребительской ценности?
  8. Как мы должны скорректировать наши усилия по продажам и маркетингу на основе сегментации покупательских моделей клиентов (чтобы максимизировать прибыль)?
  9. Как еще я могу использовать свои активы данных для увеличения ценности своих отделов продаж?
  10. Какие инструменты внутренней аналитики я могу модифицировать (или создать заново) для наших клиентов, чтобы помочь им оптимизировать свой ассортимент, цены или закупки, повысить лояльность клиентов и увеличить продажи?

Чтобы решить эти проблемы, я в основном придерживаюсь основ (например, обработка данных / диагностическая аналитика в Excel / R / Tableau / Power BI, в основном с использованием математики средней школы и большого опыта в предметной области).

Для более сложной работы я обычно полагаюсь на следующее:

  1. Линейная регрессия: для быстрых и точных прогнозов (либо в качестве основы для сравнения, либо если данные просты, а у меня достаточно знаний в предметной области, чтобы понять, что взаимосвязь в основном линейна).
  2. Случайный лес: для большинства задач прогнозирования, включая оценки оттока клиентов и ценовой эластичности. RF всегда является хорошим выбором для меня, когда мои данные довольно полны, у меня есть много функций для работы, и когда мультиколлинеарность является проблемой (что почти всегда имеет место для задач коммерческой аналитики). Несмотря на свою вычислительную сложность (хотя она идеально подходит для распараллеливания даже на стандартных ноутбуках), Random Forest также легко объяснить заинтересованным сторонам таким образом, чтобы они могли концептуализировать и понять.
  3. GBM (обычно XGBoost): для проблем с оттоком, вероятностью покупки и ценовой эластичностью. Используйте его реже, чем RF, как правило, когда мои данные скудны, а ошибки прогнозирования значительно дороже для бизнеса (также когда у меня значительно больше времени для построения моделей). LightGBM — более быстрый, но менее точный вариант. Кроме того, гораздо больше работы, чтобы объяснить вашим заинтересованным сторонам.
  4. Моделирование рыночного микса: чтобы помочь компаниям понять окупаемость их маркетинговых расходов и помочь оптимизировать бюджеты для увеличения продаж или валовой прибыли.
  5. Анализ сходства (или анализ рыночной корзины): чтобы помочь с оптимальными перекрестными продажами B2B и понять лучшие возможности ценообразования и рекламных пакетов.
  6. Когортный анализ: отслеживание поведения клиентов с течением времени по таким параметрам, как удержание, повторные покупки или пожизненная ценность клиента.
  7. Моделирование временных рядов (в основном пакет «prophet»): использование простых форм TS для визуализации сезонности или получения оптимальных членов Фурье (непрерывные предикторы в линейных регрессиях вместо использования бесчисленных фиктивных переменных). Моделирование TS также полезно для основных прогнозов доходов или объемов в качестве входных данных для анализа сценариев доходов или прибыльности.

Подводя итог, можно сказать, что для большинства болевых точек бизнеса в традиционных компаниях более продвинутое машинное обучение не требуется, а базовых методов машинного обучения, таких как линейная регрессия, случайный лес, моделирование рыночного микса, анализ сходства и некоторый анализ временных рядов, более чем достаточно. Эти методы легко объяснить заинтересованным сторонам, и они обеспечивают достаточно точные результаты, чтобы принять решение, измерить воздействие и двигаться дальше.

Большинство из этих методов существуют уже несколько десятилетий (и столетий в случае линейной регрессии), и я подозреваю, что мы по-прежнему будем преимущественно использовать эти простые инструменты для решения критических проблем бизнеса еще несколько десятилетий.

Эта статья была первоначально опубликована в Revology Analytics Insider, выходящем раз в две недели информационном бюллетене Revenue Growth Analytics. Пожалуйста, подпишитесь на будущие обновления на Medium или на моем сайте.