Обзор

Работая в организации электронной коммерции, работающей в сфере B2B, мы сталкиваемся с серьезной проблемой предоставления наиболее подходящих продуктов нашим клиентам. Когда мы говорим о «наиболее актуальных», мы стремимся предлагать продукты, которые соответствуют текущим тенденциям, имеют доступные цены и удовлетворяют, среди прочего, популярным цветовым решениям.

История начинается, когда команда по стратегии и маркетингу сидела вместе, наслаждаясь редким моментом расслабления и духа товарищества. Поднялась тема листинга продуктов, и когда мы выслушали подход маркетинговой команды, мы были шокированы. Наша реакция была Что?????

Тот случайный разговор с маркетинговой командой усложнил нам жизнь. Мы были вынуждены пересмотреть логику ранжирования продуктов и создать что-то, что действительно оправдывало бы способ ранжирования продуктов. логика снова и сделать что-то, что оправдает оценку продукта.

Совещание группы по разработке стратегии

После разговора с отделом маркетинга вся команда по стратегии, состоящая из Химаншу Джайсвал, Спарш Шах и я, провела серию совещаний, чтобы улучшить логика нашего подхода к листингу продуктов. Мы осознали необходимость усовершенствования системы и обеспечения того, чтобы она точно отражала ценность и актуальность каждого продукта.

Подход Ахила: нормализация и ранжирование на основе суммы нормализованных баллов (который был отвергнут всей командой 😥😥😥😥..позже я тоже согласился)

Я лично являюсь большим поклонником нормализации для ранжирования. Давайте разберемся с работой нормализации. Предположим, у меня есть три атрибута: годы опыта, возраст и зарплата, которые должны будут ранжировать людей на основе трех вышеуказанных параметров, тогда как я могу выполнить ранжирование с помощью нормализации?

Шаг 1: мы преобразуем все столбцы в один масштаб, что можно сделать с помощью нормализации. Нормализация преобразует данные в столбце между значениями 0–1. По возрасту

Шаг 2. Суммирование нормализованных столбцов для оценки эффективности карьеры

Если бы зарплате придавалось большее значение, чем возрасту и многолетнему опыту, мы могли бы достичь желаемых результатов, присвоив каждому атрибуту разные веса. При оценке продукта каждый атрибут будет иметь определенный вес, и оценка будет определяться на основе этих весов. Вот почему нормализация не смогла удовлетворить наши требования.

Вторая встреча, опыт Химаншу Джайсвала

Я сильно разозлился на Химаншу (ну он отверг мою идею 🤣🤣🤣🤣). Прежде чем прийти к лучшему заключению, наша дискуссия приняла бессмысленный оборот, задав такие вопросы, как Что делать с кластерами? и Можем ли мы применять индивидуальные веса для каждой категории? Прямо или косвенно мы приблизились к подходу маркетинговой команды. Однако среди всех этих разговоров произошел момент озарения.

Химаншу Джайсвал: Бхаи, нам нужно подходить к списку продуктов таким образом, чтобы предоставлять прошлые данные для каждой подкатегории. На основе этих данных математическая модель может определить значимость каждого атрибута (базовое определение машинного обучения 😁😁). Благодаря нашему коллективному опыту мы пришли к выводу, что, используя подход к обучению с учителем, мы не можем получить желаемый результат.

После нескольких обсуждений мы поняли, что нам нужно применить подход, который будет устанавливать вес каждого столбца, сравнивая конкретный столбец с каждым другим столбцом и самим столбцом, а затем присваивая оценку. Не волнуйтесь, если вы не в состоянии это переварить.

Перед построением модели машинного обучения нам предстояло выполнить еще одну большую и важную задачу: выбрать атрибуты. Атрибуты играют решающую роль в построении модели, поскольку даже один незначительный атрибут может снизить общую производительность модели.

Выбор атрибута

После нескольких раундов обсуждения с маркетинговой командой мы пришли к решению выбрать следующие атрибуты.

  1. Клики.В качестве примера представьте, что вы просматриваете веб-сайт электронной коммерции в поисках трикотажной футболки. Когда вы прокручиваете веб-сайт, вы натыкаетесь на список продуктов, но вы нажимаете только на те, которые соответствуют вашим конкретным требованиям. Такие факторы, как цвет, цена и другие факторы, могут повлиять на ваше решение нажать на конкретный продукт. Важно отметить, что чем больше кликов получает продукт, тем выше его шансы превратиться в реальные заказы.
  2. CTR(Click Through Rate):- Если клики уже получены, зачем нам учитывать CTR?

Рассмотрим сценарий 1 апреля 2023 года. В тот день, когда пользователи искали спортивную обувь, в сумме было 100 кликов из 1000 показов. Кроме того, гавайские тапочки получили 95 кликов из 800 показов. Если рассматривать только количество кликов как параметр, может показаться, что спортивная обувь показала себя хорошо. Однако, когда мы рассматриваем рейтинг кликов (CTR) в качестве параметра, мы обнаруживаем, что гавайские тапочки имели более высокий показатель успеха 1 апреля 2023 года. Поэтому важно учитывать CTR независимо от того, были ли мы уже считается количество кликов или нет.

3. Коэффициент конверсии. Конверсия — это фокус и конечная цель наших усилий. Ключ к достижению конверсий заключается в обеспечении того, чтобы клики, генерируемые пользователями, в конечном итоге приводили к заказам товаров. Чем выше коэффициент конверсии, тем выше валовая стоимость товара (GMV), что соответствует нашей конечной цели.

4. GMV. Конечная цель – добиться GMV от указанного продукта, поэтому это один из самых важных атрибутов любого продукта.

5. Счетчик пожеланий. Давайте рассмотрим сценарий, в котором вы сталкиваетесь с продуктом, который вас интересует. Однако в силу определенных обстоятельств вы не можете совершить немедленную покупку. вы решаете добавить товар в список желаний, намереваясь купить его позже.

При анализе наших внутренних данных мы обнаружили интересный атрибут. Мы наблюдали корреляцию между количеством списков желаний, которые получает продукт, и соответствующей валовой стоимостью товара (GMV), полученной от этого продукта. Другими словами, мы обнаружили, что продукты с большим количеством желаний, указывающим на большее желание пользователей совершить покупку, как правило, дают более высокий GMV. Основываясь на этом выводе, мы решили включить в наш анализ количество желаний в качестве атрибута.

6. VFM (Соотношение цены и качества):- Ваше удовлетворение продуктом как покупателя может значительно повлиять на ваши действия. Если приобретенный вами продукт не оправдает ваших ожиданий, это может привести к разочарованию. Вы можете выразить свое недовольство, обратившись в службу поддержки клиентов или оставив плохую оценку, указывающую на более низкое соотношение цены и качества (VFM). И наоборот, когда продукт превосходит ваши ожидания, вы, скорее всего, дадите ему положительный отзыв с оценкой в ​​5 звезд. Это говорит о том, что более высокие рейтинги коррелируют с удовлетворением ожиданий покупателей, и существует высокая вероятность того, что если один покупатель будет удовлетворен, другие тоже будут удовлетворены. Таким образом, концепция VFM играет важную роль в определении того, воспринимается ли продукт пользователем как хороший или нет.

7. Возврат: чем больше количество возвратов, тем больше признаков того, что продукт не соответствует потребностям или предпочтениям покупателей.

Модель была построена с обратным скорингом для доходности. Например, если продукт P1 имеет коэффициент возврата 90 %, то показатель его возврата будет равен 100 % — 90 % = 10 %. С другой стороны, если продукт P2 имеет коэффициент возврата 0%, то его показатель возврата будет равен 100%.

После нескольких встреч и общего понимания между маркетинговой и стратегической командами мы приняли решение продолжить использование вышеупомянутых атрибутов для определения ранга продуктов. Во время этих встреч мы разъяснили, что следует и что не следует учитывать в нашем подходе.

Что можно и чего нельзя делать

Наша организация в основном имеет дело с сегментом обуви и одежды, которые далее делятся на несколько категорий. Например, обувь включает спортивную обувь, кроссовки, тапочки, сандалии и многое другое. Точно так же одежда включает курти, футболки и многое другое.

  1. Избегайте одинакового веса во всех категориях. Раньше оценки продуктов распределялись на основе уровня платформы без учета отдельных подкатегорий. Однако теперь мы признаем необходимость присваивать баллы на уровне категорий.

Зачем нам нужно распределять оценки на уровне категории?

Распределение оценки продукта на уровне категории необходимо из-за различной природы атрибутов в каждой подкатегории. Например, когда пользователи просматривают обувь, рейтинг кликов (CTR) может быть ниже по сравнению с одеждой. Следовательно, вес CTR должен быть разным для категорий обуви и одежды. Это изменение относится и к другим атрибутам. Чтобы обеспечить более точное ранжирование продуктов, важно определить весовые баллы по подкатегориям, принимая во внимание конкретные характеристики и поведение пользователей в каждой категории.

2. Рассмотрение параметра New Age:- Первоначально мы столкнулись с дилеммой при сравнении недавно представленных продуктов, которые изо всех сил пытались найти свою целевую аудиторию, с продуктами, которые были на платформе в течение 30 или 60 дней. . Последний установил влиятельные факторы, такие как коэффициент конверсии и GMV. Однако стало очевидно, что новые продукты потенциально могут обладать положительными качествами, такими как хорошее количество пожеланий, большое количество кликов и впечатляющий рейтинг кликов. Несмотря на эти факторы, их низкий коэффициент конверсии и GMV привели к низкому рейтингу.

Химаншу Джайсвал (этот парень усложнил мне жизнь 😂😂😂😂), Экспертиза привела к идее включения возраста в качестве фактора при определении оценки продукта. Он предложил присваивать более высокие возрастные оценки более новым продуктам и более низкие возрастные оценки более старым.

Момент Эврики

На сцену выходит PCA (анализ главных компонентов).

Зачем нужен анализ основных компонентов?
У нас есть некоторые атрибуты, такие как Клики, Рейтинг кликов, Конверсия, GMV, VFM, Число желаний, Возраст и Доходность, основанные на этих атрибутах, мы хотим предоставить оценку для каждого продукта. PCA помогает определить оценку на основе взаимозависимых и взаимозависимых вариантов столбца.

Давайте поймем взаимозависимость и взаимозависимость. Предположим, у нас есть три столбца «Возраст», «Вес» и «Рост». Я хочу назначить вес каждого столбца.

Наблюдая за изображением, представленным выше, становится очевидным, что даже небольшая разница в возрасте может привести к существенному изменению как веса, так и роста. Кроме того, эта небольшая возрастная вариация также отражается в межстолбцовых зависимостях между этими атрибутами. Следовательно, возраст будет иметь более высокий вес по сравнению с оставшимся столбцом, таким же образом будет получен вес всех оставшихся столбцов.

Прежде чем применять PCA, следует помнить одну вещь: нам необходимо стандартизировать данные, потому что столбцы с большим диапазоном вариаций будут доминировать над столбцом с небольшими вариациями.

Предположим, мы получили веса из PCA, такие как 0,55 для возраста, 0,42 для веса и 0,38 для роста, следующие шаги будут следующими:

  1. Умножьте полученные веса на фактические значения каждого соответствующего столбца. Этот шаг включает в себя умножение веса Возраста на фактическое значение Возраста, веса Веса на фактическое значение Веса и веса Роста на фактическое значение Роста.
  2. После умножения на значимые веса мы получаем фактическую оценку для каждого столбца. Эти баллы представляют взвешенный вклад каждого столбца в общий анализ.
  3. Чтобы убедиться, что значения находятся в сопоставимой шкале, нам необходимо нормализовать баллы (нормализованный балл варьируется от 0 до 1).
  4. После нормализации оценок суммируйте нормализованные оценки всех столбцов для каждой записи.
  5. Наконец, на основе нормализованных оценок мы можем ранжировать записи и определить их относительное положение. Записи с более высокими нормализованными баллами будут ранжироваться выше, что указывает на их большую значимость в анализе.

Результат

Значение фактора, определяющего возраст, в оценке продукта оказалось для нас решающим фактором. Мы заметили, что новые продукты занимают более высокие позиции в рейтинге по сравнению со старыми, несмотря на то, что последние накапливают значительный GMV и имеют более высокие коэффициенты конверсии. Рассмотрение возраста продукта как фактора оценки дало ценную информацию и позволило нам точно оценить его эффективность, что в конечном итоге изменило нашу систему ранжирования продуктов. Прикрепление снимка исходного набора данных.

При просмотре предоставленного изображения становится очевидным, что продукт с 0 GMV имеет более высокий рейтинг по сравнению с продуктом со значительным количеством GMV. Это наблюдение вызывает опасения, поскольку оно противоречит нашим ожиданиям и общему пониманию того, что более высокая GMV означает лучшую производительность и успех продукта.

Вывод

  • Большое спасибо Himanshu Jaiswal за руководство на протяжении всего процесса.

Дополнительные материалы на PlainEnglish.io.

Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter, LinkedIn, YouTube и Discord .