Недавно я обсуждал со своей сестрой, которая также работает в области аналитики, то, как можно начать аналитическую работу с представления об использовании новейших и лучших достижений в области машинного обучения для значительного улучшения процесса. Однако к концу определения масштаба проекта выясняется, что на самом деле нужны панели показателей, возможно, созданные только с помощью Excel. Это может разочаровать начинающего аналитика (у которого также есть видение использования новейших и лучших технологий). Во многих процессах уже могут быть отчеты о показателях в той или иной форме, поэтому может показаться, что создание информационных панелей не добавляет ценности, а может лишь переформатировать то, что уже есть. Почему, когда вокруг машинного обучения столько шума, оно не используется больше, чем создание дашбордов?

Курс, который я сейчас провожу с Google на Coursera, помог мне понять контекст, почему это происходит лучше. В первой части курса Google обсудим, как они используют машинное обучение в Google. Раньше я думал, что машинное обучение улучшает процессы двумя способами:

  • Как инструмент для автоматизации конкретной задачи в процессе (например, идентифицировать объекты на изображениях)
  • Как метод улучшения аналитики данных (например, сегментация рынка или более точные прогнозы)

Этот курс заставил меня задуматься о том, что есть и третий путь:

  • Как автоматизированный способ улучшения сквозного процесса

Третий способ всем нравится, но реализовать его намного сложнее, чем первые два. Когда компании (Google, Facebook и т. д.) рассказывают в новостях о преимуществах машинного обучения, они не различают эти способы его использования. Я считаю, что именно поэтому многие люди начинают с запутанного представления о том, на что способно машинное обучение.

В ходе курса Google раскрывает путь, по которому обычно идет проект или процесс, прежде чем внедрять машинное обучение, как показано ниже.

  1. Отдельные лица: кто-то работает самостоятельно, неформально и не требует реального процесса. Например, администратор в небольшой компании.
  2. Группы. Несколько человек выполняют одну и ту же работу, например кассиры. Необходимо формализовать и задокументировать процесс, чтобы все они вели себя последовательно и предлагали одинаковый уровень обслуживания.
  3. Автоматизация. Автоматизируйте повторяющиеся четко определенные задачи с помощью компьютеров, например банкоматов. Автоматизация также позволяет начать сбор большого количества данных.
  4. Большие данные и аналитика. Данные по ключевым показателям используются для улучшения процесса (может быть повторяющейся задачей). Например, анализ проблем с данными колл-центра, с которыми сталкивались клиенты, и использование информации для более быстрого направления клиентов в нужные отделы.
  5. Машинное обучение. Непрерывный процесс просмотра данных и изменения процесса для улучшения ключевых показателей обратной связи теперь выполняется с помощью алгоритма. Алгоритм может повторяться и вносить улучшения намного быстрее, поскольку он автоматизирован. Например, механизм рекомендаций Youtube принимает в качестве входных данных то, что пользователи ранее смотрели, и использует количество просмотренных рекомендуемых видео в качестве показателя обратной связи. По мере того, как алгоритм узнает больше, улучшенные рекомендации автоматически передаются пользователям.

Если процесс находится на шаге 3 или 4 из вышеперечисленного, может быть относительно просто увидеть, как машинное обучение можно применить к конкретным задачам в рамках процесса для автоматизации или улучшения аналитической работы. Тем не менее, многие офисные процессы часто очень ручные с небольшими элементами автоматизации, все еще на шагах 2 и 3. Это затрудняет понимание того, как можно применить машинное обучение для улучшения сквозного процесса. Проблема не в том, что машинное обучение тут не поможет, а в том, что процесс, который нужно улучшить, к этому не готов.

Если процесс не очень автоматизирован с шага 3, алгоритм машинного обучения (который всегда будет частью программного обеспечения) не сможет внести коррективы в процесс. Или, если аналитика не выполнялась вручную на шаге 4, вы не будете знать, для каких показателей оптимизировать алгоритм машинного обучения.

Это возвращает нас к тому, почему проекты часто заканчиваются панелями мониторинга. Отчетность по метрикам — очень распространенная офисная задача. Это часть шага 4 более крупного процесса, но сама по себе она часто выполняется вручную отдельным лицом или небольшой группой. Если вы хотите внедрить алгоритм машинного обучения, чтобы попытаться оптимизировать более крупный процесс для одной из этих метрик; вам понадобится автоматизированный способ сбора и анализа этих данных, чтобы алгоритм мог их анализировать.

Следующим логическим шагом будет определение наиболее важных метрик и вложение средств в автоматизацию их создания. Внезапно автоматическое обновление приборной панели кажется отличной идеей! Создание информационных панелей может быть скучной работой, но это помогает создать основу для дальнейшей аналитической работы и, возможно, машинного обучения.

Кроме того, преимущество этого курса от Google заключается в том, что вы получаете интересное представление о компании. Например, сколько они ожидают получить, применяя машинное обучение в качестве инструмента улучшения процессов на шаге 5? 10 %.Учитывая всю шумиху вокруг машинного обучения, я подумал, что это мизер! Однако это имеет смысл, если вы уже выполнили шаги 3 и 4 (которые могли включать применение машинного обучения к конкретным задачам) и активно используете аналитику для улучшения процесса, так что больших улучшений не осталось. Возможно, поэтому и говорят, что не все проекты доходят до шага 5. Иногда это не стоит затраченных усилий.

Еще одним интересным моментом является то, что в любом приложении машинного обучения они всегда вовлекают людей, чтобы они знали, что делают алгоритмы. Один из способов сделать это — создать инструменты отчетности, чтобы выделить для проверки случаи, когда алгоритм не был уверен в своих результатах. Затем люди могут просмотреть и внести коррективы, если начнут возникать странные вещи. Эти инструменты отчетности создаются на шаге 4, прежде чем все автоматизировать. И они не говорят об этом явно, но вы можете себе представить, что результаты этих инструментов суммируются с помощью… информационных панелей! :П