Данные — это новая нефть. Понимание, полученное из огромных объемов информации, может выйти за рамки планирования, составления бюджета и прогнозирования, оно может определить конкурентное преимущество бренда.

Большие данные, обработанные с помощью машинного обучения, могут выявлять новые возможности, моделировать события и помогать руководителям принимать более обоснованные бизнес-решения.

Стратегии, основанные на данных

На самом деле стратегическая важность перехода к принятию решений на основе данных (DDD) становится все более реальной.

Возможно, вы уже испытали это, даже не подозревая об этом. Помните время, когда вы посетили Amazon, положили товар в корзину, передумали и в конце концов отказались от него?

Как ни странно, продукт, который вы оставили, внезапно продолжает появляться на каждом веб-сайте, который вы посещаете. Нет, это не простое совпадение, и уж точно ваш разум не играет с вами злых шуток. Это то, что рекламодатели называют ретаргетингом.

Благодаря рекламе, основанной на данных, потенциальные клиенты, которые отказались от своих корзин, рассматриваются как точки данных в алгоритме, который будет нацелен на просмотр гиперрелевантных предложений, чтобы в конечном итоге закрыть продажу.

Лучшие инсайты о клиентах

Лучшая информация о клиентах прямо у вас под носом. Чаты в социальных сетях, комментарии, фотографии и видео; корпоративные презентации и проектные документы; аудиторские отчеты и отчеты о завершении проекта.

Все идеи только и ждут, чтобы их обработали и интерпретировали. Возьмем, к примеру, LinkedIn: эта компания, управляемая данными, проводит до 300 миллиардов событий, в которых данные играют важную роль.

Uber — еще один прекрасный пример. Этот технический гигант использует большие данные, чтобы отслеживать тысячи автомобилей и водителей и сопоставлять их с лучшим маршрутом.

Роль машинного обучения

Конечно, данные, поступающие из разных источников, как структурированные, так и неструктурированные, по-видимому, невозможно обработать и даже сопоставить для получения прогнозов и выводов.

Здесь на помощь приходит машинное обучение. Большие данные, проанализированные с помощью машинного обучения с использованием таких продуктов, как WorkFusion Smart Process Automation (SPA), могут предоставить более глубокое понимание клиентов, которое не могут предоставить традиционные отчеты бизнес-аналитики.

Используя искусственный интеллект, алгоритмы от SPA могут осмысливать миллиарды данных вне зависимости от их состояния или формата. Это делается с помощью процесса интеллектуального анализа данных, который включает преобразование данных, удаление или вывод отсутствующих значений и нормализацию данных, которая преобразует разрозненные наборы данных в однородную базу данных.

Отсюда тщательно идентифицированный алгоритм машинного обучения от SPA будет выполнять описательный, предсказательный и предписывающий анализ, предоставляя информацию о клиентах, которая глубоко скрыта годами.

Как начать

Объединение больших данных и машинного обучения для получения наилучшей информации о клиентах осуществляется с помощью шестиэтапного процесса.

Понимание бизнеса и ваших данных

Начните с понимания бизнес-проблемы, которую необходимо решить, а также сильных и слабых сторон существующих источников данных.

Креативность специалиста по данным жизненно важна на этом этапе из-за необходимости тщательного преобразования бизнес-задач в проблемы науки о данных. Если все сделано правильно, бизнес-проблема теперь может быть проанализирована относительно ожидаемой ценности, что позволит специалистам по данным разложить ее на задачи интеллектуального анализа данных.

Второй шаг — понимание данных. Знание сильных сторон и ограничений существующих данных жизненно важно, поскольку различные наборы данных могут содержать разную информацию и степень достоверности.

Возможно, для решения бизнес-задачи потребуется приобрести некоторые записи, так что будьте к этому готовы. Оценка затрат и выгод каждого источника — еще один важный этап объединения больших данных и машинного обучения.

Подготовьте данные и определите подходящую модель машинного обучения.

Далее следует подготовка данных и моделирование. Здесь выполняется преобразование и нормализация данных для объединения данных из различных источников, как структурированных, так и неструктурированных.

Эти данные подвергаются исследовательскому анализу данных (EDA) для определения наиболее подходящего алгоритма обучения, шаблонов классификации данных, прогнозов и кластеризации. В совокупности это определяет вашу модель машинного обучения.

Создание модели белого ящика — лучший способ показать отношения между данными и увидеть, действительно ли модель отражает реальность системы, из которой она была получена. В качестве подсказки идеально начать с простой модели и постепенно совершенствовать ее по мере изучения данных.

Оценка и развертывание модели

После того, как модель установлена, ее необходимо оценить, чтобы получить достоверную уверенность в том, что она удовлетворяет бизнес-целям.

Помните, что целью науки о данных является создание и поддержка DDD, поэтому выполнение как качественных, так и количественных оценок идеально.

Например, методы оценки модели, такие как чувствительность и специфичность, позволяют ученым, работающим с данными, узнать вероятность того, что модель получит истинные положительные и истинные отрицательные значения. С точки зрения непрофессионала, он измеряет способность модели правильно классифицировать свои данные, что очень полезно для зрелости модели машинного алгоритма.

Последним шагом является развертывание модели в производственной системе. Как правило, модель необходимо оптимизировать, чтобы она соответствовала производственной среде, чтобы соответствовать требованиям производительности и совместимости.

Вот почему специалисты по обработке и анализу данных обычно начинают с прототипа, а разработчики проверяют, как он будет работать после запуска. Помните, что рекомендуется заранее привлекать разработчиков к любому проекту больших данных с машинным обучением, чтобы они могли выступать в качестве консультантов, предоставляя критически важную информацию команде специалистов по обработке и анализу данных.

Ключ на вынос

Сочетание больших данных и машинного обучения — будущее принятия решений на основе данных. Чтобы раскрыть лучшие идеи клиентов, организациям не нужно привлекать компании, занимающиеся исследованиями рынка, нанимать дорогих консультантов или покупать отраслевые отчеты.

Все, что им нужно, похоронено в этих устаревших системах, общих папках, сайтах социальных сетей и даже в старых пыльных картотеках бухгалтерского отдела. Путь к DDD — это не прогулка по парку; однако очень важно начать работать над этим до того, как это сделает ваш конкурент.

Информация о клиентах — это не просто дорогой товар; это определит положение компании в рыночной гонке и ее будущее.

Первоначально опубликовано на www.techwebspace.com 31 марта 2018 г.