Мнение

Многообещающие сквозные платформы машинного обучения: почему универсальные решения не всегда работают

Важность настройки и гибкости в инфраструктуре машинного обучения

В прошлом году мой почтовый ящик заполонили компании MLOps, пытающиеся продать свою универсальную инфраструктуру. Но не только там, по сравнению с доковидными годами, среди экспонентов на конференциях также доминировали платформы ML (Ops). Вы также можете найти много спама под каждой соответствующей статьей здесь, на Medium, и даже платный семинар был просто демонстрацией продаж от такой компании. Хотя я обычно открыт для новых продуктов, слишком много обещаний, и эта статья о том, как важно оставаться независимым.

MLOps — это DevOps + ML

MLOps, или операции машинного обучения, сочетают разработку программного обеспечения и машинное обучение, позволяя организациям развертывать модели машинного обучения и управлять ими масштабируемым и надежным образом с использованием принципов DevOps. Одна из критических проблем с MLOps заключается в том, что обучение, развертывание, интеграция и мониторинг моделей связаны с уникальным набором потребностей и требований. Платформа, которая хорошо работает для одной компании, может не обязательно подходить для другой, даже если они работают в одной отрасли. Каждая организация имеет уникальные источники данных, бизнес-процессы и наборы технологий.

Отсутствие функций

Большинство продуктов MLOps предлагают упрощенную версию AWS, GCP или Azure. Несмотря на то, что изучение конфигураций AWS (или GCP/Azure), таких как роли AMI, сети, EC2, Lambda и технологии для обработки этого (например, терраформирование), является болезненным, возможности велики, и вся эта борьба дает вам шанс построить высокоиндивидуальную систему. Кроме того, вы повышаете квалификацию своих инженеров и готовите их к работе в облаке. Поэтому эта статья направлена ​​не против облака, а против полностью интегрированных решений от одного поставщика.

Эти платформы ML/MLOPs пытаются упростить использование облака, абстрагируя детали в повседневные варианты использования и соединяя все части. Речь идет об аутсорсинге вашей инфраструктуры машинного обучения. Пока вы работаете только с этими простыми вариантами использования, все будет в порядке, и в этом случае вам следует обратить внимание на эти платформы.

К сожалению, машинное обучение в продакшене редко вписывается в эти игрушечные варианты использования. По моему опыту, это очень похоже на науку о данных в академических кругах и данные в отрасли. Все начинается с того простого факта, что некоторые платформы машинного обучения поддерживают только Python, и это ограничение уже должно настораживать. Кроме того, некоторые из них не позволяют различать рабочие нагрузки Batch и API. Некоторые не поддерживают графические процессоры; некоторые даже ограничивают ваш выбор алгоритмов предварительно реализованным списком или не позволяют сохранять ваши данные в соответствии с требованиями GPDR. Список длинный, и я хочу сослаться на этот репозиторий для сравнения.

Заперты в технологии, финансируемой венчурным капиталом

Но я не особо зацикливаюсь на функциях в целом. Вы можете найти решение, которое в настоящее время идеально соответствует вашим потребностям, но что, если в какой-то момент ваши требования изменятся, а они больше не изменятся? Вы бы параллельно построили вторую специализированную систему? Вы бы перешли на другую платформу? И даже если вы выберете многофункционального и самого дорогого провайдера, как вы думаете, стоит ли долгосрочная блокировка?

Платная дорогая платформа машинного обучения может быть не самым экономичным решением, особенно для молодой компании. Эти платформы могут быть дорогостоящими, и, как и большинство венчурных платформ, они работают за счет низких первоначальных затрат, сжигая много денег от инвесторов до тех пор, пока они не завладеют своими клиентами (привязка к поставщику). -в). В какой-то момент они должны получить прибыль, и угадайте, кто за это платит? Аутсорсинг MLOps этим поставщикам SaaS потенциально может быть очень дорогим.

Победы с открытым исходным кодом

Благодаря индивидуальному подходу с открытым исходным кодом организации могут легко интегрировать свою инфраструктуру машинного обучения со своими существующими системами, что позволяет им быстро и легко развертывать модели и управлять ими, не нарушая существующих операций. Это дорого обходится, для этого нужны люди.

Конечно, вокруг много инструментов, которые не стоит создавать самостоятельно. Для стандартных случаев использования некоторые решения стоит купить; прием данных, отслеживание экспериментов, мониторинг и многое другое. Большинство из них даже имеют открытый исходный код и доступны как управляемые сервисы. Обычно за этими инструментами стоит консультационный бизнес, и вы можете заплатить им за помощь в создании и масштабировании вашей системы. Но эти инструменты, как правило, взаимозаменяемы, и вы можете свести к минимуму риск быть заблокированными, и вы все еще принимаете решение о своей архитектуре машинного обучения. Вы покупаете не весь стек, а части.

Кроме того, имейте в виду, что часто существует очевидный конфликт интересов. В то время как поставщики SaaS хотят, чтобы вы тратили больше денег каждый год, часто с помощью модели, основанной на потреблении (оплата за время вычислений, объем данных и т. д.), для них не очень привлекательно снижать ваши счета за счет максимально эффективной обработки данных. .

Заключение

В целом ясно, что MLOps не является универсальным подходом, а платная дорогая платформа машинного обучения редко бывает лучшим или самым дешевым решением. Индивидуальные подходы с открытым исходным кодом предлагают уровень гибкости и адаптируемости, который часто лучше соответствует потребностям компаний и может помочь организациям сэкономить деньги, покупая инструменты, которые им действительно нужны.