Помимо множества практических преимуществ, мы любим машинное обучение (ML) за то удовольствие, которое оно приносит за счет волшебной производительности найденных и реализованных решений для задач, сопровождающих различные аспекты жизненного цикла модели ML. Имея более чем полувековую историю развития в темпе закона Мура, искусственный интеллект (ИИ) и машинное обучение все еще имеют неизведанные глубины, которые необходимо улучшить для повышения производительности и впечатляющих результатов. Активное и упреждающее обучение - чудесные методы задействования ИИ для обучения ИИ.

Активное обучение (AL) - это типовая методика обучения с учителем. Начиная с самого начала - в основном итерация обучения модели состоит из подачи помеченных данных на входы, оценки результата (прогноз или вывод) и корректировки весов и смещений модели. Затем итерация повторяется со следующей помеченной выборкой данных. После нескольких итераций модель оценивается путем подачи в нее некоторых немаркированных данных из отдельного пула, подготовленного заранее вместе с пулом обучающих данных. Затем он переходит в производство или возвращается к другому набору итераций обучения.

Ключ к модели, достаточно хорошей для реальных задач, - это качество обучения пул данных (мы еще вернемся к нему) и качество разметки.

Для маркировки образцов данных требуется опыт в предметной области, а в более сложной области - более глубокая (и более дорогая) экспертиза и больше времени на выборку. Например, в биомолекулярных исследованиях маркировка одного образца занимает до 15 секунд. Представьте себе головную боль, связанную с разметкой тысяч образцов за одну итерацию обучения. Здесь на помощь приходит активное обучение, направленное на то, чтобы свести к минимуму время присутствия эксперта в предметной области в цикле обучения. Суть в том, чтобы использовать так называемые стратегии запросов, чтобы передать эксперту наиболее информативные (а значит, наиболее полезные для обучения) образцы для разметки. Эти стратегии запросов поддерживаются статистическими алгоритмами или алгоритмами ИИ, такими как, например, запрос комитета специально обученных моделей ИИ.

Другой момент применения интеллектуальных методов в цикле активного обучения - это этап проверки модели - аналогичные методам стратегии запросов, называемым стратегиями выбора, используются для выбора наиболее значимых немаркированных выборок из пула данных проверки в пул данных обучения. , поддерживая качество последнего.

Короче говоря, Активное обучение - это контролируемое обучение ИИ с ИИ (и эксперт в курсе). См. Иллюстрацию 1 для схематического отображения цикла AL.

Хорошо, с обучением закончили, перейдем к производству. С этим тоже есть адская история, но, допустим, мы прошли через это - модель работает на производстве. Как и в жизни человека, тренировки не способны идеально подготовиться к реальной жизненной среде. Объем обучающих кейсов ограничен и зависит от квалифицированного выбора репетитора, которым в нашем случае является ML-инженер. Например. вы обучили процессор естественного языка (NLP). Насколько он подготовлен к культурным особенностям? Как насчет рифмы кокни?

Для более сложных задач, таких как обнаружение финансового мошенничества или выявление заболеваний на ранней стадии, такие случайные новшества (на самом деле они являются отклонениями от ожидаемых производственных условий) невидимы невооруженным глазом, что приводит к непредсказуемым выводам о результатах работы приложения. Этот вывод в основном ошибочен, и ошибка распространяется на все последующие процессы и операции в зависимости от приложения ML.

Было бы совершенно неплохо, если бы приложение ML могло реагировать на такие ситуации и учиться реактивно и проактивно, предотвращая возникновение ошибок или, в случае их возникновения, повторение.

Для этого потребуются возможности для трех функций:

  • обнаружение аномалий, дрейфов новинок и концепций и создание пула высококачественных образцов для переподготовки,
  • переподготовка (активное переобучение),
  • внедрять новую версию модели в производство на ходу.

Активное [пере] обучение сегодня - это хорошо известная практика, так что здесь никаких проблем. Немного сложнее ситуация с обнаружением аномалий и безударным повторным развертыванием на ходу. Но хорошие новости - решения для них появились на рынке операций по машинному обучению. Существуют среды, созданные для работы в любых инфраструктурных помещениях и позволяющие выполнять оперативное развертывание столько раз в день, сколько необходимо. Эти среды могут быть легко интегрированы с решениями для мониторинга, реализованными на основе статистических методов и алгоритмов на основе машинного обучения (например, GAN, MADE) для обнаружения аномалий, отклонений концепций и ошибок во входных и выходных производственных пространствах. Вуаля - магия, и, похоже, свобода воли - последнее, что отличает человека от многослойного перцептрона;)

Большое спасибо Ринату Гарееву за его вклад в эту статью.

Ссылки:

  1. Чен И и др., 2013 г., «Применение активного обучения к высокопроизводительным алгоритмам фенотипирования для данных электронных медицинских карт», J Am Med Inform Assoc, 2013; 20: e253 – e259. DOI: 10.1136 / amiajnl-2013–001945
  2. Льюис Д., Катлетт Дж., 1994, Выборка неоднородной неопределенности для обучения с учителем. Труды одиннадцатой международной конференции по машинному обучению; 1994.
  3. Лукас Бевальд, создание второй компании по разработке инструментов машинного обучения, десять лет спустя, 2018 г., [онлайн], https://medium.com/@l2k/starting-a-second-machine-learning-tools-company-ten-years -later-21a40324d091
  4. Пушкарев С., 2018, Мониторинг AI с AI, 2018, выступление ODSC East 2018, [онлайн-видео], https://www.youtube.com/watch?v=4M_3oZlc2B4
  5. Смит К., Хорват П., 2014 г., Стратегии активного обучения для фенотипического профилирования экранов с высоким содержанием контента - Журнал биомолекулярного скрининга, 2014 г., Vol. 19 (5) 685–695