Было показано, что машинное обучение является чрезвычайно полезным и мощным способом обучения компьютеров. Единственное требование состоит в том, чтобы у алгоритма было достаточно данных для обучения и понимания, потому что для раскрытия шаблонов требуется много информации. Но что, если у нас нет доступа к таким данным? Что, если нам нужно предсказывать чрезвычайно редкие заболевания, практически не имея данных, на которых можно было бы учиться? Обычных методов машинного обучения и глубокого обучения недостаточно. Однако, к счастью, этой проблеме посвящена целая область исследований: обучение с нулевым выстрелом.

Zero-shot Learning — это метод обучения, при котором алгоритм пытается классифицировать образец в категорию, которая ранее не обучалась во время обучения. Хотя поначалу это кажется невозможным, представьте себе этот сценарий. Ребенок, изучающий разные виды животных, досконально понял, как выглядит лошадь. Если бы ребенок не видел, как выглядит зебра, родитель сказал бы, что зебра — это, по сути, лошадь с черными и белыми полосами. В этой ситуации ребенок, скорее всего, все равно сможет отличить лошадь от зебры и любого другого животного с технически «нулевыми» данными. Это тот же принцип, который применяется к обучению с нулевым выстрелом. Предоставляя программе некоторую вспомогательную информацию в дополнение к обучению, которое она уже сделала, будь то текстовая информация или атрибуты, программа все еще может классифицировать новую метку.

Однако, к сожалению, не любая модель может обучиться с нуля для классификации новых вещей. Модель должна быть создана с расчетом на то, что ей может потребоваться классифицировать новые метки с помощью некоторой дополнительной информации. Таким образом, каждая из ранее обученных меток также должна иметь о себе некоторую информацию, аналогичную возможным новым меткам. Например, в Computer Vision, если создается новый алгоритм для фотографирования птицы и классификации ее видов, каждая метка птицы может содержать информацию о ее цвете, форме клюва и размере, которую он может использовать во время обучения. Таким образом, новые птицы могут быть объяснены модели с помощью аналогичных определений, описывая при этом совершенно новый вид.

Zero-shot Learning действительно является революционной идеей, которая сломала так много предубеждений относительно ограничений машинного обучения. Хотя это может быть не так идеально, как доступ к большому количеству размеченных данных, это все же удивительно ценно, поскольку у него есть потенциал для применения везде, где ранее машинное обучение не могло быть частью.

Ссылки: