Сколько реальных данных нам действительно нужно?

Это краткое изложение исследования – лишь одно из многих, которые еженедельно публикуются в информационном бюллетене для ученых, занимающихся искусственным интеллектом. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.

Модели глубокого обучения принесли много прорывов в задачах компьютерного зрения, включая обнаружение объектов, сегментацию сцены, анализ толпы, автономное вождение и многое другое.

Для моделей глубокого обучения требуется большой объем данных, а аннотация является дорогостоящей и чрезвычайно утомительной. Таким образом, синтетические данные используются в качестве альтернативы. Но каковы последствия замены реальных данных синтетическими данными?

Анализ эффективности обнаружения объектов с использованием синтетических и реальных данных

Исследователи глубоко изучили последствия замены реальных данных синтетическими. Они анализируют влияние ограниченного количества реальных данных на создание надежных моделей.

Они используют несколько синтетических и реальных наборов данных вместе с инструментом моделирования для создания больших объемов недорогих аннотированных синтетических данных. Они анализируют доменное сходство каждого из этих наборов данных и дают представление о разработке процедуры обучения глубоких сетей с использованием наборов данных.

Возможное использование и эффекты

В этой статье исследователи подробно проанализировали эффекты обучения с использованием наборов данных с большим количеством синтетических данных и небольшим количеством реальных данных. Точная настройка синтетической модели обучения с ограниченными реальными данными дает лучшие результаты, чем смешанное обучение.

Исследование дает представление об основной динамике между реальными и синтетическими данными и направляет будущие исследования на создание экономически эффективных процедурных методологий для обучения нейронных сетей с использованием меньших объемов реальных данных.

Подробнее: https://arxiv.org/abs/1907.07061

Спасибо за чтение. Пожалуйста, комментируйте, делитесь и не забывайте подписаться на нашу еженедельную рассылку, чтобы получать самые свежие и интересные исследовательские работы! Вы также можете следить за мной в Twitter и LinkedIn. Не забудьте поставить 👏, если вам понравилась эта статья. Ваше здоровье!