Сколько реальных данных нам действительно нужно?
Это краткое изложение исследования – лишь одно из многих, которые еженедельно публикуются в информационном бюллетене для ученых, занимающихся искусственным интеллектом. Чтобы начать получать еженедельную рассылку, зарегистрируйтесь здесь.
Модели глубокого обучения принесли много прорывов в задачах компьютерного зрения, включая обнаружение объектов, сегментацию сцены, анализ толпы, автономное вождение и многое другое.
Для моделей глубокого обучения требуется большой объем данных, а аннотация является дорогостоящей и чрезвычайно утомительной. Таким образом, синтетические данные используются в качестве альтернативы. Но каковы последствия замены реальных данных синтетическими данными?
Анализ эффективности обнаружения объектов с использованием синтетических и реальных данных
Исследователи глубоко изучили последствия замены реальных данных синтетическими. Они анализируют влияние ограниченного количества реальных данных на создание надежных моделей.
Они используют несколько синтетических и реальных наборов данных вместе с инструментом моделирования для создания больших объемов недорогих аннотированных синтетических данных. Они анализируют доменное сходство каждого из этих наборов данных и дают представление о разработке процедуры обучения глубоких сетей с использованием наборов данных.
Возможное использование и эффекты
В этой статье исследователи подробно проанализировали эффекты обучения с использованием наборов данных с большим количеством синтетических данных и небольшим количеством реальных данных. Точная настройка синтетической модели обучения с ограниченными реальными данными дает лучшие результаты, чем смешанное обучение.
Исследование дает представление об основной динамике между реальными и синтетическими данными и направляет будущие исследования на создание экономически эффективных процедурных методологий для обучения нейронных сетей с использованием меньших объемов реальных данных.
Подробнее: https://arxiv.org/abs/1907.07061
Спасибо за чтение. Пожалуйста, комментируйте, делитесь и не забывайте подписаться на нашу еженедельную рассылку, чтобы получать самые свежие и интересные исследовательские работы! Вы также можете следить за мной в Twitter и LinkedIn. Не забудьте поставить 👏, если вам понравилась эта статья. Ваше здоровье!