100 аннотированных изображений в минуту

Я занимаюсь обнаружением объектов на камерах с фиксированным положением в течение 4 лет, и до прошлой недели меня не поразило, насколько это обеспечивает гибкость. На ум приходит вычитание фона, но я хотел изучить другой способ… способ автоматического создания обучающих данных.

Шаг 1 — Создайте группу

Группы — это, по сути, метки для данных, это может быть человек, оружие, собака, что угодно.

Шаг 2 — Загрузите аватары для объекта, который вы хотите обнаружить.

Когда у вас есть группа, вырежьте изображения PNG примерно одинаковой ширины и высоты. Это будут наши «аватары» для объекта, который нам нужно обнаружить.

Мы собираемся разместить эти аватары вокруг сцены с фиксированной камерой и автоматически сгенерировать данные. Итак, давайте возьмем неподвижный кадр моей гостиной.

затем мы можем настроить, какие аватары мы хотели бы использовать, которые подходят для сцены. Я собираюсь включить их все для простоты.

Шаг 3 — Разместите аватары на сцене

Далее, давайте расположим наши аватары так, чтобы они не выглядели искаженными на сцене. Важно, чтобы все аватары имели одинаковое соотношение сторон, чтобы, когда мы копируем это изменение формы с одного аватара, оно не искажало другие.

После того, как соотношение сторон выглядит хорошо, давайте запишем несколько вероятных путей для этого объекта в сцене.

Вы можете изменить размер по мере продвижения, и каждое новое соотношение сторон будет сохранено для этой позиции. Вы также можете делать несколько объектов одновременно!

И это почти все! Теперь пришло время сгенерировать наши изображения. В настоящее время на 100 изображений уходит около 60 секунд, но это намного лучше ожидания аннотаторов!

Вы можете скачать изображения только в одном формате прямо сейчас, но эта загрузка содержит множество способов более легкого обучения. По умолчанию он совместим с YOLO и Google AutoML, но в будущем может быть легко расширен для поддержки большего количества форматов.

Но как модель справляется с фальшивыми данными? Ну, этот gif вверху был обучен с помощью yolov3 всего на 500 изображениях из генератора, больше он ничего не знал. Есть несколько ложных срабатываний, и он не обнаруживает сидящих людей, но это можно легко исправить с помощью нескольких сидячих аватаров!

дайте мне знать, что вы хотели бы видеть от этого инструмента на twitter!

Эндрю Пьерно
Последние твиты от Эндрю Пьерно (@AndrewPierno): «Мой ответ на вопрос Как программисту необходимо создать…twitter.com

Если вы хотите попробовать это сами, вы можете сделать это здесь:

autobox
Автоматическая генерация данных для алгоритмов обнаружения объектов $7 за 1000 изображений с неограниченным количеством полей на каждом изображении. 5x…autobox.dev

100 аннотированных изображений в минуту

Шаг 1 — Создайте группу

Шаг 2 — Загрузите аватары для объекта, который вы хотите обнаружить.

Шаг 3 — Разместите аватары на сцене

Вопросы по теме