Являются ли ваши собранные данные бесполезными после GDPR?

Как мобильные компании могут собирать данные о компьютерном зрении без удаления личной информации

Будущее автономного вождения зависит от способности транспортных средств самостоятельно участвовать в повседневном движении. Алгоритмы, управляющие каждым транспортным средством, должны быть способны воспринимать окружающую среду в реальном времени и, следовательно, делать правильные выводы. С помощью машинного обучения алгоритмы обучаются на данных уличных сцен, чтобы узнать, как выглядят обычные участники дорожного движения, такие как автомобили и пешеходы, и их последствия.

Этот процесс машинного обучения требует не только очень точных и достоверных данных, но и огромного их количества, что означает миллиарды изображений, отображающих различные дорожные ситуации. В гонке за то, чтобы стать первой компанией, которая запустит на дорогу беспилотный автомобиль, компании, занимающиеся мобильностью, собирают данные о восприятии. Обычно с помощью камер или радарных датчиков, в результате чего получаются двухмерные изображения, видео, трехмерные облака точек или стереовизуальные изображения. Цель состоит в том, чтобы собрать столько изображений транспортных средств и пешеходов, сколько требуется для совершенствования их систем восприятия.

Но вот в чем проблема

Согласно новому Общему регламенту ЕС по защите данных (GDPR), мобильные компании не могут обрабатывать свои собранные данные без согласия каждого человека на этих изображениях. Это влияет на лица и номерные знаки на изображениях, потому что они защищены законом. Это строгое регулирование конфиденциальности данных создает серьезные проблемы с соблюдением нормативных требований. Компании должны иметь возможность использовать накопленные за годы данные и записывать новые наборы данных.

Решение проблемы - нейронные сети

Наши исследователи и разработчики из Understand.ai разработали инструмент для решения проблемы, поставленной законодательным органом GDPR. Анонимайзер UAI от понять.ai - это сервис на основе искусственного интеллекта, который соответствует строгим нормам и автоматически анонимизирует изображения.

Нейронные сети, которые мы используем для анонимайзера UAI, работают на уровне современных сетей обнаружения объектов. Как обычно, качество анонимности во многом зависит от качества данных.

Казалось бы, небольшие улучшения уже существенно влияют на общее качество. Например, оказывается, что обучение специализированных детекторов номеров или лиц вместо комбинированного детектора дает значительно лучшие результаты. При таком подходе также проще собирать и создавать обучающие данные, поскольку не все лица в наборах данных для номерных знаков необходимо обнаруживать, и наоборот. Кроме того, увеличение времени тренировки также важно, чтобы оно не зависело от характеристик камеры, например, разрешения или цветового оттенка. Например, искажение соотношения сторон изображений при обучении имеет большое значение с точки зрения возможности обобщения.

Самым большим фактором повышения качества было аннотирование нашего собственного набора данных. Мы исследовали анонимность на общедоступных наборах данных, но оказалось, что обнаруженные лица часто не были точными, то есть части лиц не анонимизированы или размытая область покрывала большие части оставшегося изображения. Ложные срабатывания и ложные отрицания также представляют собой большую проблему, особенно в общих особых случаях, таких как лицо человека, в значительной степени прикрытое автомобилем.

Благодаря нашему собственному набору данных у нас была возможность аннотировать данные обучения с точностью до пикселя, адаптированные именно к тем случаям, на которых анонимайзер UAI должен был сосредоточиться. С помощью этой техники мы достигли почти идеальной анонимности для номерных знаков и лиц даже в сложных случаях.

В настоящее время мы увеличиваем количество используемых обучающих данных в пять раз, чтобы лучше охватить различные ситуации, такие как различные погодные условия. Мы также находимся в процессе переключения на другую сеть обнаружения возражений - ту, которую мы уже используем для решения других внутренних задач, чтобы еще больше улучшить качество анонимайзера UAI.

Наше решение протестировано на рынке

Недавно понять.ai заключил партнерство с Renovo, чтобы интегрировать наш анонимайзер непосредственно в конвейер обработки данных Renovo AWare, гарантируя, что данные, собираемые автопарками, могут быть анонимными в соответствии с GDPR. Это позволяет последующим приложениям использовать изображения, из которых уже удалена ключевая личная информация. Анонимайзер UAI можно использовать локально или для максимальной производительности в качестве услуги через облачную платформу понять. В обоих случаях мы гарантируем, что он предоставляет данные высочайшего качества в масштабе, необходимом для парка автоматизированных мобильных устройств Renovo.

Начните сегодня

Заинтересованы в том, чтобы ваши информационные активы были жизнеспособными в будущем? Мы предлагаем широкий спектр решений, которые наилучшим образом соответствуют вашим потребностям в анонимности изображений. Вы можете отправить нам свои данные, и мы анонимизируем их для вас в наших системах или создадим индивидуальное решение, чтобы наилучшим образом интегрировать наш анонимайзер для защиты личных данных в ваш рабочий процесс на месте. Свяжитесь с нами сегодня, чтобы узнать больше о том, как ваши информационные ресурсы могут сохранить свою ценность с помощью UAI Anonymizer с действующим GDPR.

Зайдите на понять.ai/UAI-Anonymizer, чтобы узнать больше.