Приложение, которое я хочу создать, требует технологии компьютерного зрения, поэтому я искал ее и
узнал о платформе Vision, поэтому я кратко изложил ее.
🔥 Что такое Vision Framework?
Vision Framework — это фреймворк, анонсированный вместе с coreML на WWDC в 2017 году.
- распознавание лиц
- Возможность отслеживать лицевые ориентиры
- Как и LiveText в iPhone, возможность поиска текста на фотографии
- Общая регистрация изображений, функция отслеживания
Алгоритмы компьютерного зрения можно применять к изображению или видео для выполнения различных функций, таких как выше.
🤔 Отличия от OpenCV
openCV также является одной из самых популярных сред компьютерного зрения.
- Он поддерживает несколько языков, но, к сожалению, Swift не поддерживается.
Однако, поскольку инфраструктура видения была разработана Apple, она поддерживает Swift. Разве это не более совместимо со Swift? 🤔 - OpenCV — это внешняя платформа, поэтому ее необходимо устанавливать отдельно, но платформа Vision
import Vision
завершена всего одним кодом.
📖 Пайплайны в фреймворке Vision
Трубопроводы состоят из частей
запрос
VNRequest
обработчик
VNImageRequestHandler
: используется при работе с неподвижными изображениями.VNSequenceRequestHandler
: Обратите внимание на последовательность. Используется при работе с последовательностями изображений (видео)
результат
VNObservation
VNRequest
Запрос, сделанный с подклассом, передается обработчику.- обработчик может быть
VNImageRequestHandler
typeVNSequenceRequestHandler
- Обработанный результат
VNObservation
возвращается как подкласс .
Например, если в качестве запроса получен тип VNRequest
, который является подклассом, тип, который является подклассом, возвращается в качестве возврата.VNDetectFaceRectanglesRequestVNObservationVNFaceObservation
В другом примере это формат VNDetectContoursRequest
, в котором принимается запрос, а возвращается VNContoursObservation
.