Приложение, которое я хочу создать, требует технологии компьютерного зрения, поэтому я искал ее и
узнал о платформе Vision, поэтому я кратко изложил ее.

🔥 Что такое Vision Framework?

Vision Framework — это фреймворк, анонсированный вместе с coreML на WWDC в 2017 году.

  • распознавание лиц
  • Возможность отслеживать лицевые ориентиры
  • Как и LiveText в iPhone, возможность поиска текста на фотографии
  • Общая регистрация изображений, функция отслеживания

Алгоритмы компьютерного зрения можно применять к изображению или видео для выполнения различных функций, таких как выше.

🤔 Отличия от OpenCV

openCV также является одной из самых популярных сред компьютерного зрения.

  • Он поддерживает несколько языков, но, к сожалению, Swift не поддерживается.
    Однако, поскольку инфраструктура видения была разработана Apple, она поддерживает Swift. Разве это не более совместимо со Swift? 🤔
  • OpenCV — это внешняя платформа, поэтому ее необходимо устанавливать отдельно, но платформа Vision
    import Visionзавершена всего одним кодом.

📖 Пайплайны в фреймворке Vision

Трубопроводы состоят из частей

запрос

  • VNRequest

обработчик

  • VNImageRequestHandler: используется при работе с неподвижными изображениями.
  • VNSequenceRequestHandler: Обратите внимание на последовательность. Используется при работе с последовательностями изображений (видео)

результат

  • VNObservation
  1. VNRequestЗапрос, сделанный с подклассом, передается обработчику.
  2. обработчик может быть VNImageRequestHandlertypeVNSequenceRequestHandler
  3. Обработанный результат VNObservationвозвращается как подкласс .

Например, если в качестве запроса получен тип VNRequest, который является подклассом, тип, который является подклассом, возвращается в качестве возврата.VNDetectFaceRectanglesRequestVNObservationVNFaceObservation

В другом примере это формат VNDetectContoursRequest, в котором принимается запрос, а возвращается VNContoursObservation.

Автор XCoder| ЛинкедИн | Средний | Гитхаб