Выводы AI Hardware Summit и Edge AI Summit 2022

AI Hardware Summit проходил с 13 по 15 сентября 2022 года в Santa Clara Marriott, CA. Основное внимание уделяется системному машинному обучению, чтобы сократить время окупаемости в жизненном цикле машинного обучения и открыть новые возможности для разработки ИИ. Это отличное событие — почувствовать пульс ИИ и узнать его границы в 2022 году.

В этом году AI Hardware Summit впервые был совмещен с Edge AI Summit, посвященным экономичному, эффективному и оптимизированному ИИ на периферии. Один пропуск на две конференции. Это отличная возможность для экспертов по искусственному интеллекту собраться вместе и разработать более совершенные технологии.

Вот список того, что мы узнали на двух саммитах:

Edge AI is a huge growth and performance improvement opportunity
AI chips can detect human emotions
TPG can be used for edge AI
Foundation models bring a new era of AI
Next steps for large-scale AI infrastructure

Edge AI — это огромная возможность роста и повышения производительности

Edge AI развертывает приложения ИИ на устройствах по всему физическому миру. Он находится на границе сети, рядом с местом, где находятся данные.

  • Пограничные вычисления могут происходить на устройствах IoT, которые представляют собой интеллектуальные устройства или датчики. Он имеет наименьшую задержку и самую высокую пропускную способность для устройств.
  • Существует несколько уровней периферии с различными возможностями API. Устройства IoT менее функциональны; периферийные устройства с более широкими возможностями — это розничные магазины, фабрики, больницы, аэропорты, железные дороги, умные города, заправочные станции и т. д. Для обработки ИИ более крупные периферийные устройства располагают большей вычислительной мощностью и емкостью хранилища.
  • Облачные, виртуальные или физические центры обработки данных имеют наилучшую среду программирования с точки зрения вычислительной мощности, масштабируемости, безопасности, энергопотребления и хранения. Однако, поскольку облако находится далеко от того места, где находятся данные, оно имеет наименьшую задержку и пропускную способность для доступа к устройствам.

Решение AI не ограничивается одним слоем. Как правило, он охватывает несколько уровней, используя преимущества быстрого реагирования интеллектуальных устройств и расширенные возможности искусственного интеллекта на более мощных границах и в самом мощном облаке.

Например, датчик автомобиля подает звуковой сигнал при обнаружении объекта, а сеть транспортного средства автоматически регулирует направление движения автомобиля, чтобы избежать столкновения. Записи отправляются в центр трафика для предварительной обработки. Все данные агрегируются и обрабатываются в облаке трафика, где рекомендации по вождению отправляются водителям менее срочно.

Пограничный ИИ продвинулся вперед благодаря развитию глубокого обучения (обучение и логический вывод нейронных сетей) и повышению вычислительной мощности. 5G также расширяет возможности устройств IoT благодаря более быстрому, стабильному и безопасному подключению. Edge AI привносит искусственный интеллект в реальные устройства и мощные центры обработки данных. Edge AI — это огромные возможности для роста и повышения производительности.

Чипы ИИ могут обнаруживать человеческие эмоции

Пограничные вычисления могут происходить на устройствах IoT. Существуют традиционные модели ИИ, такие как Регрессионный анализ, Логистическая регрессия, Нейронные сети, Машины опорных векторов, Мультиклассовая классификация и Кластеризация K-средних. Модели Edge AI более специфичны для задач, таких как общие детекторы, высокоскоростные детекторы, классификаторы, плотности, повторная идентификация, средства индивидуальной защиты (СИЗ), тепловые детекторы, обнаружение лиц, идентификация лиц, обнаружение черт лица, сегментация сцены, детекторы скелетов.

Мы видели распознавание лица и черт лица на нескольких стендах. Вот фото, сделанное на стенде BrainChip.

Нейроморфный процессор IP, Akida™, имитирует человеческий мозг для анализа основных входных данных датчиков в точке сбора данных. Это вывод в реальном времени и обучение на периферии с помощью полностью настраиваемого нейронного процессора искусственного интеллекта на основе событий Akida. Делая вывод, чип пришел к выводу, что лицо выше находится в режиме «Счастье». Другие доступные режимы: «Нейтральный» и «Грусть».

Обнаружение объектов важно в периферийном ИИ. Вот два аспекта его текущего состояния:

  • Точность: Исходные изображения, полученные с устройств IoT, могут быть искажены отражением, размытием, загрязнением, снегом, дождем, туманом и т. д. Требуется калибровка для распознавания и классификации объектов. Точность модели постоянно улучшается.
  • Эффективность: аналитика изображений должна осуществляться в режиме реального времени и, вероятно, с высокой частотой кадров. Он включает в себя калибровку географической информационной системы (ГИС) и отслеживание объектов. Пограничные вычисления уменьшают задержку сервера и пропускную способность.

Ниже представлено видео управления толпой, показанное на стенде Mythic.

Он запускает вывод ИИ в реальном сценарии. Он идентифицирует объекты в толпе в режиме реального времени.

Как мы обсуждали в другой статье, развитие технологий должно соответствовать правилам. Общее положение о защите данных (GDPR) — это положение в законодательстве ЕС о защите данных и конфиденциальности. Он защищает людей в отношении обработки персональных данных и свободного перемещения таких данных.

Поскольку процессор ИИ настолько мощен, чтобы считывать наш статус и где-то его хранить, насколько у нас есть конфиденциальность в отношении наших данных? Развивающиеся передовые рынки приносят как возможности, так и проблемы.

TPG можно использовать для Edge AI

Центральный процессор (ЦП) — это электронная схема, которая выполняет инструкции, содержащие компьютерную программу. Он считается мозгом компьютера.

Графический процессор (GPU) — специализированный процессор, предназначенный для манипулирования и изменения памяти с целью ускорения создания изображений в кадровом буфере, предназначенном для вывода на устройство отображения. Графические процессоры используются в играх, рабочих станциях, облаке, обучении ИИ, беспилотных автомобилях и т. д.

Tensor Processing Unit (TPU) — специализированная интегральная схема (ASIC) ускорителя искусственного интеллекта, разработанная Google для машинного обучения нейронных сетей с использованием собственного программного обеспечения Google TensorFlow. Google начала использовать TPU внутри компании в 2015 году, а в 2018 году сделала их доступными для стороннего использования. В июле 2018 года Google анонсировала Edge TPU, предназначенный для запуска моделей машинного обучения для периферийных вычислений.

TPG можно использовать для периферийного ИИ, и все больше поставщиков работают над TPU в качестве ускорителей ИИ.

Базовые модели открывают новую эру ИИ

Машинное обучение было частью искусственного интеллекта. Это изучение компьютерных алгоритмов, которые могут автоматически улучшаться благодаря опыту и использованию данных. Глубокое обучение — это подмножество машинного обучения, нейронная сеть с тремя или более слоями. Глубокое обучение пытается имитировать поведение человеческого мозга, чтобы учиться на больших объемах данных.

ИИ превратился из чисто академической деятельности в силу, приводящую в движение бесчисленное множество отраслей и влияющую на жизнь миллионов людей каждый день. Машинное обучение преобладало в 2000-х, а глубокое обучение — в 2010-х. В 2020-х годах наступает новая эра для моделей фундаментов.

В эту новую эру ИИ стремится заменить модели для конкретных задач, которые доминировали в ландшафте ИИ. Термин основная модель определен Стэнфордским институтом человеко-ориентированного искусственного интеллекта:

В последние годы появилась новая успешная парадигма построения систем ИИ: обучать одну модель на огромном количестве данных и адаптировать ее ко многим приложениям. Мы называем такую ​​модель базовой моделью.

В нем также упоминается, что базовые модели продемонстрировали впечатляющее поведение, но могут неожиданно дать сбой, скрывать предубеждения и плохо изучены. Тем не менее, они развертываются в масштабе. Вот два успешных примера от OpenAI:

  • Generative Pre-trained Transformer 3 (GPT-3) — это модель авторегрессионного языка, которая производит человекоподобный текст. Введите короткую подсказку, и система сгенерирует целое эссе.
  • DALL-E 2 — это новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки из описаний на естественном языке. Заглавное изображение этой статьи было сгенерировано Anupam Chugh с помощью DALL-E 2.

SambaNova продемонстрировала базовую модель платформы DataScale® с четырьмя уровнями предложений: кремний, программное обеспечение, системы и как услуга.

Следующие шаги для крупномасштабной инфраструктуры искусственного интеллекта

По данным International Data Corporation (IDC), глобальные расходы на системы искусственного интеллекта вырастут с 85,3 млрд долларов в 2021 году до более чем 204 млрд долларов в 2025 году. Совокупный годовой темп роста (CAGR) в период 2021–2025 годов составит 24,5%.

Исследователи и разработчики работают над следующими этапами крупномасштабной инфраструктуры ИИ:

  • Аппаратная архитектура важна. Высокопроизводительные компьютеры с ускорителями, оптимизированными для ИИ, должны обеспечивать большую вычислительную мощность для моделей ИИ.
  • Программное обеспечение важнее аппаратного. Программное обеспечение, которое эффективно использует вычислительную мощность, например, для обучения разреженных нейронных сетей, имеет большее значение для разработки ИИ.
  • Среда центра обработки данных с вычислительной мощностью, масштабируемостью, безопасностью, энергией и хранилищем имеет важное значение.
  • Даже охлаждение имеет значение. При наличии высокоплотного вычислительного оборудования среда охлаждения центра обработки данных должна быть продумана до мелочей. Возможны варианты охлаждения наружным воздухом, холодной водой, водой умеренного давления и/или теплой водой.

Заключение

Трехдневные саммиты завершились. Мы узнали, что периферийный ИИ — это огромные возможности для роста и повышения производительности, а развивающиеся периферийные рынки приносят как возможности, так и проблемы.

После машинного обучения и глубокого обучения базовые модели начали новую эру. GPT-3 и DALL-E 2 — масштабные проекты OpenAI. Исследователи и разработчики работают над следующими этапами крупномасштабной инфраструктуры искусственного интеллекта.

Через неделю после AI Hardware Summit и Edge AI Summit 2022 состоялась NVIDIA GTC (GPU Technology Conference), которая показала рубеж ИИ с другой точки зрения.

Спасибо за прочтение.

Want to Connect?
If you are interested, check out my directory of web development articles.

Примечания:

  • Спасибо компании Kisaco Research за приглашение на оба саммита для встречи с экспертами в области искусственного интеллекта и обмена идеями для будущего развития искусственного интеллекта.
  • Спасибо многим спикерам за предоставление материалов для этой статьи.
  • Спасибо многим стендам, которые показали мне отличные продукты ИИ в работе.