Недавно я получил сертификат AWS Certified Machine Learning — Specialty (MLS-C01), мой девятый сертификат AWS. Поскольку несколько коллег спрашивали меня о моей подготовке, я подумал, что поделюсь этим с сообществом, не разглашая, конечно, никаких деталей экзамена.

Необходимый опыт

Несколько сертификатов AWS можно получить с минимальным практическим опытом работы с AWS или без него, но с отличными навыками краткосрочного запоминания. Несмотря на то, что технически вы заработали сертификат, вы, безусловно, не сможете практиковать конкретную дисциплину. Сертификация не равно квалификация.

На мой взгляд, сертификационный экзамен AWS Certified Machine Learning — Specialty не из тех, где простое заучивание учебных материалов само по себе гарантирует проходной балл. Если вам не хватает практического опыта в науке о данных, машинном обучении, базовой статистике или анализе данных на AWS, вам будет сложно сдать этот экзамен, независимо от того, сколько вы зубрежете.

Сертифицированная AWS аналитика данных — специальность

Чтобы подготовиться к экзамену Машинное обучение — специальность, я настоятельно рекомендую сначала получить сертификат AWS Certified Data Analytics — Specialty. Согласно машинному обучению — конспект содержания экзамена по специальности, Область 1: инженерия данных составляет 20% баллов за экзамен. Понимание сервисов AWS Analytics и того, как они интегрируются для формирования наиболее эффективных конвейеров данных для обучения вашей модели машинного обучения, является требованием для этой части вопросов экзамена. Подготовка к сертификации Data Analytics — Specialty предоставит следующие знания в смежной области:

  • Амазонка Афина
  • Amazon EMR (pka Amazon Elastic MapReduce)
  • Amazon IAM
  • Amazon Kinesis Data Analytics, Data Firehose, потоки данных, видеопотоки
  • Амазонка Красное смещение
  • Амазонка S3
  • Amazon VPC
  • Конвейер данных AWS
  • Сканеры AWS Glue, вакансии, каталог данных
  • АВС Лямбда
  • Пошаговые функции AWS

Учебная литература

В моем случае успех сертификации был результатом практического опыта, курсовой работы, завершения и проверки результатов нескольких практических экзаменов и большого количества заметок. Ниже приводится список учебных материалов, которые я считаю наиболее эффективными:

Документация

Для подготовки я изучил документацию по Amazon SageMaker и другим полностью управляемым сервисам AI/ML AWS.

  1. Внимательно ознакомьтесь с разделом Выбор алгоритма в Руководстве разработчика по Amazon SageMaker. Согласно плану содержания экзамена, Область 3: Моделирование составляет 36% баллов за экзамен. Поймите 1) рекомендуемые варианты использования для каждого из встроенных алгоритмов SageMaker, 2) необходимые гиперпараметры алгоритма и 3) предписанные метрики оценки модели и методы настройки. Встроенные алгоритмы SageMaker, наиболее часто используемые в большинстве учебных материалов, включают:
  • Табличный
     – XGBoost (экстремальное ускорение градиента)
     – Linear Learner – K-ближайшие соседи (KNN) – Машины факторизации – Object2Vec
  • Видение
    - Классификация изображений
    - Обнаружение объектов
    - Семантическая сегментация
  • Кластеризация
    — K-средние
  • Прогноз временных рядов
    — DeepAR
  • Классификация и встраивание текста
    - BlazingText
  • Преобразование текста
    — последовательность в последовательность (Seq2Seq)
  • Текстовое тематическое моделирование
     – Нейронное тематическое моделирование (NTM)
     – Скрытое распределение Дирихле (LDA)
  • Уменьшение размерности
    — анализ главных компонентов (PCA)
  • Обнаружение аномалий
    — Random Cut Forest (RCF)
    — IP Insights
  1. AWS также использует Читать документы. Раздел SageMaker Алгоритм особенно полезен при подготовке к экзамену Машинное обучение — специальность: обработка изображений, обработка текста, обработка временных рядов, обучение с учителем, обучение без учителя и алгоритмы разработки признаков.
  2. Наряду с алгоритмами ознакомьтесь с документацией SageMaker Развертывание моделей для вывода. Согласно плану содержания экзамена, Область 4: Внедрение и эксплуатация машинного обучения составляет 20% баллов за экзамен. Изучите возможности SageMaker для обслуживания моделей, управления версиями моделей, стратегий развертывания и мониторинга конечных точек.
  3. Ознакомьтесь с документацией Руководства разработчика полностью управляемых сервисов AI/ML AWS для следующих сервисов:
  • Расширенный ИИ Amazon
  • Amazon CodeGuru
  • Амазонка понять
  • Прогноз Амазонки
  • Детектор мошенничества Amazon
  • Амазонка Кендра
  • Амазонка Лекс
  • Амазонка персонализировать
  • Амазонка Полли
  • Признание Амазонки
  • Амазонка Текст
  • Амазонка Расшифровка
  • Амазон Переводчик

Разберитесь в вариантах использования каждой из этих служб и, что наиболее важно, в том, как эти управляемые службы можно комбинировать для создания более сложных решений AI/ML. Например, создание переводчика речи в режиме реального времени с помощью Amazon Transcribe, Amazon Translate и Amazon Polly.

Онлайн-курсы

Для подготовки я прошел три курса Удеми. Большинство этих онлайн-курсов регулярно поступают в продажу по цене 25 долларов или меньше.

  1. AWS Certified Machine Learning Speciality 2022 — Hands On!, Фрэнк Кейн и Стефан Маарек. И Фрэнк, и Стефан хорошо известны в отрасли и пользуются уважением в качестве тренеров. Я рекомендую просмотреть разделы алгоритма, оценки модели и высокоуровневых сервисов ML более одного раза (разделы 5 и 6).
  2. Специализация по машинному обучению, сертифицированная AWS (MLS-C01), Чандра Лингам. Не увлекайтесь мельчайшими деталями кода Python; сосредоточиться на принципах машинного обучения более высокого уровня. Этот курс также содержит полноценный практический экзамен.
  3. Специализация по машинному обучению, сертифицированная AWS: 3 ПРАКТИЧЕСКИХ ЭКЗАМЕНА, Абхишек Сингх. Ничто не сравнится с полноценными практическими экзаменами и обучением на своих ошибках.
  4. Специальные практические тесты машинного обучения, сертифицированные AWS Whizlabs. Я сдал несколько небольших практических экзаменов Whizlabs, но из-за ограниченного времени я решил пройти полноценные практические тесты Udemy. Некоторые из вопросов Whizlabs казались не относящимися к теме экзамена и другим учебным материалам, которые я просматривал.

Книги

Для подготовки я прочитал или перечитал три книги, две из Packt и одну из O’Reilly.

  1. Сертифицированная специальность AWS по машинному обучению: Руководство по сертификации MLS-C01, Соманат Нанда и Уэсли Моура (Packt Publishing). Рекомендую, если у вас есть время только на одну книгу.
  2. Практическая статистика для специалистов по данным, 2-е издание, Питер Брюс, Эндрю Брюс, Питер Гедек (O’Reilly Media). Согласно Университету Сан-Диего, Статистика (или статистический анализ) лежит в основе каждого алгоритма машинного обучения. В этой книге рассматриваются многие основные статистические концепции машинного обучения, рассматриваемые на экзамене. :
  • СИНИЙ
  • Метрики классификации: кривая Precision-Recall, кривая ROC, AUC
  • Матрица путаницы: TP, FP, TN, FN, точность, точность, отзыв (чувствительность), специфичность, F1
  • Коррелированные переменные, Мультиколлинеарность
  • Распределения: нормальное (гауссовское или «гауссовая кривая»), бернуллиевское, биномиальное, пуассоновское
  • Метод локтя
  • Обучение ансамблю: бэггинг, бустинг
  • Евклидово расстояние
  • K-кратная перекрестная проверка
  • Регуляризация L1/L2 (лассо, альфа, гребень, лямбда)
  • Переоснащение, недообучение, высокое смещение, высокая дисперсия, компромисс между смещением и дисперсией
  • Графики: гистограммы, коробчатые диаграммы, диаграммы рассеяния
  • Показатели регрессии: MAE, MSE, RMSE, R-квадрат, скорректированный R-квадрат
  • Остатки
  • УДАР
  • Стандартное отклонение, правило трех сигм/эмпирическое/68–95–99,7
  • Z-оценка
  1. Машинное обучение Python — третье издание, Себастьян Рашка и Вахид Мирджалили (Packt Publishing). Обратите внимание, что эта книга гораздо глубже погружается в низкоуровневые статистические основы машинного обучения, чем это требуется для экзамена, исходя из плана экзамена. Опять же, не увлекайтесь мельчайшими подробностями Python; сосредоточиться на принципах машинного обучения более высокого уровня.

Планирование экзамена

Последний совет относительно того, когда сдавать экзамен. Я сдал 15 экзаменов AWS из девяти сертификаций AWS и нескольких повторных сертификаций. Хотя экзамен Certified Machine Learning — Specialty сложен, я обнаружил, что изменение времени, в течение которого я сдавал экзамен, значительно снизило мой уровень стресса. Раньше я брал выходной в рабочий день, чтобы сдать экзамены лично или дома с помощью онлайн-прокторинга. Я готовился к экзамену, и меня часто отвлекали по работе. Для этого экзамена я выбрал онлайн-прокторинг и сдал экзамен в 6:00 утра в воскресенье. Вставать пораньше, бодрым и полным энергии, без перерывов на работу или семью, без газонокосилок, лая собак или грохота мусоровозов, и без проблем с пропускной способностью Интернета. Я закончил к 9:00 и завтракал с семьей.

В этом блоге представлена ​​моя собственная точка зрения, а не точка зрения моего работодателя, Amazon Web Services (AWS). Все названия продуктов, логотипы и торговые марки являются собственностью соответствующих владельцев.