Введение в глубокое обучение

большинство людей ошеломлены объемом доступной информации, связанной с глубоким обучением, моя цель — прояснить ситуацию.

Глубокое обучение

На самом деле, в последние несколько лет искусственный интеллект (ИИ) был предметом интенсивной шумихи в СМИ. Машинное обучение, глубокое обучение и искусственный интеллект упоминаются в бесчисленных статьях, часто не относящихся к технологическим публикациям.

Глубокое обучение — это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями. Эти нейронные сети представляют собой набор алгоритмов, примерно смоделированных по образцу человеческого мозга, предназначен для распознавания образов. Они интерпретируют сенсорные данные посредством своего рода машинного восприятия, маркировки или кластеризации необработанных входных данных. Образцы, которые они распознают, являются числовыми, содержащимися в векторах, в которые должны быть переведены все данные реального мира, будь то изображения, звук, текст или временные ряды.

Анатомия глубокого обучения

глубокое в глубоком обучении не относится к какому-либо более глубокому пониманию, достигаемому с помощью этого подхода; скорее, это означает идею последовательных слоев представлений. Сколько слоев вносят вклад в модель данных, называется глубиной модели.

1. Фундаментальной структурой данных в нейронных сетях является слой. Слой — это модуль обработки данных, который принимает в качестве входных данных один или несколько тензоров и выдает один или несколько тензоров. Некоторые слои не имеют состояния, но чаще слои имеют состояние: веса слоя, один или несколько тензоров, изученных с помощью стохастического градиентного спуска, которые вместе содержат знания сети.

Входной слой содержит необработанные данные (каждую переменную можно рассматривать как «узел»).
На скрытых слоях в нейронных сетях происходит черная магия. Каждый уровень пытается изучить различные аспекты данных, сводя к минимуму функцию ошибки/затрат. Самый интуитивный способ понять эти слои — в контексте «распознавания цифр».
Выходной слой — самый простой, обычно состоящий из одного вывода для задач классификации. Хотя это один «узел», он по-прежнему считается слоем в нейронной сети, поскольку может содержать несколько узлов.

2-функция и метка:функция — это часть информации, которую вы извлекаете из данных, а метка — это тег, который вы хотите присвоить входным данным на основе функций, которые вы извлекаете из них. Функции помогают в присвоении метки. Таким образом, чем лучше характеристики, тем точнее вы сможете назначить метку входу.

3. Функция потерь используется для оптимизации значений параметров в модели нейронной сети. Функции потерь отображают набор значений параметров сети в скалярное значение, которое указывает, насколько хорошо эти параметры выполняют задачу, для которой предназначена сеть.

Алгоритмы 4-оптимизации помогают нам минимизировать (или максимизировать) целевую функцию (другое название функции ошибки) E(x), которая просто математическая функция, зависящая от внутренних обучаемых параметров Модели, которые используются при вычислении целевых значений (y) из набора предикторов(x), используемых в модели. Например, мы называем значения Weights(w) и Bias(b) нейронной сети ее внутренними обучаемыми параметрами, которые используются при вычислении выходных значений и изучаются и обновляются в направлении оптимальное решение, то есть минимизация потерь в процессе обучения сети, а также играют важную роль в процессе обучения модели нейронной сети.

Вывод:

Я надеюсь, что смог немного прояснить это, я буду загружать больше объяснений, потому что почему бы и нет :)

Github, LinkedIn, Захра Эльхамрауи, Upwork

Использованная литература :

[1] Глубокое обучение с помощью Python Франсуа Шолле