Байесовское концептуальное обучение:

Применения: обнаружение мошенничества с кредитными картами, фильтрация спама, медицинская диагностика, онлайн-обучение.

Чтобы использовать байесовское обучение, нам нужно понимать вероятность, априорную и апостериорную вероятность. Есть разные способы понять эту концепцию, но я понял это, играя в игру. Итак, давайте поиграем в игру.

Я ведущий игры «Угадай следующее число». Участники выбирают коробку, которую нужно открыть, и внутри этой коробки находится число. Допустим, первое число D = {5}, теперь каждому участнику предлагается угадать следующее число. Чтобы упростить игру, мы говорим, что числа в каждом поле находятся в диапазоне от [1100] включительно.

Предположение участника о следующем числе можно обобщить как гипотезу H.

H = (число — нечетное число, число кратно 5, число — следующее целое число)

После 5 раундов участники видят следующие числа D: {5,25,15,45,35}. Предположение участника о следующем числе после 5 раундов можно обобщить как H = (следующее число кратно 5 (H1) и следующее число нечетно (H2)), с максимальным количеством голосов за H1.

Таким образом, возникает вопрос, если следующая коробка однородна и выбрана случайно, как участники могут оценить ее кратность 5? D также может представлять набор нечетных чисел. Так почему нечетные числа? Ответ на этот вопрос: Вероятность.

Вероятность позволяет нам твердо верить в гипотезу, которая подтверждается данными. Причина, по которой среди участников существует твердое убеждение, что следующее число кратно 5, заключается в принципе размера. Принцип размера определяется соотношением [1/размер(h)] ^ N.

где size(h) — длина множества для гипотезы H, например, если наша гипотеза кратна 5, то множество включает {5,10,15,20…100}, длина множества равна 20 и N — общее количество точек данных в D.

Давайте посмотрим, как это работает:

В первом раунде, когда D = {5}

P(D|H1) = [1/20]^ 1 = 0.05

P(D|H2) = [1/50]¹ = 0.02

После 5 раундов при D = {5,25,15,45,35}

P(D|H1) = [1/20]⁵ = 3.125e-7

P(D|H2) = [1/50]⁵ = 3.2e-9

Следовательно, из приведенного выше уравнения мы видим, что вероятность H1 выше, чем вероятность H2. Следовательно, участники сильнее верят в то, что следующее число кратно 5.

Следующий вопрос: как участники пришли к этой гипотезе? Ответ на этот вопрос: до. Это субъективная и противоречивая часть байесовского рассуждения. Тем не менее, это также позволяет быстро учиться, используя базовые знания по проблеме. Он представлен как вероятность вашего предыдущего убеждения. В приведенном выше наборе данных D другая гипотеза H3 может быть кратна 5, за исключением кратности 10. Однако для этой неестественной концепции мы можем дать более низкую априорную вероятность, в то время как концепция, кратная 5, может иметь более высокую априорную вероятность. .

По мере получения новой информации мы хотели бы обновить нашу априорную вероятность. Это достигается за счет апостериорного. Это вероятность, умноженная на предыдущую, нормализованная. Следовательно, после определения вероятности, априорной и апостериорной вероятности мы теперь можем использовать байесовский метод для оценки следующего числа. Этот метод обучения называется байесовским обучением.

Приведенный выше пример вдохновлен Тененбаумом, Дж. Б. (2000). Правила и сходство в понятийном обучении. В Достижениях в области нейронных систем обработки информации (стр. 59–65).