Расчет предельной вероятности с помощью машинного обучения

Сравнение байесовских моделей обеспечивает принципиальную статистическую основу для выбора подходящей модели для описания данных наблюдений, естественным образом компенсируя сложность модели и точность соответствия. Однако для этого требуется вычисление свидетельств байесовской модели, также называемое предельной вероятностью, что является сложной вычислительной задачей. Мы представляем изученную оценку среднего гармонического для вычисления модельных доказательств, которая не зависит от стратегии выборки, что обеспечивает большую гибкость.

Эта статья написана в соавторстве с Алессио Спурио Манчини.

Выбор подходящей модели для описания наблюдаемых данных является важной задачей во многих областях науки о данных и науки в целом. Байесовский формализм обеспечивает надежную и принципиальную статистическую основу для сравнения и выбора моделей. Однако выполнение выбора байесовской модели требует больших вычислительных ресурсов.

Выбор байесовской модели

Байесовский формализм является одним из наиболее распространенных подходов к статистическому выводу. Для вывода параметров для данной модели M апостериорное распределение вероятностей интересующих параметров 𝜽 может быть связано с вероятностью данных y с помощью теоремы Байеса.

где априорное распределение p(𝜽| M) кодирует наши априорные знания о параметрах до наблюдения за данными (для введения в байесовский вывод см. эту превосходную статью TDS ).

Свидетельство Байесовской модели, представленное знаменателем приведенного выше уравнения, не имеет значения для оценки параметров, поскольку оно не зависит от интересующих параметров и может просто рассматриваться как нормализующая константа. Однако для сравнения моделей центральную роль играет свидетельство байесовской модели, также называемое предельной вероятностью.

Для выбора модели нас интересует модельная апостериорная вероятность, которая по другому применению теоремы Байеса может быть записана как

Поэтому для сравнения моделей нам необходимо вычислить коэффициенты Байеса, что требует вычисления модельных свидетельств рассматриваемых моделей. Вот тут-то и возникают вычислительные сложности.

Свидетельство байесовской модели дается интегралом вероятности и априорной вероятности по пространству параметров:

Таким образом, вычисление доказательств требует оценки многомерного интеграла, что может быть очень сложным с вычислительной точки зрения. Вскоре мы вернемся к этому вопросу, представив изученную оценку среднего гармонического для вычисления модельных свидетельств.

Полезно отметить, что доказательство модели естественным образом включает в себя бритву Оккама, компромисс между сложностью модели и точностью соответствия, как показано на следующей диаграмме.

Горизонтальная ось X на диаграмме выше [1] представляет все возможные наборы данных. В байесовском формализме модели задаются как распределения вероятностей по наборам данных, и, поскольку распределения вероятностей в сумме должны равняться единице, каждая модель имеет ограниченный «бюджет вероятности», который необходимо распределить. Хотя сложная модель может хорошо представлять широкий спектр наборов данных, она широко распределяет свою прогностическую вероятность. При этом модельное свидетельство сложных моделей будет оштрафовано, если такая сложность не требуется.

Таким образом, байесовский формализм обеспечивает принципиальный статистический подход к выбору модели. Хотя применение этого формализма на практике далеко не просто и требует больших вычислительных затрат.

Было разработано множество подходов к вычислению модельных свидетельств, которые оказались очень успешными (например, [2,3,4,5]). Однако они обычно имеют некоторые ограничения, и их может быть трудно масштабировать до более высоких параметров размерности. Таким образом, вычисление модельных свидетельств далека от решения проблемы. В этой статье мы сосредоточимся на гармонических средних оценках для вычисления свидетельств байесовской модели.

Исходная гармоническая средняя оценка

оценка исходного гармонического среднего была введена в Newton & Raftery в 1994 г. [6] и основана на следующем соотношении:

Это предполагает следующую оценку для (обратного) модельного свидетельства:

Таким образом, модельное свидетельство может быть оценено по среднему гармоническому правдоподобию с учетом выборок из апостериорных 𝜽, которые могут быть получены с помощью выборки Монте-Карло с цепочкой Маркова (MCMC).

Очень приятное свойство гармонической средней оценки заключается в том, что она требует выборок только из апостериорных значений, которые могут быть сгенерированы любым методом MCMC. Напротив, альтернативные подходы к вычислению модельных доказательств обычно тесно связаны с конкретными подходами к выборке, которые могут быть весьма ограничительными.

Однако сразу после того, как была предложена гармоническая оценка среднего, стало ясно, что она может привести к катастрофическим сбоям [7]. Фактически, первоначальная оценка среднего гармонического была названа самым худшим методом Монте-Карло!

Чтобы получить интуитивное представление о том, почему первоначальная оценка может дать сбой, ее можно рассмотреть с точки зрения выборки по важности. Оценщик можно рассматривать как выборку по важности, где априорное значение играет роль целевого распределения выборки по важности, а апостериорное значение играет роль плотности выборки.

Чтобы выборка по важности была эффективной, мы обычно рассматриваем плотность выборки, превышающую целевую. Однако для оценки гармонического среднего мы имеем обратное, поскольку априорное распределение, которое инкапсулирует наши начальные знания о параметрах модели, обычно шире, чем апостериорное, которое инкапсулирует наши знания о параметрах модели после наблюдения за данными. Следовательно, дисперсия исходного гармонического среднего может стать очень большой и может не быть конечной, что делает оценку неэффективной на практике.

Перенацеленная гармоническая средняя оценка

Для решения этой проблемы Гельфанд и Дей в 1994 году [8] представили оценку гармонического среднего с перенацеливанием. Перенастроенная оценка гармонического среднего вводит новое целевое распределение φ(𝜽), которое может быть спроектировано таким образом, чтобы избежать проблематичной конфигурации, описанной выше, что приводит к следующей оценке:

Остается вопрос: как выбрать новое целевое распределение φ(𝜽)?

Были рассмотрены различные случаи, например многомерный гауссиан [9] и индикаторные функции [10,11]. Гауссиан обычно имеет слишком широкие хвосты, что увеличивает дисперсию оценки. Хотя было показано, что индикаторные функции эффективны [10], они часто ограничиваются небольшой областью пространства параметров и поэтому могут быть неэффективными.

Изученная гармоническая средняя оценка

Можно получить дополнительное представление о том, как спроектировать эффективное целевое распределение, рассматривая оптимальную цель, которая представляет собой не что иное, как сам нормализованный апостериор (поскольку результирующая оценка имеет нулевую дисперсию). Однако целевое распределение должно быть нормализовано, а нормализующая константа апостериорного распределения является доказательством модели… именно этот термин мы пытаемся оценить!

Хотя оптимальная цель (нормализованная апостериорная вероятность) на практике недоступна, мы предлагаем оценить приближение с помощью машинного обучения:

Это приводит к выученной гармонической средней оценке [12]. Выученная аппроксимация апостериорной вероятности не обязательно должна быть очень точной. Но, что очень важно, у него не должно быть более толстых хвостов, чем у заднего. Мы налагаем это ограничение при изучении целевого распределения из апостериорных выборок. Кроме того, мы предлагаем стратегии для оценки дисперсии изученной гармонической средней оценки, ее собственной дисперсии и других проверок работоспособности. (Дополнительные подробности можно найти в нашей статье по теме: McEwen et al. 2021 [12].)

Численные эксперименты

Мы проводим многочисленные численные эксперименты, чтобы проверить изученную оценку среднего гармонического путем сравнения с исходными значениями данных байесовской модели.

Функция Розенброка обеспечивает общий эталон для оценки методов вычисления модельных свидетельств. На следующем графике мы показываем, что изученная оценка среднего гармонического является надежной и очень точной для этой проблемы.

Еще одна распространенная проблема с эталонным тестом — это модель Normal-Gamma, как показано графически на следующей диаграмме.

В исследовании, в котором рассматривались оценщики для вычисления свидетельств модели [13], этот пример показал патологический сбой исходной оценки гармонического среднего. В приведенной ниже таблице мы представляем значения свидетельств модели, рассчитанные для этой проблемы с помощью исходной оценки гармонического среднего и нашей изученной гармонической средней оценки. Наша обученная оценка очень точна, обеспечивая улучшение по сравнению с исходной оценкой на четыре порядка.

Гармонический код

Обученная программа оценки гармонического среднего реализована в программном пакете harmonic, который является открытым и общедоступным. Особое внимание было уделено дизайну и реализации кода в соответствии с передовыми методами разработки программного обеспечения.

Поскольку обученному оценщику среднего гармонического требуются выборки только из апостериорного распределения, гармонический код не зависит от метода или кода, используемого для создания апостериорных выборок. Тем не менее, гармонический исключительно хорошо работает с методами выборки MCMC, которые естественным образом предоставляют выборки из нескольких цепочек по своей ансамблевой природе, например ансамблевые сэмплеры аффинной инвариантности [14]. Код emcee [15] обеспечивает превосходную реализацию сэмплера ансамбля аффинной инвариантности, поэтому emcee является естественным выбором для использования с harmonic.

Краткое содержание

Сравнение байесовских моделей обеспечивает надежную и принципиальную статистическую основу для выбора подходящей модели для описания данных наблюдений, естественным образом компенсируя сложность модели и точность соответствия. Однако для этого требуется вычисление свидетельств байесовской модели, также называемое предельной вероятностью, что является вычислительно сложной задачей.

В этой статье мы рассматриваем оценщики среднего гармонического для вычисления доказательств модели, в том числе наш недавно предложенный обученный оценщик среднего гармонического. Обученная оценка среднего гармонического не зависит от метода, используемого для генерации апостериорных выборок, что обеспечивает большую гибкость. Мы также выпустили код с открытым исходным кодом harmonic, который реализует оценщик, где мы уделили особое внимание дизайну и реализации кода, следуя передовым методам разработки программного обеспечения.

В настоящее время мы используем довольно простые модели машинного обучения с нашей обученной оценкой гармонического среднего. Эти простые модели с трудом масштабируются до очень больших размеров. Мы уже изучаем использование более сложных моделей машинного обучения, которые позволят нам масштабироваться до еще более масштабных настроек.

Мы надеемся, что изученная оценка гармонического среднего уже может стать полезным инструментом для выбора байесовской модели. В частности, поскольку он не зависит от метода выборки, он позволяет вычислить модельное свидетельство для большого разнообразия подходов к выборке там, где раньше это было невозможно.

Рекомендации

[1] Гахрамани, Байесовские непараметрические и вероятностный подход к моделированию,Phil. Транс. Р. Соц. А. (2013)

[2] Skilling, Вложенная выборка для общих байесовских вычислений. Байесовский анализ (2006)

[3] Feroz & Hobson, MultiNest: эффективный и надежный инструмент байесовского вывода для космологии и физики элементарных частиц,MNRAS (2009), arXiv:0809.3437

[4] Handley, Hobson & Lasenby, PolyChord: вложенная выборка для космологии,MNRAS (2015), arXiv:1502.01856

[5] Cai, McEwen, Pereyra, Проксимальная вложенная выборка для выбора многомерной байесовской модели, arXiv:2106.03646

[6] Ньютон и Рафтери, Приблизительный байесовский вывод с бутстрапом взвешенного правдоподобия,JR Stat Soc Ser A (1994)

[7] Нил, Вклад в обсуждение «Приближенного байесовского вывода с бутстрапом взвешенного правдоподобия» (1994)

[8] Гельфанд и Дей, Выбор байесовской модели: асимптотика и точные вычисления. JR Stat Soc Ser B (1994)

[9] Чиб, Предельное правдоподобие из выходных данных Гиббса, Журнал Американской статистической ассоциации (1995 г.)

[10] Роберт и Рэйт, Вычислительные методы выбора байесовской модели, Материалы конференции Американского института физики (2009 г.),
arXiv:0907.5123

[11] ван Хаастерен, Вычисление маргинального правдоподобия с помощью методов MCMC, В Обнаружение гравитационных волн и анализ данных для массивов синхронизации пульсаров (2014)

[12] Макьюэн, Уоллис, Прайс, Дохерти, Сравнение байесовских моделей с помощью машинного обучения: обученная оценка гармонического среднего (2021),arXiv:2111.12720

[13] Friel & Wyse, Оценка доказательств — обзор, Statistica Neerlandica (2012), arXiv:1111.1957

[14] Goodman & Weare, Сэмплеры ансамбля с аффинной инвариантностью,Communications in Applied Mathematics and Computational Science (2010)

[15] Форман-Макки, Хогг, Ланг, Гудман, EMCEE: The MCMC Hammer,PASP (2013), arXiv:1202.3665