вероятность и статистика

Руководство по распределению вероятностей

С приложением в R

Распределения вероятностей

Распределения вероятностей - это математические функции, которые определяют вероятности появления различных возможных результатов в данном эксперименте. Они бывают разных форм с разными характеристиками, определяемыми средним значением, стандартным отклонением, асимметрией и эксцессом.

В этой статье объясняются 16 распределений вероятностей с соответствующими параметрами, а также с кодом R для их построения.

Нормальное распределение

Описание:

Нормальное распределение, также известное как распределение Гаусса или колоколообразная кривая, является наиболее важным распределением вероятностей для непрерывных переменных, поскольку оно встречается во многих ситуациях. Он определяется двумя параметрами: средним (которое совпадает с медианой и модой) и дисперсией. Актуальность нормального распределения обусловлена ​​центральной предельной теоремой, согласно которой сумма n случайных величин (независимо от ее среднего значения, дисперсии и распределения) приблизительно равна нормальное распределение при увеличении n.

Параметры:

  • μ: среднее
  • σ: стандартное отклонение

Код R:

Биномиальное распределение

Описание:

Биномиальное распределение дает дискретное распределение вероятностей получения ровно n успехов из N испытаний Бернулли (где результат каждого испытания Бернулли истинен с вероятностью p и ложен с вероятностью q = 1 - p).

Параметры:

  • размер: количество независимых испытаний.
  • проблема: вероятность успеха

Код R:

Гипергеометрическое распределение

Описание:

Количество элементов класса A при извлечении выборки из k элементов из набора из m + n элементов, где есть m элементов класса A и n элементов класса B. Это распределение является аналогом бинома, когда популяция конечна (достаточно мала).

Параметры:

  • m: количество элементов в генеральной совокупности, которые классифицируются как успешные.
  • n: количество элементов в генеральной совокупности, которые не классифицируются как успешные.
  • k: количество элементов в выборке, которые классифицируются как успешные.

Код R:

Геометрическое распределение

Описание:

Представляет количество неудач до первого успеха в серии испытаний Бернулли.

Параметры:

  • проблема: вероятность успеха в каждом испытании.

Код R:

Отрицательное биномиальное распределение

Описание:

Представляет количество испытаний Бернулли до достижения r успехов. Геометрическое распределение - это частный случай отрицательного бинома, когда r = 1.

Параметры:

  • размер: цель для количества успешных испытаний или параметр дисперсии (параметр формы распределения гамма-смешения).
  • проблема: вероятность успеха в каждом испытании.

Код R:

Распределение Пуассона

Описание:

Предоставляет вероятность определенного количества событий, происходящих на единицу (например, время, площадь, объем и т. Д.).

Параметры:

  • λ: среднее количество раз, когда событие происходит в единицу времени.

Код R:

Экспоненциальное распределение

Описание:

Измеряет время между событиями в пуассоновском процессе.

Параметры:

  • rate: параметр λ распределения Пуассона.

Код R:

Логнормальное распределение

Описание:

Логнормальное распределение, также известное как распределение Гальтона, представляет собой распределение вероятностей, когда логарифм переменной следует нормальному распределению. Этому типу распределения часто подходят искаженные распределения с низкими средними значениями, большой дисперсией и полностью положительными значениями.

Параметры:

  • μ log: среднее
  • σ log: стандартное отклонение.

Код R:

Равномерное распределение

Описание:

Равномерное распределение, также известное как прямоугольное распределение, представляет собой распределение вероятностей, имеющее постоянную вероятность для интервала [a b]. Равномерное распределение особенно используется для генерации случайных чисел.

Параметры:

  • min: нижний предел
  • max: верхний предел

Код R:

Гамма-распределение

Описание:

Гамма-распределение - это семейство непрерывных распределений вероятностей, наклоненных вправо. Это распределение полезно в реальной жизни, где что-то имеет естественный минимум 0.

Параметры:

  • shape: параметр формы.
  • rate: величина, обратная параметру масштаба.

Код R:

Бета-распространение

Описание:

Он используется в байесовском выводе, поскольку является априорным распределением других распределений. Он определен для значений от 0 до 1.

Параметры:

  • shape1: параметр положительной формы 1
  • shape2: параметр положительной формы 2

Код R:

Распределение Вейбулла

Описание:

Модель распределения Вейбулла имеет множество случайных величин времени до отказа и широко используется в анализе надежности, анализе данных о сроке службы и времени отказа модели.

Параметры:

  • shape: параметр формы
  • scale: параметр масштаба

Код R:

Распределение студентов

Описание:

Распределение Стьюдента t - это выборочное распределение, используемое для вывода. Его основное использование - поиск квантилей для заданного уровня достоверности или уровня значимости. Распределение t используется вместо нормального распределения, когда размер выборки невелик (например, ‹30 или‹ 40). Чем больше размер выборки, тем больше распределение t будет похоже на нормальное распределение.

Параметры:

  • df: степени свободы (размер выборки минус 1)

Код R:

Распределение хи-квадрат

Описание:

Распределение хи-квадрат - это выборочное распределение, используемое для вывода. Это частный случай гамма-распределения. ; Распределение хи-квадрат с n степенями свободы равно гамма-распределению с a = n / 2 и b = 0,5 (или β = 2). Подобно t-распределению Стьюдента, оно используется для поиска квантилей для заданного уровня достоверности или уровня значимости.

Параметры:

  • df: степени свободы (размер выборки минус 1)

Код R:

F Распространение

Описание:

Распределение F - это распределение вероятностей, связанное со статистикой f.

Параметры:

  • df1: степени свободы от первой выборки (размер выборки №1 минус 1)
  • df2: степени свободы от второй выборки (размер выборки №2 минус 1).

Код R:

Распределение Коши

Описание:

Распределение Коши, также известное как распределение Лоренца, представляет собой семейство непрерывных распределений вероятностей, которые напоминают семейство кривых нормального распределения. Хотя сходство есть, у него есть более высокий пик, чем обычно. И в отличие от нормального распределения, его толстые хвосты разлагаются гораздо медленнее.

Параметры:

  • location: параметр местоположения (указывает, где находится пик)
  • масштаб: половина ширины функции плотности вероятности на половине максимальной высоты.

Код R:

— —

Если вы нашли эту статью полезной, не стесняйтесь загрузить мои личные коды на GitHub. Вы также можете написать мне по электронной почте [email protected] и найти меня в LinkedIn. Хотите узнать больше о приложениях для анализа данных, обработки данных и машинного обучения в инженерной сфере? Изучите мои предыдущие статьи, посетив мой профиль на Медиуме. Спасибо за внимание.

- Роберт