вероятность и статистика
Руководство по распределению вероятностей
С приложением в R
Распределения вероятностей
Распределения вероятностей - это математические функции, которые определяют вероятности появления различных возможных результатов в данном эксперименте. Они бывают разных форм с разными характеристиками, определяемыми средним значением, стандартным отклонением, асимметрией и эксцессом.
В этой статье объясняются 16 распределений вероятностей с соответствующими параметрами, а также с кодом R для их построения.
Нормальное распределение
Описание:
Нормальное распределение, также известное как распределение Гаусса или колоколообразная кривая, является наиболее важным распределением вероятностей для непрерывных переменных, поскольку оно встречается во многих ситуациях. Он определяется двумя параметрами: средним (которое совпадает с медианой и модой) и дисперсией. Актуальность нормального распределения обусловлена центральной предельной теоремой, согласно которой сумма n случайных величин (независимо от ее среднего значения, дисперсии и распределения) приблизительно равна нормальное распределение при увеличении n.
Параметры:
- μ: среднее
- σ: стандартное отклонение
Код R:
Биномиальное распределение
Описание:
Биномиальное распределение дает дискретное распределение вероятностей получения ровно n успехов из N испытаний Бернулли (где результат каждого испытания Бернулли истинен с вероятностью p и ложен с вероятностью q = 1 - p).
Параметры:
- размер: количество независимых испытаний.
- проблема: вероятность успеха
Код R:
Гипергеометрическое распределение
Описание:
Количество элементов класса A при извлечении выборки из k элементов из набора из m + n элементов, где есть m элементов класса A и n элементов класса B. Это распределение является аналогом бинома, когда популяция конечна (достаточно мала).
Параметры:
- m: количество элементов в генеральной совокупности, которые классифицируются как успешные.
- n: количество элементов в генеральной совокупности, которые не классифицируются как успешные.
- k: количество элементов в выборке, которые классифицируются как успешные.
Код R:
Геометрическое распределение
Описание:
Представляет количество неудач до первого успеха в серии испытаний Бернулли.
Параметры:
- проблема: вероятность успеха в каждом испытании.
Код R:
Отрицательное биномиальное распределение
Описание:
Представляет количество испытаний Бернулли до достижения r успехов. Геометрическое распределение - это частный случай отрицательного бинома, когда r = 1.
Параметры:
- размер: цель для количества успешных испытаний или параметр дисперсии (параметр формы распределения гамма-смешения).
- проблема: вероятность успеха в каждом испытании.
Код R:
Распределение Пуассона
Описание:
Предоставляет вероятность определенного количества событий, происходящих на единицу (например, время, площадь, объем и т. Д.).
Параметры:
- λ: среднее количество раз, когда событие происходит в единицу времени.
Код R:
Экспоненциальное распределение
Описание:
Измеряет время между событиями в пуассоновском процессе.
Параметры:
- rate: параметр λ распределения Пуассона.
Код R:
Логнормальное распределение
Описание:
Логнормальное распределение, также известное как распределение Гальтона, представляет собой распределение вероятностей, когда логарифм переменной следует нормальному распределению. Этому типу распределения часто подходят искаженные распределения с низкими средними значениями, большой дисперсией и полностью положительными значениями.
Параметры:
- μ log: среднее
- σ log: стандартное отклонение.
Код R:
Равномерное распределение
Описание:
Равномерное распределение, также известное как прямоугольное распределение, представляет собой распределение вероятностей, имеющее постоянную вероятность для интервала [a b]. Равномерное распределение особенно используется для генерации случайных чисел.
Параметры:
- min: нижний предел
- max: верхний предел
Код R:
Гамма-распределение
Описание:
Гамма-распределение - это семейство непрерывных распределений вероятностей, наклоненных вправо. Это распределение полезно в реальной жизни, где что-то имеет естественный минимум 0.
Параметры:
- shape: параметр формы.
- rate: величина, обратная параметру масштаба.
Код R:
Бета-распространение
Описание:
Он используется в байесовском выводе, поскольку является априорным распределением других распределений. Он определен для значений от 0 до 1.
Параметры:
- shape1: параметр положительной формы 1
- shape2: параметр положительной формы 2
Код R:
Распределение Вейбулла
Описание:
Модель распределения Вейбулла имеет множество случайных величин времени до отказа и широко используется в анализе надежности, анализе данных о сроке службы и времени отказа модели.
Параметры:
- shape: параметр формы
- scale: параметр масштаба
Код R:
Распределение студентов
Описание:
Распределение Стьюдента t - это выборочное распределение, используемое для вывода. Его основное использование - поиск квантилей для заданного уровня достоверности или уровня значимости. Распределение t используется вместо нормального распределения, когда размер выборки невелик (например, ‹30 или‹ 40). Чем больше размер выборки, тем больше распределение t будет похоже на нормальное распределение.
Параметры:
- df: степени свободы (размер выборки минус 1)
Код R:
Распределение хи-квадрат
Описание:
Распределение хи-квадрат - это выборочное распределение, используемое для вывода. Это частный случай гамма-распределения. ; Распределение хи-квадрат с n степенями свободы равно гамма-распределению с a = n / 2 и b = 0,5 (или β = 2). Подобно t-распределению Стьюдента, оно используется для поиска квантилей для заданного уровня достоверности или уровня значимости.
Параметры:
- df: степени свободы (размер выборки минус 1)
Код R:
F Распространение
Описание:
Распределение F - это распределение вероятностей, связанное со статистикой f.
Параметры:
- df1: степени свободы от первой выборки (размер выборки №1 минус 1)
- df2: степени свободы от второй выборки (размер выборки №2 минус 1).
Код R:
Распределение Коши
Описание:
Распределение Коши, также известное как распределение Лоренца, представляет собой семейство непрерывных распределений вероятностей, которые напоминают семейство кривых нормального распределения. Хотя сходство есть, у него есть более высокий пик, чем обычно. И в отличие от нормального распределения, его толстые хвосты разлагаются гораздо медленнее.
Параметры:
- location: параметр местоположения (указывает, где находится пик)
- масштаб: половина ширины функции плотности вероятности на половине максимальной высоты.
Код R:
— —
Если вы нашли эту статью полезной, не стесняйтесь загрузить мои личные коды на GitHub. Вы также можете написать мне по электронной почте [email protected] и найти меня в LinkedIn. Хотите узнать больше о приложениях для анализа данных, обработки данных и машинного обучения в инженерной сфере? Изучите мои предыдущие статьи, посетив мой профиль на Медиуме. Спасибо за внимание.
- Роберт