# Binomial 分布
# 概述
二项分布是一个两参数曲线族。二项分布用于对具有相同成功概率的固定数量的独立试验中的成功总数进行建模,例如对给定数量的硬币在十次翻转中正面朝上的概率进行建模。
统计和机器学习工具箱 提供了几种处理二项分布的方法。
创建概率分布对象 BinomialDistribution,然后使用对象函数来评估分布、生成随机数等。
使用具有指定分布参数的分布特定函数(binocdf、binopdf、binoinv、binostat、binofit、binornd)。特定于分布的函数可以接受多个二项分布的参数。
使用具有指定分布名称("Binomial")和参数的通用分布函数(cdf、quantile、pdf、random)。
# 参数
二项分布使用以下参数。
| 参数 | 说明 | 范围 |
|---|---|---|
| N | 试验次数 | 正整数 |
| P | 单次试验成功概率 | 0≤p≤1 |
两个具有相同参数 p 的二项式随机变量之和也是一个二项式随机变量,其中 N 等于试验次数之和。
# 概率密度函数
二项分布的概率密度函数 (pdf) 是
其中 x 是成功概率为 p 的伯努利过程的 N 次试验中的成功次数。 结果是在 N 次试验中恰好 x 次成功的概率。 对于离散分布,pdf 也称为概率质量函数 (pmf)。
有关示例,请参阅计算二项分布pdf。
# 累积分布函数
二项分布的累积分布函数 (cdf) 为
其中 x 是成功概率为 p 的伯努利过程的 N 次试验中的成功次数。 结果是在 N 次试验中最多 x 次成功的概率。
有关示例,请参阅计算二项分布cdf。
# 描述性统计量
二项分布的平均值为
二项分布的方差为
# 示例
计算二项分布pdf
计算 10 次试验和成功概率 0.5 的二项式分布的 pdf。
using TyPlot
using TyStatistics
x = 0:10;
y = binopdf.(x,10,0.5);
用宽度为 1 的条形绘制 pdf。
figure()
bar(x,y,width=1)
xlabel("Observation")
ylabel("Probability")
计算二项分布cdf
用 10 次试验计算二项式分布的 cdf,成功概率为 0.5。
using TyPlot
using TyStatistics
x = 0:10;
y = binocdf.(x,10,0.5);
绘制 cdf。
figure()
stairs(x,y)
xlabel("Observation")
ylabel("Cumulative Probability")
比较二项分布和正态分布pdf
当 N 很大时,参数 N 和 p 的二项式分布可以近似为均值
计算二项式分布的 pdf,计算 50 次试验中的成功次数,在单次试验中的概率为 0.6。
using TyPlot
using TyStatistics
N = 50;
p = 0.6;
x1 = 0:N;
y1 = binopdf.(x1,N,p);
计算对应正态分布的 pdf。
mu = N*p;
sigma = sqrt(N*p*(1-p));
x2 = 0:0.1:N;
y2 = normpdf.(x2,mu,sigma);
在同一个轴上绘制这些 pdf。
figure()
bar(x1,y1,width=1)
hold("on")
plot(x2,y2,linewidth=2)
xlabel("Observation")
ylabel("Probability")
title("Binomial and Normal pdfs")
legend(["Binomial Distribution","Normal Distribution"],loc="northwest")
hold("off")
正态分布的 pdf 非常接近二项分布的 pdf。
比较二项分布和泊松分布pdf
当 p 小时,参数 N 和 p 的二项式分布可以近似为均值为
计算二项分布的 pdf,计算 20 次试验中的成功次数,单次试验的成功概率为 0.05。
using TyPlot
using TyStatistics
N = 20;
p = 0.05;
x = 0:N;
y1 = binopdf.(x,N,p);
计算相应泊松分布的 pdf。
mu = N*p;
y2 = poisspdf(x,mu);
在同一轴上绘制 pdf。
figure()
bar(x,[y1 y2])
xlabel("Observation")
ylabel("Probability")
title("Binomial and Poisson pdfs")
legend(["Binomial Distribution","Poisson Distribution"],loc="northeast")
泊松分布的 pdf 非常接近二项分布的 pdf。
# 相关分布
伯努利分布 — 伯努利分布是一个单参数离散分布,它模拟单个试验的成功,并作为
的二项分布出现。 多项式分布——多项式分布是一种离散分布,当每次试验有两个以上可能的结果时,它会推广二项式分布。
正态分布 - 正态分布是具有参数
(均值)和 (标准差)的两参数连续分布。随着 的增加,二项式分布可以近似为正态分布,其中 和 。请参阅比较二项分布和正态分布pdf。 泊松分布 — 泊松分布是一种采用非负整数值的单参数离散分布。参数
是分布的均值和方差。泊松分布是二项分布的极限情况,其中 接近无穷大, 变为零,而 。请参阅比较二项分布和泊松分布pdf。
# 另请参阅
BinomialDistribution | binocdf | binopdf | binoinv | binostat | binofit | binornd