2026a

# Beta 分布

# 概述


Beta 分布描述了仅在区间 [0,1] 上非零的曲线族。该函数的更通用版本将参数分配给区间的端点。

Statistics提供了多种使用 Beta 分布 的方法。您可以使用以下方法从样本数据中估计参数,计算 pdf、cdf 和 quantile,random等等。

  • 将概率分布对象拟合到样本数据,或创建具有指定参数值的概率分布对象。有关更多信息,请参阅使用 BetaDistribution 对象。

  • 使用概率分布函数处理来自矩阵、表格和数据集数组的数据输入。

  • 生成分布中的随机数。

# 参数

Beta 分布使用以下参数。

参数 描述 范围
第一个形状参数
第二个形状参数

# 概率密度函数

Beta 分布的概率密度函数 (pdf) 是

其中 是 Beta 函数。 指示函数 确保只有在 [0,1] 范围内的 x 值具有非零概率。

例如,请参阅绘制Beta 分布 pdf

# 累积分布函数

给定值 x 和给定参数 对的 beta cdf 为

其中 是 Beta 函数。 beta cdf 与不完全 beta 函数相同。

# 示例

绘制 Beta 分布 pdf

更改 Beta 分布参数的值以改变概率分布函数 (pdf) 的形状。

计算三个 Beta 分布的 pdf:一个形状参数 等于 0.75,一个参数等于 1,一个参数等于 4。

using TyPlot
using TyStatistics
using TyMath
x = 0:0.01:1;
y1 = betapdf.(x,0.75,0.75);
y2 = betapdf.(x,1,1);
y3 = betapdf.(x,4,4);

绘制三个 pdf。

plot(x,y1)
hold("on")
plot(x,y2)
plot(x,y3)
legend([""*raw"$\alpha$"*"="*raw"$\beta$"*"=5",""*raw"$\alpha$"*"="*raw"$\beta$"*"=1",""*raw"$\alpha$"*"="*raw"$\beta$"*"=4"],loc = "northeast");
hold("off")

常数 pdf(平线)表明标准均匀分布是 beta 分布的一个特例,它发生在参数 等于 1 时。

估计 Beta 分布参数

计算 beta 分布参数的最大似然估计 (MLE)。

最大化似然函数是估计参数的一种流行技术。似然函数与 beta 概率分布函数 (pdf) 具有相同的形式。但是,对于 pdf,参数是已知常量,变量是 x。似然函数颠倒了变量的作用。也就是说,样本值(x)已经被观察到并且是固定常数,而变量是未知参数。最大似然估计涉及计算给定特定数据集产生最高似然的参数值。

从 beta 分布中生成 100 个随机数,其中 等于 5, 等于 0.2。函数 betafit 返回 beta 分布参数的 MLE 和置信区间。

加载数据

rng = MT19937ar(5489);
r = betarnd(rng,5,0.2,100,1);
phat, pci = betafit(r)
phat = 1×2 Matrix{Float64}:
 7.49099  0.213534

pci = 2×2 Matrix{Float64}:
  5.08598  0.174438
 11.0333   0.261391

参数 的 MLE 为 7.49099。 的 95% 置信区间介于 5.08598 到 11.0333 之间,不包括真值 5。虽然这种结果不太可能出现,但在估计分布参数时可能会出现。

参数 的 MLE 为 0.213534。 的 95% 置信区间范围为 0.174438 到 0.261391,包括真值 0.2。

# 相关分布

Beta 分布与 t 分布具有函数关系。 如果 Y 是来自具有 个自由度的学生 t 分布的观测值,则以下变换会生成 X,它是符合 Beta 分布的。

如果,那么

该关系用于计算 t cdf 和反函数的值以及生成 t 分布随机数。

# 另请参阅

BetaDistribution