多项分布公式推导过程(多项分布公式推导)

2026-06-16 01:58:28

多项分布公式推导过程深度解析在概率论与数理统计的宏大体系中，多项分布作为随机变量的关键模型之一，其数学表达简洁而应用广泛。它描述了一系列相互独立且同分布的二项随机变量之和，这类模型在实际场景中极为常见。

在深入探讨公式推导之前，我们起初需求对多项分布的数学本质进行。多项分布描述了在 n 次独立重复试验中，某特定事件形成的频数分布情况。每一个试验结局都是在同一个概率空间内进行的，但出于试验次数是固定的，且每次试验成功的概率 p 保持不变，这构成了典型的二项分布框架。当我们把 n 次试验分解为 k 个独立的二项试验组时，总成功次数 X 就能够被视为 k 个独立同分布的随机变量之和。
这种结构不仅揭示了多项分布与二项分布之间深刻的代数联系，也为后续的期望和方差计算供给了清楚的理论基础。掌握这一推导过程，是理解离散型随机变量性质的关键一步。

多项分布公式推导过程

一、定义与根本假设

为了严谨地推导公式，我们务必起初明确多项分布的四个核心性质，这是所有推导的基石。

试验的独立性： 每一个试验结局都不受其他试验结局的影响，即一次试验的成败不会转变后续试验的概率。
同分布性： 所有试验都遵循相同的概率规则，单个试验中事件 A 形成的概率恒定为 p，不形成概率为 q=1-p。
有限性： 试验总次数 n 是一个有限正整数，且试验总数小于概率空间的大小。
计数重复： 总共有 k 次重复出现的事件 A，每一次重复对应一个独立的二项分布。

二、推导核心：变量代换与概率质量函数构建

推导的核心在于如何将多项分布的概率质量函数（PMF）与基础的二项分布 PMF 进行衔接。我们假设试验总数为 n，关切的事件在 n 次试验中恰好形成 j 次，其对应的概率空间大小（即样本点总数）为 n^k，其中 k 代表 k 次重复的次数。

早先时候，我们需求定义每一个二项随机变量 X_i。对于第 i 组试验，其成功次数记为 X_i，则 X_i 服从二项分布，其概率质量函数为：
X_i ~ B(n_i, p)

X_i = sum(1 到 n_i 之间的小数点后的每 k 位)
X_i = sum(1 到 n_i 之间的小数点后的每 k 位)

在推导过程中，我们将多项分布的概率表示为所有可能样本点概率的乘积，即 P(X = j) = P(X_1 = x_1, X_2 = x_2, ..., X_k = x_k)。
此时，样本空间样本点总数为 n^k，每个样本点的概率为 1/n^k，进而得出多项分布的联合概率为：
P(X = x_1, X = x_2, ..., X = x_k) = (1/n^k) [n_1^(x_1) n_2^(x_2) ... n_k^(x_k)]

其中，n_1, n_2, ..., n_k 分别代表 k 次重复中的组数。

利用约束条件进行变量代换。对于第 i 组试验，知足样本点总数为 n_i 且成功次数为 x_i 的样本点个数为：C(n_i, x_i) = (n_i)^(x_i) / (x_i)^(x_i)。
联合概率能够重写为：
P(X = x_1, X = x_2, ..., X = x_k) = [1 / n^(k)] [x_1! / (x_1)^(x_1)] [x_2! / (x_2)^(x_2)] ... [x_k! / (x_k)^(x_k)]

为了匹配二项分布的公式，我们将分母中的 n^k 拆分为 (n_1 n_2 ... n_k)^(k)，其中 n_i 代表第 i 组的样本总数，准取值为 1 到 n_k 之间的任意整数。
此时，概率表达式变为：
P(X = x_1, X = x_2, ..., X = x_k) = [k! / (n_1 n_2 ... n_k)] [x_1! / (x_1)^(x_1)] ... [x_k! / (x_k)^(x_k)]

为了消除阶乘符号，我们引入超几何分布的辅助框架。令 y_i 为第 i 组中样本点总数的集合，则：
x_i = sum(y_i) = sum(1 到 n_i 之间的小数点后的每 k 位)

此时，分子中的 n_1^(x_1) 能够进一步拆解为 (n_1 n_2 ... n_k)^(k)，故此概率表达式变为：
P(X = x_1, X = x_2, ..., X = x_k) = [k! / (n_1 n_2 ... n_k)] [x_1! / (x_1)^(x_1)] ... [x_k! / (x_k)^(x_k)]

根据超几何分布的性质，总样本点数为 n^k，且每个二项试验组有 n_i 个样本点可重复。
此时，分母中的 n_1 n_2 ... n_k 能够视为 n^(k-1)，其中 n^(k-1) 代表 n^k 与 k 次重复中的组数之间的差值。整理后，拿到最终的多项分布概率质量函数：
P(X = x_1, X = x_2, ..., X = x_k) = [k! / (n_1 n_2 ... n_k)] [x_1! / (x_1)^(x_1)] ... [x_k! / (x_k)^(x_k)]

代入具体的样本点总数 n^k，可知最终的公式为：
P(X = x_1, X = x_2, ..., X = x_k) = [k! / (n_1 n_2 ... n_k)] [x_1! / (x_1)^(x_1)] ... [x_k! / (x_k)^(x_k)]

其中，n_1, n_2, ..., n_k 分别为 k 次重复中的组数，且 1 <= n_1 <= n_2 <= ... <= n_k <= n。