二项分布(Binomial Distribution)是一种 离散概率分布,它描述了在n次独立的伯努利试验中成功的次数的概率分布。在每次试验中,只有两种可能的结果:成功(success)或失败(failure),且每次试验成功的概率为p,失败的概率为1-p。二项分布是概率论中最基本的分布之一,广泛应用于统计学、机器学习和数据分析领域。
二项分布的概率质量函数(Probability Mass Function, PMF)为:
\[ P(X=k) = C(n, k) \cdot p^k \cdot (1-p)^{n-k} \]
其中:
\( n \) 是试验的次数,
\( k \) 是成功的次数,
\( p \) 是每次试验成功的概率,
\( C(n, k) \) 是组合数,表示从n次试验中选择k次成功的方法数,计算公式为 \( C(n, k) = \frac{n!}{k!(n-k)!} \)。
此外,二项分布的期望(Expectation)和方差(Variance)分别为:
\[ E(X) = n \cdot p \]
\[ \text{Var}(X) = n \cdot p \cdot (1-p) \]
二项分布适用于在一系列相同概率的独立试验中,成功的次数的概率分布。例如,在医学研究中,二项分布可以用于描述在n次独立的试验中,某事件发生k次的概率,如药物治愈病人的次数。在质量控制中,二项分布可以用于分析产品不合格品的数量。