求置信区间通常涉及以下步骤:
收集数据
选择一个随机样本。
计算样本均值($\bar{x}$)和样本标准差($s$)。
确定样本大小
样本量 $n$ 足够大,以便样本均值的分布接近正态分布。
选择置信水平
确定一个置信水平,例如 95%,并查标准正态分布的 $\alpha$ 分位数表,找到对应的 Z 值(正态分布的临界值)。
计算标准误差
标准误差(SE)是样本标准差除以样本容量的平方根,即 $SE = \frac{s}{\sqrt{n}}$。
计算置信区间
根据样本均值、样本标准差和置信水平,使用以下公式计算置信区间:
总体均值的置信区间(样本容量大于30):
$$
\bar{x} \pm Z \times SE
$$
其中,$Z$ 是根据置信水平查表得到的 Z 分数。
样本比例的置信区间(二项分布):
$$
p \pm Z \times \sqrt{\frac{p(1-p)}{n}}
$$
其中,$p$ 是样本比例,$n$ 是样本容量。
总体方差的置信区间(样本容量大于30):
$$
\left( \frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1)s^2}{\chi^2_{1-\alpha/2, n-1}} \right)
$$
其中,$\chi^2_{\alpha/2, n-1}$ 和 $\chi^2_{1-\alpha/2, n-1}$ 是根据置信水平和自由度查表得到的卡方分数。
示例
假设我们有一个样本均值 $\bar{x} = 175$ cm,样本标准差 $s = 5$ cm,样本容量 $n = 100$,置信水平为 95%。
样本均值:
$\bar{x} = 175$
样本标准差:
$s = 5$
样本容量:
$n = 100$
置信水平:
95%
Z 分数:
$Z = 1.96$(查标准正态分布表)
标准误差:
$SE = \frac{5}{\sqrt{100}} = 0.5$
代入公式计算总体均值的置信区间:
$$
\bar{x} \pm Z \times SE = 175 \pm 1.96 \times 0.5 = 175 \pm 0.98 = [174.02, 175.98]
$$
因此,总体均值的 95% 置信区间为 $[174.02, 175.98]$ cm。
建议
确保样本量足够大,以便使用中心极限定理。
根据数据分布和样本量选择合适的置信水平和计算方法(例如,t 分布适用于小样本或方差未知的情况)。
仔细查表获取 Z 分数或卡方分数,以确保准确计算置信区间。