统计学中,刀切法(英語:jackknife)是一种重抽样方法,常用于对统计量的方差和偏差的估计。样本的刀切法估计量是指将样本去除每个元素后重新计算估计量,再将这些估计量取平均值。刀切法是自助法的一个线性近似。“刀切法”的名字由美国数学家约翰·图基提出,意在说明本方法像便携式小刀一样简单但实用,可解决多种统计问题。[1]给定一个大小为
的样本,刀切法的估计量可以通过聚合每个大小为
子样本得出。
刀切法的估计量可以通过将数据集中的每个观测值逐一排除后计算该参数并整合排除后所有结果的方法系统地得出。
例如,若被估计量为随机变量
的总体均值,那么对于一系列独立同分布的观测值
,样本均值的估计量即为:
第二个求和式中求和符号的下标意为求和序数
遍历集合
。
接下来执行刀切法,对于
,计算不包含第
个样本的刀切法子样本均值,其中
也被称为第
个刀切法replicate。
,
可以理解为这
个刀切法replicate
近似了样本均值
的分布。样本容量
的增加可以提高上述近似的精度。取上述刀切法replicate的均值即可得到刀切法的均值:
关于
的方差和偏置:从
的定义不难看出,偏置在刀切replicate的均值计算中不那么显著,因为每个刀切replicate并非独立,所以相较而言
的方差更为重要。
对刀切法的均值式稍作变换不难得出: