![Creative The name of the picture]()

Clash Royale CLAN TAG#URR8PPP
在统计学中,自助法(Bootstrap Method,Bootstrapping,或自助抽樣法)是一种从给定训练集中有放回的均匀抽样,也就是说,每当选中一个样本,它等可能地被再次选中并被再次添加到训练集中。自助法由Bradley Efron于1979年在《Annals of Statistics》上發表。當樣本來自总體,能以正态分布來描述,其抽樣分布為正态分布;但當樣本來自的总體無法以正态分布來描述,則以漸進分析法、自助法等來分析。採用隨機可置換抽樣(random sampling with replacement)。对于小数据集,自助法效果很好。
.632自助法
最常用的一种是.632自助法,假设给定的数据集包含d个样本。该数据集有放回地抽样d次,产生d个样本的训练集。这样原数据样本中的某些样本很可能在该样本集中出现多次。没有进入该训练集的样本最终形成检验集(测试集)。
显然每个样本被选中的概率是1/d,因此未被选中的概率就是(1-1/d),这样一个样本在训练集中没出现的概率就是d次都未被选中的概率,即(1-1/d)d。当d趋于无穷大时,这一概率就将趋近于e-1=0.368,所以留在训练集中的样本大概就占原来数据集的63.2%。
参见
参考文献
范明/孟小峰. 数据挖掘:概念与技术. 机械工业出版社. 2012年8月: 241. ISBN 978-7-111-39140-1 (中文).
統計學
|
|---|
| | 描述統計學 |
连续概率 |
集中趋势 |
平均數(平方 · 算術 · 幾何 · 調和 · 算术-几何 · 几何-调和 · 希羅|平均數不等式) · 中位數 · 眾數
|
|---|
| 离散程度 |
全距 · 標準差 · 變異係數 · 百分位數 · 四分差 · 四分位数 · 方差 · 標準分數 · 切比雪夫不等式
|
|---|
| 分布形态 |
偏態 · 峰態
|
|---|
|
|---|
| 离散概率 |
次數 · 列聯表
|
|---|
|
|
|---|
| 推論統計學 和 假設檢定
|
推論統計學 |
置信区间 · 區間估計 · 顯著性差異 · 元分析 · 貝氏推論
|
|---|
| 实验设计 |
统计总量 · 抽样 · 重抽样(刀切法 · 自助法 · 交叉驗證) · 重复 · 阻碍 · 特敏度 · 區集
|
|---|
| 样本量 |
统计功效 · 效应值 · 标准误差 · 零假设 · 對立假設 · 第一型和第二型誤差 · 統計檢定力
|
|---|
| 常规估计 |
贝叶斯推论 · 區間估計 · 最大似然估計 · 最小距離估計 · 矩量法 · 最大间距
|
|---|
| 特效检验 |
Z检验 · 學生t檢驗 · F检验 · 卡方检验 · Wald检验 · 曼-惠特尼检验 · 秩和检验
|
|---|
| 生存分析 |
生存函數 · 乘積極限估計量 · 對數秩和檢定 · 失效率 · 危險比例模式
|
|---|
|
|---|
| 相关及 回归分析
|
相关性 |
混淆變項 · 皮爾森積差相關係數 · 等級相關 (史匹曼等級相關係數 · 肯德等級相關係數) · 自由度
|
|---|
| 线性回归 |
線性模式 · 一般線性模式 · 廣義線性模式 · 方差分析 · 協方差分析
|
|---|
| 非线性回归 |
非参数回归模型 · 半参数回归模型 · Logit模型
|
|---|
|
|---|
| | 統計圖形 |
饼图 · 条形图 · 雙標圖 · 箱形圖 · 管制圖 · 森林圖 · 直方图 · QQ圖 · 趋势图 · 散點圖 · 莖葉圖 · 雷达图 · 示意地圖
|
|---|
| | 其他 |
回應過程效度 · 統計誤用
|
|---|
| |
|