- 型号选择。 预算外估计 功能类似于交叉验证的估计。当多次遍历数据集时,监视袋外估计而不是渐进式验证丢失是一个更好的主意。
- 置信区间。当开发一个独立的决策系统时,一个点预测通常就足够了;但是,当开发要集成到更大决策系统中的子系统时,区间预测为下游使用者提供了更丰富的摘要。
- 更好的结果。归纳可以提高模型的通用性 偏差方差权衡。到目前为止,我还没有看到对数据集的任何实际提升,这是可以理解并可以预期的:线性模型的方差低,因此不能从套袋中受益。为了从套袋中受益,您必须做一些最终输出对训练数据差异更敏感的事情,例如神经网络,树或具有自动数据驱动特征选择的线性模型。
我们可以将其建模为重要性加权分类问题,根据\ [将对$ {x_i,r_i)$转换为三元组$(x_i,y_i,c_i)$。
(x_i,r_i)\ to(x_i,1_ {r_i>0.68},| r_i-0.68 |)。
\]对于评估集,我们可以解码是否直接将决定作为模型的预测类邮寄的决定。在这种情况下,常量预测变量对应于不发邮件或发邮件给所有人的策略。正如曾经拥有邮箱的任何人所能证明的那样,向所有人发送邮件比不向任何人发送邮件更有利可图,因此``向所有人发送邮件''是要克服的基本策略。 (从理论上讲:也许不应该使用机器学习的商业秘密垃圾邮件过滤器,而应该使用机器学习并公开分发 其实 想要购买伟哥并拯救其他所有人免于烦恼。)
我建立了一个幼稚的``厨房水槽''模型,方法是采用训练集中的所有功能,将日期自1900年1月起以数字形式编码为月,使用带有经验分母的样条曲线将数字编码为结点,并对所有其他变量进行分类编码。我还整理了一个模型,其中包含10个功能(通过查看获奖者的作品)(使用与厨房水槽相同的策略进行编码)。结果如下:\ [
\ begin {array} {c | c | c | c}
\ mbox {型号}&\ mbox {训练集利润}&\ mbox {培训设置的利润(实际支出)}&\ mbox {评估集利润} \\ \ hline
\ mbox {向所有人发送邮件}& \$10788.54 & \$10704 \pm \$529 & \$10560.08 \\
\ mbox {10个功能}& \$17596.35 & \$14617 \pm \$434 & \$14896.07 \\
\ mbox {厨房水槽}& \$24353.80 & \$493 \pm \$80 & \$154.92 \\
\ end {array}
\]因此,厨房水槽严重超出了训练范围,但实际购买力不足以检测到这一点。哇
不幸的是,减少装袋并不比运行多个vee-dub快。对于具有大量I / O开销的简单模型来说,它的速度更快,但是对于更复杂的模型,摊销I / O只是一个适度的好处。在内部对所有内容进行编排更为方便,减少的内容应与vee-dub的分布式学习功能结合在一起,但是在笔记本电脑领域,这并不是一个巨大的胜利。
当然,一旦有了套袋,自然的下一步就是尝试一些不稳定的学习方法。敬请关注!
没意见:
发表评论