2010年9月7日,星期二

优先考虑机器学习

因此,我的团队维护并改进了某些模型,这些模型在公司周围的各种决策过程中都用作预言。我们要做的重要事情之一是确定新的信息来源(或现有来源的转换),这些信息来源可以改善代理度量(例如AUC或对数可能性)的性能。一旦确定了信息片段,我们就可以建立一个相对容易的新模型,但是要由工程团队将新信息提供给生产中的Oracle流程。范围从容易(例如,“已经在某个地方的数据库中明确表示”)到困难(例如,“每次发生特定事件并记录结果时,都需要运行增量计算”)。

所以今天我在一次会议上,针对两个不同的模型,我提议在困难地区进行两个更改。因此,释义是这样的:

VP工程学:“好,我应该先选哪个?”

我:“这个。”

VP工程:“为什么?”

我:“我的直觉告诉我,它将产生更大的影响。”

VP工程:“您不知道代理指标与实际业务指标影响之间的关系吗?”

我:“不。”

VP工程:“您不能进行仿真并做出预测或其他事情吗?”

我:“我可以,但是这些模拟将涉及用户行为模型以及人们如何适应我们做出的不同决策。那里的未知数太多,我可以得到任何想要的答案。”

VP工程学:“这是一个me脚的状况。您要我根据您的直觉来提供资源。”

确实很la脚,因为决策不只是在机器学习项目之间进行:存在完全不同类型的活动(产品功能增强,UI更改,站点性能增强),它们可以对业务指标产生积极影响,并且机器学习项目争夺工程资源与其他建议。

那么其他组织如何处理这些东西呢?

没意见:

发表评论