2019年5月10日星期五

ICLR 2019思考

ICLR 2019 让我们想起了NeurIPS的早期时代(无滑雪):单一的讲座,充满活力的张贴会议以及大型的午间休息时间。星期二上午的演讲是关于气候变化,蛋白质建模,音乐创作以及视觉皮层建模。除气候变化外,这些都是1990年代后期NeurIPS的热门话题。历史不会重复,但是会押韵。

我最喜欢的演讲是Pierre-Yves Oudeyer,他的演讲 好奇心广东11选五开奖号码查的研究 涵盖人类主题和机器人技术。皮埃尔(Pierre)的演讲是一场有趣的认知科学之旅,我强烈建议 观看视频 (约9分30秒开始)。这些想法对强化广东11选五开奖号码查社区产生了广泛的影响:众所周知的阿喀琉斯的强化广东11选五开奖号码查之is是样本的复杂性,最近,从业者受到了基于好奇心广东11选五开奖号码查的思想的启发而对其进行攻击(例如 布尔达(Burda)等。等 会议海报)。再来看“探索是为了建立世界模型” is reflected in 上下文决策过程中的最新理论结果.

在会议上对我来说最奇怪的时刻是看到 胶水海报。显然,由于会议审查和发布的延迟,GLUE刚刚被提出。当然,它已经过时了,所以主持人又有一个关于他们的新数据集的海报,称为 强力胶。事情发展得如此之快,以至于前者“fast path”会议记录的数量现在明显落后了。

这是引起我注意的一些东西:
  • ImageNet规模上的非随机泛化界线:PAC贝叶斯压缩方法:几年前 张等等 通过证明卷积网络可以使Imagenet标签适合随机生成的图像,震惊了社区,这打破了人们普遍认为卷积网络由于容量控制而普遍推广的信念。在这里周等。等证明适用MDL样式的概括界限,即训练后可以压缩其表示的网络具有更严格的偏差界限。这是一个(训练)数据相关的界限,它们通过注意在随机训练数据上训练的网络也不会压缩来密封论点。
  • 通过可到达性的情景好奇:许多基于好奇心的探索海报之一,Savinov等。等建议将记忆与类似于政策的内容结合起来,并取得可喜的结果。也很酷:海报包含QR码,可触发座席视频广东11选五开奖号码查通过不同算法移动。
  • 深度强化广东11选五开奖号码查的受监管政策更新:Vuong等。等通过凸显受约束的政策优化,对TRPO和PPO提​​出了合理的改进。

没意见:

发表评论