Daily Productive Sharing 1327 - The Second Half
One helpful tip per day:)
姚雨顺认为 AI 的下半场已经到来 - 将从解决问题转向定义问题。在这个新时代里,评估比训练更为重要。
- 现在突然发生了什么不同?用三个词来概括:强化学习(RL)终于奏效了。更准确地说:RL 终于能够泛化了。
- 要在这一阶段中茁壮成长,我们需要及时转变心态与技能,更接近于产品经理的思维方式。
- 在 AI 的前半程,方法比任务更难、更令人兴奋。
- 方法往往比单个任务更通用、适用范围更广,这使它们尤为有价值。
- 一种出色的新方法可以在许多不同的基准上持续爬坡,因为它足够简单和通用,其影响往往超越单个任务。
- 在 RL 中有三个关键组成部分:算法、环境和先验。
- 然而,在深度 RL 时代,经验表明环境的重要性极大:某个算法的表现往往高度依赖于它开发和测试所处的环境。
- 事实证明,RL 中最重要的部分可能既不是算法也不是环境,而是先验,而这些先验甚至可以来自完全不相关的途径。
- 然后,他迎来了人生中的一个重大顿悟——我们之所以能够泛化,是因为我们不仅可以选择“去第二个柜子”“用钥匙 1 打开第三个箱子”或“用剑杀死地牢”,我们还可以选择去思考:“地牢很危险,我需要一件武器来对付它。”
- 思考,或推理,是一种奇特的行动——它并不直接影响外部世界,但推理的空间却是开放且组合上无限的。
如果你喜欢的话,不妨直接订阅这份电子报 ⬇️