Dr Selfie

Dr Selfie

DPS 周刊 206 - 闪回厦门

前阵子在厦门玩了几天,随手记录一下。 第一顿饭是上青本港海鲜,这家上了点评的黑珍珠榜。打电话过问能不能订位,答曰订位只有限定菜单,而且低消400。不订位可以在大堂吃,但可能需要排队。 反正住在边上,就走过去,刚好开店。其实订位吃的是 fine dining,大堂吃的都是自己在鱼缸前点菜。那当然跟着本地人在鱼缸前面点: 1. 一例小份卤鹅 (服务员劝说两个人小份就够了) 2. 凉拌海蜇(分量非常大) 3. 红蟳蒸米糕(正好是吃螃蟹的季节,满膏,下面的米糕类似于煲仔饭,但没有锅巴) 4. 蛏子(尽管从小吃到大,第一次见到这么饱满的)

Daily Productive Sharing 1335 - The Bitter Lesson

One helpful tip per day:) 强化学习之父 Rich Sutton 在2019年就揭示了算力即一切的道理: 1. 从 70 年的人工智能研究中得到的最大教训是:利用算力的方法最终是最有效的,而且优势巨大。 2. 为了在短期内看到改进,研究人员往往试图利用自己对领域的人类知识,但从长期来看,唯一重要的是能否利用算力。 3. 基于人类知识的方法往往会让方法复杂化,使其不适合利用那些依赖算力的一般方法。 4. 在人工智能研究中,搜索和学习是两类最重要的技术,用来发挥海量计算的作用。 5. 另一边是更新的统计类方法,它们基于隐马尔可夫模型(HMM),需要更多计算。结果依然是统计方法战胜了基于人类知识的方法。

Daily Productive Sharing 1334 - How Claude Code is built

Claude Code 是如何炼成的?Gergely Orosz 采访了 Claude Code 的两位奠基工程师 Boris Cherny 和 Sid Bidasaria,还有产品经理 Cat Wu: 1. Claude Code 的想法最初来自一个命令行工具,它用 Claude 来显示工程师在工作时听的音乐。 2. Claude Code 中 90% 的代码是它自己写的! 3. 团队的节奏非常快,每位工程师每天大约发布

Daily Productive Sharing 1333 - Failing to Understand the Exponential

One helpful tip per day:) Julian Schrittwieser 认为到 2026 年年中,模型将能够自主工作整整一天(8 个工作小时)。其实这个估算还是有些保守,刚刚发布的 Sonnet4.5 自主编程超过了30个小时: 1. 早在全球大流行的时间和规模已经可以通过指数趋势推算出来的时候,政客、记者和大多数公众评论员仍然把它当作一个遥远的可能性或局部现象。 2. 考虑到在许多行业中,性能改善已经连续多年呈现指数型增长,如果这些改善突然停止,将会非常令人惊讶。 3. 在 2026 年结束之前,至少会有一个模型能在多个行业中达到人类专家的水平。 4.

Daily Productive Sharing 1332 - Boring is good

One helpful tip per day:) Scott Jenson 认为大语言模型事实上已经“黑入”了我们的社会协议,让人们误以为它们比实际更聪明: 1. 他的职业生涯给了她两条应对不确定性的教训:第一,技术总是往下流动;第二,我们通常一开始走的都是错路。 2. 早期工厂依赖河流获取水力,但发电机的出现让工厂摆脱了地理限制。 3. 最初,工厂只有一个大型发电机,需要复杂的滑轮系统把动力传递到整栋建筑,这使得生产流程非常复杂。 4. 随着发电机体积缩小、成本降低,工厂可以在多个位置安装发电机。这种变化比第一次更解放,因为它催生了装配线。动力开始适应生产流程,而不是流程去适应动力,