DPS 周刊 204 - Deep Search & Agent Mode

DPS 周刊 204 - Deep Search & Agent Mode
Photo by Will Xiang / Unsplash

最近用过的工具中最令我感到惊艳的是 chatGPT 里的 deep research。其他几家也推出了类似的功能,但是都不如 ChatGPT 中 GPT5 thinking 下的 deep research。

  1. Gemini 2.5 的 deep research 尽管可以洋洋洒洒写很详尽的报告,但是感觉信息密度不够高,有不少废话;
  2. Claude Sonnet 4 的 deep research 感觉差点意思,不如 ChatGPT 和 Gemini 那么详尽;
  3. Perplexity 是最简略的,即使切换到上面几家的模型,出来的效果也不行,不知道是出去成本考虑,还是请求的模型效果不如自家的模型。
  4. GPT5 thinking 刚好取得了平衡,足够详尽,又没什么废话,信息密度刚刚好。

当然 deep research 生成的报告还需要仔细阅读,找出真正有效的信息。有时候我会把找出来的信息点再丢回给 chatGPT 的 agent mode,让它用最新的信息来验证。

所以 chatGPT 的 agent mode 和 Perplexity 的 Comet 浏览器也让我眼前一亮,两者非常相似:给定指令之后,他们能够模拟人来操作浏览器找寻资料,然后再把整理好的数据呈现出来。

举个例子,我们要去一家银行搜索信用卡资料的时候,本来需要一页页地找,甚至还要打开各种写在 PDF 里的条款来仔细研究。现在只要把这家银行的网站丢给这些 agent,然后让他们梳理,他们就会模拟人的检索,仔细查找这家银行所有的信用卡资料,几分钟之后就把对比提供给我。

当然还有更加有意思的用法,比如我在查询某一个 API,就问 agent 有没有对应的 SDK(开发包)。它自己跑去 github 上检索了一遍,然后告诉我有一个基于 Typescript 的 SDK。但我对 Typescript 一无所知,就问 agent 有没有可能参照这个 SDK 改写一个 Python 的 SDK。它又跑去阅读了代码和文档,然后告诉我当然可以。前后不过几分钟时间,要是换我自己研究的话,没半天都搞不定。

这就让我想起了一句话,我们现在用的模型一定是未来最差的模型。想必这句话套用在工具上也适用。


我们已经开通了微信支付和支付宝支付,如果你想及时读到 DPS 的全文,不妨直接付费订阅:

一键使用微信或者支付宝订阅 DPS

关于支付的详情介绍,可以访问这一页面


Recap

Andrew Qu 说 MCP 协议和 AI 模型的关系就像厨师和厨房:

  • 厨师决定要做什么(AI 代理)
  • 厨房决定有哪些工具和食材(MCP 服务器)
  • 厨师只能使用厨房公开提供的内容
  1. MCP 不是一个库或 SDK,而是一个规范,就像 REST 或 GraphQL,但它是为 AI 代理设计的。
  2. 模型仍然依赖其训练所得的知识和推理能力,但现在可以通过 MCP 服务器访问专用工具来填补知识空白。
  3. 当模型需要引用库存时,不是凭空猜测,而是直接查询真实的库存系统。
  4. 核心在于:通过安全的方式,让 AI 有效访问你的系统,从而扩展其能力。
  5. MCP 增加了一层:你的工具托管在应用之外的独立服务器上。
Daily Productive Sharing 1301 - What Is MCP?
One helpful tip per day:) Andrew Qu 说 MCP 协议和 AI 模型的关系就像厨师和厨房: * 厨师决定要做什么(AI 代理) * 厨房决定有哪些工具和食材(MCP 服务器) * 厨师只能使用厨房公开提供的内容 1. MCP 不是一个库或 SDK,而是一个规范,就像 REST 或 GraphQL,但它是为 AI 代理设计的。 2. 模型仍然依赖其训练所得的知识和推理能力,但现在可以通过 MCP 服务器访问专用工具来填补知识空白。 3. 当模型需要引用库存时,不是凭空猜测,而是直接查询真实的库存系统。 4. 核心在于:通过安全的方式,让 AI 有效访问你的系统,从而扩展其能力。 5. MCP 增加了一层:

Lelauch 突然发现自己失去了好几个月的前进动力。这到底是怎么回事?

  1. 没有什么比离开熟悉的环境更能打断你的节奏。
  2. 如果睡眠出了问题,其他一切都会崩溃。缺乏睡眠不仅摧毁精力,还会彻底瓦解动力。
  3. 你的物理环境会反映你的心理状态,而你现在需要的是清晰,而不是混乱。
  4. 去健身房,或者进行任何足够艰难的体能训练,就像把自己插上电源一样。
  5. 大多数人失败的原因是缺乏清晰。他们的目标模糊、软弱,所以既达不到,也永远得不到满足。
Daily Productive Sharing 1302 - Your Way Out
One helpful tip per day:) Lelauch 突然发现自己失去了好几个月的前进动力。这到底是怎么回事? 1. 没有什么比离开熟悉的环境更能打断你的节奏。 2. 如果睡眠出了问题,其他一切都会崩溃。缺乏睡眠不仅摧毁精力,还会彻底瓦解动力。 3. 你的物理环境会反映你的心理状态,而你现在需要的是清晰,而不是混乱。 4. 去健身房,或者进行任何足够艰难的体能训练,就像把自己插上电源一样。 5. 大多数人失败的原因是缺乏清晰。他们的目标模糊、软弱,所以既达不到,也永远得不到满足。 6. 你的目标需要精准。不要做懦夫。 7. 对自己要诚实,承认什么能真正点燃你的激情。 8. 每天专注于三项关键任务。就是这三项。它们应该是可完成的,但具有战略意义。 9. 因为大多数人严重高估自己一天/一周能完成的事,却严重低估自己一个月/一年能做到的成就(通过堆叠每天的成功)。 10. 每一天,你都在向自己证明:你能出现,

Scott Young 认为动机可以用一个公式来解释:

动机 = 价值 × 概率 × 努力回报 / 距离

  1. 如果我们更看重某件事,在其他条件相同的情况下,我们就会更有动力去追求它。
  2. 努力回报:影响我们动机的不仅仅是目标本身的价值,还包括我们的努力能在多大程度上提升最终获得的价值。
  3. 提高感知价值:一件事越有价值,你就越有动力去实现它。
  4. 目标越是迫近当下,就越能激发动力。
  5. 激励自己的关键在于诊断公式中哪个环节出了问题,然后采取措施去改善它。
Daily Productive Sharing 1303 - Motivate Yourself on Hard Things
One helpful tip per day:) Scott Young 认为动机可以用一个公式来解释: 动机 = 价值 × 概率 × 努力回报 / 距离 1. 如果我们更看重某件事,在其他条件相同的情况下,我们就会更有动力去追求它。 2. 努力回报:影响我们动机的不仅仅是目标本身的价值,还包括我们的努力能在多大程度上提升最终获得的价值。 3. 提高感知价值:一件事越有价值,你就越有动力去实现它。 4. 目标越是迫近当下,就越能激发动力。 5. 激励自己的关键在于诊断公式中哪个环节出了问题,然后采取措施去改善它。 6. 当你陷入低谷期,不论是暂时的还是长期的,关键是从小目标开始,并在成功的基础上逐步积累。 7. 任何能缩短行动心理距离的方法,都有助于克服拖延。 8. 生产力系统的价值,很大一部分在于为工作建立一个组织结构,使需要完成的任务在心理上变得“更近”。 9. 越困难的目标越能激发努力,因为它放大了努力与结果差异的边际效应。 10. 在较短时间内专注于一个核心目标,会提升动机,

Kieran Klaassen 介绍了什么是复利式工程(compounding engineering):构建自我改进的开发系统,让每一次迭代都比前一次更快、更安全、更好。

  1. 每一次修复,系统都会学习。每一次审查,系统都会学习。每一次本可避免的失败,系统都会学习。
  2. 复利式工程强调要建立有记忆的系统:每一次 PR 都能教会系统新东西,每一个 bug 都成为永久的教训,每一次代码审查都会更新默认做法。
  3. 复利式工程需要前期投入:你必须先教会工具,它们才能自我学习。
  4. 但 AI 输出并非确定性的——一次有效的 prompt,下次可能就失败了。
  5. 下次我们需要检测用户情绪或行为时,不必从零开始,而是可以说:“使用挫败感检测器的工作流。” 系统已经知道该怎么做。
Daily Productive Sharing 1304 - Compounding Engineering
One Useful Tip Per Day!

Joan Westenberg 认为我们是被惯性支配的:

  1. 但在生活中,我们常常忘记,复利不仅存在于银行账户里。它体现在我们建立的习惯、积累的知识、深化的关系中。
  2. 第一次举起杠铃总是最重的,第一页写得最慢,第一次拍的视频最别扭。但每一次努力都为下一次打下基础,结果是乘法而不是加法。
  3. 重新开始的代价比维持更高——熵也会复利。
  4. 你真正的复利资产不是计费的工时,而是你的案例、你的人际关系、你的流程、你的作品。
  5. 美妙的是,惯性可以叠加。成功养成一个习惯后,你就会学会如何建立下一个。
Daily Productive Sharing 1305 - Compounding Consistency
One helpful tip per day:) Joan Westenberg 认为我们是被惯性支配的: 1. 但在生活中,我们常常忘记,复利不仅存在于银行账户里。它体现在我们建立的习惯、积累的知识、深化的关系中。 2. 第一次举起杠铃总是最重的,第一页写得最慢,第一次拍的视频最别扭。但每一次努力都为下一次打下基础,结果是乘法而不是加法。 3. 重新开始的代价比维持更高——熵也会复利。 4. 你真正的复利资产不是计费的工时,而是你的案例、你的人际关系、你的流程、你的作品。 5. 美妙的是,惯性可以叠加。成功养成一个习惯后,你就会学会如何建立下一个。 6. 开始得太猛只会导致精疲力竭。 7. 复利是成就的法则。它不要求天赋异禀,只要求坚持不懈。 如果你喜欢的话,不妨直接订阅这份电子报 ⬇️

lelouch 从头开始学习数学,但进展缓慢。直到有一天,ta 才明白:挣扎的原因不是因为 ta 不够能力,而是因为 ta 缺失了大量的前置知识。

  1. 理解上的差距并不是能力不足,而是缺乏必要的知识基础。
  2. ta 回过头去翻看更早的学习材料,选择更好的学习方法,并拼命练习。
  3. 这个过程缓慢且常常令人谦卑,但却必不可少。每一个被掌握的基础概念,都为更复杂的理论和问题奠定了基础。
  4. 实际上,ta 依然觉得自己很笨,但正在一步步慢慢靠近目标。
Daily Productive Sharing 1306 - You Just Lack the Prerequisites
One helpful tip per day:) lelouch 从头开始学习数学,但进展缓慢。直到有一天,ta 才明白:挣扎的原因不是因为 ta 不够能力,而是因为 ta 缺失了大量的前置知识。 1. 理解上的差距并不是能力不足,而是缺乏必要的知识基础。 2. ta 回过头去翻看更早的学习材料,选择更好的学习方法,并拼命练习。 3. 这个过程缓慢且常常令人谦卑,但却必不可少。每一个被掌握的基础概念,都为更复杂的理论和问题奠定了基础。 4. 实际上,ta 依然觉得自己很笨,但正在一步步慢慢靠近目标。 如果你喜欢的话,不妨直接订阅这份电子报 ⬇️

Preston Thorpe 分享了他在狱中重生的经历:

  1. 他发现自己对各种环境都能很好地适应,监狱也不例外。
  2. 监狱有自己的亚文化、行话和一套道德体系,这一切都由一种极端负面的群体思维和“我们就是罪犯”的严格心态所维持。
  3. 这种心态会强加在所有囚犯身上,而长年累月浸泡在这种消极氛围中,会改变任何人。
  4. 他曾选择了错误的方向,结果在经历短短 14 个月的成瘾与痛苦后,又回到了监狱。
  5. 他在单独监禁 13 个月后(并非因纪律处分),被列入了跨州转移名单。官方文件上写的原因是“设施的安全与稳定”。然而他没想到,这竟会成为他人生中最好的转折点。
Daily Productive Sharing 1307 - How I got here
One helpful tip per day:) Preston Thorpe 分享了他在狱中重生的经历: 1. 他发现自己对各种环境都能很好地适应,监狱也不例外。 2. 监狱有自己的亚文化、行话和一套道德体系,这一切都由一种极端负面的群体思维和“我们就是罪犯”的严格心态所维持。 3. 这种心态会强加在所有囚犯身上,而长年累月浸泡在这种消极氛围中,会改变任何人。 4. 他曾选择了错误的方向,结果在经历短短 14 个月的成瘾与痛苦后,又回到了监狱。 5. 他在单独监禁 13 个月后(并非因纪律处分),被列入了跨州转移名单。官方文件上写的原因是“设施的安全与稳定”。然而他没想到,这竟会成为他人生中最好的转折点。 6. 缅因州的监狱系统不同于其他地方,囚犯群体相对隔绝于街头和监狱帮派的掌控。 7. 他开始把时间投入在自学有机化学、金融、期权交易等方面,并第一次意识到自己可能有能力去做得更多,可以实现任何他下定决心要做的事。 8. 当机会出现时,他报名参加了缅因大学奥古斯塔分校的课程,还没开课,

Arun Venatesan 自 2020 年夏天以来,已经发布了 79 期内容,平均每 24 天一期:

  1. newsletter 订阅人数的一个优点是,它通常不像社交媒体那样单调地持续增长。
  2. 他稍微改动了封面印章,结果无意间创造出“邮票图案”这种现在对他来说已成为每期必不可少的美学元素。
  3. 一开始他尝试了不同方式,但很快就定型为三部分结构——博客更新、一则小故事或近期的思考话题、以及推荐内容。
  4. 这些想法在产生时,看起来彼此毫无联系。它们常常自发地出现在跑步时、工作时或洗澡时。只有把它们写下来再读一遍,他才发现其中的内在联系。
  5. 平均每一期都会收到三到四个回复,几乎全部写得很用心。其中不少互动进一步发展为视频通话,甚至现实中的见面。
Daily Productive Sharing 1308 - Five Years of The Newsletter
Daily Productive Sharing 1308 One helpful tip per day:) Arun Venatesan 自 2020 年夏天以来,已经发布了 79 期 newsletter,平均每 24 天一期: 1. newsletter 订阅人数的一个特点是,它通常不像社交媒体那样单调地持续增长。 2. 他稍微改动了封面印章,结果无意间创造出“邮票图案”这种现在对他来说已成为每期必不可少的美学元素。 3. 一开始他尝试了不同方式,但很快就定型为三部分结构——博客更新、一则小故事或近期的思考话题、以及推荐内容。 4. 这些想法在产生时,看起来彼此毫无联系。它们常常自发地出现在跑步时、工作时或洗澡时。只有把它们写下来再读一遍,他才发现其中的内在联系。 5. 平均每一期都会收到三到四个回复,几乎全部写得很用心。其中不少互动进一步发展为视频通话,甚至现实中的见面。 6. 友谊,

Andrej Karpathy 介绍了他使用 vibe coding (这个词就是他最先提出的)的体验:

  1. 他个人在使用大语言模型时,75% 通过 Cursor 的自动补全功能。
  2. 他觉得用文字去精确表达需求需要太多信息量和带来过多延迟,还不如直接在代码里、在正确的位置演示给模型看,效率更高。
  3. 他还没有学会同时高效地使用多个实例——单个实例已经让他觉得够难应付了。
  4. 这些模型基本上没有品味。
  5. 在他进入更偏 vibe-coding 的领域、即自己不太熟悉的部分时,它们却不可或缺。
Daily Productive Sharing 1309 - The Journey of Optimal LLM-Assisted Coding
One helpful tip per day:) Andrej Karpathy 介绍了他使用 vibe coding (这个词就是他最先提出的)的体验: 1. 他个人在使用大语言模型时,75% 通过 Cursor 的自动补全功能。 2. 他觉得用文字去精确表达需求需要太多信息量和带来过多延迟,还不如直接在代码里、在正确的位置演示给模型看,效率更高。 3. 他还没有学会同时高效地使用多个实例——单个实例已经让他觉得够难应付了。 4. 这些模型基本上没有品味。 5. 在他进入更偏 vibe-coding 的领域、即自己不太熟悉的部分时,它们却不可或缺。 6. Cursor Code 能一次性敲出上千行一次性、庞大的可视化或调试代码,只为找出一个特定的 bug,而在找到之后,这些代码就会全部删除。这是代码后稀缺时代——随时生成、随时删除上千行定制化、临时性的代码都没关系,因为它不再是昂贵稀缺的东西。 7. 当他把整段代码粘贴进

Ryan McEntush 认为在实体经济中,软件已经数字化了规划与设计,但“最后一公里”依旧受限于现实世界的复杂性与需要人参与的操作。

  1. 要让实体行业也能走上同样的轨迹,首先需要一座真正连接比特与原子的桥梁。这座桥梁就是“电气工业栈”——让机器能够像软件一样运作的技术集合。
  2. 软件曾经“吞噬世界”,而现在它将“推动世界”。
  3. 简而言之,2010 年代把物理工作流接入了 API,而 2020 年代将由自主系统与智能体来控制这些工作流。
  4. 我们正走向一个世界:曾经需要多年经验与专业技师才能完成的任务,如今只需像对话一样自然的界面来调度。
Daily Productive Sharing 1310 - The Electro-Industrial Stack
One helpful tip per day:) Ryan McEntush 认为在实体经济中,软件已经数字化了规划与设计,但“最后一公里”依旧受限于现实世界的复杂性与需要人参与的操作。 1. 要让实体行业也能走上同样的轨迹,首先需要一座真正连接比特与原子的桥梁。这座桥梁就是“电气工业栈”——让机器能够像软件一样运作的技术集合。 2. 软件曾经“吞噬世界”,而现在它将“推动世界”。 3. 简而言之,2010 年代把物理工作流接入了 API,而 2020 年代将由自主系统与智能体来控制这些工作流。 4. 我们正走向一个世界:曾经需要多年经验与专业技师才能完成的任务,如今只需像对话一样自然的界面来调度。 5. 基于电池、功率电子和高扭矩电机的电气化系统,更高效、更精确、更易于软件控制。它们能在仿真中测试,可通过 OTA 更新,并能通过遥测反馈持续改进。 6. 中国如今在这些技术的研究与生产方面占据主导,尤其是在上游金属/化学品、

一键使用微信或者支付宝订阅


本周的生产力日报集合就到此为止,如果你有什么建议,也欢迎留言告诉我们。如果想要收到最及时的推荐,不妨订阅我们的频道,或者付费解锁更多增值内容,我们下期见。

如果你喜欢的话,不妨直接订阅这份电子报 ⬇️