<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI开发 | 面条实验室</title><description>折腾些什么玩意。 群组 @miantiao_chat</description><link>http://memo.miantiao.me</link><item><title>聪明人的分工：让昂贵模型做规划，便宜模型去执行知名开源开发者 shadcn 刚刚开源了一个全新项目——improve</title><link>http://memo.miantiao.me/posts/715</link><guid isPermaLink="true">http://memo.miantiao.me/posts/715</guid><pubDate>Wed, 10 Jun 2026 14:49:10 GMT</pubDate><content:encoded>&lt;div class=&quot;tgme_widget_message_forwarded_from accent_color&quot;&gt;Forwarded from &lt;a class=&quot;tgme_widget_message_forwarded_from_name&quot; href=&quot;https://t.me/miantiao_drafts/134&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;&lt;span&gt;面条的草稿箱&lt;/span&gt;&lt;/a&gt;&lt;/div&gt;&lt;b&gt;聪明人的分工：让昂贵模型做规划，便宜模型去执行&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;知名开源开发者 shadcn 刚刚开源了一个全新项目——&lt;b&gt;improve&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;这是一个非常巧妙的 Agent Skill，它的核心理念是：&lt;b&gt;用你最聪明（也最昂贵）的 AI 模型来做高杠杆的脑力劳动（审计代码、写技术方案），然后把脏活累活（编写代码、跑测试）交给更便宜的 AI 模型去执行。&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;这个工具本身绝对不会直接修改你的一行代码，它的产出就是&lt;b&gt;一份清晰、可执行的 Markdown 格式实施方案&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;💡&lt;/b&gt;&lt;/i&gt; 它是如何工作的？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;1.  &lt;b&gt;项目审计 (&lt;/b&gt;&lt;code&gt;/improve&lt;/code&gt;&lt;b&gt;)&lt;/b&gt;：高阶模型会深度扫描并分析你的代码库，指出潜在的 Bug、性能瓶颈、安全隐患或技术债，并产出一份按“投入产出比”排序的发现清单。&lt;br /&gt;2.  &lt;b&gt;制定方案 (&lt;/b&gt;&lt;code&gt;plans/&lt;/code&gt;&lt;b&gt;)&lt;/b&gt;：当你挑选出需要解决的问题后，高阶模型会针对每个问题输出一份极其详尽的方案（Plan）。这些方案是“自包含”的，带有明确的验证命令、执行边界和异常中止条件（STOP conditions）。&lt;br /&gt;3.  &lt;b&gt;分发执行 (&lt;/b&gt;&lt;code&gt;/improve execute &amp;lt;plan&amp;gt;&lt;/code&gt;&lt;b&gt;)&lt;/b&gt;：你可以把这些高可读性的方案直接扔给任何便宜的轻量级 AI Agent。轻量级模型只需像个机械的执行者一样，按照步骤修改代码、运行测试，最后向你提交 Pull Request。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;🚀&lt;/b&gt;&lt;/i&gt; 核心指令一览&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;/improve&lt;/code&gt;：全局审计并输出优化点。&lt;br /&gt;•   &lt;code&gt;/improve quick&lt;/code&gt;：快速扫描重点。&lt;br /&gt;•   &lt;code&gt;/improve deep&lt;/code&gt;：对每个包、每个分类进行详尽审计。&lt;br /&gt;•   &lt;code&gt;/improve plan &amp;lt;description&amp;gt;&lt;/code&gt;：跳过审计，直接为指定任务编写执行方案。&lt;br /&gt;•   &lt;code&gt;/improve execute &amp;lt;plan&amp;gt;&lt;/code&gt;：派发给便宜的执行器模型并审核其成果。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;安装方式&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;项目支持 &lt;a href=&quot;https://agentskills.io/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot; title=&quot;Agent Skills&quot;&gt;Agent Skills&lt;/a&gt; 规范：&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code class=&quot;language-text&quot;&gt;npx skills add shadcn/improve
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://github.com/shadcn/improve&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot; title=&quot;https://github.com/shadcn/improve&quot;&gt;https://github.com/shadcn/improve&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%BC%80%E5%8F%91&quot; title=&quot;#AI开发&quot;&gt;#AI开发&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E4%BB%A3%E7%90%86&quot; title=&quot;#智能代理&quot;&gt;#智能代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B&quot; title=&quot;#软件工程&quot;&gt;#软件工程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23GitHub%E5%BC%80%E6%BA%90&quot; title=&quot;#GitHub开源&quot;&gt;#GitHub开源&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23shadcn&quot; title=&quot;#shadcn&quot;&gt;#shadcn&lt;/a&gt;&lt;a class=&quot;tgme_widget_message_link_preview&quot; href=&quot;https://agentskills.io/&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot; title=&quot;A standardized way to give AI agents new capabilities and expertise.&quot;&gt;
  
  &lt;div class=&quot;link_preview_site_name accent_color&quot;&gt;Agent Skills&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Agent Skills Overview - Agent Skills&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/B3yS76Xvhp4M5yZvpJDpJUWkLF3Qyzx4g7J0O0qtvqmjo0kg6m4qa36YwhSpUbwVT8UxuFvbmoeQvbCrhOrgEjFLG0Ls7mo0iwnnq_wrFhzPXdAyw0y6vSMu-ntV_OY3UKY1kT0DopulSXUCu7EI86DbKPMlZBH5GWNf5dCXChPlVGMg-Q9oV1Vjudz8AQoCotvZETD5T_7dcU0MvQjOL4gIL9F6CzfnGhUSdR5I-gdfaT8OMnC4dV7Wp1ZGttClWXi1uKDewQAq7p9voRYnkZEGt_6wi8_i_H0iM6zft8cwr6f1eiQte3Gf6QUK8q3r5KZ6nV88tNXxW5yBJOYyRg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div class=&quot;link_preview_title&quot;&gt;Agent Skills Overview - Agent Skills&lt;/div&gt;
  &lt;div class=&quot;link_preview_description&quot;&gt;A standardized way to give AI agents new capabilities and expertise.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>🔥 OpenAI &amp; Anthropic 双王炸：GPT-5.3-Codex 与 Claude Opus 4.6 同日发布（含用户即时评价）今天是 2026 年 2 月 5 日，AI 界的“超级星期五”</title><link>http://memo.miantiao.me/posts/663</link><guid isPermaLink="true">http://memo.miantiao.me/posts/663</guid><pubDate>Fri, 06 Feb 2026 02:10:40 GMT</pubDate><content:encoded>&lt;div class=&quot;tgme_widget_message_forwarded_from accent_color&quot;&gt;Forwarded from &lt;a class=&quot;tgme_widget_message_forwarded_from_name&quot; href=&quot;https://t.me/agili_channel/4&quot; target=&quot;_blank&quot; rel=&quot;noopener&quot;&gt;&lt;span&gt;Agili&lt;/span&gt;&lt;/a&gt;&lt;/div&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;🔥&lt;/b&gt;&lt;/i&gt; &lt;b&gt;OpenAI &amp;amp; Anthropic 双王炸：GPT-5.3-Codex 与 Claude Opus 4.6 同日发布（含用户即时评价）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;今天是 2026 年 2 月 5 日，AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈，战况比预想的要复杂，甚至有点“割裂”。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;🤖&lt;/b&gt;&lt;/i&gt; OpenAI: GPT-5.3-Codex&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&quot;想接管你的电脑，而且它真的变强了&quot;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;GPT-5.3-Codex 现在的定位是&lt;b&gt;全能 Agent&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;• &lt;b&gt;用户评价：&lt;/b&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👍&lt;/b&gt;&lt;/i&gt; 代码与终端操作强：&lt;/b&gt; 很多开发者反馈它在 Terminal Bench 上碾压了对手（77.3% vs 64%），是目前最强的 CLI 操作者。有用户直言：“它虽然慢，但写出来的东西是对的，不用我再去擦屁股。”&lt;br /&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👍&lt;/b&gt;&lt;/i&gt; 自我修复：&lt;/b&gt; 它不只是写代码，还能自己跑测试、查错、修 bug。&lt;br /&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👎&lt;/b&gt;&lt;/i&gt; 速度慢：&lt;/b&gt; 因为要读更多上下文、做更多检查，反应速度明显不如 Claude Code。&lt;br /&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👎&lt;/b&gt;&lt;/i&gt; 甚至有点“啰嗦”：&lt;/b&gt; 有人吐槽它太爱聊天了，而 Claude 更直接。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;🧠&lt;/b&gt;&lt;/i&gt; Anthropic: Claude Opus 4.6&lt;br /&gt;&lt;br /&gt;&lt;b&gt;&quot;代码更强了，但...灵魂呢？&quot;&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Anthropic 这次让人又爱又恨。&lt;br /&gt;&lt;br /&gt;• &lt;b&gt;用户评价：&lt;/b&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👍&lt;/b&gt;&lt;/i&gt; 编码能力提升：&lt;/b&gt; 升级后的 Claude Code 在 SWE-bench 上得分很高（80.8%），写代码确实更利索了。&lt;br /&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;👎&lt;/b&gt;&lt;/i&gt; 写作能力“被阉割”：&lt;/b&gt; 这是最大的槽点。大量用户（包括 Hack News 和 Reddit）抱怨 Opus 4.6 的&lt;b&gt;写作质量下降&lt;/b&gt;，甚至有人用“Lobotomized”（切除脑叶）来形容。它写出来的东西变得干瘪、缺乏灵气，甚至不如上一代 Opus 4.5。&lt;br /&gt;  • &lt;b&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;⚠️&lt;/b&gt;&lt;/i&gt; 建议：&lt;/b&gt; 现在的共识是——&lt;b&gt;写代码用 Opus 4.6，写文章/搞创作请坚守 Opus 4.5&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;i class=&quot;emoji&quot;&gt;&lt;b&gt;⚡️&lt;/b&gt;&lt;/i&gt; Agili 的看法&lt;br /&gt;&lt;br /&gt;现在的局面很有趣：&lt;br /&gt;&lt;br /&gt;• &lt;b&gt;OpenAI&lt;/b&gt; 赢在**“干脏活累活”**（OS 操作、终端调试），它想做那个不嫌麻烦的超级实习生。&lt;br /&gt;• &lt;b&gt;Anthropic&lt;/b&gt; 赢在**“快和灵”&lt;b&gt;（Claude Code 体验依然丝滑），但在&lt;/b&gt;通用写作**上似乎为了强化逻辑而牺牲了文采。&lt;br /&gt;&lt;b&gt;给你的建议：&lt;/b&gt;&lt;br /&gt;如果你是写代码的，哪怕慢点，GPT-5.3-Codex 值得一试；如果你是写周刊、做内容的，先别急着把 Claude Opus 4.5 换掉，现在的 4.6 可能写不出你要的那种“人味儿”。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI&quot; title=&quot;#AI&quot;&gt;#AI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23OpenAI&quot; title=&quot;#OpenAI&quot;&gt;#OpenAI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Anthropic&quot; title=&quot;#Anthropic&quot;&gt;#Anthropic&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23GPT5&quot; title=&quot;#GPT5&quot;&gt;#GPT5&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23ClaudeOpus&quot; title=&quot;#ClaudeOpus&quot;&gt;#ClaudeOpus&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%9C%9F%E5%AE%9E%E8%AF%84%E6%B5%8B&quot; title=&quot;#真实评测&quot;&gt;#真实评测&lt;/a&gt;</content:encoded></item></channel></rss>