🔥 OpenAI & Anthropic 双王炸:GPT-5.3-Codex 与 Claude Opus 4.6 同日发布(含用户即时评价)
今天是 2026 年 2 月 5 日,AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈,战况比预想的要复杂,甚至有点“割裂”。
🤖 OpenAI: GPT-5.3-Codex
"想接管你的电脑,而且它真的变强了"
GPT-5.3-Codex 现在的定位是全能 Agent。
• 用户评价: • 👍 代码与终端操作强: 很多开发者反馈它在 Terminal Bench 上碾压了对手(77.3% vs 64%),是目前最强的 CLI 操作者。有用户直言:“它虽然慢,但写出来的东西是对的,不用我再去擦屁股。”
• 👍 自我修复: 它不只是写代码,还能自己跑测试、查错、修 bug。
• 👎 速度慢: 因为要读更多上下文、做更多检查,反应速度明显不如 Claude Code。
• 👎 甚至有点“啰嗦”: 有人吐槽它太爱聊天了,而 Claude 更直接。
🧠 Anthropic: Claude Opus 4.6
"代码更强了,但...灵魂呢?"
Anthropic 这次让人又爱又恨。
• 用户评价: • 👍 编码能力提升: 升级后的 Claude Code 在 SWE-bench 上得分很高(80.8%),写代码确实更利索了。
• 👎 写作能力“被阉割”: 这是最大的槽点。大量用户(包括 Hack News 和 Reddit)抱怨 Opus 4.6 的写作质量下降,甚至有人用“Lobotomized”(切除脑叶)来形容。它写出来的东西变得干瘪、缺乏灵气,甚至不如上一代 Opus 4.5。
• ⚠️ 建议: 现在的共识是——写代码用 Opus 4.6,写文章/搞创作请坚守 Opus 4.5。
⚡️ Agili 的看法
现在的局面很有趣:
• OpenAI 赢在**“干脏活累活”**(OS 操作、终端调试),它想做那个不嫌麻烦的超级实习生。
• Anthropic 赢在**“快和灵”(Claude Code 体验依然丝滑),但在通用写作**上似乎为了强化逻辑而牺牲了文采。
给你的建议:
如果你是写代码的,哪怕慢点,GPT-5.3-Codex 值得一试;如果你是写周刊、做内容的,先别急着把 Claude Opus 4.5 换掉,现在的 4.6 可能写不出你要的那种“人味儿”。
#AI #OpenAI #Anthropic #GPT5 #ClaudeOpus #真实评测
今天是 2026 年 2 月 5 日,AI 界的“超级星期五”。OpenAI 和 Anthropic 不约而同地亮出了底牌。根据 Reddit、Hacker News 上第一波用户的反馈,战况比预想的要复杂,甚至有点“割裂”。
🤖 OpenAI: GPT-5.3-Codex
"想接管你的电脑,而且它真的变强了"
GPT-5.3-Codex 现在的定位是全能 Agent。
• 用户评价: • 👍 代码与终端操作强: 很多开发者反馈它在 Terminal Bench 上碾压了对手(77.3% vs 64%),是目前最强的 CLI 操作者。有用户直言:“它虽然慢,但写出来的东西是对的,不用我再去擦屁股。”
• 👍 自我修复: 它不只是写代码,还能自己跑测试、查错、修 bug。
• 👎 速度慢: 因为要读更多上下文、做更多检查,反应速度明显不如 Claude Code。
• 👎 甚至有点“啰嗦”: 有人吐槽它太爱聊天了,而 Claude 更直接。
🧠 Anthropic: Claude Opus 4.6
"代码更强了,但...灵魂呢?"
Anthropic 这次让人又爱又恨。
• 用户评价: • 👍 编码能力提升: 升级后的 Claude Code 在 SWE-bench 上得分很高(80.8%),写代码确实更利索了。
• 👎 写作能力“被阉割”: 这是最大的槽点。大量用户(包括 Hack News 和 Reddit)抱怨 Opus 4.6 的写作质量下降,甚至有人用“Lobotomized”(切除脑叶)来形容。它写出来的东西变得干瘪、缺乏灵气,甚至不如上一代 Opus 4.5。
• ⚠️ 建议: 现在的共识是——写代码用 Opus 4.6,写文章/搞创作请坚守 Opus 4.5。
⚡️ Agili 的看法
现在的局面很有趣:
• OpenAI 赢在**“干脏活累活”**(OS 操作、终端调试),它想做那个不嫌麻烦的超级实习生。
• Anthropic 赢在**“快和灵”(Claude Code 体验依然丝滑),但在通用写作**上似乎为了强化逻辑而牺牲了文采。
给你的建议:
如果你是写代码的,哪怕慢点,GPT-5.3-Codex 值得一试;如果你是写周刊、做内容的,先别急着把 Claude Opus 4.5 换掉,现在的 4.6 可能写不出你要的那种“人味儿”。
#AI #OpenAI #Anthropic #GPT5 #ClaudeOpus #真实评测
👍 2 ❤️ 1
目前还在开发阶段,可以关注一下,不过 Cloudflare Dashboard 肉眼可见的在大面积更新 UI
https://404.li/kumo
Agili 的 AIGC 周刊(Y26W04)
本周 AI 编程工具生态持续爆发:Claude 发布 MCP Apps、Cowork 插件系统和贡献度量功能;Kimi K2.5 以开源模型姿态登顶 SWE-Bench;OpenClaw 在混乱中完成品牌重塑拿下 10 万 GitHub stars;Sam Altman 坦承 GPT-5 写作失误并警告生物安全风险。一个有趣的信号:90% 的 DuckDuckGo 用户投票反对 AI 功能。
https://link.agi.li/23ab
本周 AI 编程工具生态持续爆发:Claude 发布 MCP Apps、Cowork 插件系统和贡献度量功能;Kimi K2.5 以开源模型姿态登顶 SWE-Bench;OpenClaw 在混乱中完成品牌重塑拿下 10 万 GitHub stars;Sam Altman 坦承 GPT-5 写作失误并警告生物安全风险。一个有趣的信号:90% 的 DuckDuckGo 用户投票反对 AI 功能。
https://link.agi.li/23ab
👍 1
随时随地,任意终端都可以 Vibe 编程了。
容器会在你不使用的10分钟后缩放至 0,不收钱。
https://github.com/miantiao-me/cloud-code
👀 2
在 Cloudflare Containers 一键运行 Moltbot(Clawdbot)
不在乎成本的大佬可以设置为 7x24 小时运行
https://github.com/miantiao-me/cloud-moltbot
不在乎成本的大佬可以设置为 7x24 小时运行
https://github.com/miantiao-me/cloud-moltbot
Agili 的 AIGC 周刊(Y26W03)
本周 AI 进化的主线很清晰:一边是办公与工程系统被更深地‘接管’(Claude 进 Excel、OpenAI 的 PostgreSQL 扩展复盘);另一边是 Agent 工具链开始成体系(Mastra、BrowserOS、AgentFS 等)。模型侧,GLM-4.7-Flash 与 Qwen3-TTS 的开源更新,把高性价比推理与高质量语音门槛进一步拉低。
https://link.agi.li/9497
本周 AI 进化的主线很清晰:一边是办公与工程系统被更深地‘接管’(Claude 进 Excel、OpenAI 的 PostgreSQL 扩展复盘);另一边是 Agent 工具链开始成体系(Mastra、BrowserOS、AgentFS 等)。模型侧,GLM-4.7-Flash 与 Qwen3-TTS 的开源更新,把高性价比推理与高质量语音门槛进一步拉低。
https://link.agi.li/9497
把 opencode 自带的 web 界面暴露出来, 周刊生成过程直观太多了,不用再一行行看日志了
https://github.com/miantiao-me/aigc-weekly
❤️ 8
npx skills add miantiao-me/bm.md 方式安装一次即可。 ❤️ 3
Agili 的 AIGC 周刊(Y26W02)
本周 Anthropic 发布 Claude Cowork,将 Agent 能力从代码扩展到日常办公;Apple 选择 Gemini 为 Siri 提供 AI 能力;Cursor 分享长时程 Agent 技术;多款轻量级模型和开发者工具涌现。
https://link.agi.li/636e
本周 Anthropic 发布 Claude Cowork,将 Agent 能力从代码扩展到日常办公;Apple 选择 Gemini 为 Siri 提供 AI 能力;Cursor 分享长时程 Agent 技术;多款轻量级模型和开发者工具涌现。
https://link.agi.li/636e
👍 1
Agili 的 AIGC 周刊(Y26W01)
本周聚焦 AI 编程助手的底层原理与实践:200 行代码实现 Claude Code、Vibe Coding 方法论让非程序员也能写代码、Cursor 动态上下文发现技术揭秘,以及 Anthropic 官方 AI Agent 评估指南。
https://link.agi.li/300e
本周聚焦 AI 编程助手的底层原理与实践:200 行代码实现 Claude Code、Vibe Coding 方法论让非程序员也能写代码、Cursor 动态上下文发现技术揭秘,以及 Anthropic 官方 AI Agent 评估指南。
https://link.agi.li/300e