AI 产研月报|2026-04
AI 产研月报|2026-04 时间范围: 2026-03-24 ~ 2026-04-23(过去 30 天) 本期是月度 AI 情报。整体看,本月主线已经从「模型能力跑分」彻底切到「长程自主编码 + 多智能体编排」:Anthropic、OpenAI、Cursor 三家在同一周完成主力面向 Agent 的重大改版;中国阵营 Kimi K2.6、GLM-5.1、Qwen 3.6 集中爆发,开源权重在 SWE-Bench Pro 上首次实质追平闭源旗舰;同时 Anthropic Engineering 连发四篇方法论,把「Harness 工程」和「评测可信度」推到了和模型并重的位置。 -- 一、行业与公司动向 1. Claude Opus 4.7 GA:把「最难的工程任务」当作主力交付场景 What happened:Anthropic 于 2026-04-16 正式发布 Claude Opus 4.7,定位为「迄今最强通用模型」,定价不变($5 / $25 per MTok),同日在 GitHub Copilot、Claude Code、Bedrock 等平台同步可用。 Key delta:相对 Opus 4.6,重点不在分数微涨,而在三件事——(a)对最困难的多步软件工程任务有体感级提升,更适合「整段交付」而非「片段补全」;(b)首次原生支持高分辨率图像(最大 2576px / 3.75MP,对应屏幕截图、UI 设计稿、长文档解析显著受益);(c)原生支持文件系统形态的 Agent 记忆,模型会主动记笔记并在下次会话引用;同时上线针对网络安全高风险场景的自动拦截器。 Why it matters:对工程团队意味着两个直接选择——把 Claude Code 的默认模型直接切到 4.7;以及评估把 Code Review、复杂 refactor、长链路 bug fix 这种「非完成不可」的任务从人主导改为 Agent 主导。对 QA 团队,这是首次值得认真把"全分辨率截图理解"放进自动化测试链路的版本。 Source:Anthropic 官方公告 2026-04-16 · Anthropic API Docs - What's new in Claude Opus 4.7 · GitHub Changelog 2026-04-16 2. OpenAI 把 Codex 升级为「编程 Superapp」并推出 Codex Labs What happened:2026-04-15~21 一周内 OpenAI 连发三个重要升级:Codex CLI 0.121-0.123、Codex 桌面应用 26.415、以及面向企业的 Codex Labs 计划,并附带新的研究模型 GPT-Rosalind(生命科学)。 Key delta:(a)Codex 桌面应用 4 月 16…
阅读完整文章