AI 早报|2026-04-29
AI R\&D 日报|2026-04-29 时间范围:过去 24 小时(不足时延伸至近 72 小时补充) -- 1. Anthropic 发布 Claude for Creative Work:MCP 连接器打通八大创意工具链 要点: Anthropic 于 4 月 28 日宣布 Claude 通过 MCP 连接器接入 Adobe Creative Cloud、Blender、Autodesk Fusion、Ableton 等八款主流创意软件,支持自然语言操作 3D 建模、批量处理素材、跨工具流水线自动化。 关联性: MCP 连接器范式直接复用于后端系统集成——此次创意工具接入是 Claude MCP 生态快速扩张的信号,后端团队可参照同等模式将内部工具(CI/CD、监控、数据平台)接入 Agent 工作流,减少人工操作节点。 来源: Anthropic 官方博客 · 2026-04-28 -- 2. SWE-bench Verified 排行榜:Claude Mythos Preview 以 93.9% 领跑(近 72 小时补充) 要点: 截至 4 月 27 日,Claude Mythos Preview 在 SWE-bench Verified 上以 93.9% 准确率位居第一,Claude Opus 4.7(Adaptive)以 87.6% 排第二,GPT-5.5 以 85% 排第三;同时 OpenAI 内审发现三家主流模型存在训练数据污染问题,部分高分系"记忆"答案而非真实推理。 关联性: 当前顶级模型在标准化代码修复任务上已接近人类熟练工程师水平(85%+),但数据污染提示:引入 AI 辅助代码审查时应用团队私有用例评估,不能单靠公开榜单选型。 来源: SWE-bench Leaderboard / Epoch AI · 2026-04-27 -- 3. GitHub Copilot 云代理提速 20%,GPT-5.5 全面上线(近 72 小时补充) 要点: GitHub 于 4 月 24–27 日密集更新:Copilot 云代理(Cloud Agent)使用优化 Actions 镜像后整体速度提升超 20%;GPT-5.5 在 GitHub Copilot 全面上线,专攻"多步骤 Agentic 编码任务";JetBrains IDE 获得 Inline Agent Mode(预览);同时宣布 Copilot 代码审查自 6 月 1 日起计入 Actions 分钟数。 关联性: 使用 JetBrains 生态的后端团队现在可以在 IDE 内直接发起 Inline Agent,不再依赖终端切换;但代码审查新计费方式会推高企业版成本,采购前需重新估算 Actions 用量。 来源: GitHub Changelog · 2026-04-24 至 2…
阅读完整文章