AI 早报|2026-04-27
AI R\&D 日报|2026-04-27 时间范围:过去 24 小时(含近 72 小时补充内容) -- 1. OpenAI GPT-5.5 正式发布,API 同日开放(近 72 小时补充) 要点: OpenAI 于 4 月 23 日发布 GPT-5.5,4 月 24 日开放 API,定价 $5/M 输入、$30/M 输出;模型在 Agentic 编码、计算机操作和知识工作上大幅提升,配套 GPT-5.5 Pro 面向高强度研究场景($30/$180)。 关联性: 后端团队若已在生产中使用 Codex 或 OpenAI API 驱动代码生成、代码审查流水线,GPT-5.5 可直接替换底座,多步骤任务完成率和调试能力明显改善。 来源: OpenAI Blog · 2026-04-23 / CNBC · 2026-04-23 -- 2. SWE-bench Pro 榜单更新:Claude Mythos 77.8%,GPT-5.5 58.6%(近 72 小时补充) 要点: 截至 4 月 24 日,SWE-bench Pro 榜首为 Claude Mythos Preview(77.8%),其次为 Claude Opus 4.7 Adaptive(64.3%)和 GPT-5.5(58.6%);SWE-bench Verified 上 Mythos 达 93.9%,但 Mythos 仅限受控访问,不对外公开。 关联性: SWE-bench Pro 是当前最具参考价值的 AI 编码基准(Scale AI 主持,具备抗污染性),可直接作为 Claude Code/Codex/Copilot 工具选型的量化依据;生产可用的前沿模型为 Opus 4.7 和 GPT-5.5。 来源: Scale AI SWE-bench Pro Leaderboard · 2026-04-24 -- 3. Qwen3.6-27B 开源:27B 稠密模型超越 397B MoE,18GB 显存可本地运行(近 72 小时补充) 要点: 阿里巴巴 Qwen 团队 4 月 22 日发布 Qwen3.6-27B(Apache 2.0 协议),SWE-bench Verified 得分 77.2,SWE-bench Pro 53.5——超越同家族 397B MoE 模型(50.9),最低仅需 18GB 显存。 关联性: 对代码数据安全敏感的团队(金融、政务、医疗)可用该模型搭建纯本地私有 AI 编程助手;18GB 显存门槛与消费级 4090、M2/M3 Max MacBook Pro 均匹配,私有化部署门槛大幅降低。 来源: MarkTechPost · 2026-04-22 / Qwen Blog · 2026-04-22 -- 4. Google Deep Research Max 上线:Gemini…
阅读完整文章