2026-04-17 精选

追踪 366 篇 · 精选 15 篇

#1 Cloudflare 统一 AI 推理层，支持多模型调用

Cloudflare 推出统一 AI 推理层，允许开发者通过单一 API 调用来自不同供应商的 70 多个 AI 模型，包括 OpenAI、Anthropic 等，并统一管理成本，支持多模态应用（图像、视频、语音）。此外，Cloudflare 还将支持 Bring Your Own Model（BYOM）。

9.1

#2 Cloudflare 将 Browser Rendering 更名为 Browser Run 赋能 AI 代理

Cloudflare 将其 Browser Rendering 产品重命名为 Browser Run，并新增多项功能，使其成为 AI 代理的专用浏览器。新功能包括实时预览、人工干预、Chrome DevTools Protocol (CDP) 端点支持、AI 编码代理客户端集成、WebMCP 支持、会话录制以及更高的并发浏览器限制（从 30 个增至 120 个），旨在提升 AI 代理与 Web 交互的能力。

9.0

#3 OpenAI发布首个生命科学模型GPT-Rosalind

OpenAI推出首个生命科学AI模型GPT-Rosalind，旨在加速药物研发与基因组学研究。该模型专为生物学研究的分析需求进行微调，能进行证据综合、假设生成、实验规划等复杂任务，并已在BixBench和LABBench2等基准测试中展现出色性能，在与Dyno Therapeutics的合作中表现优于95%的人类专家。GPT-Rosalind通过ChatGPT、Codex及API提供，并对美国企业客户实施了严格的准入控制。

8.6

#4 Alibaba发布AI Agent评测基准OccuBench

Alibaba发布了OccuBench基准，用于评估AI Agent在10个行业、100项专业任务上的表现，并使用Language World Models模拟真实环境。GPT-5.2以79.6%的领先率通过测试，但无模型在所有行业中称霸。与明确错误相比，隐含错误更具挑战性。

8.6

#5 AiScientist：自主长周期机器学习研究

AiScientist 引入了一种“文件即总线”的虚拟实验室，通过持久化的工作空间状态协调分层代理，实现跨论文理解、实现和实验的持续性研究。该系统通过文件即总线协调取代了消息传递，使持久化工件成为记录系统。AiScientist 将 PaperBench 分数提高了 10.54 分。

8.4

#6 OpenAI 启动 Trusted Access for Cyber，整合 GPT-5.4-Cyber 加强网络防御

OpenAI 宣布启动 Trusted Access for Cyber 计划，联合多家安全公司和企业，利用 GPT-5.4-Cyber 和 1000 万美元 API 赠款，以提升全球网络防御能力。

8.3

#7 OpenAI Codex 升级为全天候 AI 编码助手

OpenAI 正在大幅扩展其开发者工具 Codex 的功能，使其能够自主控制 Mac、生成图像、记住偏好设置，并能在数周内持续自主处理任务。此举直接瞄准了 Anthropic 的 Claude Code。

8.2

#8 Codex 扩展功能，支持远程连接与更多应用集成

Codex 现已支持远程连接功能，可通过 SSH 连接到您的 devbox，文件、命令和计算均保留在远程机器上。此更新现已面向企业环境进行 alpha 测试。同时，Codex 还能调用 Mac 应用、连接更多工具、生成图像、从过往操作中学习并能处理重复性任务。

8.2

#9 研究：AI 模型能力提升改变开发者工作模式

Cursor 与芝加哥大学经济学家合作研究发现，AI 模型能力提升显著改变了开发者工作方式。在 500 个团队中，开发者正承担更复杂的 AI 驱动任务，高复杂度任务同比增加 68%。AI 辅助编码使开发者更侧重输出管理，文档、架构、代码审查及学习等任务增长显著。

8.1

#10

#10 AI 加速开发：内部平台如何应对？

AI 驱动的开发加速了软件交付速度，但开发者仍依赖手动流程获取流水线，导致平台团队成为瓶颈。本文探讨如何通过内部开发者门户（IDP）实现自助服务，弥合差距，提高效率，并保证组织内部交付的一致性。活动将于 4 月 23 日举行。

8.0

#11

#11 Pull Request 恐将消亡：AI 驱动代码协作新时代

文章探讨了代码审查（Code Review）和 Pull Request（PR）在 AI 时代可能走向消亡的趋势。自 2005 年被引入并由 GitHub 推广以来，PR 已成为开发者协作的重要工具。然而，生成式 AI 的兴起，如 Prompt Request 的概念，以及开发者如 Pete Steinberger 和 Mitchell Hashimoto 的探索，预示着 PR 的终结。AI 驱动的协作模式可能不再依赖传统的 Git 工作流，而是转向更适合 Agent 协作的新范式。

8.0

#12

#12 Google AI 发布 Gemini 3.1 Flash TTS，提升语音质量与控制力

Google AI 推出 Gemini 3.1 Flash TTS 预览版 TTS 模型，显著提升语音质量、表现力控制和多语言生成能力。新模型支持 70 多种语言，集成自然语言音频标签和原生多speaker对话，并引入 SynthID 水印技术以识别 AI 生成内容。该模型现已通过 Gemini API、AI Studio、Vertex AI 及 Google Vids 推出。

7.9

#13

#13 Anthropic 发布 Claude Opus 4.7，定价不变

Anthropic 正式发布了 Claude Opus 4.7，其定价与 Opus 4.6 相同，API 模型命名为 claude-opus-4-7。Opus 4.7 能更严谨地处理长期任务，更精确地遵循指令，并能在报告前自行验证输出，可减少监督。该模型已上线 Claude 全系产品及 Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry。

7.9

#14

#14 OpenAI Codex 大更新：可操作电脑，处理多项任务

OpenAI 为其编程助手 Codex 进行了重大升级，使其能够执行电脑操作，包括自主点击鼠标和敲击键盘。新版 Codex 可在 Mac 上运行多个 agent，并与其他工具集成，还能创建图像、学习用户习惯并处理重复性任务。

7.9

#15

#15 Hugging Face 推出 HoloTab 浏览器插件，实现“电脑使用”AI 代理

Hugging Face 发布 HoloTab，一款基于 Holo3-35B-A3B 模型 Chrome 扩展，旨在模拟人类操作，直接通过浏览器界面与网站互动，执行导航、填表、重复性任务等，无需 API 集成。此举标志着 AI 领域正转向“电脑使用”方法，允许模型直接操作现有软件界面。

7.8