Skip to main content
历史
关于
EN

2026-04-21 精选

追踪 306 篇 · 精选 15 篇

#1 Cloudflare 披露内部 AI 工程栈和应用成效

Cloudflare 披露了其内部构建的 AI 工程栈,该栈运行在自家产品之上,并在过去30天内被93%的研发组织使用。该栈整合了 Cloudflare Access, AI Gateway, Workers AI, Durable Objects 等产品,显著提升了开发者效率,合并请求量季度增长显著。

9.9

#2 Cloudflare Agents Week 2026:发布系列新产品打造 Agentic Cloud

Cloudflare 举办首届 Agents Week,发布一系列为 AI agent 设计的新产品,旨在打造 Agentic Cloud。此次发布涵盖了计算、安全和网络等多个方面,包括:支持 Git 的版本化存储 Artifacts;为 AI Agent 提供持久化隔离环境的 Sandboxes GA;以及更安全的网络接入方案 Cloudflare Mesh。这些新工具旨在帮助开发者和企业应对 AI Agent 规模化部署带来的计算、安全和网络挑战。

9.9

#3 OpenAI 推出 GPT-5.4-Cyber,为网络防御提供可信访问

OpenAI 推出 GPT-5.4-Cyber,一款专为网络防御设计的微调模型。此举旨在通过身份验证和分级访问解决网络安全领域的“双重用途”问题,降低对合法安全研究人员的限制,同时防止滥用。

8.5

#4 Deck.co 简化网站代理创建

Deck.co 平台使创建网站代理变得极为容易,用户可定义任务并通过 API 访问。该平台支持结构化数据通信,隐藏了运行计算机和导航网站的复杂性,甚至支持 MFA 保护的网站。

8.1

#5 抖音发布 PersonaVLM,实现长期个性化多模态大模型

字节跳动研究人员发布了 PersonaVLM 框架,旨在将多模态大模型(MLLMs)转变为具备记忆、推理和个性化对齐能力的助手。该框架在 CVPR 2026 上得到展示,相较于基线模型提升了 22.4%,并超越 GPT-4o 5.2%。

8.1

#6 xAI发布Grok语音API,进军企业语音开发市场

xAI推出了独立的“语音识别到文本”(STT)API和“文本到语音”(TTS)API,均基于为Grok语音移动应用、特斯拉汽车和Starlink客服驱动的基础设施构建。STT API支持25种语言的实时和批量转录,定价为每小时0.10美元(批量)和0.20美元(实时)。TTS API支持20种语言和5种语音,定价为每百万字符4.20美元,并提供精细的语音控制标签。

7.9

#7 多用户 LLM Agent 基准测试

该研究介绍了首个多用户 LLM Agent 基准测试,旨在解决当前 AI 助手大多为单用户设计的局限性。测试模型如何在服务多个用户时处理利益冲突、隐私限制及协调问题。

7.8

#8 Noetik 利用 AI Transformer 解决癌症试验 95% 失败率

Noetik 公司通过训练 AI Transformer 模型,旨在解决癌症临床试验高达 95% 的失败率问题。其 TARIO-2 模型基于大规模肿瘤空间转录组学数据集,能从现有 H&E 样本预测基因图谱,以匹配最适宜的患者与疗法,而非重新发现药物。GSK 已为此技术达成 5000 万美元的协议。

7.8

#9 Codex 改进上下文理解能力,提升开发者效率

Codex 新推出的 Chronicle 功能可提升其对“此”或“彼”等指代词的理解能力,能识别屏幕上的错误、打开的文档或过去的“事物”。该功能将帮助 Codex 学习开发者工作习惯、常用工具及项目,以优化开发流程。

7.8

#10 开源 Kimi K2.6 模型挑战 GPT-5.4 和 Claude Opus 4.6

Moonshot AI 发布了开源模型 Kimi K2.6,旨在代码基准测试上媲美 GPT-5.4 和 Claude Opus 4.6,并支持高达 300 个代理的并行运行。

7.7

#11 OpenAI 发布 O1 Preview,或为 LLM 时代重要进展

OpenAI 悄然发布了 O1 Preview,作者认为这是继 GPT-3.5 之后 LLM 时代最重要的技术进展,并配有关键图表。此举涉及对推理和测试时计算的大胆投入,预示着 AI 技术的重大突破。

7.7

#12 GitHub Agentic Workflows 的安全架构

GitHub 推出 Agentic Workflows,允许 AI 代理在 GitHub Actions 中执行任务,如修复文档、编写测试和重构代码。文章探讨了 GitHub 如何围绕「代理可能泄露 API 密钥、垃圾信息或秘密」的假设,设计了三层安全架构,以应对这些不可预测且可能被操纵的系统。这与传统 CI/CD 的单一信任域假设相悖。

7.7

#13 Codex 扩展记忆功能,引入 Chronicle 改进上下文理解

继上周发布 Codex 记忆功能预览版后,此次引入 Chronicle 改进了记忆功能,利用近期屏幕上下文,使用户无需重复陈述背景信息,即可获得 Codex 的帮助。

7.7

#14 Adobe 推出企业级 AI 代理平台应对颠覆

Adobe 面对 AI 原生竞争对手的压力,推出了新的企业级 AI 代理平台。此举旨在应对 AI 对其自身商业模式的潜在颠覆。

7.6

#15 Moonshot Kimi K2.6 发布,技术细节与性能概述

Moonshot 发布了 Kimi K2.6 模型,这是一个拥有 1T 参数的 MoE 模型,具备 32B 激活、384 个专家、MLA attention、256K 上下文窗口及原生多模态能力。官方声称其在多项基准测试中取得开源 SOTA 成绩,并展示了长 horizon 执行能力。Kimi K2.6 被视为 Claude/GPT 的有力替代方案,尤其在编码和基础设施工作方面。

7.5

输入关键词开始搜索