Skip to main content
历史
关于
EN

2026-04-16 精选

追踪 323 篇 · 精选 15 篇

#1 Cloudflare推出AI助手Agent Lee,革新交互方式

Cloudflare推出AI助手Agent Lee,旨在革新用户与技术产品的交互方式。Agent Lee集成于控制面板,能理解用户Cloudflare账户,通过自然语言执行故障排查、应用变更、部署资源等任务。其基于Codemode技术,利用TypeScript API与MCP服务器协同工作,并有严格的写操作审批流程。

8.9

#2 Cloudflare 推出 Project Think,赋能下一代 AI 代理

Cloudflare 发布 Project Think,这是其 Agents SDK 的升级。新平台引入了构建长期运行 AI 代理的 'primitives',包括持久化执行、子代理、沙盒代码执行和持久化会话。它旨在解决当前 AI 代理在可扩展性、成本和管理方面的痛点,通过基于 Durable Objects 的模型,实现代理的按需唤醒和几乎零边际成本的创建,从而改变 AI 代理的可扩展性模型。

8.8

#3 Google Gemini Mac 应用上线

Google Gemini Mac 应用正式发布,用户无需打开浏览器标签页即可与 Gemini 互动,可直接分享屏幕内容或本地文件以获取帮助,提升了 Mac 用户的便捷性和信息检索效率。

8.8

#4 Google 发布 Gemini 3.1 Flash TTS,支持提示词驱动的音频生成

Google 发布了 Gemini 3.1 Flash TTS,一款新型文本转语音模型,可通过提示词控制生成音频。用户可通过 Gemini API 使用 "gemini-3.1-flash-tts-preview" 模型 ID 进行调用,但仅支持输出音频文件。该模型允许通过详细的提示词来指导声音的风格、节奏、口音等。

8.4

#5 Google 发布 Gemini 3.1 Flash TTS 模型

本文介绍了 Google 新推出的 Gemini 3.1 Flash TTS 文本转语音模型,并分享了作者对此模型的初步分析和使用心得。

8.4

#6 Anthropic Claude Code 推动个性化软件开发浪潮

Anthropic 的 Claude Code 工具正迅速改变软件开发格局,使非技术人员也能构建满足特定需求的软件。自 2025 年 5 月推出以来,Claude Code 的年化收入已达 10 亿美元,并迅速增长至 25 亿美元。该平台不仅改变了企业工程团队的运作方式,还使营销、金融等部门人员能够自行开发软件,催生了“个性化软件”新生态。例如,某公司负责人利用 Claude Code 在一周内构建了一个自动化内容工作流,成本低廉且无需专业开发技能。

8.4

#7 AI agents将聘请人类专家完成任务

Humwork (@humworkai) 推出新服务,当 AI 代理遇到困难时,可以连接到经过验证的领域专家。该平台能在 30 秒内匹配专家,如高级工程师、营销人员和设计师。用户可以加入该市场,为 AI 代理完成任务。

8.3

#8 Google DeepMind 发布 Gemini Robotics-ER 1.6

Google DeepMind 发布 Gemini Robotics-ER 1.6,该机器人是用于现实世界环境的机器人“认知大脑”。新版本在空间和物理推理方面有显著提升,并新增了“仪器读取”功能,可识别模拟仪表、压力计和数字读数,用于设施检查。该模型通过像素级定位进行空间推理,并能融合多视角信息。Gemini Robotics-ER 1.6 作为“战略家”,为执行任务的 VLA 模型提供高层指导。

8.1

#9 Jane Street 投资 CoreWeave 60 亿美元,利用 AI 提升市场效率

Jane Street 承诺向 CoreWeave 的 AI 云平台投资约 60 亿美元,并进行 10 亿美元的股权投资。该公司利用 CoreWeave 平台和 NVIDIA Vera Rubin 技术,大规模训练和部署处理海量嘈杂数据的 AI 模型,以提升做市效率。

8.0

#10 研究:LLM可通过隐藏信号传递偏好与错位等特质

一项发表于《Nature》的研究表明,大型语言模型(LLM)在模型蒸馏过程中,能够通过数据中不相关的隐藏信号,传递出与训练数据无关的行为特质,例如偏好甚至错位。

8.0

#11 推出 AHB 基准:从屏幕视角评估移动 GUI 智能体

研究人员引入了用于移动 GUI 智能体的「Agent Humanization Benchmark」(AHB),将其视为一个平台与智能体间的极小极大优化博弈,以在不牺牲效用的情况下实现自然的触摸动力学。该工作建立了检测指标和数据驱动的行为匹配方法,证明了智能体在对抗环境中可实现高可模仿性,同时保持完整的任务性能。

8.0

#12 NVIDIA Blackwell GPU 效率超越 Hopper

NVIDIA Blackwell GPU 的实际性能和效率远超其成本指标。尽管 Blackwell 的成本可能是 Hopper 的两倍,但其每瓦特输出的 tokens 数量是 Hopper 的 50 倍以上,每百万 tokens 的成本降低了约 35 倍,显示了其在能效上的巨大提升。

7.9

#13 Anthropic 准备发布 Opus 4.7 及 AI 设计工具,获天价融资

Anthropic 计划推出其新模型 Opus 4.7,以及一款旨在挑战 Adobe 和 Figma 等巨头的 AI 设计工具。同时,风险投资家正排队等待,拟以极高估值进行投资。

7.9

#14 Claude 在模型对齐任务中超越人类,但实际应用效果消失

在一次实验中,九个 Claude 实例在一个开放式模型对齐问题上表现远超人类研究员。然而,当 Anthropic 尝试将其研究方法应用于自家生产模型时,发现该效果完全消失。

7.8

#15 OpenAI发布GPT-5.4-Cyber,对抗Anthropic的Mythos

OpenAI发布了GPT-5.4-Cyber,一个更开放的AI模型,用于防御性安全工作。此举是对Anthropic的Mythos模型的直接回应,后者仅限于少数伙伴。GPT-5.4-Cyber允许经验证的防御者访问,能够逆向编译软件以检测恶意软件和安全漏洞,OpenAI认为网络安全应是“团队运动”,不应限制访问。

7.8

输入关键词开始搜索