#1 Cloudflare推出AI助手Agent Lee,革新交互方式
Cloudflare推出AI助手Agent Lee,旨在革新用户与技术产品的交互方式。Agent Lee集成于控制面板,能理解用户Cloudflare账户,通过自然语言执行故障排查、应用变更、部署资源等任务。其基于Codemode技术,利用TypeScript API与MCP服务器协同工作,并有严格的写操作审批流程。
追踪 323 篇 · 精选 15 篇
Cloudflare推出AI助手Agent Lee,旨在革新用户与技术产品的交互方式。Agent Lee集成于控制面板,能理解用户Cloudflare账户,通过自然语言执行故障排查、应用变更、部署资源等任务。其基于Codemode技术,利用TypeScript API与MCP服务器协同工作,并有严格的写操作审批流程。
Cloudflare 发布 Project Think,这是其 Agents SDK 的升级。新平台引入了构建长期运行 AI 代理的 'primitives',包括持久化执行、子代理、沙盒代码执行和持久化会话。它旨在解决当前 AI 代理在可扩展性、成本和管理方面的痛点,通过基于 Durable Objects 的模型,实现代理的按需唤醒和几乎零边际成本的创建,从而改变 AI 代理的可扩展性模型。
Google Gemini Mac 应用正式发布,用户无需打开浏览器标签页即可与 Gemini 互动,可直接分享屏幕内容或本地文件以获取帮助,提升了 Mac 用户的便捷性和信息检索效率。
Google 发布了 Gemini 3.1 Flash TTS,一款新型文本转语音模型,可通过提示词控制生成音频。用户可通过 Gemini API 使用 "gemini-3.1-flash-tts-preview" 模型 ID 进行调用,但仅支持输出音频文件。该模型允许通过详细的提示词来指导声音的风格、节奏、口音等。
本文介绍了 Google 新推出的 Gemini 3.1 Flash TTS 文本转语音模型,并分享了作者对此模型的初步分析和使用心得。
Anthropic 的 Claude Code 工具正迅速改变软件开发格局,使非技术人员也能构建满足特定需求的软件。自 2025 年 5 月推出以来,Claude Code 的年化收入已达 10 亿美元,并迅速增长至 25 亿美元。该平台不仅改变了企业工程团队的运作方式,还使营销、金融等部门人员能够自行开发软件,催生了“个性化软件”新生态。例如,某公司负责人利用 Claude Code 在一周内构建了一个自动化内容工作流,成本低廉且无需专业开发技能。
Humwork (@humworkai) 推出新服务,当 AI 代理遇到困难时,可以连接到经过验证的领域专家。该平台能在 30 秒内匹配专家,如高级工程师、营销人员和设计师。用户可以加入该市场,为 AI 代理完成任务。
Google DeepMind 发布 Gemini Robotics-ER 1.6,该机器人是用于现实世界环境的机器人“认知大脑”。新版本在空间和物理推理方面有显著提升,并新增了“仪器读取”功能,可识别模拟仪表、压力计和数字读数,用于设施检查。该模型通过像素级定位进行空间推理,并能融合多视角信息。Gemini Robotics-ER 1.6 作为“战略家”,为执行任务的 VLA 模型提供高层指导。
Jane Street 承诺向 CoreWeave 的 AI 云平台投资约 60 亿美元,并进行 10 亿美元的股权投资。该公司利用 CoreWeave 平台和 NVIDIA Vera Rubin 技术,大规模训练和部署处理海量嘈杂数据的 AI 模型,以提升做市效率。
一项发表于《Nature》的研究表明,大型语言模型(LLM)在模型蒸馏过程中,能够通过数据中不相关的隐藏信号,传递出与训练数据无关的行为特质,例如偏好甚至错位。
研究人员引入了用于移动 GUI 智能体的「Agent Humanization Benchmark」(AHB),将其视为一个平台与智能体间的极小极大优化博弈,以在不牺牲效用的情况下实现自然的触摸动力学。该工作建立了检测指标和数据驱动的行为匹配方法,证明了智能体在对抗环境中可实现高可模仿性,同时保持完整的任务性能。
NVIDIA Blackwell GPU 的实际性能和效率远超其成本指标。尽管 Blackwell 的成本可能是 Hopper 的两倍,但其每瓦特输出的 tokens 数量是 Hopper 的 50 倍以上,每百万 tokens 的成本降低了约 35 倍,显示了其在能效上的巨大提升。
Anthropic 计划推出其新模型 Opus 4.7,以及一款旨在挑战 Adobe 和 Figma 等巨头的 AI 设计工具。同时,风险投资家正排队等待,拟以极高估值进行投资。
在一次实验中,九个 Claude 实例在一个开放式模型对齐问题上表现远超人类研究员。然而,当 Anthropic 尝试将其研究方法应用于自家生产模型时,发现该效果完全消失。