#1 OpenClaw 预示代理 AI 新纪元
2025年末的事件汇聚,促使代理AI在2026年初迎来转折点。Anthropic与OpenAI发布了Opus 4.5和GPT 5.2,标志着OpenClaw的出现,预示着代理AI时代即将到来。
追踪 282 篇 · 精选 15 篇
2025年末的事件汇聚,促使代理AI在2026年初迎来转折点。Anthropic与OpenAI发布了Opus 4.5和GPT 5.2,标志着OpenClaw的出现,预示着代理AI时代即将到来。
LightSeek基金会发布了其开源LLM推理引擎TokenSpeed,采用MIT许可。该引擎专为Agentic Workloads设计,旨在实现媲美TensorRT-LLM的性能,平衡高GPU TPM和用户TPS。其架构包含编译器支持的并行机制、高性能调度器、KV资源复用限制、可插拔层状内核系统及SMG集成。在NVIDIA B200上,TokenSpeed在SWE-smith trace和Kimi K2.5模型测试中,相较TensorRT-LLM在70 TPS/User以上时,性能提升约9%。
Mozilla 首次披露了它们如何利用 Claude Mythos 预览版来定位并修复 Firefox 中的数百个安全漏洞。过去几个月,AI 模型能力和 Mozilla 的利用技术得到显著提升。去年每月修复约 20-30 个漏洞,今年 4 月飙升至 423 个,其中包括一个 20 年的 XSLT 漏洞和一个 15 年的 <legend> 元素漏洞。
Cloudflare 因公司工作模式因 AI 转型而改变,决定全球裁员超 1100 人。公司称此举旨在优化运营、加速创新,而非削减成本或评估个人表现。离职员工将获得优厚补偿,包括直至 2026 年底的工资和医疗保障。
微软 Azure Kubernetes Fleet Manager 旨在解决大规模 Kubernetes 集群管理中的复杂性。它允许团队将集群分组到不同阶段,实现分阶段部署和更新,减少手动干预。该方案还利用 Cilium Cluster Mesh 实现集群间的无缝连接和统一管理,以应对 AI 等分布式工作负载的需求。
腾讯研究员提出的 PhysForge,一个用于物理约束 3D 资产生成的两阶段框架,已被 ICML 2026 接受。该框架使用 VLM 架构规划蓝图,然后通过 KineVoxel Injection 进行扩散,生成可用于模拟的资产,并在 150K PhysDB 上进行了训练。
OpenAI 推出了官方命令行工具 openai-cli,允许开发者直接在终端调用 API,无需编写 SDK 代码。该项目已在 GitHub 开源 (openai/openai-cli),采用 Apache 2.0 协议,可通过 Homebrew 或 Go 安装。此工具支持多种功能,包括调用 responses API、生成结构化输出、图像生成/编辑、语音转录和文本转语音,并方便管理项目和 API 密钥。
Claude Code 宣布提高使用限额:Pro、Max、Team 和企业版计划的 Claude Code 5 小时限额翻倍;Pro 和 Max 计划的 Claude Code 不再有高峰时段限制;Opus 模型 API 速率限额也大幅提高。
字节跳动 Seed 发布了 PV-VAE,一种预测性视频 VAE 模型,它能在部分上下文上进行训练,以重建和预测未来帧。该模型将潜在扩散的收敛速度提高了 52%,FVD 分数比 Wan2.2 提高了 34.42%。
Max Agency 播客访谈了 Ramp Labs 应用研究主管 Alex Shevchenko,探讨了 Ramp Sheets 的构建、其内部 Agent Inspect 以及更多内容。访谈可在 YouTube、Apple 和 Spotify 上收听。
GPT image 2.0 发布两周以来,持续展现出令人惊叹的新能力。用户发现其能够轻松生成文字海报,并具备强大的二次元画风生成能力,甚至无需参考图即可根据名称IP直接出图。
据《金融时报》报道,中国人工智能实验室 Deepseek 接近完成一轮融资,估值将达约 450 亿美元。此轮融资由中国国家芯片基金领投。
Mythos 模型并非营销噱头,它是一个通用的模型,恰好在发现漏洞方面表现出色。预计 OpenAI 和 Google 也会推出类似模型,开源模型将在 8 个月内跟进。