2026-05-08 精选

追踪 282 篇 · 精选 15 篇

#1 OpenClaw 预示代理 AI 新纪元

2025年末的事件汇聚，促使代理AI在2026年初迎来转折点。Anthropic与OpenAI发布了Opus 4.5和GPT 5.2，标志着OpenClaw的出现，预示着代理AI时代即将到来。

12.1

#2 LightSeek基金会发布TokenSpeed，专为Agentic Workloads的开源LLM推理引擎

LightSeek基金会发布了其开源LLM推理引擎TokenSpeed，采用MIT许可。该引擎专为Agentic Workloads设计，旨在实现媲美TensorRT-LLM的性能，平衡高GPU TPM和用户TPS。其架构包含编译器支持的并行机制、高性能调度器、KV资源复用限制、可插拔层状内核系统及SMG集成。在NVIDIA B200上，TokenSpeed在SWE-smith trace和Kimi K2.5模型测试中，相较TensorRT-LLM在70 TPS/User以上时，性能提升约9%。

8.4

#3 Mozilla 利用 Claude Mythos 预览加固 Firefox 安全

Mozilla 首次披露了它们如何利用 Claude Mythos 预览版来定位并修复 Firefox 中的数百个安全漏洞。过去几个月，AI 模型能力和 Mozilla 的利用技术得到显著提升。去年每月修复约 20-30 个漏洞，今年 4 月飙升至 423 个，其中包括一个 20 年的 XSLT 漏洞和一个 15 年的 <legend> 元素漏洞。

7.8

#4 Cloudflare 裁员超 1100 人优化 AI 时代运营

Cloudflare 因公司工作模式因 AI 转型而改变，决定全球裁员超 1100 人。公司称此举旨在优化运营、加速创新，而非削减成本或评估个人表现。离职员工将获得优厚补偿，包括直至 2026 年底的工资和医疗保障。

7.5

#5 微软 Azure Kubernetes Fleet Manager 简化大规模集群管理

微软 Azure Kubernetes Fleet Manager 旨在解决大规模 Kubernetes 集群管理中的复杂性。它允许团队将集群分组到不同阶段，实现分阶段部署和更新，减少手动干预。该方案还利用 Cilium Cluster Mesh 实现集群间的无缝连接和统一管理，以应对 AI 等分布式工作负载的需求。

7.5

#6 Parloa 利用 OpenAI 模型打造 AI 客服

Parloa 利用 OpenAI 模型驱动可扩展的语音 AI 客服代理，使企业能够设计、模拟和部署可靠的实时互动。

7.4

#7 PhysForge 被 ICML 2026 接收

腾讯研究员提出的 PhysForge，一个用于物理约束 3D 资产生成的两阶段框架，已被 ICML 2026 接受。该框架使用 VLM 架构规划蓝图，然后通过 KineVoxel Injection 进行扩散，生成可用于模拟的资产，并在 150K PhysDB 上进行了训练。

7.1

#8 OpenAI 发布 openai-cli 官方命令行工具

OpenAI 推出了官方命令行工具 openai-cli，允许开发者直接在终端调用 API，无需编写 SDK 代码。该项目已在 GitHub 开源 (openai/openai-cli)，采用 Apache 2.0 协议，可通过 Homebrew 或 Go 安装。此工具支持多种功能，包括调用 responses API、生成结构化输出、图像生成/编辑、语音转录和文本转语音，并方便管理项目和 API 密钥。

7.0

#9 Claude Code 提高使用限额

Claude Code 宣布提高使用限额：Pro、Max、Team 和企业版计划的 Claude Code 5 小时限额翻倍；Pro 和 Max 计划的 Claude Code 不再有高峰时段限制；Opus 模型 API 速率限额也大幅提高。

6.9

#10

#10 字节跳动 Seed 发布 PV-VAE

字节跳动 Seed 发布了 PV-VAE，一种预测性视频 VAE 模型，它能在部分上下文上进行训练，以重建和预测未来帧。该模型将潜在扩散的收敛速度提高了 52%，FVD 分数比 Wan2.2 提高了 34.42%。

6.9

#11

#11 Max Agency 播客访谈 Ramp Labs 负责人

Max Agency 播客访谈了 Ramp Labs 应用研究主管 Alex Shevchenko，探讨了 Ramp Sheets 的构建、其内部 Agent Inspect 以及更多内容。访谈可在 YouTube、Apple 和 Spotify 上收听。

6.7

#12

#12 GPT image 2.0 的惊人能力

GPT image 2.0 发布两周以来，持续展现出令人惊叹的新能力。用户发现其能够轻松生成文字海报，并具备强大的二次元画风生成能力，甚至无需参考图即可根据名称IP直接出图。

6.6

#13

#13 Deepseek 融资近 450 亿美元，中国国家芯片基金领投

据《金融时报》报道，中国人工智能实验室 Deepseek 接近完成一轮融资，估值将达约 450 亿美元。此轮融资由中国国家芯片基金领投。

6.6

#14

#14 Mythos 模型被证实非营销噱头

Mythos 模型并非营销噱头，它是一个通用的模型，恰好在发现漏洞方面表现出色。预计 OpenAI 和 Google 也会推出类似模型，开源模型将在 8 个月内跟进。

6.3

#15

#15 Agent + 豆包 Seed2.0 lite 自动化视频转图文博客

使用 Agent 和豆包 Seed2.0 lite，研究人员重现了 Andrej Karpathy 两年前的工作流，旨在将长视频（如 2 小时 13 分钟的 tokenizer 教学视频）自动转换成图文博客或书籍章节。

6.2