Skip to main content
历史
关于
EN

2026-05-10 精选

追踪 195 篇 · 精选 6 篇

#1 NVIDIA Star Elastic:单一模型实现30B/23B/12B推理模型

NVIDIA研究员提出 Star Elastic 方法,通过单一训练运行,将30B、23B和12B参数的推理模型嵌套在同一检查点内,无需额外微调。该方法通过重要性评估和可训练路由器来确定嵌套子模型架构,并支持多种嵌套维度。Star Elastic还能实现不同推理阶段使用不同模型。

9.6

#2 GPT-5.5 效率与能力获 DHH 称赞

DHH 评价称,GPT-5.5 在过去一周多的低推理任务测试中表现出色,非常高效且能力强大。他表示,未使用 Opus 模型,且 GPT-5.5 比 Kimi 更简洁,认为这是 OpenAI 的巨大进步。

8.6

#3 Gemini Enterprise Agent Platform 推出 Agent Runtime

Gemini Enterprise Agent Platform 的 Agent Runtime 专为速度而构建,具备亚秒级冷启动和快速配置能力,可支持复杂的生产工作负载,让用户能够自信地扩展。

7.4

#4 Agent 开发生命周期

成功的组织能够安全、系统地重复交付 Agent。他们会尽早发布产品,从实际使用中学习,并快速迭代。

7.1

#5 OpenAI WebRTC 音频问题引争议

OpenAI 的 Luke Curley 指出,WebRTC为保持低延迟会主动丢弃音频数据包,导致网络状况差时用户体验受损。他认为,对于LLM应用,用户宁愿等待更长的响应时间以换取准确性,而非接受因低延迟设计而产生的错误。

7.1

#6 伪科学情感AI入侵职场

《大西洋月刊》的报道指出,声称能用AI读取人类情感的软件正悄然成为日常工作的一部分。

6.5

输入关键词开始搜索