2026-03-22 精选

追踪 125 篇 · 精选 6 篇

#1 ML模型生产环境部署的四种受控策略

在生产环境中直接部署ML模型存在风险。本文介绍了四种受控部署策略，旨在通过降低生产环境中的不确定性来确保模型稳定性：A/B测试(A/B Testing)通过流量切分对比表现；金丝雀发布(Canary Testing)通过小范围试点逐步推广；交错测试(Interleaved Testing)在同一请求中混合模型输出；以及影踪测试(Shadow Testing)，通过在真实环境下验证模型表现，帮助团队规避性能退化风险，保障用户体验。

7.2

#2 Moonshot AI 发布 Attention Residuals

Moonshot AI 正式开源 Attention Residuals 项目。该技术旨在通过优化注意力机制的残差连接结构，提升大语言模型(LLM)的训练效率与性能表现，为开发者提供了更高效的模型架构优化方案。

7.1

#3 purl: 支持支付功能的 HTTP 请求 CLI 工具

purl 是一款类似 curl 的命令行工具，专门用于发送需要支付验证的 HTTP 请求。该工具通过集成支付机制，简化了开发者在测试或交互受限 API 资源时的流程，为处理付费内容或服务访问提供了新的 CLI 方案。

6.5

#4 云服务推出单租户 Cloud HSM

云服务正式推出「单租户 Cloud HSM」服务。该服务提供专用且高可用的 HSM 分区集群，旨在为用户提供对加密密钥的完全控制权，满足更高的数据加密合规与安全需求。

6.2

#5 Mole 发布 v1.31.0 Makima 版本

Mole 正式发布 v1.31.0「Makima」版本。该更新带来了更快的运行性能，并提升了系统状态报告的准确性。作为开源项目，本次升级得益于社区开发者的贡献。

5.7

#6 小米发布 MiMo-V2-Pro 模型

小米发布了名为 MiMo-V2-Pro 的新模型。尽管其性能表现尚可，但并未达到行业前沿水平。值得注意的是，该模型并未采用开放权重(Open Weights)策略，这反映了当前中国前沿模型领域的一个发展趋势。

5.6