#1 MinIO推出MemKV,旨在通过消除AI重计算税提高GPU利用率
AI基础数据服务公司MinIO发布了名为MemKV的新型上下文内存存储,旨在解决AI推理中的“重计算税”问题。MemKV通过提供大规模、低延迟的内存访问,可提升GPU利用率超过95%,降低每token成本约50%。其CEO称,此举可消除AI基础设施的“结构性阻力”,使GPU更高效地运行。
追踪 253 篇 · 精选 10 篇
AI基础数据服务公司MinIO发布了名为MemKV的新型上下文内存存储,旨在解决AI推理中的“重计算税”问题。MemKV通过提供大规模、低延迟的内存访问,可提升GPU利用率超过95%,降低每token成本约50%。其CEO称,此举可消除AI基础设施的“结构性阻力”,使GPU更高效地运行。
即日起,云 Agent 可在完全配置的开发环境中运行,这些环境支持克隆代码库、安装依赖和配置工具链。每个环境都拥有独立版本历史和回滚功能,并提供审计日志。此外,Egress 和 Secrets 可按环境进行范围限定,确保安全性。
Meta 在 Hugging Face 上发布了名为「Beyond the Lab」的新数据集,该数据集包含来自多位评分者的注释,旨在用于基准测试 AI 生成图像的检测。Meta 致力于通过开源和开放科学来推动和普及人工智能。
Bridge AI 正式启动其“计算机使用”代理的测试,旨在让 AI 能安全地使用用户的计算机来完成实际工作。该代理致力于解决当前 AI 组件过于不稳定或运行成本高昂的问题。用户可通过指定链接加入测试。
Vercel 产品设计团队分享了他们在工作中使用的工具和工作流,强调了从生产环境反向设计已成为标准,“Codex 编码,Claude 评审”。文章还介绍了“Paper”插件用于抓取生产环境样式和结构,以及“UI Fork”工具。
制作高质量 SRT 字幕的关键在于断句和拼写校正,AI 或 Agent 可辅助完成。前提是获取单词级别的时间戳,主流语音识别模型(如 Whisper API)可输出 JSON 格式,标注单词的 start 和 end 时间。直接使用 Whisper API 导出的 SRT 效果不佳,可能出现过长字幕块或幻觉。建议采用 response_format=verbose_json 和 timestamp_granularities[]=word 参数,然后自行拼合字幕。
Microsoft Edge 新增功能,允许 Copilot AI 聊天机器人从所有打开的标签页中收集信息,以便用户进行跨标签页比较、文章摘要等操作。微软同时淘汰了之前的 Copilot Mode。用户可选择启用或关闭此功能。
Isomorphic Labs 宣布获得 21 亿美元新融资,以加速其药物发现的使命。该公司从 AlphaFold 开始,致力于通过 AI 改善人类健康,并最终解决所有疾病。
Snap 工程平台负责人 Prudhvi Vatala 分享了如何将日处理超 10 PB 数据的 A/B 测试迁移至 Google Cloud 的 GPU 加速管道,使作业成本降低 76%。