#1 Google 更新 Gemini API 功能
Google 宣布 Gemini API 的多项功能更新。内置工具(如搜索、地图及文件搜索)现已支持函数调用,并引入了上下文循环技术以提升模型性能。此外,Gemini 1.5 Pro 已正式支持 Google Maps 基础落地能力,旨在通过更强的工具集成改善开发者的交互体验。
追踪 170 篇 · 精选 15 篇
Google 宣布 Gemini API 的多项功能更新。内置工具(如搜索、地图及文件搜索)现已支持函数调用,并引入了上下文循环技术以提升模型性能。此外,Gemini 1.5 Pro 已正式支持 Google Maps 基础落地能力,旨在通过更强的工具集成改善开发者的交互体验。
NVIDIA 在 GitHub 上开源了 NemoClaw 项目,该工具旨在通过高效的检索与处理机制,优化大规模数据在 AI 模型训练中的调用与交互流程。这一工具的发布进一步完善了 NVIDIA 在 AI 基础设施层面的生态布局,为开发者处理复杂数据集提供了更灵活的解决方案。
MiniMax 发布的最新模型 MiniMax 2.7 在保持与 GLM-5 同等性能水平的同时,大幅提升了运行效率。该模型在成本控制方面表现优异,并引入了「自我进化」(Self-Evolution) 的初步实验,声称模型能够参与 30% 至 50% 的自身迭代工作流程,代表了中国开源模型领域的一项重要进展。
本文探讨了「规格说明即代码」这一概念,分析了当软件开发中的规格定义达到足够细致的程度时,它如何与可执行代码达成等效。作者指出,通过精确定义系统行为,文档不仅是参考资料,更可转化为实际实现的逻辑,从而减少开发偏差并提升系统的一致性与可维护性。
MolmoPoint 通过引入 Grounding Tokens 显著提升了视觉语言模型(VLM)的指向精度。该研究旨在解决模型在处理细粒度视觉定位时的准确性不足,通过相关论文及开源模型提供了一种优化视觉理解与定位能力的新路径。
继「 Vibe Coding 」之后,Google 推出 Stitch 工具,试图将 AI 驱动的「 Vibe Design 」引入 UI 设计领域。 Stitch 支持语音编辑、智能代理及即时原型制作功能,旨在通过对话式交互大幅简化设计流程,将数周的工作缩短至单次对话内完成,提升 UI 设计效率。
有消息指出,OpenAI 与 AWS 达成的合作协议可能削弱了微软(Microsoft)在 Azure 云计算平台上的排他性权益。此举引发了微软对其核心投资方合作关系及竞争格局的担忧,可能改变 AI 基础设施市场的动态。
Gumloop 联合创始人兼 CEO Max Brodeur-Urbas 在被美国遣返并禁入 5 年后,于温哥华打造出日处理 400 万任务的 AI 自动化平台。该公司近期获得由 Benchmark 领投的 5000 万美元 B 轮融资。这一经历展现了初创公司在逆境中通过技术创新实现快速扩张的潜力,吸引了包括各类企业在内的广泛客户群体。
研究者 Dan Woods 结合 Apple 的「 LLM in a Flash 」论文与自动化研究模式,成功在 48GB 内存的 MacBook Pro 上运行了 Qwen3.5-397B-A17B 模型。通过利用 MoE 架构的特性,将专家权重从 SSD 流式加载到 DRAM,实现了每秒 5.5 个以上的 Token 生成速度。该实验利用 Claude Code 自动优化 MLX 代码,并展示了通过量化和优化专家加载策略,在受限内存设备上部署超大参数模型的可能性。
针对 AI 代码生成引发的测试瓶颈问题,Sauce Labs 推出「意图驱动测试」(Intent-driven testing) 工具。该工具允许工程师通过自然语言、 Jira 规范或 Figma 设计直接生成跨平台的自动化测试套件,旨在解决传统脚本维护繁琐且难以跟上 AI 开发速度的痛点,从而提升软件交付的质量与效率。
清华大学与蚂蚁集团联合发布研究,深入分析了自治大模型智能体 OpenClaw 的安全风险。研究团队指出,OpenClaw 的「内核插件」架构在处理插件加载时存在信任边界模糊的问题。为此,研究提出了一套覆盖初始化、输入、推理、决策与执行五个阶段的生命周期安全框架,以应对内存污染与技能供应链污染等系统性威胁,旨在弥补传统防御手段在应对复杂自治代理时的局限性。
有报道称,Apple 正在阻止 Replit 和 Vibecode 等「 vibe-coding 」类应用发布新版本。尽管 Apple 援引了现有的应用商店审核准则,但外界认为此举旨在打压其生态系统内的潜在竞争对手,限制了此类新兴 AI 辅助编程工具的合规更新。
Oracle 正式发布 Java 26,尽管其并非长期支持(LTS)版本,但仍带来了 10 项 JDK 增强提案(JEP)。更新重点包括性能优化、 HTTP/3 支持、安全工具及 Applet API 清理。其中,针对 G1 垃圾回收器的同步优化与 Project Leyden 的对象缓存增强,显著提升了高并发与 AI 工作负载的性能,展现了 Java 在保持现代性与竞争力方面的持续投入。
Anthropic 宣布其开发者大会「 Code with Claude 」将于今年春季回归,并将在旧金山、伦敦和东京举办线下活动。届时将提供全天的研讨会、产品演示以及与 Claude 开发团队的 1:1 交流机会。开发者目前可申请线下参会或注册线上观看。