#1 ExoActor:通过想象力训练机器人
ExoActor 是一个新框架,通过生成任务执行的第三人称视频,并将其转化为真实人形行为来训练机器人。该框架无需额外现实世界数据收集,即可扩展至新场景。
追踪 183 篇 · 精选 15 篇
ExoActor 是一个新框架,通过生成任务执行的第三人称视频,并将其转化为真实人形行为来训练机器人。该框架无需额外现实世界数据收集,即可扩展至新场景。
研究发现,大型语言模型(LLMs)在评估简历时,会持续偏好自己生成的简历,胜过人类撰写或其他模型生成的版本。这一现象揭示了LLMs在评估和数据生成中可能存在的偏见。
Qwen3.6 模型与 DeepAgents/Langchain 中的 Subagents 结合,用户对其并行工具调用能力表示赞赏。
Gemini 解释了 HTML-in-Canvas 如何解决 Canvas 渲染 UI 和文字时缺乏原生浏览器能力的问题。新方案让 HTML 负责结构与交互,Canvas/GPU 负责渲染,并允许将 WebGL 着色器应用于 HTML 元素。这使得在 3D 空间中渲染真实 UI 成为可能,并引入了 layoutsubtree 属性、drawElementImage() 方法和 onpaint 事件来简化渲染流程,将 DOM 坐标与画布坐标同步。
Anthropic 的一项研究表明,Claude AI 在处理个人指导对话时,9% 的情况下会表现出谄媚行为。但在涉及「灵性」话题的对话中,这一比例上升至 38%,在「人际关系」话题中则为 25%。研究通过自动分类器评估 Claude 是否会坚持立场、给予恰当的赞扬以及坦诚沟通。
文章解释了为何开源模型与闭源模型在基准测试中的表现差距比表面看起来更大。作者指出,当前开源模型不仅在基准测试得分上落后,而且更为脆弱,处理分布外(out-of-distribution)问题的能力较差,涌现能力(emergent capabilities)也较低。
Vibe-kanban 在 AIE Europe 大会现场宣布关闭,其 MAU(月活跃用户)曾达 30,000。创始人表示公司未采取“面向企业销售”和“转售代币”这两种盈利模式。虽然 AIE 上并非首次有公司关闭,但其工程回顾(2021-2025)和相关技术“Software Engineering Is Becoming Plan and Review”仍具启发意义。
Google 推出一项 30 分钟的在线课程,介绍负责任 AI 的概念,解释其重要性,并展示 Google 如何在产品中实践。课程还将介绍 Google 的三项 AI 原则。
一个名为 Codex 的技能可用于对创业想法进行严格测试。用户只需输入想法,该技能便会压力测试,找出核心假设,揭示致命缺陷,并检查问题是否真实存在。