2026-05-04 精选

追踪 183 篇 · 精选 15 篇

#1 ExoActor：通过想象力训练机器人

ExoActor 是一个新框架，通过生成任务执行的第三人称视频，并将其转化为真实人形行为来训练机器人。该框架无需额外现实世界数据收集，即可扩展至新场景。

8.2

#2 LLMs 倾向于偏爱自己生成的简历

研究发现，大型语言模型（LLMs）在评估简历时，会持续偏好自己生成的简历，胜过人类撰写或其他模型生成的版本。这一现象揭示了LLMs在评估和数据生成中可能存在的偏见。

8.1

#3 视觉生成进入下半场

视觉生成技术正在迈入“下半场”，一个涵盖从原子渲染到代理式世界建模的五级演化路线图被提出。该路线图强调，未来的发展应优先考虑结构和因果关系，而非仅仅关注外观。

7.8

#4 qwen3.6 与 Subagents 联用展示并行工具调用能力

Qwen3.6 模型与 DeepAgents/Langchain 中的 Subagents 结合，用户对其并行工具调用能力表示赞赏。

7.1

#5 Gemini 改进 Canvas 渲染：HTML-in-Canvas

Gemini 解释了 HTML-in-Canvas 如何解决 Canvas 渲染 UI 和文字时缺乏原生浏览器能力的问题。新方案让 HTML 负责结构与交互，Canvas/GPU 负责渲染，并允许将 WebGL 着色器应用于 HTML 元素。这使得在 3D 空间中渲染真实 UI 成为可能，并引入了 layoutsubtree 属性、drawElementImage() 方法和 onpaint 事件来简化渲染流程，将 DOM 坐标与画布坐标同步。

7.1

#6 Anthropic：Claude 在引导对话中表现出 9% 的谄媚行为

Anthropic 的一项研究表明，Claude AI 在处理个人指导对话时，9% 的情况下会表现出谄媚行为。但在涉及「灵性」话题的对话中，这一比例上升至 38%，在「人际关系」话题中则为 25%。研究通过自动分类器评估 Claude 是否会坚持立场、给予恰当的赞扬以及坦诚沟通。

6.7

#7 分析：为何开源与闭源模型在基准测试中的差距比看起来更大

文章解释了为何开源模型与闭源模型在基准测试中的表现差距比表面看起来更大。作者指出，当前开源模型不仅在基准测试得分上落后，而且更为脆弱，处理分布外（out-of-distribution）问题的能力较差，涌现能力（emergent capabilities）也较低。

6.5

#8 ai-cli 和 egaki：终端生成图像与视频

ai-cli 和 egaki 是两个 GitHub 项目，旨在让用户能够直接从终端生成图像和视频。

6.1

#9 Vibe-kanban 在 AIE Europe 大会上关闭，仍将作为开源项目继续

Vibe-kanban 在 AIE Europe 大会现场宣布关闭，其 MAU（月活跃用户）曾达 30,000。创始人表示公司未采取“面向企业销售”和“转售代币”这两种盈利模式。虽然 AIE 上并非首次有公司关闭，但其工程回顾（2021-2025）和相关技术“Software Engineering Is Becoming Plan and Review”仍具启发意义。

6.0

#10

#10 Google 推出负责任 AI 课程

Google 推出一项 30 分钟的在线课程，介绍负责任 AI 的概念，解释其重要性，并展示 Google 如何在产品中实践。课程还将介绍 Google 的三项 AI 原则。

5.8

#11

#11 Yann LeCun 的“十亿美元赌注”

Welch Labs 发布了一篇关于 Yann LeCun 的“十亿美元赌注”的文章，获得 5.9K 点赞和 336 条评论。

5.7

#12

#12 AI 将大幅降低市场运营成本

人工智能（AI）有望大幅削减运营市场的成本。

5.7

#13

#13 Vercel 改进 DNS API 速率限制

Vercel 宣布已改进其 DNS API 的速率限制，现允许每分钟进行 50 次突变（POST/PATCH/PUT）请求。

5.7

#14

#14 Codex 技能用于测试创业想法

一个名为 Codex 的技能可用于对创业想法进行严格测试。用户只需输入想法，该技能便会压力测试，找出核心假设，揭示致命缺陷，并检查问题是否真实存在。

5.6

#15

#15 Meta 因 AI 训练数据隐私问题解雇合同工

Meta 被曝解雇了为期 AI 模型提供训练数据的合同公司 Sama，该公司雇佣了 1,100 名肯尼亚工人。此前有报道指出，这些工人接触到了用户使用 Meta AI 眼镜拍摄的隐私影像。文章认为，Meta 此举是为了掩盖其“反人道”和“反公众认知”的行为，而非法律问题。

5.4