Skip to main content
历史
关于
EN

2026-05-16 精选

追踪 269 篇 · 精选 15 篇

#1 Codex 崛起与 Claude 定量使用限制引发市场关注

自从 GPT 5.5 发布以来,AI 领域出现分化:Anthropic 的 Claude 因其增长和 CFO 受关注,但 AI 工程师对 Codex 的好感度上升。Anthropic 调整 Claude 订阅模式,将 API 积分与订阅费挂钩,引发部分用户不满,被认为是“撤资”。与此同时,OpenAI 推出企业促销,Codex 则以更宽松的政策吸引用户。Agent 基础设施和用户体验方面,Cline、LangChain、Notion 和 Cursor 均推出了新功能,侧重于长期状态、流式传输和编排。

10.5

#2 SU-01模型以30B-A3B达成奥数竞赛最高水平

SU-01模型,采用反向困惑度课程SFT和两阶段RL的统一方法,以一个紧凑的30B-A3B模型实现了奥林匹克竞赛的最高推理水平。该模型能够解决IMO 2025和USAMO 2026的赛题,每项获得35分,并能维持100K+ token的推理过程,无需外部工具。

9.5

#3 ServiceNow 发布 EVA-Bench 语音助手评估工具

ServiceNow 发布了 EVA-Bench,一个端到端的语音助手评估工具。EVA-Bench 可模拟机器人之间的音频对话,在包括航空、人力资源和 IT 在内的 213 个场景中评估任务准确性(EVA-A)和对话体验(EVA-X)。

8.7

#4 Eric Jang 分享如何从零构建 AlphaGo

Eric Jang 分享了如何利用现代 AI 工具从零开始构建 AlphaGo,并探讨了其对未来通用人工智能(AGI)的启示。他解释了 AlphaGo 的核心技术,如搜索、从经验中学习和自我对弈,并将其与当前大型语言模型(LLMs)中的强化学习(RL)进行了对比,指出了 MCTS(蒙特卡洛树搜索)在解决 RL 中的信用分配问题方面的优势。此外,Jang 还介绍了他的“自主研究”(Autoresearch)循环项目,以及 LLMs 在自动化 AI 研究方面的潜力和局限性。

7.6

#5 掌握代理管理与基础知识可助您一往无前

若您在代理管理方面出类拔萃,并深刻理解基础知识,便能所向披靡。人们乐于与各领域的顶尖人才合作。代理在提升工作产出方面的作用不容忽视。

7.6

#6 AI 开发者探索子代理(sub-agent)的应用

开发者 SVPino 分享了他对 Claude Code 中“子代理”理念的看法,认为“一切可成为子代理的都应是子代理”。他承认自己目前对此类划分的判断还需要更多经验,但正通过实践加速学习,并指出子代理拥有独立的上下文窗口,这能在多代理协作中带来优势。

7.3

#7 Raycast 更新至 Beta V2 版本,集启动器与 AI Agent 功能

Raycast 发布了 Beta V2 版本,集启动器与 AI Agent 功能于一身,UI/UX 界面与 Mac 系统设计风格更趋融合。本次更新重构了基础架构,包括启动器底层、搜索、调度、扩展功能和设置界面,并升级了搜索功能,可调用Skill。

7.1

#8 Block 将其 AI 工具 Goose 转交给 Linux 基金会

Block 将其内部开发的 AI 编码代理 Goose 开源并转交给 Linux 基金会,以解决其因商标所有权和缺乏透明治理而面临的企业采用障碍。Goose、MCP 和 Agents.MD 一起构成了新成立的 Agentic AI Foundation(AAIF)的核心,AAIF 隶属于 Linux 基金会。

6.8

#9 Show HN: benchLLM 助您根据硬件选择最佳本地 LLM

一个名为 benchLLM 的新工具,旨在帮助用户根据自身硬件配置,选择性能最佳的本地大型语言模型 (LLM)。该工具通过基准测试对模型进行排名,并提供了相应的 GitHub 页面 (https://github.com/Andyyyy64/whichllm)。

6.5

#10 AI 时代新岗位:Forward Deployed Engineer

Google 正在加大对 Forward Deployed Engineer (FDE) 职位的投入,并简化招聘流程。FDE 成为 AI 领域新的人才竞赛焦点。

6.4

#11 Claude 帮助用户找回 11 年前丢失的 5 枚比特币

一位名为 cprkrn 的比特币玩家发帖称,借助 AI Claude 的帮助,他找回了 11 年前因嗑药后忘记密码而丢失的 5 枚比特币,按当前市价约合 40 万美元。他对此表示极大感谢。

6.4

#12 QueryData for AlloyDB 助力用自然语言查询复杂数据库

本文介绍如何使用 QueryData for AlloyDB,通过自然语言和高速向量搜索来查询复杂数据库,以此 democratize 数据访问,超越简单的 SELECT 操作。

6.3

#13 React 组件 <Water> 概念演示

开发者 shuding 分享了一个正在研究中的概念:将着色器(shaders)引入 React。并发布了第一个概念演示 <Water> 组件的已部署demo,链接为 https://t.co/oyygjLlIeQ。

6.2

#14 Markdown 被指信息密度低,HTML 更优

Markdown 因信息密度低被认为“从一开始就被注定失败”。文章指出,HTML 对人类和 AI 而言是更好的选择,但因其输入不便,因此出现了一个开源工具来生成 HTML。相关链接见文内。

6.2

#15 Helfie利用Azure和NVIDIA AI改善偏远地区医疗

在澳大利亚偏远地区,就医路途遥远。Helfie利用Microsoft Azure和NVIDIA技术,通过AI驱动的健康监测来弥合这一差距,将医疗服务带给更多人。

6.1

输入关键词开始搜索